Biostatistics - A Foundation For Analysis in The Health Sciences (10th Ed) - Traducao

Machine Translated by Google

DÉCIMA EDIÇÃO
BIOSTATÍSTICA
Uma Fundação para a
Análise nas Ciências da Saúde
DÉCIMA EDIÇÃO
BIOSTATÍSTICA
Uma Fundação para a
Análise nas Ciências da Saúde
WAYNE W. DANIEL, PH.D.

Professor Emérito
Universidade Estadual da Geórgia
R
CHAD L. CROSS, PH.D., PSTAT
Estatístico
Gabinete de Informática e Analytics
Administração de Saúde dos Veteranos
Faculdade de Pós-Graduação Associada

Universidade de Nevada, Las Vegas
VP & EDITORA EXECUTIVA: Laurie Rosatone

EDITOR DE AQUISIÇÕES: Shannon Corliss
EDITOR DO PROJETO: Ellen Keohane
GERENTE DE MARKETING: Melanie Kurkjian
ASSISTENTE DE MARKETING: Patrick Flatley
EDITOR DE FOTO: Sheena Goldstein
DESENHISTA: Kenji Ngieng
SERVIÇOS DE GERENCIAMENTO DA PRODUÇÃO: Thomson Digital
GERENTE DE PRODUÇÃO ASSOCIADO: Joyce Poh
EDITOR DE PRODUÇÃO: Jolene Ling #
CRÉDITO DA FOTO DA CAPA: ktsimage/iStockphoto
Este livro foi ambientado em 10/12pt, Times Roman pela Thomson Digital e impresso e encadernado pela Edwards Brothers Malloy.
A capa foi impressa pela Edwards Brothers Malloy.
Este livro é impresso em papel livre de ácido. 1
Fundada em 1807, a John Wiley & Sons, Inc. tem sido uma valiosa fonte de conhecimento e compreensão por mais de 200 anos,
ajudando pessoas em todo o mundo a atender suas necessidades e realizar suas aspirações. Nossa empresa é construída sobre uma
base de princípios que incluem responsabilidade para com as comunidades que servimos e onde vivemos e trabalhamos. Em 2008,
lançamos uma Iniciativa de Cidadania Corporativa, um esforço global para abordar os desafios ambientais, sociais, econômicos e éticos
que enfrentamos em nossos negócios. Entre as questões que estamos abordando estão o impacto do carbono, especificações e aquisições
de papel, conduta ética dentro de nossos negócios e entre nossos fornecedores e apoio comunitário e de caridade. Para obter mais
informações, visite nosso site: www.wiley.com/go/cidadania .
Copyright # 2013, 2009, 2005, 1999 John Wiley & Sons, Inc. Todos os direitos reservados. Nenhuma parte desta publicação pode ser
reproduzida, armazenada em um sistema de recuperação ou transmitida de qualquer forma ou por qualquer meio, eletrônico, mecânico,
fotocópia, gravação, digitalização ou outro, exceto conforme permitido nas Seções 107 ou 108 do 1976 United States Copyright Aja, sem
a permissão prévia por escrito da Editora, ou autorização por meio do pagamento da taxa apropriada por cópia ao Copyright Clearance
Center, Inc. 222 Rosewood Drive, Danvers, MA 01923, site www.copyright.com. Solicitações de permissão à Editora devem ser
endereçadas ao Departamento de Permissões, John Wiley & Sons, Inc., 111 River Street, Hoboken, NJ 07030-5774, (201)748-6011, fax
(201)748-6008, website http ://www.wiley.com/go/permissions.
Cópias de avaliação são fornecidas a acadêmicos e profissionais qualificados apenas para fins de revisão, para uso em seus cursos durante
o próximo ano acadêmico. Essas cópias são licenciadas e não podem ser vendidas ou transferidas a terceiros. Após a conclusão do período
de revisão, devolva a cópia de avaliação para Wiley. Instruções de devolução e uma etiqueta de devolução gratuita estão disponíveis em
www.wiley.com/go/returnlabel. Se você optou por adotar este livro para uso em seu curso, aceite-o como sua cópia gratuita. Fora dos
Estados Unidos, entre em contato com seu representante de vendas local.
Dados de catalogação na publicação da Biblioteca do Congresso

Daniel, Wayne W., 1929- Bioestatística: uma base para análise
nas ciências da saúde / Wayne W.
Daniel, Chad Lee Cross. — Décima edição.
páginas cm
Inclui índice.
ISBN 978-1-118-30279-8 (tecido)
1. Estatísticas médicas. 2. Biometria. I. Cross, Chad Lee, 1971-II. Título.
RA409.D35 2013
0
610.72 7—dc23 2012038459
Impresso nos Estados Unidos da América
10 9 8 7 6 5 4 3 2 1
Dr. Daniel
Aos meus filhos, Jean, Carolyn
e John, e à memória de sua mãe,
minha esposa, Mary.
Dr. Cross
Para minha esposa
Pamela e para meus filhos, Annabella
Grace e Breanna Faith.
PREFÁCIO
Esta 10ª edição de Bioestatística: uma base para análise nas ciências da saúde foi preparada com
o objetivo de atrair um público amplo. As edições anteriores do livro foram usadas pelos autores e
seus colegas em diversos contextos. Para graduandos, esta edição deve fornecer uma introdução
aos conceitos estatísticos para estudantes de biociências, ciências da saúde e para estudantes de
matemática que desejam exposição a conceitos estatísticos aplicados. Como seus predecessores,
esta edição é projetada para atender às necessidades de alunos iniciantes de pós-graduação em
várias áreas, como enfermagem, ciências aplicadas e saúde pública, que buscam uma base sólida
em métodos quantitativos. Para profissionais que já trabalham na área da saúde, esta edição pode
servir como uma referência útil.
A abrangência da cobertura fornecida neste livro, juntamente com as centenas de exercícios
práticos, permite aos instrutores ampla flexibilidade na elaboração de cursos em vários níveis. Para
esse fim, oferecemos a seguir algumas ideias sobre cobertura de tópicos que consideramos úteis no
ambiente de sala de aula.
Como as edições anteriores deste livro, esta edição requer poucos pré-requisitos matemáticos
além de uma proficiência sólida em álgebra universitária. Mantivemos a ênfase na compreensão
prática e intuitiva dos princípios, e não nos conceitos abstratos subjacentes a alguns métodos e que
requerem maior sofisticação matemática. Com isso em mente, mantivemos a confiança em conjuntos
de problemas e exemplos retirados diretamente da literatura das ciências da saúde, em vez de
exemplos inventados. Acreditamos que isso torna o texto mais interessante para os alunos e mais
prático para os profissionais de saúde que fazem referência ao texto durante o exercício de suas
funções.
Para a maioria dos exemplos e técnicas estatísticas abordadas nesta edição, discutimos o
uso de software de computador para cálculos. A experiência informou nossa decisão de incluir
exemplos impressos de vários softwares estatísticos nesta edição (por exemplo, MINITAB, SAS,
SPSS e R). Sentimos que a inclusão de exemplos desses pacotes específicos, que geralmente são
os mais comumente utilizados pelos profissionais, fornece uma apresentação rica do material e
permite ao aluno a oportunidade de apreciar as várias tecnologias usadas pelos estatísticos
praticantes.
MUDANÇAS E ATUALIZAÇÕES PARA ESTA EDIÇÃO
A maioria dos capítulos inclui correções e esclarecimentos que aprimoram o material apresentado e
o tornam mais legível e acessível ao público. No entanto, fizemos várias alterações e melhorias
específicas que acreditamos serem contribuições valiosas para esta edição, e agradecemos aos
revisores da edição anterior por seus comentários e sugestões a esse respeito.
vii
viii PREFÁCIO
Mudanças específicas nesta edição incluem texto adicional sobre medidas de dispersão no
Capítulo 2, texto adicional e exemplos usando o programa R no Capítulo 6, uma nova introdução aos
modelos lineares no Capítulo 8 que une os conceitos de regressão e ANOVA nos Capítulos 8–11, a
adição de ANOVA de medidas repetidas de dois fatores no Capítulo 8, uma discussão sobre as
semelhanças de ANOVA e regressão no Capítulo 11 e um extenso texto novo e exemplos sobre como
testar o ajuste de modelos de regressão logística no Capítulo 11.
O mais importante para esta nova edição é um novo Capítulo 14 sobre Análise de Sobrevivência.
Este novo capítulo nasceu de solicitações de revisores do texto e da experiência dos autores quanto ao
uso crescente desses métodos em pesquisas aplicadas. Neste novo capítulo, incluímos parte do material
encontrado no Capítulo 12 em edições anteriores e adicionamos material e exemplos extensos.
Fornecemos cobertura introdutória de censura, estimativas de Kaplan–Meier, métodos para comparar
curvas de sobrevivência e o modelo de riscos proporcionais de regressão de Cox. Devido a esse novo
material, decidimos mover o conteúdo do capítulo de estatísticas vitais para um novo Capítulo 15 e
disponibilizá-lo online (www.wiley.com/college/daniel).
IDEIAS DE COBERTURA DE CURSOS
Na tabela abaixo, fornecemos algumas sugestões para cobertura de tópicos em diversos contextos, com
“X” indicando os capítulos que acreditamos serem mais relevantes para diversos cursos aos quais este
texto é apropriado. O texto foi elaborado para ser flexível a fim de acomodar vários estilos de ensino e
várias apresentações de cursos. Embora o texto tenha sido elaborado com a apresentação progressiva
de conceitos em mente, alguns dos tópicos podem ser omitidos ou abordados brevemente para que o
foco possa ser colocado em conceitos importantes para os instrutores.
Curso Capítulos
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Curso de Graduação para Estudantes XXXXXXXXX OXOOO

de Ciências da Saúde
Curso de Graduação em XOOOXXXXXX OXXXO

Estatística Aplicada para
Licenciatura em Matemática
Primeiro curso de bioestatística para XXXXXXXXXX OXXXO

estudantes de pós-graduação iniciantes
Curso de Bioestatística para XOOOOXXXXXX XXXXX

graduandos em ciências da saúde que
ter concluído um curso
introdutório de estatística
X: Cobertura sugerida; O: Cobertura opcional.

PREFÁCIO ix
SUPLEMENTOS
Manual de soluções do instrutor. Preparado pelo Dr. Chad Cross, este manual inclui soluções para todos os
problemas encontrados no texto. Este manual está disponível apenas para instrutores que adotaram o texto.
Manual de Soluções do Aluno. Preparado pelo Dr. Chad Cross, este manual inclui soluções para todos os
exercícios ímpares. Este manual pode ser embalado com o texto a um preço com desconto.
Conjuntos de dados. Mais de 250 conjuntos de dados estão disponíveis online para acompanhar o texto. Esses
conjuntos de dados incluem os dados apresentados em exemplos, exercícios, exercícios de revisão e os
grandes conjuntos de dados encontrados em alguns capítulos. Eles estão disponíveis nos formatos SAS, SPSS
e Minitab, bem como no formato CSV para importação para outros programas. Os dados estão disponíveis
para download em
www.wiley.com/college/daniel
Aqueles sem acesso à Internet podem entrar em contato com Wiley diretamente em 111 River Street, Hoboken,
NJ 07030-5774; telefone: 1-877-762-2974.
AGRADECIMENTOS
Muitos revisores, alunos e professores fizeram contribuições a este texto por meio de sua revisão cuidadosa,
perguntas inquisitivas e discussão profissional dos tópicos. Em particular, gostaríamos de agradecer ao Dr.
Sheniz Moonie, da Universidade de Nevada, Las Vegas; Dr. Roy T. Sabo, da Virginia Commonwealth University;
e ao Dr. Derek Webb, Bemidji State University, por seus úteis comentários sobre a nona edição deste texto.
Há três agradecimentos adicionais importantes que devem ser feitos a importantes colaboradores do
texto. Dr. João. P. Holcomb, da Cleveland State University, atualizou muitos dos exemplos e exercícios
encontrados no texto. O Dr. Edward Danial, da Morgan State University, forneceu uma extensa revisão de
precisão da nona edição do texto, e seus valiosos comentários acrescentaram muito ao livro. A Dra. Jodi BA
McKibben, da Uniformed Services University of the Health Sciences, forneceu uma extensa revisão de precisão
da edição atual do livro.
Gostaríamos de agradecer a cooperação da Minitab, Inc. por disponibilizar aos autores ao longo de
muitos anos e edições do livro as versões mais recentes de seu software.
Agradecimentos aos professores Geoffrey Churchill e Brian Schott, da Georgia State University, que
escreveram programas de computador para gerar algumas das tabelas do Apêndice, e à professora Lillian Lin,
que leu e comentou o material de regressão logística nas edições anteriores do livro. Além disso, o Dr. James
T. Wassell forneceu informações úteis
x PREFÁCIO
assistência com alguns dos métodos de análise de sobrevivência apresentados em edições anteriores
do livro.
Agradecemos aos muitos pesquisadores no campo das ciências da saúde que publicam seus
resultados e, portanto, disponibilizam dados que fornecem práticas valiosas para os estudantes de
bioestatística.
Wayne W. Daniel
Chad L. Cruz
As opiniões apresentadas neste livro são do autor e não representam necessariamente as opiniões dos Estados Unidos
Departamento de Assuntos de Veteranos.
BREVE CONTEÚDO
1 INTRODUÇÃO À BIOSTATÍSTICA 1 11 ANÁLISE DE REGRESSÃO: ALGUMAS

TÉCNICAS ADICIONAIS 539
2 ESTATÍSTICAS DESCRITIVAS 19
12 A DISTRIBUIÇÃO QUI-QUADRADO
3 ALGUMAS PROBABILIDADES BÁSICAS E A ANÁLISE DE
CONCEITOS 65 FREQUÊNCIAS 600
4 DISTRIBUIÇÕES DE PROBABILIDADE 92 13 NÃO PARAMÉTRICOS E

ESTATÍSTICAS SEM DISTRIBUIÇÃO 670
5 ALGUMAS AMOSTRAS IMPORTANTES
DISTRIBUIÇÕES 134 14 ANÁLISE DE SOBREVIVÊNCIA 750
6 ESTIMATIVA 161 15 ESTATÍSTICAS VITAIS (ONLINE)
7 TESTE DE HIPÓTESE 214 APÊNDICE: TABELAS ESTATÍSTICAS A-1
8 ANÁLISE DE VARIÂNCIA 304 RESPOSTAS PARA NUMERADOS IMPAR

EXERCÍCIOS A-107
9 REGRESSÃO LINEAR SIMPLES E
CORRELAÇÃO 413
ÍNDICE I-1
10 REGRESSÃO MÚLTIPLA E
CORRELAÇÃO 489
XI
CONTEÚDO
1 INTRODUÇÃO À BIOSTATÍSTICA 1 Questões de Revisão e Exercícios 85

Referências 90
1.1 Introdução 2
1.2 Alguns Conceitos Básicos 1.3 2

Medição e Escalas de Medição 1.4 Amostragem e 5 4 DISTRIBUIÇÕES DE PROBABILIDADE 92
Inferência Estatística 1.5 O Método Científico e o 7
4.1 Introdução 93
Planejamento de Experimentos 13
4.2 Distribuições de probabilidade de discreto
15 Variáveis 93
1.6 Computadores e análise bioestatística 1.7 Resumo
4.3 A Distribuição Binomial 99
16 Questões de revisão e referências de exercícios 18
17 4.4 A distribuição de Poisson 108
4.5 Distribuições de Probabilidade Contínua 4.6 A 113

Distribuição Normal 116
4.7 Aplicações de Distribuição Normal 4.8 Resumo 122

2 ESTATÍSTICAS DESCRITIVAS 19 128 Questões de Revisão e Exercícios Referências
133 130
2.1 Introdução 20
2.2 O Array Ordenado 20 2.3 Dados

Agrupados: A Distribuição de Frequência 2.4 Estatística 22
Descritiva: Medidas Medidas
Descritiva: de Tendência Central Estatística
de Dispersão 2.6 Resumo 55
5 ALGUMAS AMOSTRAS IMPORTANTES
38
Questões de Revisão e Exercícios DISTRIBUIÇÕES 134
2.5 43
5.1 Introdução 134
57 5.2 Distribuições amostrais 5.3 135
Referências 63 Distribuição da médiada
Distribuição amostral 136
diferença entre dois 145
5.4
Distribuição das
3 ALGUMAS PROBABILIDADES BÁSICAS 5,5 médias amostrais da proporção amostral 150 Distribuição
CONCEITOS 65 5,6 da diferença entre duas proporções amostrais 5.7
154 e exercícios
Resumo 157 Questões de revisão
3.1 Introdução 65 3.2 Duas
Referências 160
Visões de Probabilidade: Objetiva e Subjetiva 66 3.3 158
Propriedades Elementares da Probabilidade 68 3.4
Cálculo da probabilidade de um evento 69 3.5 Teorema

de Bayes, testes de triagem, sensibilidade, especificidade e valor
6 ESTIMATIVA 161
preditivo positivo e negativo 3.6 Resumo 84
78 6.1 Introdução 162
6.2 Intervalo de confiança para uma média populacional 165
xiii
xiv CONTEÚDO
6.3 A Distribuição t 171 8 ANÁLISE DE VARIÂNCIA 304

6.4 Intervalo de confiança para a diferença entre
177 8.1 Introdução 305
Duas Médias Populacionais
8.2 O Delineamento Completamente Aleatório 8.3 O 308
6.5 Intervalo de confiança para uma proporção
populacional 185 Delineamento de Blocos Completos Aleatórios 334 8.4
6.6 Intervalo de confiança para a diferença O Delineamento de Medidas Repetidas 346
Entre Duas Proporções 8.5 O Experimento Fatorial 8.6 Resumo 373 Questões de
Populacionais 187 Determinação
do Revisão e Exercícios Referências 408 358
6.7 Tamanho da Amostra para Estimar Médias 189
Determinação do Tamanho da Amostra para Estimar 376
6.8 Proporções 6.9 Intervalo de Confiança para a Variância
191
de uma População Normalmente Distribuída 193 6.10
Intervalo de Confiança para a Razão da
9 REGRESSÃO LINEAR SIMPLES E
CORRELAÇÃO 413
Variâncias de Duas Populações Normalmente 9.1 Introdução 414

Distribuídas 198 6.11Revisão
Resumoe 203
Exercícios
Questões de 9.2 O Modelo de Regressão 414 9.3 A Equação
Referências 210 de Regressão de Amostra 9.4 Avaliando a Equação 417
205 de Regressão 9.5 Usando a Equação de Regressão 427
441 9.6 O Modelo de Correlação 445
9.7 O Coeficiente de Correlação 446

7 TESTE DE HIPÓTESE 214 9.8 Algumas Precauções 459
9.9 Resumo 460

Questões de Revisão e Exercícios 464
7.2 Teste de hipótese: uma única população Referências 486
Média 222
7.3 Teste de hipótese: a diferença entre dois
População Média 236 10 REGRESSÃO MÚLTIPLA E
7.4 Comparações pareadas 249
CORRELAÇÃO 489
7.5 Teste de hipótese: uma única população
Proporção 257 10.1 Introdução 490 10.2 O
7.6 Teste de hipótese: a diferença entre dois modelo de regressão linear múltipla 490 10.3
Proporções Populacionais 261 Obtendo a equação de regressão
7.7 Teste de hipótese: uma única população múltipla 492 10.4 Avaliando a equação de regressão
Variação 264
múltipla 501 10.5 Usando a equação de
7.8 Teste de hipótese: a proporção de duas populações regressão múltipla 507 10.6 O modelo de correlação
Variações 267
múltipla 510 10.7de
Resumo
revisão523
e exercícios
Perguntas
7.9 O Erro Tipo II e o Poder de um Teste 272 Referências 537
7.10 Determinando o tamanho da amostra para controlar erros

do tipo II 277
7.11 Resumo 280 Questões 525

de Revisão e Exercícios Referências 300 282
CONTEÚDO xv
11 ANÁLISE DE REGRESSÃO: ALGUMAS 13.8 A Análise de Variância Unidirecional de Kruskal-Wallis

TÉCNICAS ADICIONAIS 539 por Rank 704
13.9 A análise bidirecional de variância de Friedman por níveis 712
11.2 Variáveis independentes qualitativas 11.3 543 13.10 A Correlação de Classificação de Spearman
Procedimentos de seleção de variáveis 560 11.4 Coeficiente 718 13.11
Regressão logística 569 11.5 Resumo 582 Questões Análise de regressão não paramétrica 727 13.12 Resumo
de revisão e exercícios 583 Referências 730 Questões de revisão e exercícios 732 Referências
597 747
14 ANÁLISE DE SOBREVIVÊNCIA 750

12 A DISTRIBUIÇÃO QUI-QUADRADO E
A ANÁLISE DAS FREQUÊNCIAS 600 14.1 Introdução 750
14.2 Dados de tempo até o evento e censura 751 14.3 O

procedimento de Kaplan–Meier 756 14.4 Comparando
12.2 As Propriedades Matemáticas da Distribuição Qui-Quadrado
763
curvas de sobrevivência 14.5 Regressão de Cox: os riscos
601
12.3 Testes de Qualidade de Ajuste 604 proporcionais
Modelo 768
12.4 Testes de Independência 12.5 619
14.6 Resumo 773 Questões
Testes de Homogeneidade 12.6 O 630
de Revisão e Exercícios 774 Referências
Teste Exato de Fisher 636
777
12.7 Risco Relativo, Razão de Chances e o
Estatística de Mantel-Haenszel 641
12.8 Resumo 655 Questões 15 ESTATÍSTICAS VITAIS (ONLINE)

de Revisão e Exercícios 657
Referências 666 www.wiley.com/college/daniel 15.1
Introdução
15.2 Taxas e Razões de Mortalidade
13 NÃO PARAMÉTRICOS E 15.3 Medidas de Fertilidade 15.4
ESTATÍSTICAS SEM DISTRIBUIÇÃO 670 Medidas de Morbidade 15.5 Resumo
13.1 Introdução 671 13.2 Escalas

Questões de Revisão e Exercícios
de medição 13.3 O teste de 672 Referências
sinais 673 13.4 O teste de posto
de sinal de Wilcoxon para localização 681 APÊNDICE: TABELAS ESTATÍSTICAS A-1
13.5 O Teste Mediano 686 RESPOSTAS PARA NUMERADOS IMPAR
13.6 O teste de Mann-Whitney 690 13.7 O teste EXERCÍCIOS A-107

de qualidade de ajuste de Kolmogorov-Smirnov 698
ÍNDICE I-1
CAPÍTULO 1
INTRODUÇÃO A
BIOSTATÍSTICA
VISÃO GERAL DO CAPÍTULO
Este capítulo destina-se a fornecer uma visão geral dos conceitos estatísticos
básicos usados em todo o livro. Um curso de estatística exige que o aluno aprenda
muitos termos e conceitos novos. Este capítulo estabelece os alicerces necessários
para a compreensão dos termos e conceitos estatísticos básicos e o papel que os
estatísticos desempenham na promoção da descoberta e sabedoria científica.
TÓPICOS
1.1 INTRODUÇÃO
1.2 ALGUNS CONCEITOS BÁSICOS
1.3 MEDIDAS E BALANÇAS DE MEDIDA
1.4 AMOSTRAGEM E INFERÊNCIA ESTATÍSTICA
1.5 O MÉTODO CIENTÍFICO E O DESENHO DE EXPERIMENTOS
1.6 COMPUTADORES E ANÁLISE BIOSSTATÍSTICA
1.7 RESUMO
RESULTADOS DE APRENDIZAGEM
Depois de estudar este capítulo, o aluno irá: 1. compreender

os conceitos básicos e a terminologia da bioestatística, incluindo os vários tipos de variáveis, medições e escalas
de medição. 2. ser capaz de selecionar uma amostra aleatória simples e outras amostras científicas de uma
população de sujeitos. 3. entender os processos envolvidos no método científico e no design de
experimentos.
4. apreciar as vantagens do uso de computadores na análise estatística de dados gerados por estudos e
experimentos realizados por pesquisadores das ciências da saúde.
1
2 CAPÍTULO 1 INTRODUÇÃO À BIOSTATÍSTICA
1.1 INTRODUÇÃO
Frequentemente somos lembrados do fato de que estamos vivendo na era da informação.

Apropriadamente, então, este livro trata da informação - como ela é obtida, como é analisada e
como é interpretada. As informações sobre as quais nos preocupamos chamamos de dados, e os
dados estão disponíveis para nós na forma de números.
Os objetivos deste livro são duplos: (1) ensinar o aluno a organizar e resumir dados e (2)
ensinar o aluno a tomar decisões sobre um grande conjunto de dados examinando apenas uma
pequena parte dele. Os conceitos e métodos necessários para atingir o primeiro objetivo são
apresentados sob o título de estatística descritiva, e o segundo objetivo é alcançado através do
estudo do que se chama de estatística inferencial.
Este capítulo discute estatísticas descritivas. Os capítulos 2 a 5 discutem tópicos que formam a
base da inferência estatística, e a maior parte do restante do livro trata de estatística inferencial.
Como este volume é destinado a pessoas que se preparam ou já seguem uma carreira na
área da saúde, o material ilustrativo e os exercícios refletem os problemas e atividades que essas
pessoas provavelmente encontrarão no desempenho de suas funções.
1.2 ALGUNS CONCEITOS BÁSICOS
Como todos os campos de aprendizagem, a estatística tem seu próprio vocabulário. Algumas das
palavras e frases encontradas no estudo da estatística serão novas para aqueles que não foram
previamente expostos ao assunto. Outros termos, embora pareçam familiares, podem ter
significados especializados diferentes dos significados que estamos acostumados a associar a esses termos.
A seguir estão alguns termos que usaremos extensivamente neste livro.
Dados A matéria-prima das estatísticas são os dados. Para nossos propósitos, podemos definir
dados como números. Os dois tipos de números que usamos em estatística são os que resultam
da tomada - no sentido usual do termo - de uma medição e os que resultam do processo de
contagem. Por exemplo, quando uma enfermeira pesa um paciente ou mede a temperatura de um
paciente, obtém-se uma medida que consiste em um número como 150 libras ou 100 graus
Fahrenheit. Um tipo bem diferente de número é obtido quando um administrador hospitalar conta
o número de pacientes - talvez 20 - que receberam alta do hospital em um determinado dia. Cada
um dos três números é um dado, e os três juntos são dados.
Estatísticas O significado das estatísticas está implícito na seção anterior. Mais concretamente, no
entanto, podemos dizer que a estatística é um campo de estudo preocupado com (1) a coleta,
organização, resumo e análise de dados; e (2) o desenho de inferências sobre um corpo de dados
quando apenas uma parte dos dados é observada.
A pessoa que realiza essas atividades estatísticas deve estar preparada para interpretar e
comunicar os resultados a outra pessoa conforme a situação exigir. Simplificando, podemos dizer
que os dados são números, os números contêm informações e o objetivo das estatísticas é
investigar e avaliar a natureza e o significado dessas informações.
1.2 ALGUNS CONCEITOS BÁSICOS 3
Fontes de dados A realização de atividades estatísticas é motivada pela necessidade de responder a

uma pergunta. Por exemplo, os médicos podem querer respostas a perguntas sobre os méritos relativos
de procedimentos de tratamento concorrentes. Os administradores podem querer respostas a perguntas
relacionadas a áreas de preocupação como o moral dos funcionários ou a utilização das instalações.
Quando determinamos que a abordagem apropriada para buscar uma resposta a uma pergunta exigirá
o uso de estatísticas, começamos a procurar dados adequados para servir como matéria-prima para
nossa investigação. Esses dados geralmente estão disponíveis em uma ou mais das seguintes fontes:
1. Registros mantidos rotineiramente. É difícil imaginar qualquer tipo de organização que não
mantenha registros das transações diárias de suas atividades. Os registros médicos do hospital,
por exemplo, contêm imensas quantidades de informações sobre os pacientes, enquanto os
registros contábeis do hospital contêm uma riqueza de dados sobre as atividades comerciais da
instalação. Quando surge a necessidade de dados, devemos procurá-los primeiro entre os
registros mantidos rotineiramente.
2. Pesquisas. Se os dados necessários para responder a uma pergunta não estiverem disponíveis
nos registros mantidos rotineiramente, a fonte lógica pode ser uma pesquisa. Suponha, por
exemplo, que o administrador de uma clínica deseja obter informações sobre o meio de
transporte utilizado pelos pacientes para visitar a clínica. Se os formulários de admissão não
contiverem uma pergunta sobre o meio de transporte, podemos realizar uma pesquisa entre os
pacientes para obter essa informação.
3. Experimentos. Freqüentemente, os dados necessários para responder a uma pergunta estão

disponíveis apenas como resultado de um experimento. Uma enfermeira pode querer saber qual
das várias estratégias é a melhor para maximizar a adesão do paciente. A enfermeira pode
conduzir um experimento no qual as diferentes estratégias de motivação de adesão são tentadas
com diferentes pacientes. A avaliação subseqüente das respostas às diferentes estratégias pode
permitir que a enfermeira decida qual é a mais eficaz.
4. Fontes externas. Os dados necessários para responder a uma pergunta podem já existir na forma
de relatórios publicados, bancos de dados disponíveis comercialmente ou literatura de pesquisa.
Em outras palavras, podemos descobrir que outra pessoa já fez a mesma pergunta, e a resposta
obtida pode ser aplicável à nossa situação atual.
Bioestatística As ferramentas da estatística são empregadas em muitos campos — negócios, educação,

psicologia, agricultura e economia, para mencionar apenas alguns. Quando os dados analisados são
derivados das ciências biológicas e da medicina, usamos o termo bioestatística para distinguir essa
aplicação específica de ferramentas e conceitos estatísticos. Esta área de aplicação é o assunto deste
livro.
Variável Se, ao observarmos uma característica, descobrimos que ela assume diferentes valores em
diferentes pessoas, lugares ou coisas, rotulamos a característica de variável. Fazemos isso pela
simples razão de que a característica não é a mesma quando observada em diferentes possuidores
dela. Alguns exemplos de variáveis incluem pressão arterial diastólica, frequência cardíaca, altura de
homens adultos, peso de crianças em idade pré-escolar e idade de pacientes atendidos em uma clínica
odontológica.
Variáveis quantitativas Uma variável quantitativa é aquela que pode ser medida no sentido usual.
Podemos, por exemplo, obter medidas de altura de homens adultos, peso de crianças em idade
pré-escolar e idade de pacientes atendidos em uma clínica odontológica. Esses são exemplos de
variáveis quantitativas. Medições feitas em variáveis quantitativas transmitem informações sobre
quantidade.
Variáveis Qualitativas Algumas características não são mensuráveis no sentido em que se medem
altura, peso e idade. Muitas características podem ser categorizadas apenas, como, por exemplo,
quando uma pessoa doente recebe um diagnóstico médico, uma pessoa é designada como
pertencente a um grupo étnico, ou uma pessoa, lugar ou objeto é dito possuir ou não possuir
alguma característica de interesse. Nesses casos, medir consiste em categorizar. Referimo-nos a
variáveis desse tipo como variáveis qualitativas. Medições feitas em variáveis qualitativas transmitem
informações sobre atributos.
Embora, no caso de variáveis qualitativas, a medição no sentido usual da palavra não seja
alcançada, podemos contar o número de pessoas, lugares ou coisas pertencentes a várias
categorias. Um administrador hospitalar, por exemplo, pode contar o número de pacientes admitidos
durante um dia em cada um dos vários diagnósticos de internação. Essas contagens, ou frequências
como são chamadas, são os números que manipulamos quando nossa análise envolve variáveis
qualitativas.
Variável Aleatória Sempre que determinamos a altura, o peso ou a idade de um indivíduo, o

resultado é frequentemente referido como um valor da respectiva variável.
Quando os valores obtidos surgem como resultado de fatores aleatórios, de modo que não podem
ser previstos com exatidão e antecedência, a variável é chamada de variável aleatória. Um exemplo
de variável aleatória é a altura do adulto. Quando uma criança nasce, não podemos prever
exatamente sua altura na maturidade. A altura adulta alcançada é o resultado de numerosos fatores
genéticos e ambientais. Os valores resultantes dos procedimentos de medição são muitas vezes
referidos como observações ou medições.
Variável Aleatória Discreta As variáveis podem ser caracterizadas adicionalmente quanto ao fato
de serem discretas ou contínuas. Como definições matematicamente rigorosas de variáveis
discretas e contínuas estão além do nível deste livro, oferecemos, em vez disso, definições não
rigorosas e damos um exemplo de cada uma.
Uma variável discreta é caracterizada por lacunas ou interrupções nos valores que ela pode
assumir. Essas lacunas ou interrupções indicam a ausência de valores entre determinados valores
que a variável pode assumir. Alguns exemplos ilustram o ponto. O número de internações diárias
em um hospital geral é uma variável aleatória discreta, pois o número de internações por dia deve
ser representado por um número inteiro, como 0, 1, 2 ou 3. O número de internações em um
determinado dia não pode ser um número como 1,5, 2,997 ou 3,333. O número de dentes cariados,
perdidos ou obturados por criança em uma escola primária é outro exemplo de variável discreta.
Variável Aleatória Contínua Uma variável aleatória contínua não possui as lacunas ou interrupções
características de uma variável aleatória discreta. Uma variável aleatória contínua pode assumir
qualquer valor dentro de um intervalo relevante especificado
1.3 MEDIDA E ESCALAS DE MEDIDA 5
de valores assumidos pela variável. Exemplos de variáveis contínuas incluem as várias medidas que
podem ser feitas em indivíduos, como altura, peso e circunferência do crânio. Não importa quão
próximas sejam as alturas observadas de duas pessoas, por exemplo, podemos, teoricamente,
encontrar outra pessoa cuja altura esteja em algum lugar intermediário.
Devido às limitações dos instrumentos de medição disponíveis, no entanto, as observações

sobre variáveis que são inerentemente contínuas são registradas como se fossem discretas.
A altura, por exemplo, geralmente é registrada com precisão de um quarto, meia ou polegada inteira,
ao passo que, com um dispositivo de medição perfeito, essa medição pode ser feita com a precisão
desejada.
População A pessoa comum pensa em uma população como uma coleção de entidades, geralmente
pessoas. Uma população ou coleção de entidades pode, no entanto, consistir de animais, máquinas,
lugares ou células. Para nossos propósitos, definimos uma população de entidades como a maior
coleção de entidades pelas quais temos interesse em um determinado momento. Se fizermos uma
medição de alguma variável em cada uma das entidades em uma população, geramos uma população
de valores dessa variável. Podemos, portanto, definir uma população de valores como a maior coleção
de valores de uma variável aleatória pela qual temos interesse em um determinado momento. Se, por
exemplo, estivermos interessados nos pesos de todas as crianças matriculadas em um determinado
sistema de ensino fundamental do município, nossa população consiste em todos esses pesos.
Se nosso interesse reside apenas nos pesos dos alunos da primeira série do sistema, temos uma
população diferente – pesos dos alunos da primeira série matriculados no sistema escolar. Portanto, as
populações são determinadas ou definidas por nossa esfera de interesse. As populações podem ser
finitas ou infinitas. Se uma população de valores consiste em um número fixo desses valores, diz-se
que a população é finita. Se, por outro lado, uma população consiste em uma sucessão infinita de
valores, a população é infinita.
Amostra Uma amostra pode ser definida simplesmente como parte de uma população. Suponha que
nossa população consista nos pesos de todas as crianças do ensino fundamental matriculadas em um
determinado sistema escolar municipal. Se coletarmos para análise os pesos de apenas uma fração
dessas crianças, teremos apenas uma parte de nossa população de pesos, ou seja, teremos uma amostra.
1.3 MEDIDAS E BALANÇAS DE

MEDIDA
Na discussão anterior, usamos a palavra medição várias vezes em seu sentido usual e, presumivelmente,
o leitor entendeu claramente o significado pretendido. A palavra medição, no entanto, pode receber
uma definição mais científica. Na verdade, existe todo um corpo de literatura científica dedicado ao
assunto da medição. Parte dessa literatura preocupa-se também com a natureza dos números que
resultam das medições. As autoridades em matéria de medição falam de escalas de medição que
resultam na categorização das medições de acordo com a sua natureza. Nesta seção, definimos
medição e as quatro escalas de medição resultantes. Uma discussão mais detalhada do assunto pode
ser encontrada nos escritos de Stevens (1,2).
Medição Isso pode ser definido como a atribuição de números a objetos ou eventos de acordo com
um conjunto de regras. As várias escalas de medição resultam do fato de que a medição pode ser
realizada sob diferentes conjuntos de regras.
A escala nominal A escala de medição mais baixa é a escala nominal. Como o nome indica, consiste
em “nomear” observações ou classificá-las em várias categorias mutuamente exclusivas e coletivamente
exaustivas. A prática de usar números para distinguir entre os vários diagnósticos médicos constitui
medida em escala nominal. Outros exemplos incluem dicotomias como homem-mulher, bem-doente,
menos de 65 anos de idade-65 anos ou mais, criança-adulto e casado-não casado.
A escala ordinal Sempre que as observações não são apenas diferentes de categoria para categoria,
mas podem ser classificadas de acordo com algum critério, diz-se que elas são medidas em uma
escala ordinal. Os pacientes convalescentes podem ser caracterizados como não melhorados,
melhorados e muito melhorados. Os indivíduos podem ser classificados de acordo com o nível
socioeconômico em baixo, médio ou alto. A inteligência das crianças pode estar acima da média, na
média ou abaixo da média. Em cada um desses exemplos, os membros de qualquer categoria são
todos considerados iguais, mas os membros de uma categoria são considerados inferiores, piores ou
menores do que os de outra categoria, que por sua vez mantém uma relação semelhante com outra
categoria. Por exemplo, um paciente muito melhorado está em melhor estado de saúde do que um
classificado como melhorado, enquanto um paciente que melhorou está em melhores condições do
que aquele que não melhorou. Geralmente é impossível inferir que a diferença entre os membros de
uma categoria e a próxima categoria adjacente é igual à diferença entre os membros dessa categoria
e os membros da próxima categoria adjacente a ela. O grau de melhoria entre não melhorado e
melhorado provavelmente não é o mesmo que entre melhorado e muito melhorado. A implicação é
que, se uma divisão mais refinada fosse feita, resultando em mais categorias, essas também poderiam
ser ordenadas de maneira semelhante. A função dos números atribuídos aos dados ordinais é ordenar
(ou classificar) as observações do menor para o maior e, portanto, o termo ordinal.
A escala de intervalo A escala de intervalo é uma escala mais sofisticada do que a nominal ou ordinal,
pois com essa escala não só é possível ordenar medições, mas também a distância entre quaisquer
duas medições é conhecida. Sabemos, digamos, que a diferença entre uma medida de 20 e uma
medida de 30 é igual à diferença entre as medidas de 30 e 40. A capacidade de fazer isso implica o
uso de uma unidade de distância e um ponto zero, ambos arbitrários. O ponto zero selecionado não é
necessariamente um zero verdadeiro, pois não precisa indicar uma ausência total da quantidade sendo
medida. Talvez o melhor exemplo de uma escala intervalar seja fornecido pela maneira como a
temperatura é geralmente medida (graus Fahrenheit ou Celsius). A unidade de medida é o grau, e o
ponto de comparação é o “zero grau” escolhido arbitrariamente, o que não indica falta de calor. A
escala de intervalo, ao contrário das escalas nominal e ordinal, é uma escala verdadeiramente
quantitativa.
A escala de proporção O nível mais alto de medição é a escala de proporção. Essa escala é
caracterizada pelo fato de que tanto a igualdade de proporções quanto a igualdade de intervalos
podem ser determinadas. Fundamental para a escala de proporção é um verdadeiro ponto zero. A
medição de características familiares como altura, peso e comprimento faz uso da escala de proporção.
1.4 AMOSTRAGEM E INFERÊNCIA ESTATÍSTICA 7
1.4 AMOSTRAGEM E
INFERÊNCIA ESTATÍSTICA
Conforme observado anteriormente, um dos propósitos deste livro é ensinar os conceitos de inferência estatística,
que podemos definir da seguinte forma:
DEFINIÇÃO
A inferência estatística é o procedimento pelo qual chegamos a uma conclusão sobre uma
população com base nas informações contidas em uma amostra extraída dessa população.
Existem muitos tipos de amostras que podem ser retiradas de uma população. Nem todo tipo de amostra,
no entanto, pode ser usado como base para fazer inferências válidas sobre uma população. Em geral, para fazer
uma inferência válida sobre uma população, precisamos de uma amostra científica da população. Existem
também muitos tipos de amostras científicas que podem ser retiradas de uma população. A mais simples delas é
a amostra aleatória simples. Nesta seção, definimos uma amostra aleatória simples e mostramos como extrair
uma de uma população.
Se usarmos a letra N para designar o tamanho de uma população finita e a letra n para
designar o tamanho de uma amostra, podemos definir uma amostra aleatória simples como segue:
DEFINIÇÃO
Se uma amostra de tamanho n for extraída de uma população de tamanho N de tal forma que
toda amostra possível de tamanho n tenha a mesma chance de ser selecionada, a amostra é
chamada de amostra aleatória simples.
A mecânica de extrair uma amostra para satisfazer a definição de um aleatório simples

amostra é chamada de amostragem aleatória simples.
Demonstraremos o procedimento de amostragem aleatória simples em breve, mas primeiro vamos
considerar o problema de amostrar com reposição ou sem reposição. Quando a amostragem com reposição é
empregada, cada membro da população está disponível em cada sorteio. Por exemplo, suponha que estamos
extraindo uma amostra de uma população de ex-pacientes de hospital como parte de um estudo de tempo de
internação. Suponhamos que a amostragem envolva a seleção, nas prateleiras do departamento de prontuários,
de uma amostra de prontuários de pacientes que receberam alta. Na amostragem com reposição faríamos o
seguinte: selecionar um prontuário para compor a amostra, anotar o tempo de permanência e devolver o prontuário
à estante. A ficha está de volta na “população” e poderá ser sorteada novamente em algum sorteio subseqüente,
caso em que o tempo de permanência será novamente registrado. Na amostragem sem reposição, não
devolveríamos um gráfico desenhado à estante após registrar o tempo de permanência, mas o deixaríamos de
lado até que toda a amostra fosse coletada. Seguindo esse procedimento, um determinado gráfico poderia
aparecer na amostra apenas uma vez. Via de regra, na prática, a amostragem é sempre feita sem reposição. O
significado e as consequências disso serão explicados mais tarde, mas primeiro vamos ver como alguém
seleciona uma amostra aleatória simples. Para garantir a verdadeira aleatoriedade da seleção, precisaremos
seguir algum procedimento objetivo. Com certeza vamos querer evitar
usando nosso próprio julgamento para decidir quais membros da população constituem uma
amostra aleatória. O exemplo a seguir ilustra um método de seleção de uma amostra aleatória
simples de uma população.
EXEMPLO 1.4.1
Ouro e outros. (A-1) estudou a eficácia na cessação do tabagismo de bupropiona SR, um adesivo
de nicotina ou ambos, quando coadministrados com terapia cognitivo-comportamental. Pacientes
consentidos consecutivos se atribuíram a um dos três tratamentos. Para fins ilustrativos, vamos
considerar todos esses sujeitos como uma população de tamanho N ¼ 189. Desejamos selecionar
uma amostra aleatória simples de tamanho 10 dessa população cujas idades são mostradas na
Tabela 1.4.1.
TABELA 1.4.1 Idades de 189 indivíduos que participaram de um estudo sobre cessação do tabagismo
Sujeito nº Idade Sujeito Nº Idade Sujeito Nº Idade Sujeito Nº Idade
1 48 49 38 97 51 145 52
2 35 50 44 98 50 146 53
3 46 51 43 99 50 147 61
4 44 52 47 100 55 148 60
5 43 53 46 101 63 149 53
6 42 54 57 102 50 150 53
7 39 55 52 103 59 151 50
8 44 56 54 104 54 152 53
9 49 57 56 105 60 153 54
10 49 58 53 106 50 154 61
11 44 59 64 107 56 155 61
12 39 60 53 108 68 156 61
13 38 61 58 109 66 157 64
14 49 62 54 110 71 158 53
15 49 63 59 111 82 159 53
16 53 64 56 112 68 160 54
17 56 65 62 113 78 161 61
18 57 66 50 114 66 162 60
19 51 67 64 115 70 163 51
20 61 68 53 116 66 164 50
21 53 69 61 117 78 165 53
22 66 70 53 118 69 166 64
23 71 71 62 119 71 167 64
24 75 72 57 120 69 168 53
25 72 73 52 121 78 169 60
26 65 74 54 122 66 170 54
27 67 75 61 123 68 171 55
28 38 76 59 124 71 172 58
(Contínuo )
Sujeito No. Idade Sujeito No. Idade Sujeito Nº Idade Sujeito Nº Era
29 37 77 57 125 69 173 62
30 46 78 52 126 77 174 62
31 44 79 54 127 76 175 54
32 44 80 53 128 71 176 53
33 48 81 62 129 43 177 61
34 49 82 52 130 47 178 54
35 30 83 62 131 48 179 51
36 45 84 57 132 37 180 62
37 47 85 59 133 40 181 57
38 45 86 59 134 42 182 50
39 48 87 56 135 38 183 64
40 47 88 57 136 49 184 63
41 47 89 53 137 43 185 65
42 44 90 59 138 46 186 71
43 48 91 61 139 34 187 71
44 43 92 55 140 46 188 73
45 45 93 61 141 46 189 66
46 40 94 56 142 48
47 48 95 52 143 47
48 49 96 54 144 43
Fonte: Dados fornecidos por cortesia de Paul B. Gold, Ph.D.
Solução: Uma forma de selecionar uma amostra aleatória simples é usar uma tabela de números
aleatórios como a mostrada no Apêndice, Tabela A. Como primeiro passo,
localizamos um ponto inicial aleatório na tabela. Isso pode ser feito de várias
maneiras, uma das quais é desviar o olhar da página enquanto a toca com a ponta
de um lápis. O ponto de partida aleatório é o dígito mais próximo de onde o lápis
tocou a página. Vamos supor que seguir este procedimento levou a um ponto inicial
aleatório na Tabela A na interseção da linha 21 e coluna 28. O dígito neste ponto é
5. Como temos 189 valores para escolher, podemos usar apenas os números
aleatórios 1 a 189. Será conveniente escolher números de três dígitos para que os
números de 001 a 189 sejam os únicos elegíveis. O primeiro número de três dígitos,
começando em nosso ponto de partida aleatório, é 532, um número que não
podemos usar. O próximo número (descendo) é 196, que novamente não podemos
usar. Vamos passar de 196, 372, 654 e 928 até chegarmos a 137, um número que
podemos usar. A idade do 137º sujeito da Tabela 1.4.1 é 43, o primeiro valor em
nossa amostra. Registramos o número aleatório e a idade correspondente na Tabela
1.4.2. Registramos o número aleatório para acompanhar os números aleatórios
selecionados. Como queremos amostrar sem reposição, não queremos incluir a
idade do mesmo indivíduo duas vezes.
Procedendo da maneira que acabamos de descrever, chegamos aos nove números
aleatórios restantes e suas idades correspondentes mostradas na Tabela 1.4.2.
Observe que quando chegamos ao final da coluna, simplesmente passamos três dígitos
TABELA 1.4.2 Amostra de 10

idades extraídas das idades na
Tabela 1.4.1
Aleatório Amostra
Número Número do Indivíduo Idade
137 1 43
114 2 66
155 3 61
183 4 64
185 5 65
028 6 38
085 7 59
181 8 57
018 9 57
164 10 50
para 028 e continue subindo a coluna. Poderíamos ter começado de cima com o
número 369.
Assim, extraímos uma amostra aleatória simples de tamanho 10 de uma
população de tamanho 189. Em discussões futuras, sempre que o termo amostra
aleatória simples for usado, entender-se-á que a amostra foi extraída desta ou de uma
maneira equivalente. &
A discussão anterior sobre amostragem aleatória é apresentada devido ao papel importante

que o processo de amostragem desempenha no planejamento de estudos e experimentos de
pesquisa. A metodologia e os conceitos empregados nos processos de amostragem serão descritos
com mais detalhes na Seção 1.5.
DEFINIÇÃO
Um estudo de pesquisa é um estudo científico de um fenômeno de interesse.

Os estudos de pesquisa envolvem a elaboração de protocolos de amostragem,
coleta e análise de dados e fornecimento de conclusões válidas com base nos
resultados das análises.
DEFINIÇÃO
Os experimentos são um tipo especial de estudo de pesquisa no qual as observações

são feitas após a realização de manipulações específicas das condições; eles
fornecem a base para a pesquisa científica.
Apesar da tremenda importância da amostragem aleatória no planejamento de pesquisas e

experimentos, há algumas ocasiões em que a amostragem aleatória pode não ser o método mais
apropriado a ser usado. Consequentemente, outros métodos de amostragem devem ser considerados.
A intenção aqui não é fornecer uma revisão abrangente dos métodos de amostragem, mas
em vez disso, familiarizar o aluno com dois métodos adicionais de amostragem que são empregados nas
ciências da saúde, amostragem sistemática e amostragem aleatória estratificada. Os leitores interessados
devem consultar os livros de Thompson (3) e Levy e Lemeshow (4) para uma visão geral detalhada de vários
métodos de amostragem e explicações de como as estatísticas de amostra são calculadas quando esses
métodos são aplicados em estudos de pesquisa e experimentos.
Amostragem Sistemática Um método de amostragem amplamente utilizado na pesquisa em saúde é a

amostragem sistemática. Os registros médicos, que contêm dados brutos usados na pesquisa em saúde,
geralmente são armazenados em um sistema de arquivos ou em um computador e, portanto, são fáceis de
selecionar de maneira sistemática. Usando metodologia de amostragem sistemática, um pesquisador calcula
o número total de registros necessários para o estudo ou experimento em questão. Uma tabela de números
aleatórios é então empregada para selecionar um ponto inicial no sistema de arquivos. O registro localizado
neste ponto inicial é chamado de registro x. Um segundo número, determinado pelo número de registros
desejados, é selecionado para definir o intervalo de amostragem (chame esse intervalo de k).
Consequentemente, o conjunto de dados seria composto pelos registros x, x þ k, x þ 2k, x þ 3k, e assim por
diante, até que o número necessário de registros seja obtido.
EXEMPLO 1.4.2
Continuando com o estudo de Gold et al. (A-1) ilustrado no exemplo anterior, imagine que desejássemos uma
amostra sistemática de 10 sujeitos dentre os listados na Tabela 1.4.1.
Solução: Para obter um ponto de partida, usaremos novamente a Tabela A do Apêndice. Para fins de ilustração,
vamos assumir que o ponto de partida aleatório na Tabela A foi a interseção da linha 10 e da
coluna 30. O dígito é um 4 e servirá como nosso ponto de partida, x. Como estamos
começando no assunto 4, restam 185 assuntos restantes (ou seja, 189–4) para escolher.
Como desejamos selecionar 10 sujeitos, um método para definir o intervalo de amostra, k,
seria tomar 185/10 ¼ 18,5. Para garantir que haverá indivíduos suficientes, costuma-se
arredondar esse quociente para baixo e, portanto, arredondaremos o resultado para 18. A
amostra resultante é mostrada na Tabela 1.4.3.
TABELA 1.4.3 Amostra de 10 idades selecionadas usando uma amostra

sistemática das idades na Tabela 1.4.1
Número do Assunto Selecionado Sistematicamente Era
4 44
22 66
40 47
58 53
76 59
94 56
112 68
130 47
148 60
166 64
&
Amostragem Aleatória Estratificada Uma situação comum que pode ser encontrada em uma população
em estudo é aquela em que as unidades amostrais ocorrem juntas de forma agrupada. Ocasionalmente,
quando as unidades amostrais não são inerentemente agrupadas, pode ser possível e desejável agrupá-
las para fins de amostragem. Em outras palavras, pode ser desejável dividir uma população de interesse
em grupos, ou estratos, nos quais as unidades amostrais dentro de um determinado estrato sejam mais
semelhantes entre si do que com as unidades amostrais que compõem os outros estratos. Após a
estratificação da população, costuma-se obter uma amostra aleatória independentemente de cada estrato.
Essa técnica é chamada de amostragem aleatória estratificada. A amostra resultante é chamada de
amostra aleatória estratificada. Embora os benefícios da amostragem aleatória estratificada possam não
ser prontamente observáveis, é mais comum que amostras aleatórias coletadas dentro de um estrato
tenham muito menos variabilidade do que uma amostra aleatória coletada em todos os estratos. Isso
ocorre porque as unidades amostrais dentro de cada estrato tendem a ter características semelhantes.
EXEMPLO 1.4.3
Os centros de trauma hospitalar recebem classificações dependendo de suas capacidades para tratar
vários traumas. Neste sistema, um centro de trauma de nível 1 é o nível mais alto de atendimento ao
trauma disponível e um centro de trauma de nível 4 é o nível mais baixo de atendimento ao trauma
disponível. Imagine que estamos interessados em estimar a taxa de sobrevivência de vítimas de trauma
atendidas em hospitais de uma grande área metropolitana. Suponha que a área metropolitana tenha um
centro de trauma de nível 1, nível 2 e nível 3. Desejamos coletar amostras de pacientes desses centros
de trauma de forma que o tamanho total da amostra seja 30.
Solução: Assumimos que as taxas de sobrevivência dos pacientes podem depender significativamente
do trauma que sofreram e, portanto, do nível de cuidado que recebem. Assim, uma
amostra aleatória simples de todos os pacientes traumatizados, sem considerar o centro
em que foram atendidos, pode não representar taxas reais de sobrevida, uma vez que os
pacientes recebem atendimento diferenciado nos diversos centros de trauma. Uma
maneira de estimar melhor a taxa de sobrevivência é tratar cada centro de trauma como
um estrato e, em seguida, selecionar aleatoriamente 10 prontuários de pacientes de cada
um dos três centros. Esse procedimento baseia-se no fato de suspeitarmos que as taxas
de sobrevivência dentro dos centros de trauma são menos variáveis do que as taxas de
sobrevivência entre os centros de trauma. Portanto, acreditamos que a amostra aleatória
estratificada fornece uma melhor representação da sobrevivência do que uma amostra
tomada sem levar em consideração as diferenças dentro dos estratos. &
Deve-se notar que duas pequenas modificações da técnica de amostragem estratificada são
freqüentemente empregadas. Para ilustrar, considere novamente o exemplo do centro de trauma. Em
primeiro lugar, uma amostra sistemática de prontuários poderia ter sido selecionada de cada centro de
trauma (estrato). Essa amostra é chamada de amostra sistemática estratificada.
A segunda modificação da amostragem estratificada envolve a seleção da amostra de um
determinado estrato de tal forma que o número de unidades amostrais selecionadas desse estrato seja
proporcional ao tamanho da população desse estrato. Suponha que, em nosso exemplo de centro de
trauma, o centro de trauma de nível 1 tratou 100 pacientes e os centros de trauma de nível 2 e 3 trataram
apenas 10 cada. Nesse caso, selecionar uma amostra aleatória de 10 de
1.5 O MÉTODO CIENTÍFICO E O DESENHO DE EXPERIMENTOS 13
cada centro de trauma super-representa os centros de trauma com cargas de pacientes menores. Para
evitar esse problema, ajustamos o tamanho da amostra retirada de um estrato para que seja proporcional
ao tamanho da população do estrato. Esse tipo de amostragem é chamado de amostragem estratificada
proporcional ao tamanho. As amostras dentro do estrato podem ser aleatórias ou sistemáticas, conforme
descrito acima.
EXERCÍCIOS
1.4.1 Usando a tabela de números aleatórios, selecione um novo ponto de partida aleatório e extraia outra amostra
aleatória simples de tamanho 10 a partir dos dados da Tabela 1.4.1. Registre as idades dos sujeitos nesta nova
amostra. Salve seus dados para uso futuro. Qual é a variável de interesse neste exercício? Que escala de medida
foi usada para obter as medidas?
1.4.2 Selecione outra amostra aleatória simples de tamanho 10 da população representada na Tabela 1.4.1.
Compare os sujeitos neste exemplo com aqueles no exemplo desenhado no Exercício 1.4.1. Há algum sujeito
que apareceu em ambas as amostras? Quantos? Compare as idades dos sujeitos nas duas amostras. Quantas
idades na primeira amostra foram duplicadas na segunda amostra?
1.4.3 Usando a tabela de números aleatórios, selecione uma amostra aleatória e uma amostra sistemática, cada uma de
tamanho 15, a partir dos dados da Tabela 1.4.1. Compare visualmente as distribuições das duas amostras. Eles
parecem semelhantes? Qual parece ser a melhor representação dos dados?
1.4.4 Construir um exemplo onde seria apropriado usar amostragem estratificada. Discuta como você usaria amostragem
aleatória estratificada e amostragem estratificada proporcional ao tamanho com este exemplo.
Qual você acha que representaria melhor a população que você descreveu em seu exemplo? Porque?
1.5 O MÉTODO CIENTÍFICO E O DESENHO

DE EXPERIMENTOS
Análises de dados usando uma ampla gama de métodos estatísticos desempenham um papel
significativo em estudos científicos. A seção anterior destacou a importância de obter amostras de
maneira científica. Técnicas de amostragem apropriadas aumentam a probabilidade de que os
resultados das análises estatísticas de um conjunto de dados forneçam resultados válidos e cientificamente defens
Devido à importância da coleta adequada de dados para apoiar a descoberta científica, é necessário
considerar o fundamento de tal descoberta – o método científico – e explorar o papel da estatística no
contexto desse método.
DEFINIÇÃO
O método científico é um processo pelo qual a informação científica é coletada,

analisada e relatada a fim de produzir resultados imparciais e replicáveis em um
esforço para fornecer uma representação precisa dos fenômenos observáveis.
O método científico é reconhecido universalmente como a única forma verdadeiramente aceitável

de produzir uma nova compreensão científica do mundo que nos rodeia. Baseia-se numa abordagem
empírica, em que as decisões e os resultados são baseados em dados. Existem vários elementos-chave
associados ao método científico, e os conceitos e técnicas da estatística desempenham um papel

de destaque em todos esses elementos.
Fazendo uma Observação Primeiro, uma observação é feita de um fenômeno ou um grupo de

fenômenos. Essa observação leva à formulação de perguntas ou incertezas que podem ser
respondidas de forma cientificamente rigorosa. Por exemplo, é facilmente observável que o
exercício regular reduz o peso corporal em muitas pessoas. Também é facilmente observável que
mudar a dieta pode ter um efeito semelhante. Nesse caso, há dois fenômenos observáveis,
exercício regular e mudança na dieta, que têm o mesmo ponto final.
A natureza deste ponto final pode ser determinada pelo uso do método científico.
Formulando uma hipótese Na segunda etapa do método científico, uma hipótese é formulada
para explicar a observação e fazer previsões quantitativas de novas observações. Frequentemente,
as hipóteses são geradas como resultado de uma extensa pesquisa de antecedentes e revisões
da literatura. O objetivo é produzir hipóteses cientificamente sólidas. As hipóteses podem ser
declaradas como hipóteses de pesquisa ou hipóteses estatísticas. Definições explícitas desses
termos são dadas no Capítulo 7, que discute a ciência de testar hipóteses. Por enquanto, basta
dizer que uma hipótese de pesquisa a partir do exemplo de perda de peso seria uma afirmação
como: “O exercício parece reduzir o peso corporal”. Certamente não há nada de incorreto nessa
conjectura, mas falta uma base verdadeiramente quantitativa para testá-la. Uma hipótese
estatística pode ser formulada usando a terminologia quantitativa da seguinte forma: “A perda
média (média) de peso corporal de pessoas que se exercitam é maior do que a perda média
(média) de peso corporal de pessoas que não se exercitam”. Nesta afirmação, uma medida
quantitativa, o valor “médio” ou “médio”, é hipoteticamente maior na amostra de pacientes que se
exercitam. O papel do estatístico nesta etapa do método científico é formular a hipótese de forma
que conclusões válidas possam ser tiradas e interpretar corretamente os resultados de tais
conclusões.
Projetando um experimento A terceira etapa do método científico envolve projetar um experimento

que produzirá os dados necessários para testar validamente uma hipótese estatística apropriada.
Esta etapa do método científico, assim como a análise de dados, requer a perícia de um
estatístico. Experimentos mal planejados são a principal causa de resultados inválidos e
conclusões injustificadas. Além disso, a maioria dos estudos que são contestados por especialistas
são contestados com base na adequação ou inadequação do projeto de pesquisa do estudo.
Aqueles que projetam adequadamente os experimentos de pesquisa fazem todos os

esforços para garantir que a medição do fenômeno de interesse seja exata e precisa. Precisão
refere-se à exatidão de uma medição. A precisão, por outro lado, refere-se à consistência de uma
medição. Deve-se notar que, nas ciências sociais, o termo validade às vezes é usado para
significar precisão e confiabilidade às vezes é usado para significar precisão.
No contexto do exemplo de perda de peso dado anteriormente, a balança usada para medir o
peso dos participantes do estudo seria precisa se a medição fosse validada usando uma balança
devidamente calibrada. Se, no entanto, a balança estiver errada em 3 libras, então o peso de
cada participante será 3 libras a mais; as medições seriam precisas, pois cada uma estaria errada
em þ3 libras, mas as medições não seriam precisas. Medições imprecisas ou imprecisas podem
invalidar os resultados da pesquisa.
1.6 COMPUTADORES E ANÁLISE BIOSSTATÍSTICA 15
O projeto de um experimento depende do tipo de dados que precisam ser coletados para testar uma
hipótese específica. Conforme discutido na Seção 1.2, os dados podem ser coletados ou disponibilizados por vários
meios. Para muitas pesquisas científicas, no entanto, o padrão para coleta de dados é a experimentação. Um
projeto experimental verdadeiro é aquele em que os sujeitos do estudo são designados aleatoriamente para um
grupo experimental (ou grupo de tratamento) e um grupo de controle que não é diretamente exposto a um
tratamento. Continuando com o exemplo de perda de peso, uma amostra de 100 participantes poderia ser
designada aleatoriamente para duas condições usando os métodos da Seção 1.4. Uma amostra de 50 dos
participantes seria designada para um programa de exercícios específico e os 50 restantes seriam monitorados,
mas solicitados a não se exercitar por um período de tempo específico. No final desta experiência, as perdas de
peso médias (médias) dos dois grupos podem ser comparadas. A razão pela qual os projetos experimentais são
desejáveis é que, se todos os outros fatores potenciais forem controlados, uma relação de causa-efeito pode ser
testada; isto é, tudo o mais sendo igual, poderíamos concluir ou deixar de concluir que o grupo experimental perdeu
peso como resultado do exercício.
A complexidade potencial dos projetos de pesquisa requer conhecimento estatístico, e o Capítulo 8 destaca
alguns projetos experimentais comumente usados. Para uma discussão mais aprofundada sobre projetos de
pesquisa, o leitor interessado pode consultar os textos de Kuehl (5), Keppel e Wickens (6) e Tabachnick e Fidell (7).
Conclusão Na execução de um estudo ou experimento de pesquisa, espera-se ter coletado os dados necessários
para tirar conclusões, com algum grau de confiança, sobre as hipóteses que foram colocadas como parte do
projeto. Muitas vezes, as hipóteses precisam ser modificadas e retestadas com novos dados e um design diferente.
Quaisquer que sejam as conclusões do processo científico, no entanto, os resultados raramente são considerados
conclusivos. Ou seja, os resultados precisam ser replicados, muitas vezes um grande número de vezes, antes que
a credibilidade científica seja concedida a eles.
EXERCÍCIOS
1.5.1 Usando o exemplo da perda de peso como ponto final, discuta como você usaria o método científico para testar
a observação de que a mudança na dieta está relacionada à perda de peso. Inclua todas as etapas, incluindo
a hipótese a ser testada e o projeto de seu experimento.
1.5.2 Continuando com o Exercício 1.5.1, considere como você usaria o método científico para testar a observação
de que tanto o exercício quanto a mudança na dieta estão relacionados à perda de peso. Inclua todas as
etapas, prestando atenção especial em como você pode planejar o experimento e quais hipóteses seriam
testáveis de acordo com o seu design.
1.6 COMPUTADORES E ANÁLISE

BIOSSTATÍSTICA
O uso generalizado de computadores teve um tremendo impacto na pesquisa em ciências da saúde em geral e na
análise bioestatística em particular. A necessidade de realizar cálculos aritméticos longos e tediosos como parte da
análise estatística de dados vive apenas no
memória daqueles pesquisadores e profissionais cujas carreiras antecedem a chamada revolução do

computador. Os computadores podem realizar mais cálculos com mais rapidez e precisão do que os
técnicos humanos. O uso de computadores permite que os investigadores dediquem mais tempo à
melhoria da qualidade dos dados brutos e à interpretação dos resultados.
A prevalência atual de microcomputadores e a abundância de programas de software estatístico

disponíveis revolucionaram ainda mais a computação estatística. O leitor em busca de um pacote de
software estatístico pode consultar The American Statistician, uma publicação trimestral da American
Statistical Association. Pacotes de software estatístico são regularmente revisados e anunciados no
periódico.
Os computadores atualmente no mercado estão equipados com recursos de geração de números
aleatórios. Como alternativa ao uso de tabelas impressas de números aleatórios, os investigadores
podem usar computadores para gerar os números aleatórios de que precisam. Na verdade, os números
“aleatórios” gerados pela maioria dos computadores são na realidade números pseudo-aleatórios porque
são o resultado de uma fórmula determinística. No entanto, como Fishman (8) aponta, os números
parecem servir satisfatoriamente para muitos propósitos práticos.
A utilidade do computador nas ciências da saúde não se limita à análise estatística. O leitor
interessado em aprender mais sobre o uso de computadores nas ciências da saúde encontrará os livros
de Hersh (4), Johns (5), Miller et al. (6), e Saba e McCormick (7) úteis. Aqueles que desejam obter o
máximo benefício da Internet podem consultar os livros Physicians' Guide to the Internet (13) e
Computers in Nursing's Nurses' Guide to the Internet (14). Os desenvolvimentos atuais no uso de
computadores em biologia, medicina e áreas afins são relatados em vários periódicos dedicados ao
assunto. Alguns desses periódicos são Computers in Biology and Medicine, Computers and Biomedical
Research, International Journal of Bio-Medical Computing, Computer Methods and Programs in
Biomedicine, Computer Applications in the Biosciences e Computers in Nursing.
Impressões de computador são usadas ao longo deste livro para ilustrar o uso de computadores
em análises bioestatísticas. Os pacotes de software estatístico MINITAB, SPSS, R e SAS® para o
computador pessoal foram usados para essa finalidade.
1.7 RESUMO
Neste capítulo apresentamos ao leitor os conceitos básicos de estatística. Definimos estatística como
uma área de estudo preocupada com a coleta e descrição de dados e com a realização de inferências
estatísticas. Definimos inferência estatística como o procedimento pelo qual chegamos a uma conclusão
sobre uma população com base nas informações contidas em uma amostra extraída dessa população.
Aprendemos que um tipo básico de amostra que nos permitirá fazer inferências válidas é a amostra
aleatória simples. Aprendemos como usar uma tabela de números aleatórios para extrair uma amostra
aleatória simples de uma população.
O leitor recebe as definições de alguns termos básicos, como variável e amostra, que são usados
no estudo da estatística. Também discutimos a medição e definimos quatro escalas de medição —
nominal, ordinal, intervalar e proporcional. o leitor é
QUESTÕES DE REVISÃO E EXERCÍCIOS 17
também introduziu o método científico e o papel da estatística e do estatístico neste processo.
Por fim, discutimos a importância dos computadores no desempenho do

atividades envolvidas em estatísticas.
PERGUNTAS DE REVISÃO E EXERCÍCIOS
1. Explique o que significa estatística descritiva.
2. Explique o que significa estatística inferencial.
3. Defina:
(a) Estatística (b) Bioestatística
(c) Variável (e) (d) Variável quantitativa (f)
Variável qualitativa (g) Variável aleatória (h)
População (i) População População finita (j) Amostra
infinita (k) Variável discreta (l) Variável contínua (n)
(m) Amostra aleatória Amostragem com reposição
simples (o) Amostragem sem
reposição
4. Defina a palavra medição.
5. Liste, descreva e compare as quatro escalas de medição.
6. Para cada uma das seguintes variáveis, indique se é quantitativa ou qualitativa e especifique a escala de medição
que é empregada ao fazer medições em cada uma: (a) Posição de classe dos membros desta classe em relação
uns aos outros (b) Admissão de diagnóstico de pacientes internados em uma clínica de saúde mental (c) Pesos
de bebês nascidos em um hospital durante um ano (d) Sexo de bebês nascidos em um hospital durante um ano
(e) Amplitude de movimento da articulação do cotovelo de estudantes matriculados em uma universidade de
saúde currículo de ciências (f) Temperatura axilar de bebês de um dia nascidos em um hospital
7. Para cada uma das seguintes situações, responda às perguntas de a a e:

(a) Qual é a amostra do estudo? (b) Qual é
a população? (c) Qual é a variável de
interesse? (d) Quantas medições foram
usadas no cálculo dos resultados relatados? (e) Que escala de medida foi usada?
Situação A. Um estudo de 300 famílias em uma pequena cidade do sul revelou que 20% tinham pelo menos uma
criança em idade escolar presente.
Situação B. Um estudo de 250 pacientes internados em um hospital durante o ano passado revelou que, em
média, os pacientes viviam a 15 milhas do hospital.
8. Considere as duas situações fornecidas no Exercício 7. Para a Situação A, descreva como você usaria uma amostra
aleatória estratificada para coletar os dados. Para a Situação B, descreva como você usaria amostragem
sistemática de registros de pacientes para coletar os dados.
REFERÊNCIAS
Referências Metodológicas
1. SS STEVENS, "Sobre a Teoria das Escalas de Medida", Science, 103 (1946), 677-680.
2. SS STEVENS, "Mathematics, Measurement and Psychophysics", em SS Stevens (ed.), Handbook of Experimental
Psicologia, Wiley, Nova York, 1951.
3. STEVEN K. THOMPSON, Sampling (2ª ed.), Wiley, Nova York, 2002.
4. PAUL S. LEVY e STANLEY LEMESHOW, Amostragem de Populações: Métodos e Aplicações (3ª ed.), Wiley,
Nova York, 1999.
5. ROBERT O. KUEHL, Statistical Principles of Research Design and Analysis (2ª ed.), Duxbury Press, Belmont, CA,
1999.
6. GEOFFREY KEPPEL e THOMAS D. WICKENS, Design and Analysis: A Researcher's Handbook (4ª ed.), Prentice
Hall, Upper Saddle River, NJ, 2004.
7. BARBARA G. TABACHNICK e LINDA S. FIDELL, Experimental Designs using ANOVA, Thomson, Belmont, CA, 2007.
8. GEORGE S. FISHMAN, Concepts and Methods in Discrete Event Digital Simulation, Wiley, Nova York, 1973.
9. WILLIAM R. HERSH, Information Retrieval: A Health Care Perspective, Springer, Nova York, 1996.
10. MERIDA L. JOHNS, Information Management for Health Professions, Delmar Publishers, Albany, NY, 1997.
11. MARVIN J. MILLER, KENRIC W. HAMMOND e MATTHEW G. HILE (eds.), Mental Health Computing, Springer,
Nova York, 1996.
12. VIRGINIA K. SABA e KATHLEEN A. MCCORMICK, Essentials of Computers for Nurses, McGraw-Hill, Nova York,
1996.
13. LEE HANCOCK, Physicians' Guide to the Internet, Lippincott Williams & Wilkins Publishers, Filadélfia, 1996.
14. LESLIE H. NICOLL e TEENA H. OUELLETTE, Computers in Nursing's Nurses' Guide to the Internet, 3ª ed.,
Lippincott Williams & Wilkins Publishers, Filadélfia, 2001.
Referências de aplicativos
A-1. PAUL B. GOLD, ROBERT N. RUBEY e RICHARD T. HARVEY, “Naturalistic, Self-Assignment Comparative Trial of
Bupropion SR, a Nicotine Patch, or Both for Smoking Cessation Treatment in Primary Care,” American Journal on
Addictions, 11 ( 2002), 315–331.
CAPÍTULO 2
ESTATÍSTICAS DESCRITIVAS
Este capítulo apresenta um conjunto de procedimentos básicos e medidas

estatísticas para descrever dados. Os dados geralmente consistem em um grande
número de medições ou observações que são muito numerosas ou complicadas
para serem compreendidas através da simples observação. Portanto, este capítulo
apresenta várias técnicas, incluindo a construção de tabelas, exibições gráficas e
cálculos estatísticos básicos que fornecem maneiras de condensar e organizar
informações em um conjunto de medidas descritivas e dispositivos visuais que
aprimoram a compreensão de dados complexos.
TÓPICOS
2.1 INTRODUÇÃO
2.2 A MATRIZ ORDENADA
2.3 DADOS GRUPOS: A DISTRIBUIÇÃO DE FREQUÊNCIA
2.4 ESTATÍSTICAS DESCRITIVAS: MEDIDAS DE TENDÊNCIA CENTRAL
2.5 ESTATÍSTICA DESCRITIVA: MEDIDAS DE DISPERSÃO
2.6 RESUMO
Depois de estudar este capítulo, o aluno 1. entenderá

como os dados podem ser organizados e exibidos adequadamente. 2. entender como reduzir
conjuntos de dados em algumas medidas úteis e descritivas. 3. ser capaz de calcular e interpretar medidas
de tendência central, como a média,
mediana e moda.
4. ser capaz de calcular e interpretar medidas de dispersão, tais como amplitude, variância e desvio padrão.
19
20 CAPÍTULO 2 ESTATÍSTICAS DESCRITIVAS
2.1 INTRODUÇÃO
No Capítulo 1, afirmamos que a realização de uma medição e o processo de contagem produzem números que
contêm informações. O objetivo de quem aplica as ferramentas da estatística a esses números é determinar a
natureza dessa informação. Essa tarefa fica muito mais fácil se os números forem organizados e resumidos.
Quando as medições de uma variável aleatória são feitas nas entidades de uma população ou amostra, os
valores resultantes são disponibilizados ao pesquisador ou estatístico como uma massa de dados não ordenados.
As medições que não foram organizadas, resumidas ou manipuladas de outra forma são chamadas de dados
brutos.
A menos que o número de observações seja extremamente pequeno, será improvável que esses dados brutos
forneçam muita informação até que tenham sido colocados em algum tipo de ordem.
Neste capítulo, aprendemos várias técnicas para organizar e resumir dados para que possamos
determinar com mais facilidade quais informações eles contêm. O máximo em sumarização de dados é o cálculo
de um único número que, de alguma forma, transmita informações importantes sobre os dados a partir dos
quais foi calculado. Esses números únicos usados para descrever dados são chamados de medidas descritivas.
Depois de estudar este capítulo, você será capaz de calcular várias medidas descritivas para populações e
amostras de dados.
O objetivo deste capítulo é equipá-lo com as habilidades que lhe permitirão manipular as informações —
na forma de números — que você encontra como profissional de ciências da saúde. Quanto melhor você for
capaz de manipular essas informações, melhor compreensão terá do ambiente e das forças que geram as
informações.
2.2 A MATRIZ ORDENADA
Uma primeira etapa na organização de dados é a preparação de uma matriz ordenada. Uma matriz ordenada é
uma listagem dos valores de uma coleção (população ou amostra) em ordem de grandeza, do menor valor ao
maior valor. Se o número de medições a serem solicitadas for de tamanho apreciável, o uso de um computador
para preparar a matriz ordenada é altamente desejável.
Uma matriz ordenada permite determinar rapidamente o valor da menor medição, o valor da maior
medição e outros fatos sobre os dados da matriz que podem ser necessários com pressa. Ilustramos a
construção de um array ordenado com os dados discutidos no Exemplo 1.4.1.
EXEMPLO 2.2.1
A Tabela 1.4.1 contém uma lista das idades dos indivíduos que participaram do estudo sobre cessação do
tabagismo discutido no Exemplo 1.4.1. Como pode ser visto, esta tabela não ordenada requer uma pesquisa
considerável para que possamos verificar informações elementares como a idade dos sujeitos mais jovens e
mais velhos.
Solução: A Tabela 2.2.1 apresenta os dados da Tabela 1.4.1 na forma de um array ordenado. Com referência à
Tabela 2.2.1, podemos determinar rapidamente a idade do sujeito mais jovem (30) e a idade
do sujeito mais velho (82). Também notamos prontamente que cerca de um terço dos indivíduos
tem 50 anos de idade ou menos.
2.2 A MATRIZ ORDENADA 21
TABELA 2.2.1 Matriz Ordenada de Idades dos Indivíduos da Tabela 1.4.1
30 34 35 37 37 38 38 38 38 39 39 40 40 42 42
43 43 43 43 43 43 44 44 44 44 44 44 44 45 45
45 46 46 46 46 46 46 47 47 47 47 47 47 48 48
48 48 48 48 48 49 49 49 49 49 49 49 50 50 50
50 50 50 50 50 51 51 51 51 52 52 52 52 52 52
53 53 53 53 53 53 53 53 53 53 53 53 53 53 53
53 53 54 54 54 54 54 54 54 54 54 54 54 55 55
55 56 56 56 56 56 56 57 57 57 57 57 57 57 58
58 59 59 59 59 59 59 60 60 60 60 61 61 61 61
61 61 61 61 61 61 61 62 62 62 62 62 62 62 63
63 64 64 64 64 64 64 65 65 66 66 66 66 66 66
67 68 68 68 69 69 69 70 71 71 71 71 71 71 71
72 73 75 76 77 78 78 78 82
&
Análise de computador Se cálculos adicionais e organização de um conjunto de dados tiverem que

ser feitos manualmente, o trabalho pode ser facilitado trabalhando a partir de uma matriz ordenada.
Se os dados forem analisados por um computador, pode ser indesejável preparar uma matriz
ordenada, a menos que seja necessária para fins de referência ou para algum outro uso. Um
computador não precisa que seu usuário primeiro construa uma matriz ordenada antes de inserir
dados para a construção de distribuições de frequência e a realização de outras análises. No
entanto, quase todos os pacotes estatísticos de computador e programas de planilhas contêm uma
rotina para classificar os dados em ordem crescente ou decrescente. Veja a Figura 2.2.1, por exemplo.
Caixa de diálogo: Comando de sessão:
Dados Ordenar MTB > Ordenar C1 C2; SUBC>

Por C1.
FIGURA 2.2.1 Caixa de diálogo do MINITAB para o Exemplo 2.2.1.

2.3 DADOS GRUPOS: A DISTRIBUIÇÃO DE

FREQUÊNCIA
Embora um conjunto de observações possa se tornar mais compreensível e significativo por meio de uma
matriz ordenada, um resumo útil adicional pode ser alcançado agrupando os dados. Antes da era dos
computadores, um dos principais objetivos ao agrupar grandes conjuntos de dados era facilitar o cálculo de
várias medidas descritivas, como porcentagens e médias. Como os computadores podem realizar esses
cálculos em grandes conjuntos de dados sem primeiro agrupar os dados, o principal objetivo do agrupamento
de dados agora é o resumo. Deve-se ter em mente que os dados contêm informações e que a sumarização é
uma forma de facilitar a determinação da natureza dessas informações. Deve-se também estar ciente de que
reduzir uma grande quantidade de informações para resumir os dados de forma sucinta traz consigo o
potencial de perder inadvertidamente alguma especificidade em relação ao conjunto de dados subjacente.
Portanto, é importante agrupar os dados suficientemente para que as vastas quantidades de informações
sejam reduzidas a resumos compreensíveis. Ao mesmo tempo, os dados devem ser resumidos na medida
em que as complexidades úteis dos dados não sejam facilmente óbvias.
Para agrupar um conjunto de observações, selecionamos um conjunto de intervalos contíguos e não

sobrepostos, de modo que cada valor no conjunto de observações possa ser colocado em um, e apenas um,
dos intervalos. Esses intervalos são geralmente referidos como intervalos de classe.
Uma das primeiras considerações quando os dados devem ser agrupados é quantos intervalos incluir.
Poucos intervalos são indesejáveis devido à perda de informações resultante. Por outro lado, se forem usados
muitos intervalos, o objetivo da sumarização não será alcançado. O melhor guia para isso, bem como para
outras decisões a serem tomadas no agrupamento de dados, é o seu conhecimento dos dados. Pode ser que
os intervalos de classe tenham sido determinados por precedentes, como no caso de tabulações anuais,
quando os intervalos de classe de anos anteriores são mantidos para fins comparativos. Uma regra prática
comumente seguida afirma que não deve haver menos de cinco intervalos e não mais de 15. Se houver
menos de cinco intervalos, os dados foram resumidos demais e as informações que eles contêm foram
perdidas. Se houver mais de 15 intervalos, os dados não foram resumidos o suficiente.
Aqueles que precisam de orientação mais específica na questão de decidir quantos intervalos de
classe empregar podem usar uma fórmula fornecida por Sturges (1). Esta fórmula dá k ¼ 1 þ 3:322 log ð Þ
10 n consideração.
onde k representa o número ,deconsiderada
intervalos Ade
como
resposta
classe
final,
en
obtida
mas
é o número
apenas
pela aplicação
de
como
valores
um
daguia.
regra
no conjunto
Ode
número
Sturges
de de
dados
não
intervalos
deve
em serde
classe especificados pela regra deve ser aumentado ou diminuído para conveniência e apresentação clara.
Suponhamos, por exemplo, que temos uma amostra de 275 observações que queremos agrupar. O
logaritmo para a base 10 de 275 é 2,4393. A aplicação da fórmula de Sturges dá k ¼ 1 þ 3:322 2ð Þ' :4393 9.
Na prática, outras consideraçõesclasse.
podem nos levar a usar oito ou menos ou talvez 10 ou mais intervalos de
Outra questão que deve ser decidida diz respeito à largura dos intervalos de classe. Os intervalos de
classe geralmente devem ter a mesma largura, embora isso às vezes seja impossível de conseguir. Essa
largura pode ser determinada dividindo o intervalo por k, o número de intervalos de classe. Simbolicamente,
a largura do intervalo de classe é dada por
R
w¼ (2.3.1)
k
2.3 DADOS GRUPOS: A DISTRIBUIÇÃO DE FREQUÊNCIA 23
onde R (o intervalo) é a diferença entre a menor e a maior observação no conjunto de dados e k é definido
como acima. Como regra, este procedimento produz uma largura que é inconveniente para o uso. Novamente,
podemos exercer nosso bom senso e selecionar uma largura (geralmente próxima àquela dada pela Equação
2.3.1) que seja mais conveniente.
Existem outras regras práticas que são úteis na configuração de intervalos de aula úteis.
Quando a natureza dos dados os torna apropriados, larguras de intervalo de classe de 5 unidades, 10 unidades
e larguras que são múltiplos de 10 tendem a tornar o resumo mais compreensível. Quando essas larguras são
empregadas, geralmente é uma boa prática ter o limite inferior de cada intervalo terminando em zero ou 5.
Normalmente, os intervalos de classe são ordenados do menor para o maior; ou seja, o primeiro intervalo de
classe contém as medições menores e o último intervalo de classe contém as medições maiores. Quando este
for o caso, o limite inferior do primeiro intervalo de classe deve ser igual ou menor que a menor medida no
conjunto de dados, e o limite superior do último intervalo de classe deve ser igual ou maior que a maior medida.
A maioria dos pacotes estatísticos permite que os usuários alterem interativamente o número de
intervalos de classe e/ou as larguras de classe, para que várias visualizações dos dados possam ser obtidas
rapidamente. Esse recurso permite que os usuários exercitem seu julgamento ao decidir qual exibição de dados
é mais apropriada para uma determinada finalidade. Vamos usar as 189 idades mostradas na Tabela 1.4.1 e
arranjadas na Tabela 2.2.1 para ilustrar a construção de uma distribuição de frequência.
EXEMPLO 2.3.1
Queremos saber quantos intervalos de classe devem existir na distribuição de frequência dos dados.
Também queremos saber qual deve ser a largura dos intervalos.
Solução: Para se ter uma ideia do número de intervalos de classe a serem usados, podemos aplicar
Regra de Sturges para obter
k ¼ 1 þ 3:322 log 189 ð Þ ¼

1 þ 3:322 2ð Þ :2764618 9
Agora vamos dividir o intervalo por 9 para ter uma ideia sobre a largura do intervalo de
classe. Nós temos
R 82 30 52
¼ ¼ ¼ 5:778
k 9 9
É evidente que uma largura de intervalo de classe de 5 ou 10 será mais conveniente

de usar, bem como mais significativa para o leitor. Suponha que decidamos por 10. Podemos
agora construir nossos intervalos. Como o menor valor na Tabela 2.2.1 é 30 e o maior valor é
82, podemos começar nossos intervalos com 30 e terminar com 89. Isso dá os seguintes
intervalos:
30–39
40–49
50–59
60–69
70–79
80–89
Vemos que há seis desses intervalos, três a menos do que o número sugerido pela regra de
Sturges.
Às vezes é útil referir-se ao centro, chamado ponto médio, de um intervalo de classe. O
ponto médio de um intervalo de classe é determinado obtendo a soma dos limites superior e
inferior do intervalo de classe e dividindo por 2.
Assim, por exemplo, o ponto médio do intervalo de classe 30–39 é ð Þ 30 þ 39 =2 ¼ 34:5. &
Quando agrupamos dados manualmente, determinar o número de valores que caem em cada intervalo
de classe é apenas uma questão de olhar para a matriz ordenada e contar o número de observações que caem
nos vários intervalos. Quando fazemos isso em nosso exemplo, temos a Tabela 2.3.1.
Uma tabela como a Tabela 2.3.1 é chamada de distribuição de frequência. Esta tabela mostra a maneira
como os valores da variável são distribuídos entre os intervalos de classe especificados.
Ao consultá-lo, podemos determinar a frequência de ocorrência dos valores dentro de qualquer um dos intervalos
de classes apresentados.
Frequências Relativas Às vezes, pode ser útil saber a proporção, em vez do número, de valores que caem
dentro de um determinado intervalo de classe. Obtemos esta informação dividindo o número de valores no
intervalo de classe particular pelo número total de valores. Se, no nosso exemplo, quisermos saber a proporção
de valores entre 50 e 59, inclusive, dividimos 70 por 189, obtendo 0,3704. Assim dizemos que 70 de 189, ou
70/189, ou 0,3704, dos valores estão entre 50 e 59. Multiplicando 0,3704 por 100 nos dá a porcentagem de
valores entre 50 e 59. Podemos dizer, então, que 37,04 por cento dos sujeitos têm entre 50 e 59 anos de idade.
Podemos nos referir à proporção de valores que caem dentro de um intervalo de classe como a frequência
relativa de ocorrência de valores nesse intervalo. Na Seção 3.2 veremos que uma frequência relativa pode ser
interpretada também como a probabilidade de ocorrência dentro de um dado intervalo. Essa probabilidade de
ocorrência também é chamada de probabilidade experimental ou probabilidade empírica.
TABELA 2.3.1 Distribuição de Frequência das

Idades de 189 Indivíduos Mostradas nas Tabelas 1.4.1 e
2.2.1
Intervalo de classe Frequência
30–39 11
40–49 46
50–59 70
60–69 45
70–79 16
80–89 1
Total 189
TABELA 2.3.2 Frequência, frequência cumulativa, frequência relativa e distribuições de frequência relativa
cumulativa das idades dos sujeitos descritos no exemplo 1.4.1
cumulativo
Classe cumulativo Relativo Relativo
Intervalo Frequência Frequência Frequência Frequência
30–39 11 11 0,0582 0,0582

40–49 46 57 .2434 .3016
50–59 70 127 .3704 0,6720
60–69 45 172 .2381 .9101
70–79 16 188 0,0847 .9948
80–89 1 189 0,0053 1.0001
Total 189 1.0001
Nota: As frequências não somam 1,0000 exatamente por causa do arredondamento.
Ao determinar a frequência de valores que caem dentro de dois ou mais intervalos de classe,
obtemos a soma do número de valores que caem dentro dos intervalos de classe de interesse.
Da mesma forma, se quisermos saber a frequência relativa de ocorrência de valores dentro de dois ou
mais intervalos de classe, adicionamos as respectivas frequências relativas. Podemos somar ou acumular
as frequências e frequências relativas para facilitar a obtenção de informações sobre a frequência ou
frequência relativa de valores dentro de dois ou mais intervalos de classe contíguos. A Tabela 2.3.2 mostra
os dados da Tabela 2.3.1 juntamente com as frequências cumulativas, as frequências relativas e as
frequências relativas cumulativas.
Suponha que estamos interessados na frequência relativa de valores entre 50 e 79.
Usamos a coluna de frequência relativa cumulativa da Tabela 2.3.2 e subtraímos 0,3016 de 0,9948,
obtendo 0,6932.
Podemos usar um pacote estatístico para obter uma tabela semelhante à mostrada na Tabela 2.3.2.
As tabelas obtidas dos softwares MINITAB e SPSS são mostradas na Figura 2.3.1.
O Histograma Podemos exibir uma distribuição de frequência (ou uma distribuição de frequência relativa)
graficamente na forma de um histograma, que é um tipo especial de gráfico de barras.
Quando construímos um histograma os valores da variável em consideração são representados
pelo eixo horizontal, enquanto o eixo vertical tem como escala a frequência (ou frequência relativa se
desejado) de ocorrência. Acima de cada intervalo de classe no eixo horizontal, uma barra retangular, ou
célula, como às vezes é chamada, é erguida de modo que a altura corresponda à respectiva frequência
quando os intervalos de classe têm a mesma largura. As células de um histograma devem ser unidas e,
para isso, devemos levar em consideração os verdadeiros limites dos intervalos de classe para evitar que
ocorram lacunas entre as células do nosso gráfico.
O nível de precisão observado nos dados relatados que são medidos em uma escala contínua
indica alguma ordem de arredondamento. A ordem de arredondamento reflete a preferência pessoal do
relator ou as limitações do instrumento de medida empregado. Quando uma distribuição de frequência é
construída a partir dos dados, os limites do intervalo de classe geralmente refletem o grau de precisão dos
dados brutos. Isso foi feito em nosso exemplo ilustrativo.
ob golaiD :x :dnammoc noisseS
Tabelas Estatísticas Registrar Variáveis Individuais MTB > Tally C2;

SUBC> Contagens;
Digite C2 em Variáveis. Verifique as contagens, SUBC> CumCounts;
porcentagens, contagens cumulativas e porcentagens SUBC> Porcentagens;
cumulativas em Exibição. Clique em OK. SUBC> CumPercents;
Saída:
Contagem para variáveis discretas: C2
ptuO BATINIM tu ptuO SSPS tu
C2 Count CumCnt Percent CumPct Válido Cumulativo
0 11 11 5,82 5,82 Frequência Percentual Percentual
1 46 57 24,34 30,16 Válido 30-39 11 5.8 5.8 5.8

2 70 127 37,04 67,20 40-49 46 24.3 24.3 30.2
3 45 172 23,81 91,01 50-59 70 37,0 37,0 67.2
60-69 45 23.8 23.8 91,0
4 16 188 8,47 99,47
70-79 16 8.5 8.5 99,5
5 1 189 0,53 100,00
80-89 1 .5 .5 100,0
N= 189 Total 189 100,0 100,0
FIGURA 2.3.1 Frequência, frequências cumulativas, porcentagem e distribuição percentual

cumulativa das idades dos sujeitos descritos no Exemplo 1.4.1 conforme construído pelo MINITAB e
SPSS.
Sabemos, no entanto, que alguns dos valores que caem no intervalo de segunda classe, por exemplo, quando
medidos com precisão, provavelmente seriam um pouco menores que 40 e alguns seriam um pouco maiores
que 49. Considerando a continuidade subjacente de nossa variável, e assumindo que os dados foram
arredondados para o número inteiro mais próximo, achamos conveniente pensar em 39,5 e 49,5 como os
verdadeiros limites desse segundo intervalo. Os verdadeiros limites para cada um dos intervalos de classe,
então, são os mostrados na Tabela 2.3.3.
Se construirmos um gráfico usando esses limites de classe como base de nossos retângulos, não haverá
lacunas e teremos o histograma mostrado na Figura 2.3.2. Usamos o MINITAB para construir este histograma,
conforme mostrado na Figura 2.3.3.
Referimo-nos ao espaço delimitado pelos limites do histograma como a área do histograma. A cada
observação é atribuída uma unidade desta área. Como temos 189 observações, o histograma consiste em um
total de 189 unidades. Cada célula contém uma certa proporção da área total, dependendo da frequência. A
segunda célula, por exemplo, contém 46/189 da área. Isso, como aprendemos, é a frequência relativa de
ocorrência de valores entre 39,5 e 49,5. A partir disso vemos que as subáreas do histograma definidas pelas
células correspondem às frequências de ocorrência dos valores entre os limites da escala horizontal das áreas.
A razão de uma determinada subárea para a área total do histograma é igual à frequência relativa de ocorrência
de valores entre os pontos correspondentes no eixo horizontal.
TABELA 2.3.3 Os dados da Tabela 70

2.3.1 Mostrando os verdadeiros limites de
classe 60
Verdadeiros Limites de Classe Frequência 50
29,5–39,5 11 40
Frequência
39,5–49,5 46
30
49,5–59,5 70
59,5–69,5 45 20
69,5–79,5 16
79,5–89,5 1 10
Total 189 0
34,5 44,5 54,5 64,5 74,5 84,5
Era
FIGURA 2.3.2 Histograma de idades de 189

indivíduos da Tabela 2.3.1.
O Polígono de Frequência Uma distribuição de frequência pode ser retratada graficamente ainda de
outra maneira por meio de um polígono de frequência, que é um tipo especial de gráfico de linha.
Para desenhar um polígono de frequência, primeiro colocamos um ponto acima do ponto médio de
cada intervalo de classe representado no eixo horizontal de um gráfico como o mostrado na Figura
2.3.2. A altura de um determinado ponto acima do eixo horizontal corresponde à frequência do intervalo
de classe relevante. Conectar os pontos por linhas retas produz o polígono de frequência. A Figura
2.3.4 é o polígono de frequência para os dados de idade na Tabela 2.2.1.
Observe que o polígono é reduzido ao eixo horizontal nas extremidades em pontos que seriam
os pontos médios se houvesse uma célula adicional em cada extremidade do histograma
correspondente. Isso permite que a área total seja cercada. A área total sob o polígono de frequência
é igual à área sob o histograma. A Figura 2.3.5 mostra o polígono de frequência da Figura 2.3.4
sobreposto ao histograma da Figura 2.3.2. Esta figura permite ver, para um mesmo conjunto de dados,
a relação entre as duas formas gráficas.
Gráfico Histograma Simples OK MTB > Histograma 'Idade'; SUBC>

MidPoint 34.5:84.5/10;
Digite Idade nas Variáveis do Gráfico: Clique em OK. SUBC> Barra.
Agora clique duas vezes no histograma e clique na guia Binning .

Digite 34.5:84.5/10 nas posições MidPoint/CutPoint : Clique
em OK.
FIGURA 2.3.3 Caixa de diálogo do MINITAB e comando de sessão para construir histograma a partir de dados sobre
idades no Exemplo 1.4.1.
70 70
60 60
50 50
40 40
Frequência Frequência
30 30
20 20
10 10
0 0
24,5 34,5 44,5 54,5 64,5 74,5 84,5 94,5 24,5 34,5 44,5 54,5 64,5 74,5 84,5 94,5
Era Era
FIGURA 2.3.4 Polígono de frequência para as idades de FIGURA 2.3.5 Histograma e polígono de frequência para
189 sujeitos mostrado na Tabela 2.2.1. as idades de 189 sujeitos mostrados na Tabela 2.2.1.
Exibições de caule e folha Outro dispositivo gráfico útil para representar conjuntos de dados quantitativos é a
exibição de ramo e folha. Uma exibição de ramo e folha tem uma forte semelhança com um histograma e serve
ao mesmo propósito. Uma exibição de caule e folha adequadamente construída, como um histograma, fornece
informações sobre o intervalo do conjunto de dados, mostra a localização da maior concentração de medições
e revela a presença ou ausência de simetria. Uma vantagem da exibição de caule e folha sobre o histograma é
o fato de que ele preserva as informações contidas nas medições individuais. Essas informações são perdidas
quando as medições são atribuídas aos intervalos de classe de um histograma. Como ficará claro, outra
vantagem das exibições de caule e folha é o fato de que elas podem ser construídas durante o processo de
contagem, de modo que a etapa intermediária de preparação de uma matriz ordenada é eliminada.
Para construir uma exibição de ramo e folha, dividimos cada medição em duas partes.
A primeira parte é chamada de caule e a segunda parte é chamada de folha. O caule consiste em um ou mais
dos dígitos iniciais da medição e a folha é composta por um ou mais dos dígitos restantes. Todos os números
particionados são mostrados juntos em uma única exibição; as hastes formam uma coluna ordenada com a
haste menor no topo e a maior na parte inferior. Incluímos na coluna da haste todas as hastes dentro do intervalo
dos dados, mesmo quando uma medição com essa haste não está no conjunto de dados. As linhas do display
contêm as folhas, ordenadas e listadas à direita de seus respectivos caules. Quando as folhas consistem em
mais de um dígito, todos os dígitos após o primeiro podem ser excluídos. Decimais, quando presentes nos dados
originais, são omitidos na exibição de ramo e folha. As hastes são separadas de suas folhas por uma linha
vertical. Assim, vemos que uma exibição de ramo e folha também é uma matriz ordenada dos dados.
As exibições de caule e folha são mais eficazes com conjuntos de dados relativamente pequenos. Como
regra, eles não são adequados para uso em relatórios anuais ou outras comunicações destinadas ao público
em geral. Eles são principalmente valiosos para ajudar pesquisadores e tomadores de decisão a entender a
natureza de seus dados. Os histogramas são mais apropriados para publicações de circulação externa. O
exemplo a seguir ilustra a construção de uma exibição de ramo e folha.
folha do caule
3 04577888899
4 0022333333444444455566666677777788888889999999
5 0000000011112222223333333333333333344444444444555666666777777788999999
6 000011111111111222222233444444556666667888999
7 0111111123567888
82
FIGURA 2.3.6 Exibição de caule e folha de idades de 189 indivíduos mostrados na Tabela 2.2.1 (unidade de caule
¼ 10, unidade de folha ¼ 1).
EXEMPLO 2.3.2
Vamos usar os dados de idade mostrados na Tabela 2.2.1 para construir uma exibição de ramo e folha.
Solução: Como as medidas são todas números de dois dígitos, teremos hastes de um dígito e folhas de um
dígito. Por exemplo, a medição 30 tem um caule de 3 e uma folha de 0. A Figura 2.3.6 mostra
a exibição de caule e folha para os dados.
O pacote de software estatístico MINITAB pode ser usado para construir exibições de
ramo e folha. O procedimento e a saída do MINITAB são mostrados na Figura 2.3.7. O
subcomando de incremento especifica a distância de uma haste para a seguinte. Os números
na coluna de saída mais à esquerda da Figura 2.3.7
Gráfico Caule-e-Folha MTB > 'Idade' do Caule-e-Folha; SUBC>

Incremento 10.
Digite Idade nas Variáveis do Gráfico. Digite 10 em Incremento.
Clique em OK.
Saída:
Exibição de caule e folha: idade
Caule e folha de idade N = 189 Unidade de

folha = 1,0
11 3 04577888899
57 4 0022333333444444455566666677777788888889999999
(70) 5 00000000111122222233333333333333333444444444445556666667777777889+
62 6 0000111111111112222222334444444556666667888999
17 7 0111111123567888
1 82
FIGURA 2.3.7 Exibição de caule e folha preparada pelo MINITAB a partir dos dados sobre as idades dos indivíduos
mostrados na Tabela 2.2.1.
Unidade de caule e folha de folha N = 189

de idade = 1,0
2 3 04
11 3 577888899
28 4 00223333334444444
57 4 55566666677777788888889999999
(46) 5 0000000011112222223333333333333333344444444444
86 5 555666666777777788999999
62 6 000011111111111222222233444444
32 6 556666667888999
17 7 0111111123
7 7 567888
1 82
FIGURA 2.3.8 Exibição de caule e folha preparada pelo MINITAB a partir dos dados sobre as idades dos indivíduos
mostrados na Tabela 2.2.1; largura do intervalo de classe ¼ 5.
fornecer informações sobre o número de observações (folhas) em uma determinada linha e

acima ou o número de observações em uma determinada linha e abaixo. Por exemplo, o
número 57 na segunda linha mostra que existem 57 observações (ou folhas) nessa linha e na
que está acima dela. O número 62 na quarta linha a partir do topo nos diz que existem 62
observações nessa linha e todas as abaixo. O número entre parênteses nos diz que existem
70 observações nessa linha. Os parênteses marcam a linha que contém a observação do meio
se o número total de observações for ímpar ou as duas observações do meio se o número total
de observações for par.
O þ no final da terceira linha na Figura 2.3.7 indica que a frequência dessa linha (faixa
etária de 50 a 59 anos) excede a capacidade da linha e que há pelo menos uma folha adicional
que não é mostrada. Nesse caso, a frequência para a faixa etária de 50 a 59 anos foi de 70. A
linha contém apenas 65 folhas, então o þ indica que há mais cinco folhas, o número 9, que não
são mostradas.
&
Uma forma de evitar exceder a capacidade de uma linha é ter mais linhas. Isso é feito diminuindo a
distância entre as linhas, ou seja, diminuindo as larguras dos intervalos de classe. Para o presente exemplo,
podemos usar larguras de intervalo de classe de 5, de modo que a distância entre as linhas seja 5. A Figura
2.3.8 mostra o resultado quando o MINITAB é usado para produzir a exibição de ramo e folha.
EXERCÍCIOS
2.3.1 Em um estudo sobre a prática de cuidados bucais domiciliares e razões para procurar atendimento odontológico entre
indivíduos em diálise renal, Atassi (A-1) estudou 90 indivíduos em diálise renal. O estado de higiene oral de todos
os indivíduos foi examinado usando um índice de placa com um intervalo de 0 a 3 (0 ¼ sem depósitos de placa mole,
EXERCÍCIOS 31
3 ¼ abundância de depósitos de placa mole). A tabela a seguir mostra as pontuações do índice de placa para todos os
90 indivíduos.
1,17 2,50 2,00 2,33 1,67 1.33
1,17 2,17 2,17 1,33 2,17 2,00
2.17 1,17 2,50 2,00 1,50 1,50
1,00 2,17 2,17 1,67 2,00 2,00 1,50
1,33 2,17 2,83 2,50 2,33
0,33 2,17 1,83 2,00 2,17 2,00 1,00 2,17 2,17 1,33
2,17 2,50 0,83 1,17 2,17 2,502,00
2,002,00
2,502,00
0,502,00
1,50
1,17 1,33 2.33
1,67 2.33
2,17 1,50 2,00 1,67 0,33 1,50 2,17
1,17 0,00 1,50 2,33 1,83 2,67

0,83 1.17 1,50 2,17 2,67 1,50
2,00 2,17 1.33 2,00 2,33 2,00
2,17 2,17 2,00 2,17 2,00 2,17
Fonte: Dados fornecidos por cortesia de

Farhad Atassi, DDS, MSc, FICOI.
(a) Use esses dados para preparar:

Uma distribuição de
frequência Uma distribuição de
frequência relativa Uma distribuição de
frequência cumulativa Uma distribuição de
frequência relativa cumulativa Um histograma Um
polígono de frequência (b) Que porcentagem das
medições é menor que 2,00? (c) Que proporção dos sujeitos tem
medidas maiores ou iguais a 1,50? (d) Que porcentagem das medições está entre 1,50 e 1,99
inclusive? (e) Quantas das medições são maiores que 2,49? (f) Que proporção das medições é
menor que 1,0 ou maior que 2,49? (g) Alguém escolhe uma medida aleatória desse conjunto de
dados e pede que você adivinhe o valor.
Qual seria sua resposta? Porque? (h) As

distribuições de frequência e seus histogramas podem ser descritos de várias maneiras, dependendo de sua forma.
Por exemplo, eles podem ser simétricos (a metade esquerda é pelo menos aproximadamente uma imagem espelhada
da metade direita), enviesados para a esquerda (as frequências tendem a aumentar à medida que as medições
aumentam de tamanho), enviesados para a direita (as frequências tendem diminuir à medida que as medições
aumentam de tamanho) ou em forma de U (as frequências são altas em cada extremidade da distribuição e pequenas no centro).
Como você descreveria a distribuição atual?
2.3.2 Janardhan et al. (A-2) conduziram um estudo no qual mediram aneurismas intracranianos (AIIs) incidentais em
125 pacientes. Os pesquisadores examinaram as complicações pós-procedimento e concluíram que os IIAs
podem ser tratados com segurança, sem causar mortalidade e com uma taxa de complicações menor do que a
relatada anteriormente. A seguir estão os tamanhos (em milímetros) dos 159 IIAs na amostra.
8,1 10,0 5,0 7,0 10,0 3,0 6,0

20,0 4,0 4,0 6,0 7,0
(continuação)
10,0 4.0 3.0 5,0 6.0 6.0

6.0 6.0 6.0 5,0 4.0 5,0
6,0 25,0 10,0 14,0 6.0 6.0
4,0 15,0 5,0 5,0 8,0 19,0
21,0 8,3 7,0 8,0 5,0 10,0 8,0
5,0 7,5 7,0 15,0 8,0
10,0 3,0 15,0 6,0 10,0 8,0
7,0 5,0 10,0 3,0 7,0 3,0 3,3
15,0 5,0 5,0 7,0 10,0 15,0
5,0 8,0
3,0 6,0 6,0 4,0 5,0 10,0 6,0
3,0 3,0 7,0 4,0 8,0 9,2
16,0 7,0 8,0 10,0
9,0 5,0 5,0 4,0
3,0 4.0 5,0 8,0 30,0 14,0
15,0 2.0 8,0 7,0 12,0 4.0
3.8 10,0 25,0 8,0 9,0 14,0
30,0 2.0 10,0 5,0 5,0 10,0
22,0 5,0 5,0 3.0 4.0 8,0
7.5 5,0 8,0 3.0 5,0 7,0
8,0 5,0 9,0 11,0 2.0 10,0
6.0 5,0 5,0 12,0 9,0 8,0
15,0 18,0 10,0 9,0 5,0 6.0
6.0 8,0 12,0 10,0 5,0
5,0 16,0 8,0 5,0 8,0
4,0 16,0 3.0 7,0 13,0
Fonte: Dados fornecidos por cortesia

de Vallabh Janardhan, MD
(a) Use esses dados para preparar:

Uma distribuição de frequência
Uma distribuição de frequência relativa
Uma distribuição de frequência cumulativa
Uma distribuição de frequência relativa cumulativa Um
histograma Um polígono de frequência (b) Que
porcentagem das medições está entre 10 e 14,9
inclusive? (c) Quantas observações são menores que 20? (d) Que proporção das medições é
maior ou igual a 25? (e) Que porcentagem das medições é menor que 10,0 ou maior que 19,95?
(f) Consulte o Exercício 2.3.1, parte h. Descreva a distribuição do tamanho dos aneurismas nesta
amostra.
2.3.3 Hoekema et al. (A-3) estudaram a morfologia craniofacial de pacientes com diagnóstico de síndrome da apneia obstrutiva
do sono (SAOS) em indivíduos saudáveis do sexo masculino. Uma das variáveis demográficas que os pesquisadores
coletaram para todos os participantes foi o Índice de Massa Corporal (calculado pela divisão do peso em kg pelo
quadrado da altura do paciente em cm). A seguir estão os valores de IMC de 29 indivíduos com SAOS.
33,57 27,78 40,81 29,01

38,34 47,78 54,33 28,99
26,86 (Continuação)
EXERCÍCIOS 33
25.21 30.49 27.38

36,42 41,50 29.39
24.54 41,75 44,68
24.49 33.23 47.09
29.07 28.21 42.10
26.54 27.74 33.48
31.44 30.08
Fonte: Dados fornecidos por

cortesia de A. Hoekema, DDS
(a) Use esses dados para construir:

Uma distribuição de frequência relativa cumulativa
Um histograma Um polígono de frequência (b) Qual
porcentagem das medições é menor que 30? (c)
Que porcentagem das medições está entre 40,0 e 49,99 inclusive? (d)
Que porcentagem das medições é maior que 34,99? (e) Descreva esses dados em relação à
simetria e assimetria conforme discutido no Exercício 2.3.1, parte h. (f) Quantas das medições
são menores que 40?
2.3.4 David Holben (A-4) estudou os níveis de selênio em carne bovina criada em uma região com baixo teor de selênio
nos Estados Unidos. O objetivo do estudo foi comparar os níveis de selênio na carne bovina da região com os
níveis de selênio em veado cozido, esquilo e carne bovina de outras regiões dos Estados Unidos. Os dados abaixo
são os níveis de selênio calculados com base no peso seco em mg=100 g para uma amostra de 53 bovinos
criados na região.
11.23 15.82
29.63 27.74
20.42 22h35
10.12 34,78
39,91 35.09
32,66 32,60
38.38 37.03
36.21 27h00
16.39 44,20
27.44 13.09
17.29 33.03
56,20 9.69
28,94 32.45
20,11 37.38
25,35 34,91
21,77 27,99
31,62 22,36
32,63 22,68
30,31 26,52
46,16 46,01
(Contínuo )
56,61 38.04
24.47 30,88
29.39 30.04
40,71 25.91
18.52 18,54
27,80 25,51
19h49

cortesia de David Holben, Ph.D.
(a) Use esses dados para construir:

um histograma
Um polígono de frequência
(b) Descreva esses dados em relação à simetria e assimetria conforme discutido no Exercício 2.3.1, parte h.
(c) Quantas das medidas são maiores que 40? (d) Que porcentagem das medições é inferior a 25?
2.3.5 A tabela a seguir mostra o número de horas que 45 pacientes do hospital dormiram após a administração
de um determinado anestésico.
7 10 12 4 8 7 12 11 3 851
3 8 1 13 10 4
4 5 5 8 77 3 23
8 13 1 7 17 3 4 55
3 1 17 10 4 7 7 11 8
(a) A partir desses dados construídos:

um histograma
2.3.6 A seguir, o número de bebês nascidos durante um ano em 60 hospitais comunitários.
30 55 27 45 56 48 45 49 32 57 47 56
37 55 52 34 54 42 32 59 35 46 24 57
32 26 40 28 53 54 29 42 42 54 53 59
39 56 59 58 49 53 30 53 21 34 28 50
52 57 43 46 54 31 22 31 24 24 57 29

um histograma
EXERCÍCIOS 35
2.3.7 Em um estudo dos níveis de resistência física de calouros da faculdade, os seguintes compostos de resistência
pontuações baseadas em várias rotinas de exercícios foram coletadas.
254 281 192 260 212 179 225 179 181 149
182 210 235 239 258 166 159 223 186 190
180 188 135 233 220 204 219 211 245 151 198 190 151 157 204 238 205
229 191 200 222. 220 201 203 172 234 198 173. 169 187 204 180 261
236 217 205 212 218
191 124 199 235 139 231 116 182 243 217
251 206 173 236 215 228 183 204 186 134
188 195 240 163 208

um histograma
2.3.8 A seguir estão as idades de 30 pacientes atendidos no pronto-socorro de um hospital em uma sexta-feira à noite.
Construa uma exibição de ramo e folha a partir desses dados. Descreva esses dados em relação à simetria e
assimetria conforme discutido no Exercício 2.3.1, parte h.
35 32 21 43 39 60
36 12 54 45 37 53
45 23 64 10 34 22
36 45 55 44 55 46
22 38 35 56 45 57
2.3.9 A seguir estão as cobranças de emergência feitas a uma amostra de 25 pacientes em dois hospitais da cidade.
Construa uma exibição de ramo e folha para cada conjunto de dados. O que uma comparação dos dois
monitores sugere em relação aos dois hospitais? Descreva os dois conjuntos de dados em relação à simetria
e assimetria conforme discutido no Exercício 2.3.1, parte h.
Hospital A
249,10 202,50 222.20 214,40 205,90

214,30 195.10 213,30 225,50 191,40
201.20 239,80 245,70 213,00 238,80
171.10 222,00 212,50 201,70 184,90
248,30 209,70 233,90 229,80 217,90
Hospital B
199,50 184,00 173,20 186,00 214.10

125,50 143,50 190,40 152,00 165,70
154,70 145,30 154,60 190,30 135,40
167,70 203,40 186,70 155,30 195,90
168,90 166,70 178,60 150,20 212,40
2.3.10 Consulte as idades dos pacientes discutidos no Exemplo 1.4.1 e exibidos na Tabela 1.4.1.
(a) Use larguras de intervalo de classe de 5 e construa:
um histograma
2.3.11 Os objetivos do estudo de Skjelbo et al. (A-5) deveriam examinar (a) a relação entre o metabolismo da cloroguanida
e a eficácia na profilaxia da malária e (b) o metabolismo da mefenitoína e sua relação com o metabolismo da
cloroguanida entre os tanzanianos. A partir das informações fornecidas pelas amostras de urina dos 216
indivíduos, os investigadores calcularam a proporção de S-mefenitoína inalterada para R-mefenitoína (relação
S/R). Os resultados foram os seguintes:
0.0269 0.0400 0.0550 0.0550 0.0650 0.0670 0.0700 0.0720 0.0760 0.0850 0.0870 0.0870
0.0880 0.0900 0.0900 0.0990 0.0990 0.0990 0.0990 0.0990 0.0990 0.0990 0.0990 0.0990
0,0990 0,0990 0,0990 0,0990 0,0990 0,0990 0,0990 0,0990

0,0990 0,0990 0,0990 0,0990 0,0990 0,0990 0,0990 0,0990
0,0990 0,0990 0,0990 0,0990 0,0990 0,1000 0,1020 0,1040
0,1050 0,1050 0,1080 0,1080 0,1090 0,1090 0,1090 0,1160
0,1190 0,1200 0,1230 0,1240 0,1340 0,1340 0,1370 0,1390
0,1460 0,1480 0,1490 0,1490 0,1500 0,1500 0,1500 0,1540
0,1550 0,1570 0,1600 0,1650 0,1650 0,1670 0,1670 0,1677
0,1690 0,1710 0,1720 0,1740 0,1780 0,1780 0,1790 0,1790
0,1810 0,1880 0,1890 0,1890 0,1920 0,1950 0,1970 0,2010
0,2070 0,2100 0,2100 0,2140 0,2150 0,2160 0,2260 0,2290
0,2390 0,2400 0,2420 0,2430 0,2450 0,2450 0,2460 0,2460
0,2470 0,2540 0,2570 0,2600 0,2620 0,2650 0,2650 0,2680
0,2710 0,2800 0,2800 0,2870 0,2880 0,2940 0,2970 0,2980
0,2990 0,3000 0,3070 0,3100 0,3110 0,3140 0,3190 0,3210
0.3400 0.3440 0.3480 0.3490 0.3520 0.3530 0.3570 0.3630 0.3630 0.3660 0.3830 0.3900
0.3960 0.3990 0.4080 0.4080 0.4090 0.4090 0.4100 0.4160 0.4210 0.4260 0.4290 0.4290
0.4300 0.4360 0.4370 0.4390 0.4410 0.4410 0.4430 0.4540 0.4680 0.4810 0.4870 0.4910
0.4980 0.5030 0.5060 0.5220 0.5340 0.5340 0.5460 0.5480 0.5480 0.5490 0.5550 0.5920
0.5930 0.6010 0,6240 0,6280 0,6380 0,6600 0,6720 0,6820
(Contínuo )
EXERCÍCIOS 37
0,6870 0,6900 0,6910 0,6940 0,7040 0,7120 0,7200 0,7280

0,7860 0,7950 0,8040 0,8200 0,8350 0,8770 0,9090 0,9520
0,9530 0,9830 0,9890 1,0120 1,0260 1,0320 1,0620 1,1600
Fonte: Dados fornecidos por cortesia de Erik Skjelbo, MD
(a) A partir desses dados, construa as seguintes distribuições: frequência, frequência relativa, frequência
cumulativa e frequência relativa cumulativa; e os seguintes gráficos: histograma, polígono de frequência e
diagrama de ramo e folha. (b) Descreva esses dados em relação à simetria e assimetria conforme discutido
no Exercício 2.3.1, parte h. (c) Os investigadores definiram como metabolizadores fracos de mefenitoína
qualquer indivíduo com uma razão S/R de mefenitoína superior a 0,9. Quantos e que porcentagem dos
sujeitos eram metabolizadores fracos?
(d) Quantos e que porcentagem dos sujeitos tiveram razões menores que 0,7? Entre 0,3 e 0,6999 inclusive?
Maior que 0,4999?
2.3.12 Schmidt et al. (A-6) conduziu um estudo para investigar se a autotransfusão de sangue derramado no mediastino
poderia reduzir o número de pacientes que precisam de transfusão de sangue homólogo e reduzir a
quantidade de sangue homólogo transfundido se critérios fixos de transfusão fossem usados. A tabela a
seguir mostra as alturas em centímetros dos 109 indivíduos, dos quais 97 eram do sexo masculino.
1,720 1,710 1,700 1,655 1,800 1,700

1,730 1,700 1,820 1,810 1,720 1,800
1,800 1,800 1,790 1,820 1,800 1,650
1,680 1,730 1,820 1,720 1,710 1,850
1,760 1,780 1,760 1,820 1,840 1,690
1,770 1,920 1,690 1,690 1,780 1,720
1,750 1,710 1,690 1,520 1.805 1.780
1.820 1.790 1,760 1,830 1.760 1.800
1.700 1.760 1.750 1.630 1.760 1.770
1.840 1.690 1.640 1.760 1.850 1.820
1.760 1.700 1.720 1.780 1.630 1.650
1.660 1.880 1.740 1.900 1.830
1.600 1.800 1.670 1.780 1.800
1.750 1.610 1.840 1.740 1.750
1.960 1.760 1.730 1.730 1.810
1.810 1.775 1.710 1.730 1.740
1.790 1.880 1.730 1.560 1.820
1.780 1.630 1.640 1.600 1.800
1.800 1.780 1.840 1.830
1.770 1.690 1.800 1.620
Fonte: Dados fornecidos por cortesia de Erik Skjelbo, MD
(a) Para esses dados, construa as seguintes distribuições: frequência, frequência relativa, frequência
cumulativa e frequência relativa cumulativa; e os seguintes gráficos: histograma, polígono de frequência e
diagrama de ramo e folha. (b) Descreva esses dados em relação à simetria e assimetria conforme discutido
no Exercício 2.3.1, parte h. (c) Como você explica a forma da distribuição desses dados? (d) Qual era a
altura dos 6,42 por cento mais altos dos sujeitos? (e) Qual era a altura dos 10,09 por cento mais baixos dos
sujeitos?
2.4 ESTATÍSTICAS DESCRITIVAS: MEDIDAS

DE TENDÊNCIA CENTRAL
Embora as distribuições de frequência sirvam a propósitos úteis, há muitas situações que requerem outros tipos
de resumo de dados. O que precisamos em muitos casos é a capacidade de resumir os dados por meio de um
único número chamado de medida descritiva. As medidas descritivas podem ser calculadas a partir dos dados
de uma amostra ou dos dados de uma população. Para distingui-los, temos as seguintes definições:
DEFINIÇÕES
1. Uma medida descritiva calculada a partir dos dados de uma amostra é chamada de
estatística.
2. Uma medida descritiva calculada a partir dos dados de uma população é chamada de
parâmetro.
Vários tipos de medidas descritivas podem ser calculadas a partir de um conjunto de dados. Neste
capítulo, no entanto, limitamos a discussão às medidas de tendência central e medidas de dispersão.
Consideramos medidas de tendência central nesta seção e medidas de dispersão na seguinte.
Em cada uma das medidas de tendência central, das quais discutimos três, temos um único valor que é
considerado típico do conjunto de dados como um todo. Medidas de tendência central transmitem informações
sobre o valor médio de um conjunto de valores. Como veremos, a palavra média pode ser definida de diferentes
maneiras.
As três medidas de tendência central mais usadas são a média, a mediana e a moda.
Média aritmética A medida mais familiar de tendência central é a média aritmética. É a medida descritiva que a
maioria das pessoas tem em mente quando fala da “média”. O adjetivo aritmética distingue esta média de outras
médias que podem ser calculadas. Uma vez que não tratamos dessas outras médias neste livro, nos referiremos
à média aritmética simplesmente como média. A média é obtida adicionando todos os valores em uma população
ou amostra e dividindo pelo número de valores que são adicionados.
EXEMPLO 2.4.1
Desejamos obter a idade média da população de 189 sujeitos representada na Tabela 1.4.1.
Solução: Procedemos da seguinte forma:
48 þ 35 þ 46 þþ 73 þ 66 ¼ 55:032
idade média ¼
189
&
Os três pontos no numerador representam os valores que não mostramos para salvar
espaço.
2.4 ESTATÍSTICAS DESCRITIVAS: MEDIDAS DE TENDÊNCIA CENTRAL 39
Fórmula Geral para a Média Será conveniente se pudermos generalizar o procedimento para
obtenção da média e, também, representar o procedimento em uma forma de notação mais
compacta. Vamos começar designando a variável aleatória de interesse pela letra maiúscula X.
Em nossa ilustração atual, deixamos X representar a variável aleatória, idade. Valores específicos
de uma variável aleatória serão designados pela letra minúscula x. Para distinguir um valor de
outro, anexamos um subscrito ao x e deixamos o subscrito referir-se ao primeiro, ao segundo, ao
terceiro valor e assim por diante. Por exemplo, da Tabela 1.4.1 temos
x1 ¼ 48; x2 ¼ 35; ... ; x189 ¼ 66
Em geral, um valor típico de uma variável aleatória será designado por xi e o valor final, em uma
população finita de valores, por xN, onde N é o número de valores na população.
Finalmente, usaremos a letra grega m para representar a média da população. Podemos agora
escrever a fórmula geral para uma média de população finita como segue:
N
P XI
i¼1
m¼ (2.4.1)
N
O símbolo PN nosi¼1instrui a somar todos os valores da variável do primeiro ao último. Este símbolo
S, chamado de sinal de soma, será amplamente utilizado neste livro. Quando do contexto for
óbvio quais valores devem ser adicionados, os símbolos acima e abaixo de S serão omitidos.
A média da amostra Quando calculamos a média de uma amostra de valores, o procedimento

que acabamos de descrever é seguido com algumas modificações na notação. Usamos x para
designar a média da amostra en para indicar o número de valores na amostra. A média amostral
então é expressa como
Pn XI
i¼1
x¼ (2.4.2)
n
EXEMPLO 2.4.2
No Capítulo 1, selecionamos uma amostra aleatória simples de 10 sujeitos da população de

sujeitos representada na Tabela 1.4.1. Vamos agora calcular a idade média dos 10 indivíduos em
nossa amostra.
Solução: Recordamos (ver Tabela 1.4.2) que as idades dos 10 indivíduos da nossa amostra eram
x1 ¼ 43; x2 ¼ 66; x3 ¼ 61; x4 ¼ 64; x5 ¼ 65; x6 ¼ 38; x7 ¼ 59; x8 ¼ 57; x9 ¼ 57;
x10 ¼ 50. A substituição de nossos dados de amostra na Equação 2.4.2 fornece
Pn XI 43 þ 66 þþ 50 ¼ 56
i¼1 ¼
x¼
n 10 &
Propriedades da média A média aritmética possui certas propriedades, algumas desejáveis e outras nem
tanto. Essas propriedades incluem o seguinte:
1. Singularidade. Para um determinado conjunto de dados existe uma e apenas uma média aritmética.
2. Simplicidade. A média aritmética é facilmente compreendida e fácil de calcular.

3. Como todo e qualquer valor em um conjunto de dados entra no cálculo da média, ele é afetado por
cada valor. Valores extremos, portanto, influenciam a média e, em alguns casos, podem distorcê-
la a ponto de torná-la indesejável como medida de tendência central.
Como exemplo de como valores extremos podem afetar a média, considere a seguinte situação.
Suponha que os cinco médicos que praticam em uma área sejam pesquisados para determinar seus
preços para um determinado procedimento. Suponha que eles relatem essas cobranças: $ 75, $ 75, $
80, $ 80 e $ 280. O custo médio dos cinco médicos é de US$ 118, um valor pouco representativo do
conjunto de dados como um todo. O único valor atípico teve o efeito de inflar a média.
Mediana A mediana de um conjunto finito de valores é aquele valor que divide o conjunto em duas partes
iguais de modo que o número de valores iguais ou maiores que a mediana seja igual ao número de
valores iguais ou menores que a mediana. Se o número de valores for ímpar, a mediana será o valor do
meio quando todos os valores tiverem sido organizados em ordem de grandeza. Quando o número de
valores é par, não há um único valor intermediário. Em vez disso, existem dois valores intermediários.
Nesse caso, a mediana é considerada a média desses dois valores centrais, quando todos os valores
foram arranjados na ordem de suas magnitudes. Em outras palavras, a observação mediana de um
conjunto de dados é a ð Þ n þ 1 =2ª quando a observação foi ordenada. Se,
observações,
por exemplo,
a mediana
temos 11é a 11
ð Þ þ 1 =2 ¼ 6ª observação ordenada. Se tivermos 12 observações, a mediana é a ð Þ 12 þ 1 =2 ¼ 6:5ª
observação ordenada e é um valor intermediário entre a 6ª e a 7ª observações ordenadas.
EXEMPLO 2.4.3
Vamos ilustrar encontrando a mediana dos dados na Tabela 2.2.1.
Solução: Os valores já estão ordenados, portanto, precisamos apenas encontrar os dois valores do meio.
O valor do meio é o ð Þ n þ 1 =2 ¼
189
ð Þþ 1 =2 ¼ 190=2
95º. ¼
Contando do menor até o 95º valor vemos que é 54.
Assim, a idade média dos 189 indivíduos é de 54 anos. &
EXEMPLO 2.4.4
Desejamos encontrar a idade mediana dos sujeitos representados na amostra descrita no Exemplo 2.4.2.
Solução: Organizando as 10 eras em ordem de grandeza, da menor para a maior, dá 38, 43, 50, 57, 57,
59, 61, 64, 65, 66. Como temos um número par de eras, há
2.4 ESTATÍSTICAS DESCRITIVAS: MEDIDAS DE TENDÊNCIA CENTRAL 41
não é um valor médio. Os dois valores do meio, no entanto, são 57 e 59. A mediana, então,
é 57 ð Þ þ 59 = 2 ¼ 58. &
Propriedades da mediana As propriedades da mediana incluem o seguinte:
1. Singularidade. Como acontece com a média, há apenas uma mediana para um determinado conjunto de
dados.
2. Simplicidade. A mediana é fácil de calcular.
3. Não é tão drasticamente afetado por valores extremos quanto a média.
A moda A moda de um conjunto de valores é aquele valor que ocorre com mais frequência. Se todos os
valores forem diferentes não há moda; por outro lado, um conjunto de valores pode ter mais de uma moda.
EXEMPLO 2.4.5
Encontre a idade modal dos sujeitos cujas idades são dadas na Tabela 2.2.1.
Solução: Uma contagem das idades na Tabela 2.2.1 revela que a idade de 53 anos ocorre mais
frequentemente (17 vezes). A moda para esta população de idades é 53. &
Para um exemplo de conjunto de valores que possui mais de uma moda, consideremos um laboratório
com 10 funcionários cujas idades são 20, 21, 20, 20, 34, 22, 24, 27, 27 e 27. Poderíamos dizer que esses
dados têm duas modas, 20 e 27. A amostra que consiste nos valores 10, 21, 33, 53 e 54 não tem moda, pois
todos os valores são diferentes.
A moda também pode ser usada para descrever dados qualitativos. Por exemplo, suponha que os
pacientes atendidos em uma clínica de saúde mental durante um determinado ano recebam um dos seguintes
diagnósticos: retardo mental, síndrome cerebral orgânica, psicose, neurose e transtorno de personalidade. O
diagnóstico mais frequente no grupo de pacientes seria chamado de diagnóstico modal.
Uma propriedade atraente de uma distribuição de dados ocorre quando a média, a mediana e a moda
são todas iguais. A conhecida “curva em forma de sino” é uma representação gráfica de uma distribuição para
a qual a média, a mediana e a moda são todas iguais. Muitas inferências estatísticas são baseadas nessa
distribuição, sendo a mais comum a distribuição normal. A distribuição normal é apresentada na Seção 4.6 e
discutida com mais detalhes nos capítulos subseqüentes. Outra distribuição comum desse tipo é a distribuição
t, apresentada na Seção 6.3.
Distorção As distribuições de dados podem ser classificadas com base no fato de serem simétricas ou
assimétricas. Se uma distribuição for simétrica, a metade esquerda de seu gráfico (histograma ou polígono de
frequência) será uma imagem espelhada de sua metade direita. Quando a metade esquerda e a metade
direita do gráfico de uma distribuição não são imagens espelhadas uma da outra, a distribuição é assimétrica.
DEFINIÇÃO
Se o gráfico (histograma ou polígono de frequência) de uma distribuição for

assimétrico, diz-se que a distribuição é assimétrica. Se uma distribuição
não é simétrica porque seu gráfico se estende mais para a direita do que para a
esquerda, ou seja, se tem uma cauda longa para a direita, dizemos que a distribuição é
assimétrica à direita ou é assimétrica positiva. Se uma distribuição não é simétrica porque seu
gráfico se estende mais para a esquerda do que para a direita, ou seja, se tem uma cauda
longa para a esquerda, dizemos que a distribuição é assimétrica à esquerda ou é assimétrica
negativa.
Uma distribuição será assimétrica à direita, ou positivamente assimétrica, se sua média for maior que
sua moda. Uma distribuição será assimétrica à esquerda, ou negativamente assimétrica, se sua média for
menor que sua moda. A assimetria pode ser expressa da seguinte forma:
ffiffiffi ffiffiffi
3 3
np Pn ð xi x º np Pn ð xi x º
i¼1 i¼1
Distorção ¼ ¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
(2.4.3)
3=2 Þn1 n 1 p s3 ð
2
Pnð xi x º
i¼1
Na Equação 2.4.3, s é o desvio padrão de uma amostra conforme definido na Equação 2.5.4. A maioria dos
pacotes estatísticos de computador inclui essa estatística como parte de uma impressão padrão. Um valor de
assimetria > 0 indica assimetria positiva e um valor de assimetria < 0 indica assimetria negativa. Uma ilustração
da assimetria é mostrada na Figura 2.4.1.
EXEMPLO 2.4.6
Considere as três distribuições mostradas na Figura 2.4.1. Dado que os histogramas representam contagens
de frequência, os dados podem ser facilmente recriados e inseridos em um pacote estatístico.
Por exemplo, a observação da distribuição “No Skew” produziria os seguintes dados: 5, 5, 6, 6, 6, 7, 7, 7, 7, 8,
8, 8, 8, 8, 9, 9, 9 , 9, 10, 10, 10, 11, 11. Os valores podem ser obtidos em
FIGURA 2.4.1 Três histogramas ilustrando assimetria.

2.5 ESTATÍSTICAS DESCRITIVAS: MEDIDAS DE DISPERSÃO 43
as distribuições assimétricas de maneira semelhante. Usando o software SPSS, as seguintes

estatísticas descritivas foram obtidas para essas três distribuições
Sem Inclinação Inclinação Direita Inclinação Esquerda
Significar 8,0000 6.6667 8.3333

Mediana 8,0000 6,0000 9,0000
Modo 8h00 5,00 10.00
Distorção 000 .627 .627
&
2.5 ESTATÍSTICA DESCRITIVA: MEDIDAS

DE DISPERSÃO
A dispersão de um conjunto de observações refere-se à variedade que elas exibem. Uma medida de
dispersão transmite informações sobre a quantidade de variabilidade presente em um conjunto de dados.
Se todos os valores forem iguais, não há dispersão; se não forem todos iguais, há dispersão nos dados.
A quantidade de dispersão pode ser pequena quando os valores, embora diferentes, estão próximos.
A Figura 2.5.1 mostra os polígonos de frequência para duas populações que têm médias iguais, mas
quantidades diferentes de variabilidade. A população B, que é mais variável do que a população A, é
mais dispersa. Se os valores estiverem amplamente dispersos, a dispersão é maior. Outros termos
usados como sinônimos de dispersão incluem variação, propagação e dispersão.
A Faixa Uma maneira de medir a variação em um conjunto de valores é calcular a faixa. A amplitude é
a diferença entre o maior e o menor valor em um conjunto de observações. Se denotarmos o intervalo
por R, o maior valor por xL e o menor valor por xS, calculamos o intervalo da seguinte forma:
R ¼ xL x P (2.5.1)
População A
População B
m
FIGURA 2.5.1 Duas distribuições de frequência com médias iguais, mas quantidades diferentes
de dispersão.
EXEMPLO 2.5.1
Desejamos calcular a faixa etária dos sujeitos da amostra discutidos na Tabela 2.2.1.
Solução: Como o sujeito mais jovem da amostra tem 30 anos e o mais velho 82,
calculamos o intervalo a ser
R ¼ 82 30 ¼ 52 &
A utilidade do intervalo é limitada. O fato de levar em conta apenas dois valores faz com que seja
uma medida de dispersão ruim. A principal vantagem em usar o intervalo é a simplicidade de seu
cálculo. Uma vez que o intervalo, expresso como uma única medida, fornece informações mínimas
sobre um conjunto de dados e, portanto, é de uso limitado, muitas vezes é preferível expressar o
intervalo como um par de números, ½ xS; xL , emnoque conjunto
xS e xL desão
dados,
os menores
respectivamente.
e maioresPara
valores
os
dados do Exemplo 2.5.1, podemos expressar o intervalo como o par de números [30, 82]. Embora
esta não seja a expressão tradicional para o intervalo, é intuitivo imaginar que o conhecimento dos
valores mínimo e máximo neste conjunto de dados transmitiria mais informações do que saber
apenas que o intervalo é igual a 52. Um número infinito de distribuições, cada uma com valores
mínimos e máximos bastante diferentes, pode ter um alcance de 52.
A Variância Quando os valores de um conjunto de observações estão próximos de sua média, a

dispersão é menor do que quando eles estão dispersos em uma ampla faixa. Como isso é verdade,
seria intuitivamente atraente se pudéssemos medir a dispersão em relação à dispersão dos valores
em torno de sua média. Tal medida é realizada no que é conhecido como variância. Ao calcular a
variância de uma amostra de valores, por exemplo, subtraímos a média de cada um dos valores,
elevamos ao quadrado as diferenças resultantes e depois somamos as diferenças ao quadrado.
Essa soma dos desvios quadrados dos valores de sua média é dividida pelo tamanho da amostra,
menos 1, para obter a variância da amostra. Fazendo com que s2 represente a variância da
amostra, o procedimento pode ser escrito na forma de notação da seguinte forma:
2
Pnð xi x º
2 i¼1
segundos
¼
(2.5.2)
n1
Portanto, é fácil ver que a variância pode ser descrita como o desvio médio quadrado dos valores
individuais da média desse conjunto. Pode parecer não intuitivo neste estágio que as diferenças no
numerador sejam elevadas ao quadrado. No entanto, considere uma distribuição simétrica. É fácil
imaginar que, se calcularmos a diferença de cada ponto de dados na distribuição a partir do valor médio,
metade das diferenças seria positiva e metade seria negativa, resultando em uma soma que seria zero.
Uma variância de zero seria uma medida não informativa para qualquer distribuição de números, exceto
aquela em que todos os valores são iguais. Portanto, o quadrado de cada diferença é usado para
garantir um numerador positivo e, portanto, uma medida de dispersão muito mais valiosa.
EXEMPLO 2.5.2
Vamos ilustrar calculando a variância das idades dos assuntos discutidos no Exemplo 2.4.2.
Solução: 2 2 2
ðs2
Þ¼43 56 þ ð Þ 66 56 9 þþ ð Þ 50 56
810
¼ ¼ 90
9 &
Graus de liberdade A razão para dividir por n 1 em vez de n, como poderíamos esperar, é a consideração
teórica referida como graus de liberdade. Ao calcular a variância, dizemos que temos n 1 graus de liberdade.
Nós raciocinamos da seguinte forma. A soma dos desvios dos valores de sua média é igual a zero, como pode
ser demonstrado. Se, então, conhecemos os valores de n 1 dos desvios da média, conhecemos o n-ésimo,
pois ele é determinado automaticamente pela necessidade de todos os n valores somarem zero. Do ponto de
vista prático, é necessário dividir as diferenças ao quadrado por n 1 em vez de n para usar a variância da
amostra nos procedimentos de inferência discutidos posteriormente. O conceito de graus de liberdade será
revisitado em um capítulo posterior. Os alunos interessados em aprofundar o assunto neste momento devem
consultar o artigo de Walker (2).
Quando calculamos a variância de uma população finita de N valores, os procedimentos descritos

acima são seguidos, exceto que subtraímos m de cada x e dividimos por N em vez de N 1. Se deixarmos s2
representar a variância da população finita, a fórmula é do seguinte modo:
N
2
Pð x m º
i¼1
s2 ¼ (2.5.3)
N
Desvio Padrão A variância representa unidades ao quadrado e, portanto, não é uma medida apropriada de
dispersão quando queremos expressar este conceito em termos das unidades originais. Para obter uma
medida de dispersão em unidades originais, simplesmente tiramos a raiz quadrada da variância. O resultado
é chamado de desvio padrão. Em geral, o desvio padrão de uma amostra é dado por
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
2
fffiffiffi
Pnð xi x º
i¼1
s¼
s2 p ¼ (2.5.4)
vuuut
n1
O desvio padrão de uma população finita é obtido pela raiz quadrada da quantidade
obtida pela Equação 2.5.3, e é representado por s.
O coeficiente de variação O desvio padrão é útil como medida de variação dentro de um

determinado conjunto de dados. Quando se deseja comparar a dispersão em dois conjuntos
de dados, no entanto, comparar os dois desvios padrão pode levar a resultados falaciosos.
Pode ser que as duas variáveis envolvidas sejam medidas em unidades diferentes. Por
exemplo, podemos desejar saber, para uma determinada população, se os níveis séricos de
colesterol, medidos em miligramas por 100 ml, são mais variáveis do que o peso corporal, medido em libr
Além disso, embora seja utilizada a mesma unidade de medida, as duas médias
podem ser bastante diferentes. Se compararmos o desvio padrão dos pesos das crianças
da primeira série com o desvio padrão dos pesos dos calouros do ensino médio, podemos
descobrir que o último desvio padrão é numericamente maior que o primeiro, porque os
próprios pesos são maiores, não porque a dispersão é maior.
O que é necessário em situações como essas é uma medida de variação relativa em vez de variação
absoluta. Tal medida é encontrada no coeficiente de variação, que expressa o desvio padrão como uma
porcentagem da média. A fórmula é dada por
s
C:V: ¼ ð Þ 100% (2.5.5)
x
Vemos que, como a média e os desvios padrão são expressos na mesma unidade de medida, a unidade
de medida se anula no cálculo do coeficiente de variação. O que temos, então, é uma medida independente da
unidade de medida.
EXEMPLO 2.5.3
Suponha que duas amostras de machos humanos produzam os seguintes resultados:
Amostra 1 Amostra 2
Era 25 anos 11 anos

Peso médio 145 libras 80 libras
Desvio padrão 10 libras 10 libras
Queremos saber o que é mais variável, os pesos dos jovens de 25 anos ou os pesos dos jovens de 11 anos.
Solução: Uma comparação dos desvios padrão pode levar a concluir que as duas amostras possuem variabilidade
igual. Se calcularmos os coeficientes de variação, no entanto, temos para os jovens de 25 anos
10
C:V: ¼ ð Þ¼ 100 6:9%
145
e para crianças de 11 anos
10
C:V: ¼ ð Þ¼ 100 12:5%
80
Se compararmos esses resultados, teremos uma impressão bem diferente. Fica claro a partir
desse exemplo que a variação é muito maior na amostra de jovens de 11 anos do que na amostra
de 25 anos. &
O coeficiente de variação também é útil para comparar os resultados obtidos por diferentes pessoas que
estão realizando investigações envolvendo a mesma variável. Como o coeficiente de variação é independente da
escala de medição, é uma estatística útil para comparar a variabilidade de duas ou mais variáveis medidas em
diferentes escalas. Poderíamos, por exemplo, usar o coeficiente de variação para comparar a variabilidade nos
pesos de uma amostra de indivíduos cujos pesos são expressos em libras com a variabilidade nos pesos de outra
amostra de indivíduos cujos pesos são expressos em quilogramas.
Variável NN* Média SE Média StDev Mínimo Q1 Mediana Q3 Máximo C1 10 0 56,00 3,00 9,49 38,00 48,25 58,00 64,25 66,00
FIGURA 2.5.2 Impressão de medidas descritivas calculadas a partir da amostra de idades no

Exemplo 2.4.2, pacote de software do MINITAB.
Análise de computador Pacotes de software de computador fornecem uma variedade de

possibilidades no cálculo de medidas descritivas. A Figura 2.5.2 mostra uma impressão das
medidas descritivas disponíveis no pacote MINITAB. Os dados consistem nas idades do Exemplo
2.4.2.
Na impressão , Q1 e Q3 são o primeiro e terceiro quartis, respectivamente. Essas medidas
são descritas mais adiante neste capítulo. N representa o número de observações de dados e N
representa o número de valores ausentes. O termo SEMEAN significa erro padrão da média. Essa
medida será discutida em detalhes em um capítulo posterior. A Figura 2.5.3 mostra, para os
mesmos dados, a impressão SAS® obtida usando o PROC MEANS
declaração.
Percentis e quartis A média e a mediana são casos especiais de uma família de parâmetros
conhecidos como parâmetros de localização. Essas medidas descritivas são chamadas de
parâmetros de localização porque podem ser usadas para designar certas posições no eixo
horizontal quando a distribuição de uma variável é representada graficamente. Nesse sentido, os
chamados parâmetros de localização “localizam” a distribuição no eixo horizontal. Por exemplo,
uma distribuição com mediana de 100 está localizada à direita de uma distribuição com mediana
de 50 quando as duas distribuições são representadas graficamente. Outros parâmetros de
localização incluem percentis e quartis. Podemos definir um percentil da seguinte forma:
DEFINIÇÃO
Dado um conjunto de n observações x1; x2; ... xn, o p-ésimo percentil P é o valor de X
tal que p por cento ou menos das observações são menores que P e 100 ð Þ p por cento
ou menos das observações são maiores que P.
O Procedimento MEIOS
Variável de Análise: Idade
N Significar Std Dev Mínimo Máximo

10 56,0000000 9.4868330 38,0000000 66,0000000
Coeff de
Erro Padrão Soma variância Variação
3,0000000 560,0000000 90,0000000 16.9407732
FIGURA 2.5.3 Impressão de medidas descritivas calculadas a partir da amostra de idades no

Exemplo 2.4.2, pacote de software SAS®.
Subscritos em P servem para distinguir um percentil de outro. O 10º percentil, por exemplo, é designado
P10, o 70º é designado P70 e assim por diante. O percentil 50 é a mediana e é designado P50. O percentil 25 é
muitas vezes referido como o primeiro quartil e denotado Q1. O 50º percentil (a mediana) é referido como o
segundo ou quartil médio e escrito Q2, e o 75º percentil é referido como o terceiro quartil, Q3.
Quando queremos encontrar os quartis para um conjunto de dados, usamos as seguintes fórmulas:
nþ1 9
Q1 ¼ a observação ordenada
4
2ð Þ n þ 1 n þ 1ª
Q2 ¼ ¼ observação ordenada (2.5.6)
4 2 >>>>>>>=
3ð Þ n þ 1
Q3 ¼ a observação ordenada 4 >>>>>>>;
Deve-se notar que as equações mostradas em 2.5.6 determinam as posições dos quartis em um conjunto de
dados, não os valores dos quartis. Também deve ser observado que, embora haja uma maneira universal de
calcular a mediana (Q2), há várias maneiras de calcular os valores Q1 e Q2 . Por exemplo, o SAS fornece um total
de cinco maneiras diferentes de calcular os valores de quartil, e outros programas implementam métodos ainda
diferentes. Para uma discussão dos vários métodos de cálculo de quartis, os leitores interessados devem consultar
o artigo de Hyndman e Fan (3). Para ilustrar, observe que a impressão no MINITAB na Figura 2.5.2 mostra Q1 ¼
48,25 e Q3 ¼ 64,25, enquanto o programa R produz os valores Q1 ¼ 52,75 e Q3 ¼ 63,25.
Intervalo Interquartílico Como vimos, o intervalo fornece uma medida bruta da variabilidade presente em um
conjunto de dados. Uma desvantagem do intervalo é o fato de ser calculado a partir de apenas dois valores, o
maior e o menor. Uma medida semelhante que reflete a variabilidade entre os 50% intermediários das observações
em um conjunto de dados é o intervalo interquartílico.
DEFINIÇÃO
O intervalo interquartil (IQR) é a diferença entre o terceiro e o primeiro quartil: isto é,
IQR ¼ Q3 Q1 (2.5.7)
Um grande IQR indica uma grande variabilidade entre os 50% intermediários das observações relevantes, e um
pequeno IQR indica uma pequena variabilidade entre as observações relevantes. Como essas afirmações são
bastante vagas, é mais informativo comparar a faixa interquartil com a faixa de todo o conjunto de dados. Uma
comparação pode ser feita formando a razão do IQR para o intervalo (R) e multiplicando por 100. Ou seja, 100
(IQR/R) nos diz qual é a porcentagem do IQR do intervalo geral.
Curtose Assim como podemos descrever uma distribuição em termos de assimetria, podemos descrever uma
distribuição em termos de curtose.
DEFINIÇÃO
Curtose é uma medida do grau em que uma distribuição é “picada” ou plana

em comparação com uma distribuição normal cujo gráfico é caracterizado por
uma aparência em forma de sino.
Uma distribuição, em comparação com uma distribuição normal, pode possuir uma proporção
excessiva de observações em suas caudas, fazendo com que seu gráfico apresente uma aparência achatada.
Tal distribuição é chamada de platicúrtica. Por outro lado, uma distribuição, em comparação com uma
distribuição normal, pode possuir uma proporção menor de observações em suas caudas, de modo
que seu gráfico exibe uma aparência mais pontiaguda. Tal distribuição é chamada de leptocúrtica.
Uma distribuição normal, ou em forma de sino, é chamada de mesocúrtica.
A curtose pode ser expressa como
4 4
n Pn ð xi x º n Pn ð xi x º
Curtose ¼ i¼1 3¼ i¼1 3
2 2
(2.5.8)
2 ðÞn1 s4
Pnð _ xi x º
i¼1
O cálculo manual usando a Equação 2.5.8 geralmente não é necessário, pois a maioria dos pacotes
estatísticos calcula e relata informações sobre curtose como parte das estatísticas descritivas de
um conjunto de dados. Observe que cada uma das duas partes da Equação 2.5.8 foi reduzida em
3. Uma distribuição perfeitamente mesocúrtica tem uma medida de curtose de 3 com base na equação.
A maioria dos algoritmos de computador reduz a medida em 3, como é feito na Equação 2.5.8, de
modo que a medida de curtose de uma distribuição mesocúrtica seja igual a 0. Uma distribuição
leptocúrtica, então, terá uma medida de curtose > 0 e uma distribuição platicúrtica distribuição terá
uma medida de curtose < 0. Esteja ciente de que nem todos os pacotes de computador fazem esse
ajuste. Nesses casos, as comparações com uma distribuição mesocúrtica são feitas contra 3 em vez
de contra 0. Gráficos de distribuições representando os três tipos de curtose são mostrados na Figura 2.5.4.
EXEMPLO 2.5.4
Considere as três distribuições mostradas na Figura 2.5.4. Dado que os histogramas representam
contagens de frequência, os dados podem ser facilmente recriados e inseridos em um pacote estatístico.
Por exemplo, a observação da distribuição “mesocúrtica” produziria os seguintes dados:
1, 2, 2, 3, 3, 3, 3, 3, . . . , 9, 9, 9, 9, 9, 10, 10, 11. Os valores podem ser obtidos de outras
distribuições de maneira semelhante. Usando o software SPSS, as seguintes estatísticas
descritivas foram obtidas para essas três distribuições:
Mesocúrtica Leptocúrtica Platicúrtico
Significar 6,0000 6,0000 6,0000

Mediana 6,0000 6,0000 6,0000
Modo 6,00 6,00 6,00
Curtose 000 .608 1,158
&
FIGURA 2.5.4 Três histogramas representando a curtose.
Gráficos Box-and-Whisker Um dispositivo visual útil para comunicar as informações contidas em um conjunto
de dados é o gráfico box-and-whisker. A construção de um gráfico box-and-whisker (às vezes chamado
simplesmente de boxplot) utiliza os quartis de um conjunto de dados e pode ser realizada seguindo estas cinco
etapas:
1. Represente a variável de interesse no eixo horizontal.
2. Desenhe uma caixa no espaço acima do eixo horizontal de forma que a extremidade esquerda da caixa
se alinhe com o primeiro quartil Q1 e a extremidade direita da caixa se alinhe com o terceiro quartil Q3.
3. Divida a caixa em duas partes por uma linha vertical alinhada com a mediana Q2.
4. Desenhe uma linha horizontal chamada bigode da extremidade esquerda da caixa até um ponto que se
alinhe com a menor medida no conjunto de dados.
5. Desenhe outra linha horizontal, ou bigode, da extremidade direita da caixa até um ponto que se alinhe
com a maior medição no conjunto de dados.
O exame de um gráfico de caixa e bigodes para um conjunto de dados revela informações

em relação à quantidade de dispersão, localização da concentração e simetria dos dados.
O exemplo a seguir ilustra a construção de um gráfico box-and-whisker.
EXEMPLO 2.5.5
Evans e outros. (A-7) examinou o efeito da velocidade nas forças de reação do solo (GRF) em cães com
claudicação de um ligamento cruzado cranial rompido. Os cães foram passeados e trotados sobre uma
plataforma de força, e o GRF foi registrado durante uma determinada fase de sua performance. A Tabela 2.5.1
contém 20 medições de força onde cada valor mostrado é a média de cinco medições de força por cão ao trote.
TABELA 2.5.1 Medições de GRF ao trotar de 20 cães com um ligamento claudicante
14.6 24.3 24.9 27,0 27.2 27.4 28.2 28.8 29.9 30.7
31,5 31.6 32.3 32,8 33.3 33.6 34.3 36,9 38.3 44,0
Fonte: Dados fornecidos por cortesia de Richard Evans, Ph.D.

14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 4644
Medições GRF
FIGURA 2.5.5 Gráfico box-and-whisker para o Exemplo 2.5.5.
Solução: As medidas menor e maior são 14,6 e 44, respectivamente. O primeiro quartil é a medida Q1
¼ ð Þ 20 þ 1 =4 ¼ 5:25, que é 27:2¼þ10:5
ð Þ :25
a medição
ð 27:25.ouA 30:7
mediana
þ ð Þé:5
Q2ðþ
Þ¼ðÞ
31:5
20 þ
30:7
1 =2
27:4
31:1; e o terceiro
ð Þ :75 27:2é33:3
quartil
ð 33:6 a medida
Þ¼ Q3 þ 3 20 ð Þ þ 1 =4 ¼ 15:75, que é igual a 33:3 þ
33:525. O intervalo interquartil é IQR ¼ 33:525

27:25 ¼ 6:275. O intervalo é 29,4 e o IQR é 100 6ð Þ :275=29:4 ¼ 21% do intervalo. O
gráfico box-and-whisker resultante é mostrado na Figura 2.5.5.
&
O exame da Figura 2.5.5 revela que 50 por cento das medições estão entre cerca de 27 e 33,
os valores aproximados do primeiro e terceiro quartis, respectivamente. A barra vertical dentro da caixa
mostra que a mediana é de cerca de 31.
Muitos pacotes de software estatístico têm a capacidade de construir gráficos de caixas e
bigodes. A Figura 2.5.6 mostra um construído pelo MINITAB e outro construído pelo NCSS a partir dos
dados da Tabela 2.5.1. O procedimento para produzir o gráfico MINTAB é mostrado na Figura 2.5.7.
Os asteriscos na Figura 2.5.6 nos alertam para o fato de que o conjunto de dados contém um valor
excepcionalmente grande e um valor incomumente pequeno, chamados outliers. Os outliers são os
cachorros que geraram forças de 14,6 e 44. A Figura 2.5.6 ilustra o fato de que os gráficos de caixa e
bigode podem ser exibidos tanto vertical quanto horizontalmente.
Um outlier, ou uma observação típica, pode ser definido da seguinte forma.
45 45
*
40
35 35
Força 30
25 25
20
15
* 15
FIGURA 2.5.6 Box-and-whisker plot construído pelo MINITAB (esquerda) e por R (direita) a partir dos
dados da Tabela 2.5.1.
:xob golaiD :dnammoc noisseS
Stat EDA Boxplot Simples Clique em OK. MTB > Boxplot 'Força';
SUBC> IQRbox;
SUBC> Outlier.
Variáveis do gráfico de força do tipo .
Clique em OK.
FIGURA 2.5.7 Procedimento do MINITAB para produzir a Figura 2.5.6.
DEFINIÇÃO
Um outlier é uma observação cujo valor, x, excede o valor do terceiro quartil

em uma magnitude maior que 1,5 (IQR) ou é menor que o valor do primeiro quartil
em uma magnitude maior que 1,5 (IQR).
Ou seja, uma observação de x > Q3 þ 1:5 IQR ð Þ ou uma observação de
x < Q1 1:5 IQR ð Þ é chamada de outlier.
Para os dados da Tabela 2.5.1 podemos usar os valores de Q1 previamente calculados;

Q3 e IQR para determinar quão grande ou quão pequeno um valor teria que ser para ser
considerado um outlier. Os cálculos são os seguintes:
x < 27:25 1:5 6ð Þ¼ :275 17:8375 e x > 33:525 þ 1:5 6ð Þ¼ :275 42:9375
Para os dados da Tabela 2.5.1, então, um valor observado menor que 17,8375 ou maior que
42,9375 seria considerado um outlier.
A instrução SAS® PROC UNIVARIATE pode ser usada para obter um gráfico box-and-
whisker. A declaração também produz outras medidas e exibições descritivas, incluindo gráficos
de ramo e folha, médias, variações e quartis.
Análise exploratória de dados Gráficos de caixa e bigodes e exibições de caule e folha são
exemplos do que é conhecido como técnicas de análise exploratória de dados. Essas técnicas,
popularizadas como resultado do trabalho de Tukey (4), permitem ao investigador examinar os
dados de forma a revelar tendências e relacionamentos, identificar características únicas de
conjuntos de dados e facilitar sua descrição e resumo.
EXERCÍCIOS
Para cada um dos conjuntos de dados nos exercícios a seguir, calcule (a) a média, (b) a mediana, (c)
a moda, (d) o intervalo, (e) a variância, (f) o desvio padrão, (g ) o coeficiente de variação, e (h) a
amplitude interquartil. Trate cada conjunto de dados como uma amostra. Para os exercícios para os
quais você acha que seria apropriado, construa um gráfico de caixa e bigodes e discuta a utilidade de
entender a natureza dos dados que este dispositivo fornece. Para cada exercício selecione a medida
de tendência central que você acha que seria mais apropriada para descrever os dados. Dê motivos
para justificar sua escolha.
EXERCÍCIOS 53
2.5.1 Porcellini et al. (A-8) estudou 13 pacientes HIV positivos que foram tratados com terapia antirretroviral
altamente ativa (HAART) por pelo menos 6 meses. As contagens de células T CD4 106=L na linha de
base para os 13 indivíduos estão listadas abaixo.
230 205 313 207 227 245 173

181 Porcellini,
58 103 301 Fonte: Simona 105 169
Guiliana Vallanti, Silvia Nozza, Guido Poli, Adriano
Lazzarin, Guiseppe Tambussi, Antonio Grassia, “Improved
Thymopoietic Potential in Aviremic HIV Infected Individuals
with HAART by Intermittent IL-2 Administration,” AIDS, 17
( 2003), 1621-1630.
2.5.2 Shair e Jasper (A-9) investigaram se a diminuição do retorno venoso em ratos jovens afetaria as
vocalizações ultrassônicas (USVs). Sua pesquisa não mostrou nenhuma mudança significativa no
número de vocalizações ultrassônicas quando o sangue foi removido da veia cava superior ou da
artéria carótida. Outra variável importante medida foi a frequência cardíaca (bmp) durante a retirada do sangue.
A tabela abaixo apresenta a frequência cardíaca de sete filhotes de ratos do experimento envolvendo a artéria
carótida.
._ 560 570 450 570
2.5.3 Butz et al. (A-10) avaliaram a duração do benefício derivado do uso de ventilação não invasiva com pressão
positiva por pacientes com esclerose lateral amiotrófica nos sintomas, qualidade de vida e sobrevida. Uma
das variáveis de interesse é a pressão parcial de dióxido de carbono arterial (PaCO2). Os valores abaixo
(mm Hg) refletem o resultado do teste de linha de base em 30 indivíduos, conforme estabelecido por análises
de gases no sangue arterial.
40.0 47.0 34.0 42.0 54.0 48.0 53.6 56.9 58.0 45.0 54.5 54.0 43.0 44.3 53.9 41.8 33.0
43.1 52.4 37.9 34.5 40.1 33.0 59.9 62.6 54.1 45.7
Wollinsky, U. 40.6 56.6 59.0 Source:A.
Widemuth-Catrinescu, SM.Winter,
Butz, KH
Sperfeld,
HH
Mehrkens, AC Ludolph e H. Schreiber,com"Efeitos
pressãolongitudinais
positiva
lateral
emdaamiotrófica",
pacientes
ventilação
comAmerican
não
esclerose
invasiva
Journal of Medical Rehabilitation, 82 (2003), 597–604.
2.5.4 Segundo Starch et al. (A-11), os enxertos de tendão dos isquiotibiais têm sido o “elo mais fraco” na
reconstrução do ligamento cruzado anterior. Em um estudo controlado de laboratório, eles compararam
duas técnicas de reconstrução: parafuso de interferência ou manga central e parafuso no lado tibial.
Para oito joelhos cadavéricos, as medidas abaixo representam a força necessária (em newtons) na
qual ocorreu a falha inicial dos fios do enxerto para a técnica de manga central e parafuso.
172,5 239,76 19,57 195,72

216,63 Fonte:
212,62 98,97David W. Starch,
66,95 Jerry W. Alexander, Philip C.
Noble, Suraj Reddy e David M.
Lintner, “Fixação de enxerto de tendão de isquiotibiais multitranda com um parafuso central de quatro
quadrantes ou um parafuso de interferência tibial padrão para reconstrução do ligamento cruzado
anterior”, The American Journal of Sports Medicine, 31 (2003), 338–344.
2.5.5 Cardoso et al. (A-12) realizou uma revisão retrospectiva de 4 anos de 102 mulheres submetidas a histerectomia
radical para câncer cervical ou endometrial. Infecção do trato urinário associada ao cateter foi observada em 12
dos indivíduos. Abaixo estão os números de dias de pós-operatório até o diagnóstico da infecção para cada
indivíduo que apresentou uma infecção.
16 10 49 15 6 15
8 19 11 Fonte: 22 13 17
Richard J. Cardosi, Rosemary Cardosi, Edward C.
Grendys Jr., James V. Fiorica e Mitchel S. Hoffman, “Infectious
Urinary Tract Morbidity with Prolonged Bladder Catheterization
After Radical Hysterectomy,” American Journal of Obstetrics and
Gynecology , 189 (2003), 380–384.
2.5.6 O objetivo do estudo de Nozawa et al. (A-13) foi avaliar o resultado do reparo cirúrgico do defeito da pars
interarticularis por fixação segmentar com fio em adultos jovens com espondilólise lombar. Os autores
descobriram que a fixação com fio segmentar historicamente tem sido bem-sucedida no tratamento de não
atletas com espondilólise, mas não havia informações sobre os resultados desse tipo de cirurgia em atletas. Em
um estudo retrospectivo, os autores encontraram 20 indivíduos que fizeram a cirurgia entre 1993 e 2000. Para
esses indivíduos, os dados abaixo representam a duração em meses de acompanhamento após a operação.
103 68 62 60 60 54 49 44 42 41 19 19 17 16 Fonte: Satoshi

38 36 34 30 19 19 Nozawa, Katsuji
Shimizu, Kei Miyamoto e Mizuo Tanaka, “Repair of Pars
Interarticularis Defect by Segmental Wire Fixation in Young Athletes
with Spondylolysis,” American Journal of Sports Medicina, 31
(2003), 359–364.
2.5.7 Ver Exercício 2.3.1.
2.5.14 Em um estudo piloto, Huizinga et al. (A-14) queria obter mais informações sobre as consequências psicossociais
para os filhos de pais com câncer. Para o estudo, 14 famílias participaram de entrevistas semiestruturadas e
preencheram questionários padronizados. Abaixo está a idade do pai doente com câncer (em anos) para as 14
famílias.
37 48 53 46 42 49 44
38 32 32 51 51 41 Fonte:
48 Gea A.
Huizinga, Winette TA van der Graaf, Annemike Visser, Jos S. Dijkstra
e Josette EHM Hoekstra-Weebers, “Psychosocial Consequences for Children
of a Parent with Cancer,” Cancer Nursing, 26 (2003) , 195–202.
RESUMO DAS FÓRMULAS DO CAPÍTULO 2 55
2.6 RESUMO
Neste capítulo, vários procedimentos estatísticos descritivos são explicados. Isso inclui a organização
dos dados por meio da matriz ordenada, a distribuição de frequência, a distribuição de frequência relativa,
o histograma e o polígono de frequência. Os conceitos de tendência central e variação são descritos,
juntamente com métodos para calcular suas medidas mais comuns: média, mediana, moda, intervalo,
variância e desvio padrão. O leitor também é apresentado aos conceitos de assimetria e curtose e à
análise exploratória de dados por meio de uma descrição de exibições de caule e folha e gráficos de caixa
e bigode.
Enfatizamos o uso do computador como ferramenta de cálculo de medidas descritivas

e construir várias distribuições a partir de grandes conjuntos de dados.
RESUMO DAS FÓRMULAS DO CAPÍTULO 2
Fórmula
Número Nome Fórmula
2.3.1 Largura do intervalo de R

w¼
classe usando a regra de Sturges k
2.4.1 Média de uma população

PN XI
i¼1 m ¼
N
2.4.2 Distorção ffiffiffi
3 ffiffiffi
3
np Pn ð xi x º np Pn ð xi x º
i¼1 i¼1
Distorção ¼ ¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
32 1Þ n 1 p s3 ð n
2
Pnð xi x º
i¼1
2.4.2 Média de uma amostra

Pn XI
i¼1
x¼
n
2.5.1 Alcance R ¼ xL xs
2.5.2 Variação da amostra 2

Pnð xi x º
i¼1
s2 ¼
n1
2.5.3 variação da população 2

PN ð Þ xi m
i¼1
s2 ¼
N
(Contínuo )
2.5.4 Desvio padrão

2
fffiffiffi
Pn ð Þ xi x
i¼1
s¼ s2 p ¼
vuuut
n1
2.5.5 Coeficiente de variação s

C:V: ¼ ð Þ 100%
x
2.5.6 Localização do quartil na 1

Q1 ¼ ðnþ1Þ
matriz ordenada 4
1
Q2 ¼ ð n þ 1 Þ 2
3
Q3 ¼ ðnþ1Þ
4
2.5.7 Intervalo interquartílico IQR ¼ Q3 Q1
2.5.8 Curtose 4 4
Pn ðxi x º n Pn ðxi x º
i¼1 i¼1
Curtose ¼ 2
3¼
2
3
2 ðn1Þ s4
Pn ðxi x º
i¼1
Chave de símbolo C:V: coeficiente de variação de ¼
IQR ¼ intervalo interquartil k ¼

número de intervalos de classe
m ¼ média populacional
N ¼ tamanho da população
n ¼ tamanho da amostra ð
Þ¼ n 1 graus de liberdade
Q1 ¼ primeiro quartil
Q2 ¼ segundo quartil ¼ mediana
Q3 ¼ terceiro quartil
Faixa de R ¼
s ¼ desvio padrão
s2 ¼ variância da amostra
s2 ¼ variância da população
th xi ¼ i observação de dados
xL ¼ maior ponto de dados xS
¼ menor ponto de dados x ¼
média da amostra
w ¼ largura da classe
1. Defina:
(a) Exibição de caule e folha (b) Box-and-whisker plot (d)

(c) Percentil (e) Parâmetro Quartil (f) Análise exploratória
de localização (g) Matriz de dados (h) Distribuição de
ordenada (i) Distribuição de frequência (j) Estatística (l)
frequência relativa (k) Parâmetro (m) Polígono de frequência (n)
Limites reais de classe Histograma
2. Defina e compare as características da média, da mediana e da moda.
3. Quais são as vantagens e limitações do alcance como medida de dispersão?
4. Explique a justificativa para usar n 1 para calcular a variância da amostra.
5. Qual é a finalidade do coeficiente de variação?
6. Qual é o propósito da regra de Sturges?
7. Qual é outro nome para o percentil 50 (segundo ou quartil médio)?
8. Descreva de seu campo de estudo uma população de dados em que o conhecimento da tendência central e da
dispersão seria útil. Obtenha valores sintéticos reais ou realistas dessa população e calcule a média, mediana,
moda, variância e desvio padrão.
9. Colete um conjunto de dados reais ou realistas de seu campo de estudo e construa uma distribuição de frequência, uma
distribuição de frequência relativa, um histograma e um polígono de frequência.
10. Calcule a média, mediana, moda, variância e desvio padrão para os dados do Exercício 9.
11. Encontre um artigo em um periódico de sua área de estudo em que alguma medida de tendência central e
dispersão foram calculados.
12. O objetivo do estudo de Tam et al. (A-15) foi investigar a manobra da cadeira de rodas em indivíduos com lesão
medular (LM) de nível inferior e controles saudáveis. Os sujeitos usaram uma cadeira de rodas modificada para
incorporar uma superfície de assento rígida para facilitar as medições experimentais especificadas.
A medição da pressão da interface foi registrada usando um tapete sensível à pressão de alta resolução com
uma resolução espacial de 4 sensores por centímetro quadrado colado no suporte do assento rígido. Durante
as condições sentadas estáticas, as pressões médias foram registradas sob as tuberosidades isquiáticas. Os
dados para medições da tuberosidade isquiática esquerda (em mm Hg) para os grupos SCI e controle são
mostrados abaixo.
Controle 131 115 124 131 122 117 88 114 150 169
SCI 60 150 130 180 163 130 121 119 130 148
Fonte: Eric W. Tam, Arthur F. Mak, Wai Nga Lam, John H. Evans e York Y.
Chow, "Movimento pélvico e distribuição de pressão na interface durante a propulsão
manual da cadeira de rodas", Archives of Physical Medicine and Rehabilitation, 84 (2003),
1466–1472.
(a) Encontre a média, mediana, variância e desvio padrão para os controles.

(b) Encontre a média, a variância mediana e o desvio padrão para o grupo SCI.
(c) Construa um gráfico de caixa e bigode para os controles.

(d) Construa um gráfico box-and-whisker para o grupo SCI. (e)
Você acredita que há uma diferença nas leituras de pressão para controles e indivíduos com LM neste
estudo?
13. Johnson et al. (A-16) realizou uma revisão retrospectiva de 50 fetos submetidos a fechamento aberto
de mielomeningocele fetal. Os dados abaixo mostram a idade gestacional em semanas dos 50 fetos
submetidos ao procedimento.
25 25 26 27 29 29 29 30 30 31
32 32 32 33 33 33 33 34 34 34
35 35 35 35 35 35 35 35 35 36
36 36 36 36 36 36 36 36 36 36
36 36 36 36 36 36 36 36 37 37
Fonte: Mark P. Johnson, Leslie N. Sutton, Natalie Rintoul, Timothy M. Crom bleholme, Alan W.
Flake, Lori J. Howell, Holly L. Hedrick, R. Douglas Wilson e N. Scott Adzick, “Fetal Myelomeningocele
Repair : Resultados Clínicos de Curto Prazo,”
American Journal of Obstetrics and Gynecology, 189 (2003), 482–487.
(a) Construa um gráfico de caule e folha para essas idades

gestacionais. (b) Com base no diagrama de ramo e folha, que palavra você usaria para descrever a
natureza dos dados? (c) Por que você acha que o diagrama de ramo e folha tem essa aparência? (d)
Calcule a média, a mediana, a variância e o desvio padrão.
14. A tabela a seguir apresenta a distribuição etária do número de mortes no estado de Nova York devido a
acidentes para residentes com 25 anos ou mais.
Número de mortes
Anos de idade) Devido a Acidentes
25–34 393
35–44 514
45–54 460
55–64 341
65–74 365
75–84 616
85–94 618
Fonte: Departamento de Saúde do Estado de Nova York, Estatísticas

Vitais do Estado de Nova York, 2000, Tabela 32: Informações
Resumidas de Óbitos por Idade.
Pode incluir mortes devido a acidentes para adultos com mais
de 94 anos.
Para esses dados, construa uma distribuição de frequência cumulativa, uma distribuição de frequência relativa e
uma distribuição de frequência relativa cumulativa.
15. Krieser et al. (A-17) examinou a taxa de filtração glomerular (TFG) em receptores de transplante renal
pediátrico. A TFG é um parâmetro importante da função renal avaliada em receptores de transplante renal.
A seguir estão as medições de 19 indivíduos de GFR medidos com ácido dietilenotriamina penta-
acético. (Nota: alguns assuntos foram medidos mais de uma vez.)
18 42
21 43
21 43
23 48
27 48
27 51
30 55
32 58
32 60
32 62
36 67
37 68
41 88
42 63
Fonte: Dados fornecidos por cortesia de DMZ Krieser, MD
(a) Calcule média, mediana, variância, desvio padrão e coeficiente de variação. (b) Construa uma
exibição de ramo e folha. (c) Construa um gráfico de caixa e bigodes. (d) Que porcentagem das
medições está dentro de um desvio padrão da média? Dois desvios padrão? Três desvios padrão?
16. A seguir estão os níveis de cistatina C (mg/L) para os pacientes descritos no Exercício 15 (A-17).
A cistatina C é uma proteína básica catiônica que foi investigada por sua relação com os níveis de TFG. Além
disso, os níveis de creatinina também são fornecidos. (Nota: Alguns assuntos foram medidos mais de uma vez.)
Cistatina C (mg/L) Creatinina (mmol/L)
1,78 4,69 0,35 0,14

2.16 3,78 0,30 0,11
1,82 2.24 0,20 0,09
1,86 4,93 0,17 0,12
1,75 2.71 0,15 0,07
1,83 1,76 0,13 0,12
2.49 2.62 0,14 0,11
1,69 2.61 0,12 0,07
1,85 3,65 0,24 0,10
1,76 2.36 0,16 0,13
1.25 3.25 0,17 0,09
1,50 2.01 0,11 0,12
2.06 2.51 0,12 0,06
2.34
Fonte: Dados fornecidos por cortesia de DMZ Krieser, MD
(a) Para cada variável, calcule a média, a mediana, a variância, o desvio padrão e o coeficiente de variação.
(b) Para cada variável, construa uma exibição de ramo e folha e um gráfico de caixa e bigodes.
(c) Qual conjunto de medições é mais variável, cistatina C ou creatinina? Em que você baseia sua resposta?
17. Dê três sinônimos para variação (variabilidade).
18. A tabela a seguir mostra a distribuição etária dos nascidos vivos no Condado de Albany, Nova York, para
2000.
idade da mãe Número de Nascidos Vivos
10–14 7
15–19 258
20–24 585
25–29 841
30–34 981
35–39 526
40–44 99
45–49 4
Fonte: Departamento de Saúde do Estado de Nova York, Estatísticas

Vitais Anuais 2000, Tabela 7, Nascidos Vivos por Condado de
Residente e Idade da Mãe.
Pode incluir nascidos vivos de mães com mais de 49 anos.
Para esses dados, construa uma distribuição de frequência cumulativa, uma distribuição de frequência relativa e
uma distribuição de frequência relativa cumulativa.
19. Spivack (A-18) investigou a gravidade da doença associada a C. difficilie em pacientes pediátricos internados.
Uma das variáveis que eles examinaram foi o número de dias em que os pacientes tiveram diarreia. Os dados
para os 22 indivíduos no estudo aparecem abaixo. Calcule a média, a mediana, a variância e o desvio padrão.
3 11 3 4 14 2 4 5 3 11 2
2 321 17211 32
Fonte: Jordan G. Spivack, Stephen C. Eppes e Joel D. Klien, “Clostridium
Difficile–Associated Diarrhea in a Pediatric Hospital,” Clinical Pediatrics, 42
(2003), 347–352.
20. Expresse em palavras as seguintes propriedades da média amostral: (a)

2
Sð Þ xx (b) nx ¼ ¼
Sxno
(c)mínimo
Sð Þ¼ xx 0
21. Seu instrutor de estatística informa no primeiro dia de aula que haverá cinco testes durante o semestre.
A partir das pontuações desses testes para cada aluno, o instrutor calculará uma medida de tendência central
que servirá como a nota final do aluno no curso. Antes de fazer o primeiro teste, você deve escolher se deseja
que sua nota final seja a média ou a mediana das cinco notas do teste. Qual você escolheria? Porque?
22. Considere os seguintes intervalos de classe possíveis para uso na construção de uma distribuição de frequência de
níveis séricos de colesterol de indivíduos que participaram de uma triagem em massa:
(a) 50–74 (b) 50–74 (c) 50–75

75–99 75–99 75–100
100–149 100–124 100–125
150–174 125–149 125–150
175–199 150–174 150–175

200–249 175–199 175–200
250–274 200–224 200–225
etc. 225–249 225–250
etc. etc.
Qual conjunto de intervalos de classe você acha que é mais apropriado para o propósito? Porque? Indique especificamente
para cada um porque você acha que os outros dois são menos desejáveis.
23. Em um teste de estatística, os alunos foram solicitados a construir uma distribuição de frequência dos níveis de creatina no
sangue (unidades/litro) para uma amostra de 300 indivíduos saudáveis. A média foi 95 e o desvio padrão foi 40. As
seguintes larguras de intervalo de classe foram usadas pelos alunos:
(a) 1 (d) 15
(b) 5 (e) 20
(c) 10 (f) 25
Comente sobre a adequação dessas escolhas de larguras.
24. Dê um exemplo relacionado às ciências da saúde de uma população de medições para a qual a média seria
ser uma medida de tendência central melhor do que a mediana.
25. Dê um exemplo relacionado às ciências da saúde de uma população de medições para a qual a mediana seria
ser uma medida de tendência central melhor do que a média.
26. Indique para as seguintes variáveis qual você acha que seria uma medida melhor de tendência central,
a média, a mediana ou a moda e justifique sua escolha: (a) Renda
anual de auxiliares de enfermagem licenciadas no Sudeste. (b) Diagnósticos de
pacientes atendidos no departamento de emergência de um hospital de grande cidade. (c) Pesos de
jogadores de basquete do ensino médio.
27. Consulte o Exercício 2.3.11. Calcule a média, mediana, variância, desvio padrão, primeiro quartil, terceiro quartil e intervalo
interquartil. Construa um boxplot dos dados. A moda, a mediana e a média são iguais? Se não, explique por quê. Discuta
os dados em termos de variabilidade. Compare o IQR com o intervalo.
O que a comparação lhe diz sobre a variabilidade das observações?
28. Consulte o Exercício 2.3.12. Calcule a média, mediana, variância, desvio padrão, primeiro quartil, terceiro quartil e intervalo
interquartil. Construa um boxplot dos dados. A moda, a mediana e a média são iguais? Se não, explique por quê. Discuta
os dados em termos de variabilidade. Compare o IQR com o intervalo.
O que a comparação lhe diz sobre a variabilidade das observações?
29. Thilothammal et al. (A-19) desenhou um estudo para determinar a eficácia da vacina BCG (bacilo Calmette-Guerin) na
prevenção da meningite tuberculosa. Entre os dados coletados em cada sujeito estava uma medida do estado nutricional
(peso real expresso como uma porcentagem do peso esperado para a altura real). A tabela a seguir mostra os valores do
estado nutricional dos 107 casos estudados.
73,3 54,6 82,4 76,5 72.2 73,6 74,0

80,5 71,0 56,8 80,6 100,0 79,6 67,3
50,4 66,0 83,0 72,3 55,7 64,1 66,3
50,9 71,0 76,5 99,6 79,3 76,9 96,0
64,8 74,0 72,6 80,7 109,0 68,6 73,8
74,0 72,7 65,9 73,3 84,4 73,2 70,0
72,8 73,6 70,0 77,4 76,4 66,3 50,5
72,0 97,5 130,0 68.1 86,4 70,0 73,0

59,7 89,6 76,9 74,6 67,7 91,9 55,0
90,9 70,5 88.2 70,5 74,0 55,5 80,0
76,9 78.1 63,4 58,8 92,3 100,0 84,0
71,4 84,6 123,7 93,7 76,9 79,6
45,6 92,5 65,6 61.3 64,5 72,7
77,5 76,9 80.2 76,9 88,7 78,1
60,6 59,0 84,7 78,2 72,4 68,3
67,5 76,9 82,6 85,4 65,7 65,9
Fonte: Dados fornecidos por cortesia do Dr. N. Thilothammal.
(a) Para esses dados, calcule as seguintes medidas descritivas: média, mediana, moda, variância, desvio padrão, amplitude,
primeiro quartil, terceiro quartil e IQR. (b) Construa os seguintes gráficos para os dados: histograma, polígono de frequência,
gráfico de ramo e folha e boxplot. (c) Discuta os dados em termos de variabilidade. Compare o IQR com o intervalo. O que
a comparação lhe diz sobre a variabilidade das observações? (d) Que proporção das medições está dentro de um desvio
padrão da média? Dois desvios padrão da média? Três desvios padrão da média?
(e) Que proporção das medições é inferior a 100? (f) Que proporção das
medições é inferior a 50?
Exercícios para uso com grandes conjuntos de dados disponíveis no seguinte site : www.wiley.com/college/daniel
1. Consulte o conjunto de dados NCBIRTH800. O Centro Estadual da Carolina do Norte para Estatísticas de Saúde e
O Instituto Howard W. Odum para Pesquisa em Ciências Sociais da Universidade da Carolina do Norte em Chapel Hill (A-20)
disponibiliza publicamente os dados de nascimento e morte infantil de todas as crianças nascidas no estado da Carolina do
Norte. Esses dados podem ser acessados em www.irss.unc.edu/ncvital/bfd1down.html.
Os registros sobre dados de nascimento remontam a 1968. Este conjunto de dados abrangente para os nascimentos em 2001
contém 120.300 registros. Os dados representam uma amostra aleatória de 800 desses nascimentos e variáveis selecionadas.
As variáveis são as seguintes:
Descrição do Rótulo da Variável
PLURALIDADE Número de filhos nascidos da gravidez

SEXO ¼ masculino; 2 ¼ Sexo
fêmeada criança 1ð Þ
MAGO Idade da mãe (anos)
SEMANAS Semanas completas de gestação (semanas)
CASAL ¼ casado; 2 ¼ não casado
Estado civil 1ðÞ
RACEMOM Raça da mãe (0 ¼ outro não-branco, 1 ¼ branco; 2 ¼ preto; 3 ¼ americano
indiano, 4 ¼ chinês; 5 ¼ Japonês; 6 ¼ havaianas; 7 ¼ Filipino; 8 ¼ Outro
asiático ou ilhéu do Pacífico)
HISPMOM Mãe de origem hispânica (C ¼ cubana; M ¼ mexicana; N ¼ não hispânica,
O ¼ hispânico desconhecido, P ¼ porto-riquenho, S ¼ central=sul
americano, U ¼ não classificável)
GANHOU Peso ganho durante a gravidez (libras) 0 ¼ mãe não
FUMAÇA fumou durante a gravidez 1 ¼ mãe fumou durante a
gravidez
REFERÊNCIAS 63
BEBER 0 ¼ mãe não consumiu álcool durante a gravidez 1 ¼ mãe

consumiu álcool durante a gravidez
TONS Peso da criança (onças)
TGRAMS Peso da criança (gramas)
BAIXO 0 ¼ criança não nasceu com baixo peso
1 ¼ criança nasceu com baixo peso 0 ¼
PREMIE criança não nasceu prematura 1 ¼
criança nasceu prematura
Prematuro definido com 36 semanas ou antes
Para as variáveis de MAGE, WEEKS, GAINED, TOUNCES e TGRAMS:0
1. Calcule a média, mediana, desvio padrão, IQR e intervalo.
2. Para cada um, construa um histograma e comente o formato da distribuição.
3. Os histogramas para TOUNCES e TGRAMS são notavelmente semelhantes? Porque?
4. Construa gráficos de caixa e bigode para todas as quatro variáveis.
5. Construa gráficos de caixa e bigode lado a lado para a variável de TOUNCES para mulheres que admitiram fumar e
mulheres que não admitiram fumar. Você vê uma diferença no peso ao nascer nos dois grupos? Qual grupo tem
mais variabilidade?
6. Construa gráficos de caixa e bigode lado a lado para a variável de MAGE para mulheres casadas e não casadas. Você
vê uma diferença de idade nos dois grupos? Qual grupo tem mais variabilidade?
Os resultados são surpreendentes?
7. Calcule a assimetria e a curtose do conjunto de dados. O que eles indicam?
REFERÊNCIAS
1. HA STURGES, “The Choice of a Class Interval,” Journal of the American Statistical Association, 21 (1926),
65–66.
2. HELEN M. WALKER, “Degrees of Freedom”, Journal of Educational Psychology, 31 (1940), 253–269.
3. ROB J. HYNDMAN e YANAN FAN, “Sample Quantiles in Statistical Packages,” The American Statistician, 50
(1996), 361-365.
4. JOHN W. TUKEY, Análise Exploratória de Dados, Addison-Wesley, Reading, MA, 1977.
A-1. FARHAD ATASSI, “Oral Home Care and the Reasons for Seeking Dental Care by Individuals on Renal Dialysis”,
Journal of Contemporary Dental Practice, 3 (2002), 031–041.
A-2. VALLABH JANARDHAN, ROBERT FRIEDLANDER , HOWARD RIINA e PHILIP EDWIN STIEG, “Identificando pacientes em
risco de morbidade pós-procedimento após tratamento de aneurismas intracranianos incidentais: o papel do tamanho e
localização do aneurisma”, Neurosurgical Focus, 13 (2002), 1–8.
A-3. A. HOEKEMA, B. HOVINGA, B. STEGENGA e LGM De BONT, "Morfologia Craniofacial e Apnéia Obstrutiva do Sono:
Uma Análise Cefalométrica", Journal of Oral Rehabilitation, 30 (2003), 690–696.
A-4. DAVID H. HOLBEN, "Conteúdo de selênio de carne de veado, esquilo e carne bovina comprada ou produzida em Ohio, uma
região com baixo teor de selênio dos Estados Unidos", Journal of Food Science, 67 (2002), 431–433.
A-5. ERIK SKJELBO, THEONEST K. MUTABINGWA, IB BYGBJERG, KARIN K. NIELSEN, LARS F. GRAM e KIM BRØSEN,
“Chloroguanide Metabolism in Relation to the Efficacy in Malaria Prophylaxis and the S-Mephenytoin Oxidation in
Tanzanians,” Clinical Pharmacology & Therapeutics , 59 (1996), 304–311.
A-6. HENRIK SCHMIDT, POUL ERIK MORTENSEN, SAREN LARS FALSGAARD e ESTHER A. JENSEN, “Autotransfusion
after Coronary Artery Bypass Grafting Halvings the Number of Patients Needing Blood Transfusion,” Annals of
Thoracic Surgery, 61 (1996), 1178–1181.
A-7. RICHARD EVANS, WANDA GORDON e MIKE CONZEMIUS, “Efeito da velocidade nas forças de reação do solo em
cães com claudicação atribuível ao rompimento do ligamento cruzado cranial”, American Journal of Veterinary
Research, 64 (2003), 1479–1481.
A-8. SIMONA PORCELLINI, GUILIANA VALLANTI, SILVIA NOZZA, GUIDO POLI, ADRIANO LAZZARIN, GUISEPPE
TAMBUSSI e ANTONIO GRASSIA, “Improved Thymopoietic Potential in Aviremic HIV Infected Individuals with HAART
by Intermittent IL-2 Administration,” AIDS, 17 (2003) 1621–1630 .
A-9. HARRY N. SHAIR e ANNA JASPER, “A diminuição do retorno venoso não é suficiente nem necessária para provocar a
vocalização ultrassônica de filhotes de ratos infantis”, Behavioral Neuroscience, 117 (2003), 840–853.
A-10. M. BUTZ, KH WOLLINSKY, U. WIDEMUTH-CATRINESCU, A. SPERFELD, S. WINTER, HH MEHRKENS, AC
LUDOLPH e H. SCHREIBER, “Efeitos longitudinais da ventilação não invasiva com pressão positiva em pacientes com
esclerose lateral amiotófica”, American Journal of Medical Rehabilitation, 82 (2003), 597–604.
A-11. DAVID W. STARCH, JERRY W. ALEXANDER, PHILIP C. NOBLE, SURAJ REDDY, e DAVID M. LINTNER,
“Multistranded Hamstring Tendon Graft Fixation with a Central Four-Quadrant or a Standard Tibial Interference
Screw for Anterior Cruciate Ligament Reconstruction,” American Journal of Sports Medicine, 31 (2003), 338–344.
A-12. RICHARD J. CARDOSI, ROSEMARY CARDOSI, EDWARD C. GRENDYS Jr., JAMES V. FIORICA e MITCHEL S.
HOFFMAN, “Infectious Urinary Tract Morbidity with Prolonged Bexiga Catheterization after Radical Hysterectomy,”
A-13. SATOSHI NOZAWA, KATSUJI SHIMIZU, KEI MIYAMOTO e MIZUO TANAKA, “Repair of Pars Interarticularis Defect
by Segmental Wire Fixation in Young Athletes with Spondylolysis,” American Journal of Sports Medicine, 31 (2003),
359–364.
A-14. GEA A. HUIZINGA, WINETTE TA van der GRAAF, ANNEMIKE VISSER, JOS S. DIJKSTRA e JOSETTE EHM
HOEKSTRA-WEEBERS, “Psychosocial Consequences for Children of a Parent with Cancer,” Cancer Nursing, 26 (2003),
195–202.
A-15. ERIC W. TAM, ARTHUR F. MAK, WAI NGA LAM, JOHN H. EVANS e YORK Y. CHOW, “Pelvic Movement and Interface
Pressure Distribution Durante Manual Wheelchair Propulsion,” Archives of Physical Medicine and Rehabilitation, 84
(2003) , 1466–1472.
A-16. MARK P. JOHNSON, LESLIE N. SUTTON, NATALIE RINTOUL, TIMOTHY M. CROMBLEHOLME, ALAN W. FLAKE,
LORI J. HOWELL, HOLLY L. HEDRICK, R. DOUGLAS WILSON e N. SCOTT ADZICK, “Fetal Myelomeningocele
Repair: Short -term Clinical Outcomes,” American Journal of Obstetrics and Gynecology, 189 (2003), 482–487.
A-17. DMZ KRIESER, AR ROSENBERG, G. KAINER e D. NAIDOO, “A relação entre creatinina sérica, cistatina C sérica e taxa de
filtração glomerular em receptores de transplante renal pediátrico: um estudo piloto,”
Transplante Pediátrico, 6 (2002), 392–395.
A-18. JORDAN G. SPIVACK, STEPHEN C. EPPES e JOEL D. KLIEN, “Clostridium Difficile - Diarréia Associada em um
Hospital Pediátrico,” Clinical Pediatrics, 42 (2003), 347–352.
A-19. N. THILOTHAMMAL, PV KRISHNAMURTHY , DESMOND K. RUNYAN e K. BANU, “Does BCG Vaccine Prevent
Meningite Tuberculosa? Archives of Disease in Childhood, 74 (1996), 144–147.
A-20. Centro Estadual da Carolina do Norte para Estatísticas de Saúde e Instituto Howard W. Odum para Pesquisa em Ciências Sociais
na Universidade da Carolina do Norte em Chapel Hill. Dados de nascimento de 2001 encontrados em www.irss.unc.edu/
ncvital/bfd1down.html . Todos os cálculos foram realizados por John Holcomb e não representam as conclusões do Centro
ou Instituto.
CAPÍTULO 3
ALGUMAS PROBABILIDADES BÁSICAS

CONCEITOS
A probabilidade estabelece a base para a inferência estatística. Este capítulo fornece

uma breve visão geral dos conceitos de probabilidade necessários para a compreensão
dos tópicos abordados nos capítulos seguintes. Ele também fornece um contexto para
entender as distribuições de probabilidade usadas na inferência estatística e apresenta
ao aluno várias medidas comumente encontradas na literatura médica (por exemplo, a
sensibilidade e a especificidade de um teste).
TÓPICOS
3.1 INTRODUÇÃO
3.2 DUAS VISÃO DA PROBABILIDADE: OBJETIVO E SUBJETIVO
3.3 PROPRIEDADES ELEMENTARES DA PROBABILIDADE
3.4 CÁLCULO DA PROBABILIDADE DE UM EVENTO
3.5 TEOREMA DE BAYES, TESTES DE TRIAGEM, SENSIBILIDADE, ESPECIFICIDADE

E VALOR PREDITIVO POSITIVO E NEGATIVO
3.6 RESUMO
Depois de estudar este capítulo, o aluno 1.

compreenderá frequência clássica, relativa e probabilidade subjetiva. 2. compreender
as propriedades da probabilidade e as regras de probabilidade selecionadas. 3. ser capaz
de calcular a probabilidade de um evento. 4. ser capaz de aplicar o teorema de Bayes no
cálculo dos resultados dos testes de triagem.
3.1 INTRODUÇÃO
A teoria da probabilidade fornece a base para a inferência estatística. No entanto, esta

teoria, que é um ramo da matemática, não é a preocupação principal deste livro e,
conseqüentemente, apenas seus conceitos fundamentais são discutidos aqui. Alunos que desejam
65
66 CAPÍTULO 3 ALGUNS CONCEITOS BÁSICOS DE PROBABILIDADE
Para prosseguir com esse assunto, consulte os muitos livros sobre probabilidade disponíveis na maioria
das bibliotecas de faculdades e universidades. Os livros de Gut (1), Isaac (2) e Larson (3) são recomendados.
Os objetivos deste capítulo são ajudar os alunos a adquirir alguma habilidade matemática na área de
probabilidade e auxiliá-los no desenvolvimento de uma compreensão dos conceitos mais importantes. O
progresso nessa linha contribuirá imensamente para seu sucesso na compreensão dos procedimentos de
inferência estatística apresentados posteriormente neste livro.
O conceito de probabilidade não é estranho aos profissionais de saúde e é frequentemente
encontrado na comunicação cotidiana. Por exemplo, podemos ouvir um médico dizer que um paciente tem
50% de chance de sobreviver a uma determinada operação. Outro médico pode dizer que tem 95% de
certeza de que um paciente tem uma determinada doença. Uma enfermeira de saúde pública pode dizer
que nove em cada dez vezes um determinado cliente vai cancelar uma consulta. Como esses exemplos
sugerem, a maioria das pessoas expressa probabilidades em termos de porcentagens. Ao lidar com
probabilidades matematicamente, é mais conveniente expressar probabilidades como frações. (As
porcentagens resultam da multiplicação das frações por 100.) Assim, medimos a probabilidade de
ocorrência de algum evento por um número entre zero e um. Quanto mais provável o evento, mais próximo
o número está de um; e quanto mais improvável o evento, mais próximo o número está de zero. Um evento
que não pode ocorrer tem probabilidade zero, e um evento que certamente ocorrerá tem probabilidade um.
Os pesquisadores das ciências da saúde se perguntam continuamente se os resultados de seus

esforços poderiam ter ocorrido por acaso ou se alguma outra força estaria operando para produzir os
efeitos observados. Por exemplo, suponha que seis em cada dez pacientes que sofrem de alguma doença
sejam curados após receber um determinado tratamento. É provável que tal taxa de cura tenha ocorrido se
os pacientes não tivessem recebido o tratamento, ou é evidência de um verdadeiro efeito curativo por parte
do tratamento? Veremos que questões como essas podem ser respondidas por meio da aplicação dos
conceitos e leis da probabilidade.
3.2 DUAS VISÃO DA PROBABILIDADE: OBJETIVO

E SUBJETIVO
Até muito recentemente, a probabilidade era considerada por estatísticos e matemáticos apenas como um
fenômeno objetivo derivado de processos objetivos.
O conceito de probabilidade objetiva pode ser categorizado ainda sob os títulos de (1) probabilidade
clássica, ou a priori, e (2) a frequência relativa, ou a posteriori, conceito de probabilidade.
Probabilidade clássica O tratamento clássico da probabilidade remonta ao século XVII e ao trabalho de

dois matemáticos, Pascal e Fermat. Grande parte dessa teoria se desenvolveu a partir de tentativas de
resolver problemas relacionados a jogos de azar, como os que envolvem o lançamento de dados. Exemplos
de jogos de azar ilustram muito bem os princípios envolvidos na probabilidade clássica. Por exemplo, se
um dado honesto de seis faces for lançado, a probabilidade de que um 1 seja observado é igual a 1=6 e é
a mesma para as outras cinco faces.
Se uma carta for retirada aleatoriamente de um baralho bem embaralhado de cartas comuns, a probabilidade
de sair uma copa é 13=52. Probabilidades como essas são calculadas pelos processos de raciocínio
abstrato. Não é necessário jogar um dado ou tirar uma carta para calcular
3.2 DUAS VISÃO DA PROBABILIDADE: OBJETIVO E SUBJETIVO 67
essas probabilidades. No lançamento do dado, dizemos que cada um dos seis lados tem a mesma
probabilidade de ser observado se não houver razão para favorecer qualquer um dos seis lados. Da mesma
forma, se não há razão para favorecer a retirada de uma determinada carta de um baralho, dizemos que cada
uma das 52 cartas tem a mesma probabilidade de ser retirada. Podemos definir probabilidade no sentido
clássico da seguinte forma:
DEFINIÇÃO
Se um evento pode ocorrer de N maneiras mutuamente exclusivas e igualmente prováveis,

e se m destas possuir uma característica E, a probabilidade da ocorrência de E é igual a
m=N.
Se lermos P Eð Þ como “a probabilidade de E”, podemos expressar essa definição como
m
P Eð Þ¼ (3.2.1)
N
Probabilidade de frequência relativa A abordagem de probabilidade de frequência relativa depende da

repetibilidade de algum processo e da capacidade de contar o número de repetições, bem como o número de
vezes que algum evento de interesse ocorre. Neste contexto podemos definir a probabilidade de observar
alguma característica, E, de um evento como segue:
DEFINIÇÃO
Se algum processo for repetido um grande número de vezes, n, e se algum evento

resultante com a característica E ocorrer m vezes, a frequência relativa de ocorrência
de E, m=n, será aproximadamente igual à probabilidade de E.
Para expressar esta definição de forma compacta, escrevemos
m
P Eð Þ¼ (3.2.2)
n
Devemos ter em mente, entretanto, que, a rigor, m=n é apenas uma estimativa de P Eð Þ.
Probabilidade subjetiva No início da década de 1950, LJ Savage (4) deu um impulso considerável ao que é
chamado de conceito “personalístico” ou subjetivo de probabilidade. Essa visão sustenta que a probabilidade
mede a confiança que um indivíduo em particular tem na verdade de uma proposição em particular. Este
conceito não depende da repetibilidade de nenhum processo. De fato, aplicando esse conceito de
probabilidade, pode-se avaliar a probabilidade de um evento que só pode acontecer uma vez, por exemplo, a
probabilidade de que uma cura para o câncer seja descoberta nos próximos 10 anos.
Embora a visão subjetiva da probabilidade tenha recebido maior atenção ao longo do

anos, não foi totalmente aceito pelos estatísticos que têm orientações tradicionais.
Métodos bayesianos Os métodos bayesianos são nomeados em homenagem ao reverendo Thomas Bayes
(1702–1761), um clérigo inglês que tinha interesse em matemática.
Os métodos bayesianos são um exemplo de probabilidade subjetiva, pois levam em consideração o grau
de crença que se tem na chance de um evento ocorrer. Enquanto as probabilidades baseadas em conceitos
de frequência clássica ou relativa são projetadas para permitir que decisões sejam tomadas apenas com
base nos dados coletados, os métodos bayesianos fazem uso do que é conhecido como probabilidades
anteriores e probabilidades posteriores.
DEFINIÇÃO
A probabilidade prévia de um evento é uma probabilidade baseada em

conhecimento prévio, experiência anterior ou resultados derivados de atividades
anteriores de coleta de dados.
DEFINIÇÃO
A probabilidade posterior de um evento é uma probabilidade obtida usando novas

informações para atualizar ou revisar uma probabilidade anterior.
À medida que mais dados são coletados, mais provavelmente se sabe sobre a probabilidade “verdadeira”
do evento em consideração. Embora a ideia de atualizar probabilidades com base em novas informações
esteja em contraste direto com a filosofia por trás da probabilidade de frequência de ocorrência, os
conceitos bayesianos são amplamente usados. Por exemplo, as técnicas bayesianas encontraram aplicação
recente na construção de filtros de spam de e-mail. Normalmente, a aplicação dos conceitos bayesianos
faz uso de uma fórmula matemática chamada teorema de Bayes. Na Seção 3.5, empregamos o teorema
de Bayes na avaliação de dados de testes de triagem diagnóstica.
3.3 PROPRIEDADES ELEMENTARES

DA PROBABILIDADE
Em 1933, a abordagem axiomática da probabilidade foi formalizada pelo matemático russo AN Kolmogorov
(5). A base dessa abordagem está incorporada em três propriedades a partir das quais todo um sistema de
teoria da probabilidade é construído por meio do uso da lógica matemática. As três propriedades são as
seguintes.
1. Dado algum processo (ou experimento) com n resultados mutuamente exclusivos (chamados En, a
eventos), E1; E2; ... ; probabilidade de qualquer evento Ei recebe um valor não negativo
número. Isso é,
P EðÞi 0 (3.3.1)
Em outras palavras, todos os eventos devem ter probabilidade maior ou igual a zero, requisito
razoável em vista da dificuldade de se conceber probabilidade negativa. Um conceito-chave na
declaração dessa propriedade é o conceito de resultados mutuamente exclusivos. Dois eventos são
ditos mutuamente exclusivos se eles não podem ocorrer simultaneamente.
3.4 CÁLCULO DA PROBABILIDADE DE UM EVENTO 69
2. A soma das probabilidades dos resultados mutuamente exclusivos é igual a 1.
P Eð Þþ 1 P Eð Þþþ 2 P Eð Þ¼ n 1 (3.3.2)
Esta é a propriedade da exaustividade e refere-se ao fato de que o observador de um processo

probabilístico deve permitir todos os eventos possíveis e, quando todos são considerados juntos, sua
probabilidade total é 1. O requisito de que os eventos sejam mutuamente exclusivos especifica que o eventos
E1; E2; ... ; En não se sobrepõem; ou seja, dois deles
não podem ocorrer ao mesmo tempo.
3. Considere quaisquer dois eventos mutuamente exclusivos, Ei e Ej. A probabilidade de ocorrência

de Ei ou Ej é igual à soma de suas probabilidades individuais.
P Ei þ Ej ¼ P Eð Þþi P Ej (3.3.3)
Suponha que os dois eventos não sejam mutuamente exclusivos; isto é, suponha que eles
possam ocorrer ao mesmo tempo. Ao tentar calcular a probabilidade de ocorrência de Ei ou Ej , o
problema da sobreposição seria descoberto e o procedimento poderia se tornar bastante complicado.
Este conceito será discutido mais adiante na próxima seção.
3.4 CÁLCULO DA PROBABILIDADE DE UM EVENTO
Agora fazemos uso dos conceitos e técnicas das seções anteriores para calcular as probabilidades
de eventos específicos. Idéias adicionais serão introduzidas conforme necessário.
EXEMPLO 3.4.1
O objetivo principal do estudo de Carter et al. (A-1) foi investigar o efeito da idade de início do
transtorno bipolar no curso da doença. Uma das variáveis investigadas foi o histórico familiar de
transtornos de humor. A Tabela 3.4.1 mostra a frequência de uma história familiar de
TABELA 3.4.1 Frequência de história familiar de transtorno de humor por faixa etária entre
indivíduos bipolares
Histórico familiar de transtornos do humor Cedo ¼ 18(E) Mais tarde > 18(L) Total
Negativo (A) 28 35 63
Transtorno bipolar (B) 19 38 57
Unipolar (C) 41 44 85
Unipolar e bipolar (D) 53 60 113
Total 141 177 318
Fonte: Tasha D. Carter, Emanuela Mundo, Sagar V. Parkh e James L. Kennedy, “Early Age at
Onset as a Risk Factor for Poor Outcome of Bipolar Disorder,” Journal of Psychiatric Research,
37 (2003), 297– 303.
transtornos do humor nos dois grupos de interesse (Idade de início precoce definida como 18 anos ou menos
e Idade de início tardia definida como posterior a 18 anos). Suponha que escolhamos uma pessoa
aleatoriamente dessa amostra. Qual é a probabilidade de que essa pessoa tenha 18 anos ou menos?
Solução: Para fins de ilustração do cálculo das probabilidades, consideramos este grupo de 318 indivíduos
como o maior grupo pelo qual temos interesse. Em outras palavras, para este exemplo,
consideramos os 318 sujeitos como uma população.
Assumimos que Early e Later são categorias mutuamente exclusivas e que a probabilidade
de selecionar qualquer pessoa é igual à probabilidade de selecionar qualquer outra pessoa.
Definimos a probabilidade desejada como o número de sujeitos com a característica de
interesse (Early) dividido pelo número total de sujeitos. Podemos escrever o resultado em
notação de probabilidade da seguinte forma: PðEÞ ¼ número de participantes iniciais =
número total de participantes ¼ 141=318 ¼ :4434

&
Probabilidade condicional Ocasionalmente, o conjunto de “todos os resultados possíveis” pode constituir um

subconjunto do grupo total. Em outras palavras, o tamanho do grupo de interesse pode ser reduzido por
condições não aplicáveis ao grupo total. Quando as probabilidades são calculadas com um subconjunto do
grupo total como denominador, o resultado é uma probabilidade condicional.
A probabilidade calculada no Exemplo 3.4.1, por exemplo, pode ser considerada uma probabilidade
incondicional, pois o tamanho do grupo total serviu como denominador. Nenhuma condição foi imposta para
restringir o tamanho do denominador. Também podemos pensar nessa probabilidade como uma probabilidade
marginal, pois um dos totais marginais foi usado como numerador.
Podemos ilustrar o conceito de probabilidade condicional referindo-nos novamente à Tabela 3.4.1.
EXEMPLO 3.4.2
Suponha que escolhemos um sujeito aleatoriamente entre os 318 e descobrimos que ele tem 18 anos ou
menos (E). Qual é a probabilidade de que esse sujeito seja alguém que não tenha histórico familiar de
transtornos de humor (A)?
Solução: O número total de disciplinas não interessa mais, pois, com a seleção de uma disciplina Early, as
disciplinas Later são eliminadas. Podemos definir a probabilidade desejada, então, da
seguinte forma: Qual é a probabilidade de um sujeito não ter histórico familiar de transtornos
de humor (A), dado que o sujeito selecionado é Precoce (E)? Esta é uma probabilidade
condicional e é escrita como PðA j EÞ em que a linha vertical é lida “dada”. Os 141 sujeitos
Early tornam-se o denominador dessa probabilidade condicional, e 28, o número de sujeitos
Early sem história familiar de transtornos do humor, torna-se o numerador.
Nossa probabilidade desejada, então, é
PðA j EÞ ¼ 28=141 ¼ :1986 &

Probabilidade conjunta Às vezes queremos encontrar a probabilidade de que um sujeito escolhido

aleatoriamente de um grupo de sujeitos possua duas características ao mesmo tempo. Tal probabilidade
é chamada de probabilidade conjunta. Ilustramos o cálculo de uma probabilidade conjunta com o seguinte
exemplo.
EXEMPLO 3.4.3
Consultemos novamente a Tabela 3.4.1. Qual é a probabilidade de que uma pessoa escolhida
aleatoriamente entre os 318 sujeitos seja Precoce (E) e seja uma pessoa sem histórico familiar de
transtornos do humor (A)?
Solução: A probabilidade que estamos procurando pode ser escrita em notação simbólica como PðE \ AÞ
em que o símbolo \ é lido como “interseção” ou “e”. A declaração E \ A indica a ocorrência
conjunta das condições E e A. O número de sujeitos que satisfazem ambas as condições
desejadas é encontrado na Tabela 3.4.1 na interseção da coluna rotulada E e da linha
rotulada A e é visto como 28. Como a seleção será feita a partir do conjunto total de
sujeitos, o denominador é 318. Assim, podemos escrever a probabilidade conjunta como
PðE \ AÞ ¼ 28=318 ¼ :0881
&
A regra da multiplicação Uma probabilidade pode ser calculada a partir de outras probabilidades. Por
exemplo, uma probabilidade conjunta pode ser calculada como o produto de uma probabilidade marginal
apropriada e uma probabilidade condicional apropriada. Essa relação é conhecida como a regra de
multiplicação da probabilidade. Ilustramos com o seguinte exemplo.
EXEMPLO 3.4.4
Desejamos calcular a probabilidade conjunta de idade de início precoce (E) e uma história familiar negativa
de transtornos do humor (A) a partir do conhecimento de uma probabilidade marginal apropriada e de uma
probabilidade condicional apropriada.
Solução: A probabilidade que buscamos é PðE \ AÞ. Já calculamos uma probabilidade marginal, PðEÞ ¼
141=318 ¼ :4434, e uma probabilidade condicional, PðAjEÞ ¼ 28=141 ¼ :1986. Acontece
que essas são probabilidades marginais e condicionais apropriadas para calcular a
probabilidade conjunta desejada. Podemos agora calcular PðE \ AÞ ¼ PðEÞPðA j
EÞ¼ð:4434Þð:1986Þ ¼ :0881.
Este, notamos, é, como esperado, o mesmo resultado que obtivemos anteriormente para PðE \ AÞ.&
Podemos enunciar a regra de multiplicação em termos gerais como segue: Para quaisquer dois eventos
A e B,
P Að Þ¼ \ BP Bð ÞP Að Þ jB ; se P Bð Þ 6¼ 0 (3.4.1)
Para os mesmos dois eventos A e B, a regra de multiplicação também pode ser escrita como j AP Að Þ¼
\ BP; Að ÞP Bð Þ se P Að Þ 6¼ 0.
Vemos que, por meio da manipulação algébrica, a regra de multiplicação conforme declarada na
Equação 3.4.1 pode ser usada para encontrar qualquer uma das três probabilidades em sua declaração
se as outras duas forem conhecidas. Podemos, por exemplo, encontrar a probabilidade condicionalÞPj B
Aðpor
dividindo P Að Þ \ B por P Bð Þ. Essa relação nos permite definir formalmente a probabilidade condicional
da seguinte maneira.
DEFINIÇÃO
A probabilidade condicional de A dado B é igual à probabilidade de A \ B dividida pela

probabilidade de B, desde que a probabilidade de B não seja zero.
Isso é,
P Að Þ \ B
P Að Þ¼ j B ; P Bð Þ 6¼ 0 (3.4.2)
P Bð Þ
Ilustramos o uso da regra de multiplicação para calcular uma probabilidade condicional com o exemplo a
seguir.
EXEMPLO 3.4.5
Queremos usar a Equação 3.4.2 e os dados da Tabela 3.4.1 para encontrar a probabilidade condicional,
PðA j EÞ
Solução: De acordo com a Equação 3.4.2,
PðA j EÞ ¼ PðA \ EÞ=PðEÞ &
Anteriormente encontramos P Eð Þ¼ \ AP Að Þ¼ \ E 28=318 ¼ :0881. Também determinamos que P Eð

Þ¼ 141=318 ¼ :4434. Usando esses resultados, podemos calcular P Að Þ¼ j E :0881=:4434 ¼ :1987,
que, como esperado, é o mesmo resultado obtido usando as frequências diretamente da Tabela 3.4.1. (A
pequena discrepância deve-se ao arredondamento.)
A regra da adição A terceira propriedade da probabilidade dada anteriormente afirma que a probabilidade
da ocorrência de um ou outro de dois eventos mutuamente exclusivos é igual à soma de suas
probabilidades individuais. Suponha, por exemplo, que escolhamos uma pessoa aleatoriamente entre as
318 representadas na Tabela 3.4.1. Qual é a probabilidade de que essa pessoa tenha idade de início
precoce ð Þ E ou idade de início tardia ð Þ L ? Declaramos essa probabilidade em símbolos como P Eð Þ
, exclusivas,
[ L onde o símbolo [ é lido como “união” ouP “ou”.
Eð Þ¼ Como
\ L ðas
Þþduas
141=318
condições
ð Þ¼ de
177=318
idade são
:4434
mutuamente
þ :5566 ¼ 1.
E se dois eventos não forem mutuamente exclusivos? Este caso é coberto pelo que é conhecido
como regra da adição, que pode ser enunciado da seguinte forma:
DEFINIÇÃO
Dados dois eventos A e B, a probabilidade de que o evento A, ou o evento B, ou

ambos ocorram é igual à probabilidade de que o evento A ocorra, mais a probabilidade
de que o evento B ocorra, menos a probabilidade de que os eventos ocorram
simultaneamente.
A regra de adição pode ser escrita
P Að Þ¼ [ BP Að Þþ P Bð Þ P Að Þ \ B (3.4.3)
Quando os eventos A e B não podem ocorrer simultaneamente, P Að Þ \ B às vezes é chamado de

“ou exclusivo” e P Að Þ¼ [ B 0. Quando os eventos A e B podem ocorrer simultaneamente, P Að Þ [ B às
vezes é chamado de “inclusivo ou ,” e usamos a regra da adição para calcular P Að Þ [ B
. Vamos ilustrar o uso da regra de adição por meio de um exemplo.
EXEMPLO 3.4.6
Se selecionarmos uma pessoa aleatoriamente entre os 318 sujeitos representados na Tabela 3.4.1, qual é
a probabilidade de que essa pessoa seja um sujeito em idade precoce de início (E) ou não tenha histórico
familiar de transtornos do humor (A) ou ambos ?
Solução: A probabilidade que buscamos é PðE [ AÞ. Pela regra de adição expressa pela Equação 3.4.3,
esta probabilidade pode ser escrita como PðE [ AÞ ¼
PðEÞ þ PðAÞ PðE \ AÞ. Já descobrimos que PðEÞ ¼ 141=318 ¼ :4434 e PðE \ AÞ ¼
28=318 ¼ :0881. A partir das informações da Tabela 3.4.1 calculamos PðAÞ ¼ 63=318 ¼
:1981. Substituindo esses resultados na equação para PðE [ AÞ, temos PðE [ AÞ ¼ :4434 þ
:1981 :0881 ¼ :5534.
&
Observe que os 28 indivíduos que são Early e não têm histórico familiar de transtornos do humor estão
incluídos nos 141 que são Early, bem como nos 63 que não têm histórico familiar de transtornos do humor.
Uma vez que, ao calcular a probabilidade, esses 28 foram adicionados ao numerador duas vezes, eles
devem ser subtraídos uma vez para superar o efeito de duplicação ou sobreposição.
Eventos independentes Suponha que, na Equação 3.4.2, seja informado que o evento B ocorreu, mas que
esse fato não tem efeito sobre a probabilidade de A. Ou seja, suponha que a probabilidade do evento A seja
a mesma independentemente de não B ocorre. Nesta situação, P Að Þ¼ j BP Að Þ. Nesses casos, dizemos
que A e B são eventos independentes. A regra de multiplicação para dois eventos independentes, então,
pode ser escrita como
P Að Þ¼ \ BP Að ÞP Bð Þ; P AðÞ 6¼ 0; P Bð Þ 6¼ 0 (3.4.4)
Assim, vemos que se dois eventos são independentes, a probabilidade de sua união
ocorrência é igual ao produto das probabilidades de suas ocorrências individuais.
Observe que quando dois eventos com probabilidades diferentes de zero são independentes, cada uma
das seguintes afirmações é verdadeira:
P Að Þ¼ j BP Að Þ; P Bð Þ¼ jA P Bð Þ; P Að Þ¼ \ BP Að ÞP Bð Þ
Dois eventos não são independentes, a menos que todas essas afirmações sejam verdadeiras. É
importante estar ciente de que os termos independentes e mutuamente exclusivos não significam a mesma coisa.
Vamos ilustrar o conceito de independência por meio do seguinte exemplo.
EXEMPLO 3.4.7
Em certa turma de ensino médio, composta por 60 meninas e 40 meninos, observa-se que 24 meninas
e 16 meninos usam óculos. Se um aluno for escolhido aleatoriamente dessa classe, a probabilidade de
que ele use óculos, P(E), é 40=100, ou 0,4.
(a) Qual é a probabilidade de que um aluno escolhido ao acaso use óculos, dado que
o aluno é um menino?
Solução: Usando a fórmula para calcular uma probabilidade condicional, encontramos isso
ser estar
PðE \ BÞ 16=100
PðE j BÞ ¼ ¼ ¼ :4
PðBÞ 40=100
Assim, a informação adicional de que um aluno é menino não altera a probabilidade de

o aluno usar óculos, e PðEÞ ¼ PðE j BÞ. Dizemos que os eventos ser menino e usar
óculos para esse grupo são independentes. Podemos também mostrar que o evento de
usar óculos, E, e não ser um menino, B também são independentes como segue:
PðE \ BÞ 24=100 24
PðE j BÞ ¼ ¼ ¼ ¼ :4
PðBÞ 60=100 60
(b) Qual é a probabilidade da ocorrência conjunta dos eventos de usar óculos e ser menino?
Solução: Usando a regra dada na Equação 3.4.1, temos
PðE \ BÞ ¼ PðBÞPðE j BÞ
mas, como mostramos que os eventos E e B são independentes, podemos substituir

PðE j BÞ por P(E) para obter, pela Equação 3.4.4,
PðE \ BÞ ¼ PðBÞPðEÞ
40 40
¼
100 100
¼ :16 &
Eventos Complementares Anteriormente, usando os dados da Tabela 3.4.1, calculamos a probabilidade

de que uma pessoa escolhida aleatoriamente entre os 318 indivíduos seja um indivíduo em idade
precoce de início como P Eð Þ¼ 141=318 ¼ :4434. Descobrimos que a probabilidade de uma idade de
início mais tardia é P Lð Þ¼ 177=318 ¼ :5566. Descobrimos que a soma dessas duas probabilidades é
igual a 1. Isso é verdade porque os eventos de início precoce e de início tardio são eventos
complementares. Em geral, podemos fazer a seguinte declaração sobre eventos complementares. A
probabilidade de um evento A é igual a 1 menos a probabilidade de seu
complemento, que é escrito A e
Pð Þ¼ A 1 P Að Þ (3.4.5)
Isso segue da terceira propriedade da probabilidade desde que o evento, A, e sua

complemento, A são mutuamente exclusivos.
EXEMPLO 3.4.8
Suponha que de 1.200 internações em um hospital geral durante um determinado período de tempo,
750 sejam internações particulares. Se os designarmos como conjunto A, então A é igual a 1200 menos
750 ou 450. Podemos calcular
PðAÞ ¼ 750=1200 ¼ :625
e
PðAÞ ¼ 450=1200 ¼ :375
e veja isso
PðAÞ ¼ 1 PðAÞ
:375 ¼ 1 :625
:375 ¼ :375
&
Probabilidade Marginal Anteriormente, usamos o termo probabilidade marginal para nos referirmos
a uma probabilidade na qual o numerador da probabilidade é um total marginal de uma tabela
como a Tabela 3.4.1. Por exemplo, quando calculamos a probabilidade de que uma pessoa
escolhida aleatoriamente entre as 318 pessoas representadas na Tabela 3.4.1 seja um sujeito de
início precoce, o numerador da probabilidade é o número total de sujeitos precoces, 141. Assim,
P Eð Þ¼ 141=318 ¼ :4434. Podemos definir a probabilidade marginal de forma mais geral da seguinte forma
DEFINIÇÃO
Dada alguma variável que pode ser dividida em m categorias designadas por A1;
A2; ... ; Ai; ... ; Am e outro ocorrendo em conjunto
variável que se decompõe em n categorias designadas por B1; Bn, a
probabilidade
; Bj; ... é; igual marginal
à soma das de Ai;P Að
probabilidades Þi , B2; ...
conjuntas de Ai com todas
as categorias de B. Ou seja,
P AðÞ¼i SP Ai \ Bj ; para todos os valores de j (3.4.6)
O exemplo a seguir ilustra o uso da Equação 3.4.6 no cálculo de uma probabilidade marginal.
EXEMPLO 3.4.9
Desejamos usar a Equação 3.4.6 e os dados da Tabela 3.4.1 para calcular a probabilidade
marginal P(E).
Solução: A variável idade de início é dividida em duas categorias, Precoce para início de 18 anos ou
menos (E) e Mais tarde para início ocorrendo em idade superior a 18 anos (L). A variável
história familiar de transtornos do humor é dividida em quatro categorias: história familiar
negativa (A), apenas transtorno bipolar (B), apenas transtorno unipolar (C) e indivíduos
com história de transtorno unipolar e bipolar (D). A categoria Precoce ocorre
conjuntamente com todas as quatro categorias da variável história familiar de transtornos
de humor. As quatro probabilidades conjuntas que podem ser calculadas são
P Eð Þ¼ \ A 28=318 ¼ :0881
P EðÞ¼ \ B 19=318 ¼ :0597
P EðÞ¼ \ C 41=318 ¼ :1289
P EðÞ¼ \ D 53=318 ¼ :1667
Obtemos a probabilidade marginal P(E) adicionando essas quatro probabilidades

conjuntas como segue:
P Eð Þ¼ P Eð Þþ \ AP Eð Þþ \ BP Eð Þþ \ CP Eð Þ \ D
¼ :0881 þ :0597 þ :1289 þ :1667
¼:4434 &
O resultado, como esperado, é o mesmo obtido usando o total marginal de Early como numerador e o
número total de sujeitos como denominador.
EXERCÍCIOS
3.4.1 Num estudo sobre a vitimização violenta de mulheres e homens, Porcerelli et al. (A-2) coletou informações de 679
mulheres e 345 homens com idades entre 18 e 64 anos em vários centros de prática familiar na área metropolitana
de Detroit. Os pacientes preencheram um questionário de histórico de saúde que incluía uma pergunta sobre
vitimização. A tabela a seguir apresenta a classificação cruzada dos sujeitos da amostra por sexo e tipo de vitimização
violenta relatada. As categorias de vitimização são definidas como nenhuma vitimização, vitimização do parceiro (e
não por outros), vitimização por outras pessoas que não os parceiros (amigos, familiares ou estranhos) e aqueles
que relataram vitimização múltipla.
Sem Vitimização Parceiros Não Parceiros Vitimização Múltipla Total
Mulheres 611 34 16 18 679

Homens 308 10 17 10 345
Total 919 44 33 28 1024
Fonte: Dados fornecidos por cortesia de John H. Porcerelli, Ph.D., Rosemary Cogan, Ph.D.
(a) Suponha que escolhemos um sujeito aleatoriamente desse grupo. Qual é a probabilidade de que esse sujeito seja
uma mulher?
(b) Como chamamos a probabilidade calculada na parte a? (c) Mostre

como calcular a probabilidade solicitada na parte a por meio de dois métodos adicionais.
EXERCÍCIOS 77
(d) Se escolhermos um sujeito aleatoriamente, qual é a probabilidade de que o sujeito seja uma mulher e tenha sofrido abuso
do parceiro? (e) Como chamamos a probabilidade calculada na parte d? (f) Suponha que escolhemos um homem ao acaso.
Sabendo dessa informação, qual é a probabilidade de ele ter sofrido abuso de não parceiros? (g) Como chamamos a
probabilidade calculada na parte f? (h) Suponha que escolhemos um sujeito aleatoriamente. Qual é a probabilidade de ser um
homem ou alguém que sofreu abuso de uma parceira? (i) Como chamamos o método pelo qual você obteve a probabilidade na
parte h?
3.4.2 Fernando et al. (A-3) estudou o compartilhamento de drogas entre usuários de drogas injetáveis no South Bronx, na cidade de Nova
York. Os usuários de drogas na cidade de Nova York usam o termo “dividir um saco” ou “subir em um saco” para se referir à
prática de dividir um saco de heroína ou outras substâncias injetáveis. Uma prática comum inclui a divisão de drogas depois de
dissolvidas em um fogão comum, um procedimento com risco considerável de HIV.
Embora essa prática seja comum, pouco se sabe sobre a prevalência de tais práticas. Os pesquisadores perguntaram aos
usuários de drogas injetáveis em quatro bairros do sul do Bronx se eles já “absorveram” drogas em sacolas ou injeções. Os
resultados classificados por gênero e prática de divisão são apresentados abaixo:
Drogas divididas por gênero Nunca divida drogas Total
Macho 349 324 673

Fêmea 220 128 348
Total 569 452 1021
Fonte: Daniel Fernando, Robert F. Schilling, Jorge Fontdevila e

Nabila El-Bassel, “Preditores de compartilhamento de drogas entre
usuários de drogas injetáveis no South Bronx: Implicações para a
transmissão do HIV”, Journal of Psychoactive Drugs, 35 (2003), 227 –236.
(a) Quantas probabilidades marginais podem ser calculadas a partir desses dados? Indique cada uma em notação de
probabilidade e faça os cálculos.
(b) Quantas probabilidades conjuntas podem ser calculadas? Indique cada uma em notação de probabilidade e faça os cálculos.
(c) Quantas probabilidades condicionais podem ser calculadas? Indique cada uma em notação de probabilidade e faça os
cálculos.
(d) Use a regra da multiplicação para encontrar a probabilidade de que uma pessoa escolhida ao acaso nunca divida drogas e
seja mulher. (e) Como chamamos a probabilidade calculada na parte d? (f) Use a regra da multiplicação para encontrar a
probabilidade de que uma pessoa escolhida ao acaso seja do sexo masculino, dado que ela admite dividir drogas. (g) Como
chamamos a probabilidade calculada na parte f?
3.4.3 Consulte os dados do Exercício 3.4.2. Indique as seguintes probabilidades em palavras e calcule: (a) Pð Þ Masculino \ Dividir
Drogas (b) Pð Þ Masculino [ Dividir Drogas (c) Pð Masculino j Dividir Drogas Þ (d) P(Masculino)
3.4.4 Laveist e Nuru-Jeter (A-4) conduziram um estudo para determinar se a concordância racial médico-paciente estava associada
a uma maior satisfação com o atendimento. Para esse fim, eles coletaram uma amostra nacional de entrevistados afro-
americanos, caucasianos, hispânicos e asiáticos-americanos. A tabela a seguir classifica a raça dos sujeitos, bem como a
raça de seu médico:
raça do paciente
africano asiático
corrida do médico caucasiano americano hispânico Total Americano
Branco 779 436 406 175 1796

Afro-americano 14 162 15 5 196
hispânico 19 17 128 2 166
Asiático=Ilha do Pacífico 68 75 71 203 417
De outros 30 55 56 4 145
Total 910 745 676 389 2720
Fonte: Thomas A. Laveist e Amani Nuru-Jeter, “Is Doctor–Patient Race Concordance Associated with Greater
Satisfaction with Care?” Jornal de Saúde e Comportamento Social, 43 (2002), 296–306.
(a) Qual é a probabilidade de que um sujeito selecionado aleatoriamente tenha um médico asiático=das ilhas do Pacífico?
(b) Qual é a probabilidade de um sujeito afro-americano ter um médico afro-americano? (c) Qual é a probabilidade de que
um sujeito selecionado aleatoriamente no estudo seja asiático-americano e tenha um médico asiático=das ilhas do Pacífico?
(d) Qual é a probabilidade de que um sujeito escolhido ao acaso seja hispânico ou tenha um médico hispânico? (e) Use o
conceito de eventos complementares para encontrar a probabilidade de que um sujeito escolhido aleatoriamente no estudo
não tenha um médico branco.
3.4.5 Se a probabilidade de ser canhoto em um determinado grupo de pessoas é 0,05, qual é a probabilidade de
destro (assumindo que não há ambidestria)?
3.4.6 A probabilidade é de 0,6 de que um paciente selecionado aleatoriamente entre os atuais residentes de um determinado hospital
seja do sexo masculino. A probabilidade de que o paciente seja um homem para cirurgia é de 0,2. Um paciente selecionado
aleatoriamente entre os residentes atuais é do sexo masculino; qual é a probabilidade de que o paciente esteja no hospital
para a cirurgia?
3.4.7 Em uma determinada população de pacientes hospitalares, a probabilidade é de 0,35 de que um paciente selecionado
aleatoriamente tenha uma doença cardíaca. A probabilidade é de 0,86 de que um paciente com doença cardíaca seja
fumante. Qual é a probabilidade de um paciente selecionado aleatoriamente da população ser fumante e ter doença cardíaca?
3.5 TEOREMA DE BAYES, TESTES DE TRIAGEM,

SENSIBILIDADE, ESPECIFICIDADE E VALOR
PREDITIVO POSITIVO E NEGATIVO
No campo das ciências da saúde, uma aplicação amplamente utilizada de leis e conceitos de probabilidade é encontrada na
avaliação de testes de triagem e critérios diagnósticos. De interesse para os médicos é uma capacidade aprimorada de prever
corretamente a presença ou ausência de uma doença específica de
3.5 TEOREMA DE BAYES, TESTES DE TRIAGEM, SENSIBILIDADE, ESPECIFICIDADE 79
conhecimento dos resultados dos testes (positivos ou negativos) e=ou estado dos sintomas apresentados
(presentes ou ausentes). Também são interessantes as informações sobre a probabilidade de resultados
de testes positivos e negativos e a probabilidade da presença ou ausência de um sintoma específico em
pacientes com e sem uma doença específica.
Ao considerar os testes de triagem, devemos estar cientes do fato de que eles nem sempre são
infalíveis. Ou seja, um procedimento de teste pode produzir um falso positivo ou um falso negativo.
DEFINIÇÃO
1. Um resultado falso positivo quando um teste indica um status positivo quando

o verdadeiro status é negativo.
2. Um resultado falso negativo quando um teste indica um status negativo quando
o verdadeiro status é positivo.
Em resumo, as seguintes perguntas devem ser respondidas para avaliar a utilidade dos resultados
dos testes e do estado dos sintomas para determinar se um indivíduo tem ou não alguma doença:
1. Dado que um sujeito tem a doença, qual é a probabilidade de um resultado de teste positivo (ou
a presença de um sintoma)?
2. Dado que um sujeito não tem a doença, qual é a probabilidade de um negativo
resultado do teste (ou a ausência de um sintoma)?
3. Dado um teste de triagem positivo (ou a presença de um sintoma), qual é a probabilidade
que o sujeito tem a doença?
4. Dado um resultado negativo no teste de triagem (ou a ausência de um sintoma), qual é a
probabilidade de que o sujeito não tenha a doença?
Suponha que tenhamos para uma amostra de n sujeitos (onde n é um número grande) as
informações mostradas na Tabela 3.5.1. A tabela mostra para esses n indivíduos seu status em relação
a uma doença e os resultados de um teste de triagem projetado para identificar indivíduos com a doença.
As entradas de célula representam o número de assuntos que se enquadram nas categorias definidas
pelos cabeçalhos de linha e coluna. Por exemplo, a é o número de indivíduos que têm a doença e cujo
resultado do teste de triagem foi positivo.
Como aprendemos, uma variedade de estimativas de probabilidade pode ser calculada a partir
das informações exibidas em uma tabela de duas entradas, como a Tabela 3.5.1. Por exemplo, podemos
TABELA 3.5.1 Amostra de n indivíduos (onde n é grande)

classificados de acordo com o estado da doença e o resultado do
teste de triagem
Doença
Resultado do teste Presente (D) Ausente (D) Total
Positivo (T ) a ba þ b
Negativo (T ) c dc þ d
Total aþc bþd n

calcule a estimativa de probabilidade condicional P Tð Þ¼ j D a=ð Þ a þ c . estimativa Esta proporção é uma

da sensibilidade do teste de triagem.
DEFINIÇÃO
A sensibilidade de um teste (ou sintoma) é a probabilidade de um resultado de teste positivo

(ou presença do sintoma) dada a presença da doença.
Podemos também calcular a estimativa de probabilidade condicional Pð Þ¼ T j D d=ð Þ b þ d .

Essa proporção é uma estimativa da especificidade do teste de triagem.
DEFINIÇÃO
A especificidade de um teste (ou sintoma) é a probabilidade de um resultado de teste negativo

(ou ausência do sintoma) dada a ausência da doença.
A partir dos dados da Tabela 3.5.1, respondemos à Questão 3 calculando a estimativa de probabilidade
condicional
denominada valor preditivo positivo .de um teste
j T P de
Dð triagem
Þ Esta razão é uma estimativa de uma probabilidade
(ou sintoma).
DEFINIÇÃO
O valor preditivo positivo de um teste de triagem (ou sintoma) é a probabilidade de um

sujeito ter a doença dado que o sujeito tem um resultado de teste de triagem positivo (ou
tem o sintoma).
Da mesma forma, a razão Pð Þ D j T é uma estimativa da probabilidade condicional de que um sujeito

não tenha a doença dado que o sujeito tem um resultado de teste de triagem negativo (ou não tem o sintoma).
A probabilidade estimada por essa razão é chamada de valor preditivo negativo do teste de rastreamento ou
sintoma.
DEFINIÇÃO
O valor preditivo negativo de um teste de triagem (ou sintoma) é a probabilidade de um

sujeito não ter a doença, dado que o sujeito tem um resultado negativo no teste de triagem (ou
não tem o sintoma).
As estimativas do valor preditivo positivo e do valor preditivo negativo de um teste (ou sintoma) podem
ser obtidas a partir do conhecimento da sensibilidade e especificidade de um teste (ou sintoma) e da
probabilidade da doença relevante na população em geral. Para obter essas estimativas de valor preditivo,
utilizamos o teorema de Bayes. A seguinte declaração do teorema de Bayes, empregando a notação
estabelecida na Tabela 3.5.1, dá o valor preditivo positivo de um teste de triagem (ou sintoma):
P Tð ÞP jDð
D Þ
P Dð Þ¼ j T (3.5.1)
P Tð ÞP jDð
D Þþ P Tð Þ j D Pð Þ D
3.5 TEOREMA DE BAYES, TESTES DE TRIAGEM, SENSIBILIDADE, ESPECIFICIDADE 81
É instrutivo examinar a composição da Equação 3.5.1. Recordamos da Equação 3.4.2 que

a probabilidade condicional P Dð Þ j T é igual a P Dð Þ \ T =P
teorema
Tð Þ. de
Para
Bayes,
entender
devemos
a lógica
reconhecer
do
que o numerador da Equação 3.5.1 representa P Dð Þ \ T e que o denominador representa P Tð
Þ. Sabemos pela regra de multiplicação da probabilidade dada na Equação 3.4.1 que o numerador
da Equação 3.5.1, P Tð Þ j DP Dð Þ, é igual a P Dð Þ \ T Agora vamos mostrar que o denominador
da Equação classificado
3.5. 1 é igualcomo
a P Tð
positivo
Þ. Sabemos . a
em relação
que o um
evento
teste
T de
é otriagem
resultado
(oude
classificado
um indivíduo
como
ser
tendo o sintoma). Um indivíduo classificado como positivo pode ter a doença ou não ter a
doença. Portanto, a ocorrência de T é resultado de um sujeito ter a doença e ser positivo ½ P Dð
Þ \ T ou não ter a doença e ser positivo ½ Pð Þ D \ T Esses dois eventos são mutuamente
exclusivos (sua interseção é zero ), e conseqüentemente, pela regra de adição dada pela Equação
3.4.3, podemos escrever
.
P Tð Þ¼ P Dð Þþ \ T Pð Þ D \ T (3.5.2)
Como, pela regra da multiplicação, P Dð Þ¼ \ TP Tð Þ P Tð Þ j D jPð

DP Dð Þ e Pð Þ¼ D \ T
,
Þ D podemos reescrever a Equação 3.5.2 como
P Tð Þ ¼ P Tð ÞPj Dð
D Þþ P Tð Þ j DPð Þ D (3.5.3)
que é o denominador da Equação 3.5.1.

Observe, também, que o numerador da Equação 3.5.1 é igual à sensibilidade vezes a taxa
(prevalência) da doença e o denominador é igual à sensibilidade vezes a taxa da doença mais o
termo 1 menos a sensibilidade vezes o termo 1 menos a taxa da doença. Assim, vemos que o
valor preditivo positivo pode ser calculado a partir do conhecimento da sensibilidade, especificidade
e taxa da doença.
A avaliação da Equação 3.5.1 responde à Questão 3. Para responder à Questão 4, seguimos
uma linha de raciocínio agora familiar para chegar à seguinte afirmação do teorema de Bayes:
Pð Þ T j D Pð Þ D
Pð Þ¼ D j T (3.5.4)
Pð Þ T j D Pð Þþ D Pð Þ T j DP Dð Þ
A Equação 3.5.4 nos permite calcular uma estimativa da probabilidade de um sujeito que é
negativo no teste (ou não tem nenhum sintoma) não ter a doença, que é o valor preditivo negativo
de um teste de triagem ou sintoma.
Ilustramos o uso do teorema de Bayes para calcular um valor preditivo positivo com o
seguinte exemplo.
EXEMPLO 3.5.1
Uma equipe de pesquisa médica desejava avaliar um teste de triagem proposto para a doença de
Alzheimer. O teste foi aplicado a uma amostra aleatória de 450 pacientes com doença de Alzheimer
e uma amostra aleatória independente de 500 pacientes sem sintomas da doença.
As duas amostras foram retiradas de populações de indivíduos com 65 anos de idade ou mais. Os
resultados são os seguintes:
Diagnóstico de Alzheimer?
Resultado do teste Sim (D) Aceno com a cabeça )
Total
Positivo (T) 436 441

Negativo (T) 14 5 495 509
Total 450 500 950
Usando esses dados, estimamos a sensibilidade do teste como sendo PðT j DÞ ¼ 436=450 ¼ :97. A
especificidade do teste é estimada em PðT j DÞ ¼ 495=500 ¼ :99. Agora usamos os resultados do
estudo para calcular o valor preditivo positivo do teste. Ou seja, desejamos estimar a probabilidade de
um sujeito positivo no teste ter a doença de Alzheimer. A partir dos dados tabulados calculamos PðT j
DÞ ¼ 436=450 ¼ :9689 e PðT j DÞ ¼ 5=500 ¼ :01.
A substituição desses resultados na Equação 3.5.1 fornece
ð:9689ÞPðDÞ
PðD j TÞ ¼ (3.5.5)
ð:9689ÞPðDÞþð:01ÞPðDÞ
Vemos que o valor preditivo positivo do teste depende da taxa da doença na população relevante em
geral. Neste caso, a população relevante consiste em indivíduos com 65 anos de idade ou mais.
Enfatizamos que a taxa de doença na população geral relevante, P(D), não pode ser calculada a partir
dos dados da amostra, uma vez que duas amostras independentes foram extraídas de duas populações
diferentes. Devemos procurar em outro lugar uma estimativa de P(D).
Evans e outros. (A-5) estimou que 11,3 por cento da população dos EUA com 65 anos ou mais tem a
doença de Alzheimer. Quando substituímos esta estimativa de P(D) na Equação 3.5.5, obtemos
ð:9689Þð:113Þ
PðD j TÞ ¼ ¼ :93 ð:9689Þð:113Þþð:01Þð1 :113Þ
Como vemos, neste caso, o valor preditivo do teste é muito alto.

Da mesma forma, consideremos agora o valor preditivo negativo do teste. Já calculamos todas as
entradas necessárias, exceto PðT j DÞ ¼ 14=450 ¼ :0311. Usando os valores obtidos anteriormente e
nosso novo valor, encontramos
ð:99Þð1:113Þ
PðD j TÞ ¼ ¼ :996 ð:99Þð1 :113Þþð:0311Þð:113Þ
Como podemos ver, o valor preditivo negativo também é bastante alto. &
EXERCÍCIOS 83
EXERCÍCIOS
3.5.1 Uma equipe de pesquisa médica deseja avaliar a utilidade de um determinado sintoma (chame-o de S) no diagnóstico de uma
doença específica. Em uma amostra aleatória de 775 pacientes com a doença, 744 relataram ter o sintoma. Em uma amostra
aleatória independente de 1.380 indivíduos sem a doença, 21 relataram que tinham o sintoma. (a) No contexto deste exercício,
o que é um falso positivo? (b) O que é um falso negativo? (c) Calcule a sensibilidade do sintoma. (d) Calcule a especificidade
do sintoma. (e) Suponha que se saiba que a taxa da doença na população em geral é. 001. Qual é o valor preditivo positivo do
sintoma? (f) Qual é o valor preditivo negativo do sintoma? (g) Encontre o valor preditivo positivo e o valor preditivo negativo
para o sintoma para as seguintes taxas de doenças hipotéticas: 0,0001, 0,01 e 0,10. (h) O que você conclui sobre o valor
preditivo do sintoma com base nos resultados obtidos na parte g?
3.5.2 Em um artigo intitulado “Lágrimas meniscais em alça de balde do joelho: sensibilidade e especificidade dos sinais de ressonância
magnética”, Dorsay e Helms (A-6) realizaram um estudo retrospectivo de 71 joelhos escaneados por ressonância magnética.
Um dos indicadores que eles examinaram foi a ausência do “sinal da gravata borboleta” na ressonância magnética como
evidência de uma ruptura do menisco em alça de balde ou tipo alça de balde. No estudo, a cirurgia confirmou que 43 dos 71
casos eram lágrimas em alça de balde. Os casos podem ser classificados de acordo com o status do “sinal da gravata borboleta”
e os resultados cirúrgicos da seguinte forma:
Rasgar cirurgicamente Rasgo confirmado cirurgicamente como

Confirmado (D) Não Presente ð Þ D Total
Teste Positivo 38 10 48
(sinal de gravata borboleta ausente) (T)
Teste negativo 5 18 23
(sinal do laço presente) ð Þ T
Total 43 28 71
Fonte: Theodore A. Dorsay e Clyde A. Helms, “Lágrimas meniscais do joelho: sensibilidade e especificidade dos
sinais de ressonância magnética”, Skeletal Radiology, 32 (2003), 266–272.
(a) Qual é a sensibilidade do teste para ver se o sinal de laço ausente indica uma ruptura meniscal? (b) Qual é a especificidade
do teste para ver se o sinal de gravata borboleta ausente indica uma ruptura meniscal? (c) Que informação adicional você
precisaria para determinar o valor preditivo do teste?
3.5.3 Oexle et al. (A-7) calculou o valor preditivo negativo de um teste para portadores de deficiência de ornitina transcarbamilase ligada
ao cromossomo X (OTCD — um distúrbio do ciclo da ureia). Um teste conhecido como “teste de alopurinol” é freqüentemente
usado como um dispositivo de triagem de potenciais portadores cujos parentes são pacientes com OTCD. Eles citaram um
estudo de Brusilow e Horwich (A-8) que estimou a sensibilidade do teste de alopurinol como 0,927. Oexle et al. eles próprios
estimaram a especificidade do teste de alopurinol como 0,997. Também estimaram a prevalência na população de indivíduos
com OTCD como 1=32000. Use essas informações e o teorema de Bayes para calcular o valor preditivo negativo do teste de
triagem de alopurinol.
3.6 RESUMO
Neste capítulo, algumas das ideias e conceitos básicos de probabilidade foram apresentados. O objetivo
tem sido fornecer uma “sensação” suficiente para o assunto de modo que os aspectos probabilísticos da
inferência estatística possam ser mais prontamente compreendidos e apreciados quando este tópico for
apresentado posteriormente.
Definimos probabilidade como um número entre 0 e 1 que mede a probabilidade de ocorrência de
algum evento. Distinguimos entre probabilidade subjetiva e probabilidade objetiva. A probabilidade objetiva
pode ser categorizada ainda como probabilidade de frequência clássica ou relativa. Depois de declarar as
três propriedades da probabilidade, definimos e ilustramos o cálculo dos seguintes tipos de probabilidades:
marginal, conjunta e condicional. Também aprendemos como aplicar as regras de adição e multiplicação
para encontrar certas probabilidades. Aprendemos o significado de eventos independentes, mutuamente
exclusivos e complementares. Aprendemos o significado de especificidade, sensibilidade, valor preditivo
positivo e valor preditivo negativo quando aplicado a um teste de triagem ou sintoma de doença.
Por fim, aprendemos a usar o teorema de Bayes para calcular a probabilidade de um sujeito ter uma
doença, dado que o sujeito tem um resultado positivo no teste de triagem (ou apresenta o sintoma de
interesse).
Nome do número da fórmula Fórmula
3.2.1 m
probabilidade clássica
P Eð Þ¼
N
3.2.2 m
Probabilidade de
P Eð Þ¼
n
frequência relativa
3.3.1–3.3.3 Propriedades de probabilidade P EðÞi 0
P Eð Þþ 1 P Eð Þþþ 2 P Eð Þ¼ n 1
P Ei þ Ej ¼ P Eð Þþi P Ej
3.4.1 regra de multiplicação PðA \ BÞ ¼ PðBÞPðA j BÞ ¼ PðAÞPðB j AÞ
3.4.2 Probabilidade Condicional PðA \ BÞ

PðA j BÞ ¼
PðBÞ
3.4.3 regra de adição PðA [ BÞ ¼ PðAÞ þ PðBÞ PðA \ BÞ
3.4.4 eventos independentes PðA \ BÞ ¼ PðAÞPðBÞ
3.4.5 eventos complementares PðAÞ ¼ 1 PðAÞ
3.4.6 Probabilidade marginal PðAiÞ ¼ PPðAi \ BjÞ

uma
Sensibilidade de um teste de triagem

PðT j DÞ ¼
ða þ cÞ
Especificidade de um teste de triagem d

PðT j DÞ ¼
ðb þ dÞ
3.5.1 Valor preditivo positivo de um teste P Tð ÞPj Dð

D Þ
P Dð Þ¼ j T
de triagem P Tð ÞPj Dð
D Þþ P Tð Þ j D Pð Þ D
3.5.2 Valor preditivo negativo de um teste Pð Þ T j D Pð Þ D

Pð Þ¼ D j T
de triagem Pð Þ T j D Pð Þþ D Pð Þ T j DP Dð Þ
Tecla de símbolo D ¼ doença

E ¼ Evento
m ¼ o número de vezes que um evento Ei ocorre n ¼
tamanho da amostra ou o número total de vezes que um processo ocorre
N ¼ Tamanho da população ou o número total de eventos mutuamente exclusivos e
igualmente prováveis
PðAÞ ¼ um evento complementar; a probabilidade de um evento A não ocorrer
PðEiÞ ¼ probabilidade de algum evento Ei ocorrer

PðA \ BÞ ¼ uma declaração de “interseção” ou “e”; a probabilidade de ocorrer um
evento A e um evento B
PðA [ BÞ ¼ uma declaração “união” ou “ou”; a probabilidade de um evento
A ou um evento B ou ambos ocorrendo
PðA j BÞ ¼ uma declaração condicional; a probabilidade de um evento A ocorrer
dado que um evento B já ocorreu
Resultados do teste T ¼
1. Defina o seguinte:
(a) Probabilidade (b) Probabilidade objetiva (d)

(c) Probabilidade subjetiva (e) Probabilidade clássica (f)
O conceito de frequência relativa de probabilidade (g) Eventos mutuamente exclusivos (h)
Independência (i) Probabilidade conjunta (k) A regra da Probabilidade marginal (j)
adição (m) Eventos complementares (o) Falso negativo (q) Probabilidade condicional (l) A regra
Especificidade (s) Valor preditivo negativo da multiplicação (n) Falso positivo
(p) Sensibilidade (r) Valor preditivo
positivo (t) teorema de bayes
2. Cite e explique as três propriedades da probabilidade.
3. Coughlin et al. (A-9) examinou as práticas de triagem de mama e colo do útero de mulheres hispânicas e não hispânicas em
condados que se aproximam da região da fronteira sul dos EUA. O estudo utilizou dados das pesquisas do Sistema de
Vigilância de Fatores de Risco Comportamentais de adultos com 18 anos ou mais, realizadas em 1999 e 2000. A tabela
abaixo relata o número de observações de mulheres hispânicas e não hispânicas que fizeram mamografia nos últimos 2
anos cruzada com o estado civil.
Estado civil hispânico não hispânico Total
Atualmente casado 319 738 1057

Divorciados ou Separados 130 329 459
Viúva 88 402 490
Nunca se casou ou vive como um 41 95 136
casal solteiro
Total 578 1564 2142
Fonte: Steven S. Coughlin, Robert J. Uhler, Thomas Richards e Katherine M. Wilson,

“Práticas de triagem de câncer de mama e colo do útero entre mulheres hispânicas e
não hispânicas que residem perto da fronteira entre os Estados Unidos e o México,
1999–2000,” Família e Community Health, 26 (2003), 130–139.
(a) Selecionamos aleatoriamente um sujeito que fez uma mamografia. Qual é a probabilidade de ela ser divorciada ou
separada? (b) Selecionamos aleatoriamente uma pessoa que fez mamografia e descobrimos que ela é hispânica. Com essa
informação, qual é a probabilidade de ela ser casada? (c) Selecionamos aleatoriamente um sujeito que fez mamografia. Qual
é a probabilidade de que ela não seja hispânica e seja divorciada ou separada? (d) Selecionamos aleatoriamente um sujeito
que fez uma mamografia. Qual é a probabilidade de ela ser hispânica ou viúva? (e) Selecionamos aleatoriamente um sujeito
que fez mamografia. Qual a probabilidade de ela não ser casada?
4. Swor et al. (A-10) analisou a eficácia do treinamento de ressuscitação cardiopulmonar (RCP) em pessoas com mais de 55 anos.
Eles compararam as taxas de retenção de habilidades de indivíduos nessa faixa etária que concluíram um curso de instrução
de RCP tradicional com aqueles que receberam ressuscitação cardiopulmonar apenas com compressão torácica (CC-CPR).
Grupos independentes foram testados 3 meses após o treinamento.
A tabela abaixo mostra os números de retenção de habilidades em relação à competência geral conforme avaliado por
avaliações de vídeo feitas por dois avaliadores de vídeo.
Avaliação geral
Competente RCP CC-CPR Total
Sim 12 15 27
Não 15 14 29
Total 27 29 56
Fonte: Robert Swor, Scott Compton, Fern Vining, Lynn Ososky Farr,
Sue Kokko, Rebecca Pascual e Raymond E. Jackson, “A Randomized
Controlled Trial of Chest Compression Only CPR for Older Adults—a
Pilot Study,” Resuscitation, 58 ( 2003), 177–185.
(a) Encontre as seguintes probabilidades e explique seu significado:
1. Um indivíduo selecionado aleatoriamente foi inscrito na classe CC-CPR.

2. Um sujeito selecionado aleatoriamente foi classificado como competente.
3. Um indivíduo selecionado aleatoriamente foi classificado como competente e foi matriculado no curso de RCP.
4. Um indivíduo selecionado aleatoriamente foi classificado como competente ou foi inscrito em CC-CPR.
5. Um indivíduo selecionado aleatoriamente foi classificado como competente, visto que se matriculou no CC-CPR
curso.
(b) Definimos os seguintes eventos como

A ¼ um indivíduo inscrito no curso de RCP B ¼
um indivíduo inscrito no curso CC-CPR C ¼ um
indivíduo foi avaliado como competente D ¼ um
indivíduo foi avaliado como não competente Então
explique por que cada uma das equações a seguir é ou não uma afirmação verdadeira: 1. P Að Þ¼ \ CP
Cð Þ \ A 2. P Að Þ¼ [ BP Bð Þ [ A 3. P Að Þ¼ P
P Dð
Að Þ¼
ÞÞ [j CP
AP Dð
Að Þ [6.DP4.Cð
P Bð
Þ¼Þ¼
\ BP[ CP
Cð Bð
ÞP Þþ
Bð P
Þ Cð
7. PÞAð
5.
Þ¼ \ B 0 j B 8. P Cð Þ¼ \ BP Bð ÞP Cð Þ 9. P Að Þ¼ \ DP Að ÞP Að Þ jD
5. Pillman et al. (A-11) estudou pacientes com episódios agudos breves de psicoses. Os pesquisadores classificaram os
indivíduos em quatro tipos de personalidade: obsessivo, astênico = baixa autoconfiança, astênico = alta
autoconfiança, nervoso = tenso e indeterminável. A tabela abaixo classifica esses tipos de personalidade com três
grupos de indivíduos - aqueles com transtornos psicóticos agudos e transitórios (ATPD), aqueles com esquizofrenia
"positiva" (PS) e aqueles com transtorno esquizoafetivo bipolar (BSAD):
Tipo de personalidade ATPD (1) PS (2) BSAD (3) Total
Obsessóide (O) 17 9 2 6
Astênico=baixo Autoconfiante (A) 52 20 17 15
Astênico = alto Autoconfiante (S) 16 5 3 8
Nervoso=tenso (N) 474 15

Indeterminável (U) 26 4 13 9
Total 42 42 42 126
Fonte: Frank Pillmann, Raffaela Bloink, Sabine Balzuweit, Annette Haring e

Andreas Marneros, “Personalidade e interações sociais em pacientes com psicoses
breves agudas”, Journal of Nervous and Mental Disease, 191 (2003), 503–508.
Encontre as seguintes probabilidades se um sujeito neste estudo for escolhido aleatoriamente:

(b) P Að ÞÞ[ 2 (d)
\ 3 (h)
Pð Pð
Þ AÞ(a)
2 jP(O)
A (c) P(1) (e) P Að Þ j 3 (f) P 3Þð (g) Pð
6. Um determinado departamento de saúde municipal recebeu 25 inscrições para uma vaga existente para enfermeira
de saúde pública. Desses candidatos, 10 têm mais de 30 anos e 15 têm menos de 30 anos. Dezessete são apenas
bacharéis e oito têm mestrado. Dos com menos de 30 anos, seis são mestres. Se uma seleção entre esses 25
candidatos for feita aleatoriamente, qual é a probabilidade de que uma pessoa com mais de 30 anos ou uma pessoa
com mestrado seja selecionada?
7. A tabela a seguir apresenta 1.000 candidatas ao curso de enfermagem classificadas de acordo com as notas do
vestibular e a qualidade do ensino médio em que se formaram, avaliadas por um grupo de educadores:
Qualidade das Escolas Secundárias
Pontuação Ruim (P) Médio (A) Superior (S) Total
Baixo (L) 105 60 55 220

Médio (M) 70 175 145 390
Alto (H) 25 65 300 390
Total 200 300 500 1000

(a) Calcule a probabilidade de que um candidato escolhido aleatoriamente desse grupo:

1. Teve nota baixa no exame.
2. Ter concluído o ensino médio.
3. Tirou nota baixa no exame e concluiu o ensino médio.
4. Obteve nota baixa no exame, visto que se formou em nível superior
escola.
5. Fez uma pontuação alta ou se formou em uma escola secundária superior.
(b) Calcule as seguintes probabilidades:
1. P(A) 2. P(H) 3. P(M)

4. PðA j HÞ 5. PðM \ PÞ 6. ðH j SÞ
8. Se a probabilidade de uma enfermeira de saúde pública encontrar um cliente em casa é 0,7, qual é a probabilidade
(supondo independência) de que em duas visitas domiciliares feitas em um dia ambos os clientes estejam em casa?
9. Por uma variedade de razões, os resultados de doenças autorreferidas são freqüentemente usados sem verificação na
pesquisa epidemiológica. Em um estudo de Parikh-Patel et al. (A-12), os pesquisadores analisaram a relação entre os
casos de câncer autorrelatados e os casos reais. Eles usaram os dados de câncer auto-relatados de um Estudo de
Professores da Califórnia e validaram os casos de câncer usando os dados do Registro de Câncer da Califórnia. A
tabela a seguir relata suas descobertas para o câncer de mama:
Câncer relatado (A) Câncer em Registro (B) Câncer não registrado Total
Sim 2991 2244 5235

Não 112 115849 115961
Total 3103 118093 121196
Fonte: Arti Parikh-Patel, Mark Allen, William E. Wright e o California Teachers Study Steering Committee,
“Validation of Self-reported Cancers in the California Teachers Study,” American Journal of Epidemiology,
157 (2003), 539–545 .
(a) Seja A o evento de relatar câncer de mama no California Teachers Study. Encontre a probabilidade de A neste
estudo. (b) Seja B o evento de câncer de mama confirmado no Registro de Câncer da Califórnia. Encontre a
probabilidade de B neste estudo. (c) Encontre PðA \ BÞ (d) Encontre ð Þ A j B (e) Encontre PðB j AÞ (f) Encontre a
sensibilidade de usar o câncer de mama autorreferido como um preditor de câncer de mama real no registro da
Califórnia. (g) Encontre a especificidade do uso de câncer de mama autorrelatado como preditor de câncer de mama
real no registro da Califórnia.
10. Em uma certa população, a probabilidade de um indivíduo selecionado aleatoriamente ter sido exposto a um determinado
alérgeno e apresentar uma reação ao alérgeno é de 0,60. A probabilidade é de 0,8 de um indivíduo exposto ao
alérgeno apresentar uma reação alérgica. Se um indivíduo for selecionado aleatoriamente dessa população, qual é a
probabilidade de ele ter sido exposto ao alérgeno?
11. Suponha que 3% das pessoas em uma população de adultos tenham tentado o suicídio. Sabe-se também que 20 por
cento da população vive abaixo do nível de pobreza. Se esses dois eventos forem
independente, qual é a probabilidade de que uma pessoa selecionada aleatoriamente da população tenha
tentado o suicídio e esteja vivendo abaixo do nível de pobreza?
12. Em certa população de mulheres, 4% tiveram câncer de mama, 20% são fumantes e 3% são fumantes e tiveram
câncer de mama. Uma mulher é selecionada aleatoriamente da população.
Qual é a probabilidade de ela ter câncer de mama, fumar ou ambos?
13. A probabilidade de que uma pessoa selecionada aleatoriamente em uma população exiba o sintoma clássico de
uma certa doença é 0,2, e a probabilidade de que uma pessoa selecionada aleatoriamente tenha a doença é 0,23.
A probabilidade de que uma pessoa que apresenta o sintoma também tenha a doença é de 0,18. Uma pessoa
selecionada aleatoriamente da população não apresenta o sintoma. Qual é a probabilidade de que a pessoa
tenha a doença?
14. Para uma determinada população definimos os seguintes eventos para a idade da mãe no momento do parto: A
¼ menos de 20 anos; B ¼ 20–24 anos; C ¼ 25–29 anos; D ¼ 30–44 anos. Os eventos A, B, C e D são
mutuamente exclusivos?
15. Consulte o Exercício 14. Enuncie por extenso o evento E ¼ ðA [ BÞ.
16. Consulte o Exercício 14. Enuncie por extenso o evento F ¼ ðB [ CÞ.
17. Consulte o Exercício 14. Comente o evento G ¼ ðA \ BÞ.
18. Para uma determinada população, definimos os seguintes eventos com relação aos níveis de lipoproteína
plasmática (mg=dl): A ¼ (10–15); B ¼ ð 30Þ; C ¼ ð 20Þ. Os eventos A e B são mutuamente exclusivos? A e C?
B e C? Explique sua resposta para cada pergunta.
19. Consulte o Exercício 18. Enuncie por palavras o significado dos seguintes eventos:
(a) A [ B (b) A \ B (c) A \ C (d) A [ C
20. Consulte o Exercício 18. Enuncie por palavras o significado dos seguintes eventos:
(a) A (b) B (c) C
21. Rothenberg et al. (A-13) investigou a eficácia do uso do Hologic Sahara Sonometer, um dispositivo portátil que
mede a densidade mineral óssea (DMO) no tornozelo, na previsão de uma fratura. Eles usaram um valor de
densidade mineral óssea estimado pela Hologic de 0,57 como ponto de corte. O resultado da investigação
rendeu os seguintes dados:
Fratura confirmada
Presente (D) Não Presente ð Þ D Total
DMO ¼ :57ðTÞ 214 670 884

DMO > :57ðTÞ 73 330 403
Total 287 1000 1287
Fonte: Dados fornecidos por cortesia de Ralph J. Rothenberg, MD,

Joan L. Boyd, Ph.D., e John P. Holcomb, Ph.D.
(a) Calcule a sensibilidade de usar um valor de DMO de 0,57 como valor de corte para prever fraturas e interprete
seus resultados. (b) Calcule a especificidade de usar um valor de DMO de 0,57 como valor de corte para prever
fratura e interprete seus resultados.
22. Verma et al. (A-14) examinou o uso da triagem ELISA de heparina-PF4 para trombocitopenia induzida por
heparina (HIT) em pacientes criticamente enfermos. Usando o ensaio de liberação de serotonina C (SRA)
como forma de validar o HIT, os autores descobriram que em 31 pacientes com teste negativo para SRA, 22
também tiveram teste negativo para heparina-PF4 ELISA. (a) Calcule a especificidade do teste heparina-PF4
ELISA para HIT. (b) Usando uma “sensibilidade derivada da literatura” de 95 por cento e uma probabilidade
prévia de ocorrência de HIT de 3,1 por cento, encontre o valor preditivo positivo. (c) Usando as mesmas
informações da parte (b), encontre o valor preditivo negativo.
23. A sensibilidade de um teste de triagem é de 0,95 e sua especificidade é de 0,85. A taxa da doença para a qual o
teste é usado é 0,002. Qual é o valor preditivo positivo do teste?
Exercícios para uso com grandes conjuntos de dados disponíveis no seguinte site:
www.wiley.com/college/daniel Consulte a amostra aleatória de 800 indivíduos do registro de
nascimento da Carolina do Norte que investigamos nos exercícios de revisão do Capítulo 2.
1. Crie uma tabela que cruze as contagens de mães nas classificações se o bebê era prematuro ou não
(PREMIE) e se a mãe admitiu fumar durante a gravidez (SMOKE) ou não. (a) Encontre a probabilidade de
que uma mãe nesta amostra tenha admitido fumar. (b) Encontre a probabilidade de uma mãe nesta
amostra ter um bebê prematuro. (c) Encontre a probabilidade de que uma mãe na amostra tenha um bebê
prematuro dado que a mãe
admitiu fumar.
(d) Encontre a probabilidade de uma mãe da amostra ter um bebê prematuro dado que a mãe não admitiu
fumar. (e) Encontre a probabilidade de que uma mãe na amostra tenha tido um bebê prematuro ou
que a mãe tenha
não admite fumar.
2. Crie uma tabela que faça uma tabulação cruzada das contagens do estado civil de cada mãe (CIVIL) e
se ela teve um bebê de baixo peso (BAIXO). (a) Encontre a
probabilidade de uma mãe selecionada aleatoriamente nesta amostra ter um bebê com baixo peso ao nascer. (b)
Encontre a probabilidade de uma mãe selecionada aleatoriamente nesta amostra ser casada. (c) Encontre a
probabilidade de uma mãe selecionada aleatoriamente nesta amostra ter um filho com baixo peso ao nascer dado
que ela era casada. (d) Encontre a probabilidade de uma mãe selecionada aleatoriamente nesta amostra ter
um filho com baixo peso ao nascer
visto que ela não era casada.
(e) Encontre a probabilidade de uma mãe selecionada aleatoriamente nesta amostra ter um filho com baixo peso ao nascer
e a mãe era casada.
REFERÊNCIAS
1. ALLAN GUT, An Intermediate Course in Probability, Springer-Verlag, Nova York, 1995.

2. RICHARD ISAAC, The Pleasures of Probability, Springer-Verlag, Nova York, 1995.
3. HAROLD J. LARSON, Introdução à Probabilidade, Addison-Wesley, Reading, MA, 1995.
4. LJ SAVAGE, Foundations of Statistics, Segunda Edição Revisada, Dover, Nova York, 1972.
5. AN KOLMOGOROV, Foundations of the Theory of Probability, Chelsea, Nova York, 1964 (edição original alemã
publicada em 1933).
REFERÊNCIAS 91
A-1. TASHA D. CARTER, EMANUELA MUNDO, SAGARV. PARKH e JAMES L. KENNEDY, "Idade de início precoce como um fator de
risco para resultados ruins do transtorno bipolar", Journal of Psychiatric Research, 37 (2003), 297–303.
A-2. JOHN H. PORCERELLI, ROSEMARY COGAN, PATRICIA P. WEST, EDWARD A. ROSE, DAWN LAMBRECHT, KAREN E.
WILSON, RICHARD K. SEVERSON e DUNIA KARANA, “Vitimização violenta de mulheres e homens: sintomas físicos e
psiquiátricos,” Journal do Conselho Americano de Prática Familiar, 16 (2003), 32–39.
A-3. DANIEL FERNANDO, ROBERT F. SCHILLING, JORGE FONTDEVILA e NABILA EL-BASSEL, “Preditores de compartilhamento de
drogas entre usuários de drogas injetáveis no South Bronx: Implicações para a transmissão do HIV”, Journal of Psychoactive
Drugs, 35 (2003), 227–236 .
A-4. THOMAS A. LAVEIST e AMANI NURU-JETER, “A concordância racial médico-paciente está associada a uma maior satisfação
com o atendimento?” Jornal de Saúde e Comportamento Social, 43 (2002), 296–306.
A-5. DA EVANS, PA SCHERR, NR COOK, MS ALBERT, HH FUNKENSTEIN, LA SMITH, LE HEBERT, TT WETLE, LG BRANCH, M.
CHOWN, CH HENNEKENS e JO TAYLOR, “Estimated Prevalence of Alzheimer's Disease in the United States,” Milbank
Quarterly, 68 (1990), 267-289.
A-6. THEODORE A. DORSAY e CLYDE A. HELMS, “Lágrimas meniscais em alça de balde do joelho: sensibilidade e especificidade
dos sinais de ressonância magnética”, Skeletal Radiology, 32 (2003), 266–272.
A-7. KONRAD OEXLE, LUISA BONAFE e BEAT STENMANN, “Observação sobre a utilidade e as taxas de erro do teste de alopurinol na
detecção de deficiência leve de ornitina transcarbamilase,” Molecular Genetics and Metabolism, 76 (2002), 71–75.
A-8. SW BRUSILOW, AL HORWICH, “Urea Cycle Enzymes,” em: CR SCRIVER, AL BEAUDET, WS SLY, D. VALLE (Eds.), The
Metabolic and Molecular Bases of Inherited Disease, 8th ed., McGraw-Hill, New York , 2001, pp. 1909–1963.
A-9. STEVEN S. COUGHLIN, ROBERT J. UHLER, THOMAS RICHARDS e KATHERINE M. WILSON, “Práticas de triagem de câncer de
mama e colo do útero entre mulheres hispânicas e não hispânicas que residem perto da fronteira entre os Estados Unidos e o
México, 1999–2000”, Família e Comunidade Saúde, 26 (2003), 130–139.
A-10. ROBERT SWOR, SCOTT COMPTON, FERN VINING, LYNN OSOSKY FARR, SUE KOKKO, REBECCA PASCUAL e RAYMOND E.
JACKSON, “A Randomized Controlled Trial of Chest Compression Only CPR for Older Adults—a Pilot Study,”
Ressuscitação, 58 (2003), 177–185.
A-11. FRANK PILLMANN, RAFFAELA BLOINK, SABINE BALZUWEIT, ANNETTE HARING e ANDREAS MARNEROS, "Personalidade e
Interações Sociais em Pacientes com Psicoses Breves Agudas", The Journal of Nervous and Mental Disease, 191 (2003), 503–
508.
A-12. ARTI PARIKH -PATEL, MARK ALLEN, WILLIAM E. WRIGHT e o Comitê Diretor do Estudo de Professores da Califórnia, “Validação
de Cânceres Autorrelatados no Estudo de Professores da Califórnia”, American Journal of Epidemiology, 157 (2003), 539–545.
A-13. RALPH J. ROTHENBERG, JOAN L. BOYD e JOHN P. HOLCOMB, “Quantitative Ultrasound of the Calcaneus as a Screening
Tool to Detect Osteoporosis: Different Reference Ranges for Caucasian Women, African-American Women, and Caucasian
Men,” Journal of Clinical Densitometria, 7 (2004), 101–110.
A-14. ARUN K. VERMA, MARC LEVINE, STEPHEN J. CARTER e JOHN G. KELTON, "Frequência de Trombocitopenia Induzida por
Herparina em Pacientes de Cuidados Críticos", Pharmacotheray, 23 (2003), 645–753.
CAPÍTULO 4
DISTRIBUIÇÕES DE PROBABILIDADE
As distribuições de probabilidade de variáveis aleatórias assumem papéis poderosos

em análises estatísticas. Uma vez que mostram todos os valores possíveis de uma
variável aleatória e as probabilidades associadas a esses valores, as distribuições de
probabilidade podem ser resumidas de forma a permitir que os pesquisadores tomem
facilmente decisões objetivas com base em amostras extraídas das populações que as
distribuições representam. Este capítulo apresenta distribuições de probabilidade
discretas e contínuas usadas com frequência que são usadas em capítulos posteriores
para fazer inferências estatísticas.
TÓPICOS
4.1 INTRODUÇÃO
4.2 DISTRIBUIÇÕES DE PROBABILIDADE DE VARIÁVEIS DISCRETAS
4.3 A DISTRIBUIÇÃO BINOMIAL
4.4 A DISTRIBUIÇÃO DO VENENO
4.5 DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUA
4.6 A DISTRIBUIÇÃO NORMAL
4.7 APLICAÇÕES DE DISTRIBUIÇÃO NORMAL
4.8 RESUMO
Depois de estudar este capítulo, o aluno irá 1. entender as distribuições

discretas selecionadas e como usá-las para calcular
probabilidades em problemas do mundo real.

2. entender as distribuições contínuas selecionadas e como usá-las para calcular
probabilidades em problemas do mundo real.
3. ser capaz de explicar as semelhanças e diferenças entre as distribuições do tipo discreto e do tipo contínuo e quando é adequado o
uso de cada uma delas.
92
4.2 DISTRIBUIÇÕES DE PROBABILIDADE DE VARIÁVEIS DISCRETAS 93
4.1 INTRODUÇÃO
No capítulo anterior, introduzimos os conceitos básicos de probabilidade, bem como métodos para calcular
a probabilidade de um evento. Desenvolvemos esses conceitos no presente capítulo e exploramos
maneiras de calcular a probabilidade de um evento sob condições um pouco mais complexas. Neste
capítulo veremos que a relação entre os valores de uma variável aleatória e as probabilidades de sua
ocorrência pode ser resumida por meio de um dispositivo denominado distribuição de probabilidade. Uma
distribuição de probabilidade pode ser expressa na forma de uma tabela, gráfico ou fórmula. O conhecimento
da distribuição de probabilidade de uma variável aleatória fornece ao clínico e ao pesquisador uma
ferramenta poderosa para resumir e descrever um conjunto de dados e para chegar a conclusões sobre
uma população de dados com base em uma amostra de dados extraída da população.
4.2 DISTRIBUIÇÕES DE PROBABILIDADE DE VARIÁVEIS

DISCRETAS
Vamos começar nossa discussão sobre distribuições de probabilidade considerando a distribuição de

probabilidade de uma variável discreta, que definiremos como segue:
DEFINIÇÃO
A distribuição de probabilidade de uma variável aleatória discreta é uma tabela,

gráfico, fórmula ou outro dispositivo usado para especificar todos os valores possíveis
de uma variável aleatória discreta junto com suas respectivas probabilidades.
Se deixarmos a distribuição de probabilidade discreta ser representada por p xð Þ, então p xð Þ¼

P Xð Þ ¼ x é a probabilidade da variável aleatória discreta X assumir um valor x.
EXEMPLO 4.2.1
Em um artigo publicado no Journal of the American Dietetic Association, Holben et al.

(A-1) analisou a situação de segurança alimentar em famílias na região dos Apalaches, no sul de Ohio.
O objetivo do estudo foi examinar as taxas de fome de famílias com crianças em um programa local Head
Start em Athens, Ohio. O instrumento de pesquisa incluiu o US de 18 perguntas
Módulo de Pesquisa de Segurança Alimentar Doméstica para medir a fome e a segurança alimentar. Além
disso, foi perguntado aos participantes quantos programas de assistência alimentar eles usaram nos
últimos 12 meses. A Tabela 4.2.1 mostra o número de programas de assistência alimentar utilizados pelos
sujeitos desta amostra.
Deseja-se construir a distribuição de probabilidade da variável discreta X, onde X ¼ número de
programas de assistência alimentar utilizados pelos sujeitos do estudo.
Solução: Os valores de X são x1 ¼ 1; x2 ¼ 2; ... x7 ¼ 7 e x8 ¼; 8. Calculamos as probabilidades desses

valores dividindo suas respectivas frequências pelo total, 297. Assim, por exemplo, p xð
Þ¼ 1 P Xð Þ¼ ¼ x1 62=297 ¼ :2088 .
94 CAPÍTULO 4 DISTRIBUIÇÕES DE PROBABILIDADE
TABELA 4.2.1 Número de programas de assistência

utilizados por famílias com crianças em programas Head
Start no sul de Ohio
Número de Programas Frequência
1 62
2 47
3 39
4 39
5 58
6 37
7 4
8 11
Total 297
Fonte: Dados fornecidos por cortesia de David H.

Holben, Ph.D. e John P. Holcomb, Ph.D.
TABELA 4.2.2 Distribuição de Probabilidade de Programas

Utilizados por Famílias Entre os Sujeitos Descritos no
Exemplo 4.2.1
Número de Programas (x) P XðÞ ¼ x
1 .2088
2 .1582
3 .1313
4 .1313
5 .1953
6 .1246
7 0,0135
8 0,0370
Total 1,0000
Apresentamos os resultados na Tabela 4.2.2, que é a distribuição de probabilidade

desejada. &
Alternativamente, podemos apresentar esta distribuição de probabilidade na forma de um gráfico,

como na Figura 4.2.1. Na Figura 4.2.1, o comprimento de cada barra vertical indica a probabilidade do
valor correspondente de x.
Observar-se-á na Tabela 4.2.2 que os valores de p xð Þ¼ P Xð Þ ¼ x são todos positivos, são todos menores
que 1 e sua soma é igual a 1. Esses não são fenômenos peculiares a este exemplo particular, mas são características
de todas as distribuições de probabilidade de variáveis discretas. Se x1; x2; x3; ... xk são todos os valores possíveis
do aleatório discreto ;
0,25
0,20
0,15
Probabilidade
0,10
0,05
0,00
1 2 3 4 5 6 7 8
x (número de programas de assistência)
FIGURA 4.2.1 Representação gráfica da distribuição de

probabilidade apresentada na Tabela 4.2.1.
variável X, então podemos fornecer as duas propriedades essenciais de uma distribuição de probabilidade
de uma variável discreta:
ð1Þ 0 P Xð Þ ¼ x ð2Þ 1
PP Xð Þ¼ ¼ x 1; para todo x
O leitor também notará que cada uma das probabilidades na Tabela 4.2.2 é a relativa
frequência de ocorrência do valor correspondente de X.
Com sua distribuição de probabilidade disponível para nós, podemos fazer declarações de
probabilidade em relação à variável aleatória X. Ilustramos com alguns exemplos.
EXEMPLO 4.2.2
Qual é a probabilidade de uma família selecionada aleatoriamente usar três programas de assistência?
Solução: Podemos escrever a probabilidade desejada como pð Þ¼ 3 P Xð Þ ¼ 3 . Vemos na Tabela 4.2.2

que a resposta é 0,1313. &
EXEMPLO 4.2.3
Qual é a probabilidade de que uma família selecionada aleatoriamente tenha usado um ou dois programas?
Solução: Para responder a essa pergunta, usamos a regra de adição para eventos mutuamente exclusivos.
Usando a notação de probabilidade e os resultados da Tabela 4.2.2, escrevemos a resposta
como Pð Þ¼ 1 [ 2 Pð Þþ 1 Pð Þ¼ 2 :2088 þ :1582 ¼ :3670: &
TABELA 4.2.3 Distribuição de probabilidade cumulativa do número de programas

utilizados pelas famílias entre os assuntos descritos no Exemplo 4.2.1
Número de Programas (x) Frequência cumulativa P Xð Þ x
1 .2088
2 .3670
3 0,4983
4 0,6296
5 0,8249
6 0,9495
7 0,9630
8 1,0000
Distribuições cumulativas Algumas vezes será mais conveniente trabalhar com a distribuição de
probabilidade cumulativa de uma variável aleatória. A distribuição de probabilidade cumulativa
para a variável discreta cuja distribuição de probabilidade é dada na Tabela 4.2.2 pode ser obtida
adicionando sucessivamente as probabilidades, P Xð Þ ¼ xi , dadas na última
probabilidade
coluna. cumulativa
A
para xi é escrita como F xð Þ¼i P Xð Þ xi . Dá a
probabilidade de que X seja menor ou igual a um valor especificado, xi.
A distribuição de probabilidade cumulativa resultante é mostrada na Tabela 4.2.3. O gráfico
da distribuição de probabilidade cumulativa é mostrado na Figura 4.2.2. O gráfico de uma
distribuição de probabilidade cumulativa é chamado de ogiva. Na Figura 4.2.2 o gráfico de F(x)
consiste apenas nas linhas horizontais. As linhas verticais apenas dão ao gráfico uma aparência
conectada. O comprimento de cada linha vertical representa a mesma probabilidade da linha
correspondente na Figura 4.2.1. Por exemplo, o comprimento da linha vertical em X ¼ 3 na Figura
4.2.2 representa a mesma probabilidade que o comprimento da linha erguida em X ¼ 3 na Figura
4.2.1, ou 0,1313 na escala vertical.
1,0
0,9
0,8
0,7
0,6
f(x)
0,5
0,4
0,3
0,2
0,1
0,0
123 5 4 678
x (número de programas)
FIGURA 4.2.2 Distribuição de probabilidade cumulativa do número de programas de atendimento entre os sujeitos
descritos no Exemplo 4.2.1.
Consultando a distribuição de probabilidade cumulativa, podemos responder rapidamente a

perguntas como as dos exemplos a seguir.
EXEMPLO 4.2.4
Qual é a probabilidade de uma família escolhida ao acaso ter usado dois ou menos programas
assistenciais?
Solução: A probabilidade que procuramos pode ser encontrada diretamente na Tabela 4.2.3 lendo a
probabilidade cumulativa oposta x ¼ 2, e vemos que é 0,3670. Ou seja, P Xð Þ¼ 2
:3670. Tambémdeterminando
podemos encontrar
a alturaado
resposta
gráfico inspecionando
(medida no eixo
a vertical)
Figura 4.2.2
acima
e do
valor X ¼ 2. &
EXEMPLO 4.2.5
Qual é a probabilidade de que uma família selecionada aleatoriamente tenha usado menos de quatro programas?
Solução: Como uma família que usou menos de quatro programas usou um, dois ou três programas,
a resposta é a probabilidade cumulativa para 3. Ou seja, P Xð Þ¼ < 4 P Xð Þ¼ 3
:4983. &
EXEMPLO 4.2.6
Qual é a probabilidade de uma família selecionada aleatoriamente usar cinco ou mais programas?
Solução: Para encontrar a resposta, usamos o conceito de probabilidades complementares. O

conjunto de famílias que utilizaram cinco ou mais programas é o complemento do
conjunto de famílias que utilizaram menos de cinco (ou seja, quatro ou menos) programas.
A soma das duas probabilidades associadas a esses conjuntos é igual a 1.
Escrevemos essa relação em notação de probabilidade como P Xð Þþ 5 P Xð Þ¼ 4
1: Portanto, P Xð Þ¼ 5 1 P Xð Þ¼ 4 1 :6296 ¼ :3704 . &
EXEMPLO 4.2.7
Qual é a probabilidade de uma família selecionada aleatoriamente usar entre três e cinco programas,
inclusive?
Solução: P Xð Þ¼ 5 :8249 é a probabilidade de uma família ter usado entre um e cinco programas,
inclusive. Para obter a probabilidade entre três e cinco programas, subtraímos, de
0,8249, a probabilidade de dois ou menos. Usando a notação de probabilidade,
escrevemos a resposta como Pð Þ¼ 3 X 5 P Xð P Xð Þ¼ Þ5
2 :8249 :3670 ¼ :4579. &
A distribuição de probabilidade dada na Tabela 4.2.1 foi desenvolvida a partir da experiência real,
então encontrar outra variável seguindo esta distribuição seria coincidência. A probabilidade
as distribuições de muitas variáveis de interesse, no entanto, podem ser determinadas ou assumidas

com base em considerações teóricas. Nas seções posteriores, estudaremos em detalhes três dessas
distribuições teóricas de probabilidade: a binomial, a de Poisson e a normal.
Média e variância de distribuições de probabilidade discretas A média e a variância de uma distribuição

de probabilidade discreta podem ser facilmente encontradas usando as fórmulas abaixo.
m ¼ XxpðxÞ s2 (4.2.1)
2
¼ Xðx mÞ pðxÞ ¼ Xx2 pðxÞ m2 (4.2.2)
onde p(x) é a frequência relativa de uma determinada variável aleatória X. O desvio padrão é
simplesmente a raiz quadrada positiva da variância.
EXEMPLO 4.2.8
Quais são a média, variância e desvio padrão da distribuição do Exemplo 4.2.1?
Solução: m
¼ ð1Þð:2088Þþð2Þð:1582Þþð3Þð:1313Þþþð8Þð:0370Þ ¼ 3:5589
2 2 2
s2 ¼ ð1 3:5589Þ ð:2088Þþð2 3:5589Þ ð:1582Þþð3 3:5589Þ ð:1313Þ
2
þþð8 3:5589Þ ð:0370Þ ¼ 3:8559
Portanto, podemos concluir que o número médio de programas utilizados foi de 3,5589 com 3:8559 p ¼
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
3,8559. O desvio padrão é, portanto, 1:9637 programas. & variância de
EXERCÍCIOS
4.2.1. Em um estudo de Cross et al. (A-2), os pacientes que estavam envolvidos no tratamento do jogo problemático
foram questionados sobre dependências concomitantes de drogas e álcool. Deixe a variável aleatória discreta
X representar o número de substâncias viciantes co-ocorrentes usadas pelos sujeitos. A Tabela 4.2.4 resume a
distribuição de frequência para esta variável aleatória. (a) Construa uma tabela da frequência relativa e da
frequência cumulativa para esta distribuição discreta.
(b) Construa um gráfico da distribuição de probabilidade e um gráfico representando a distribuição de

probabilidade cumulativa para esses dados.
4.2.2. Consulte o Exercício 4.2.1.
(a) Qual é a probabilidade de que um indivíduo selecionado aleatoriamente tenha usado cinco substâncias
viciantes? (b) Qual é a probabilidade de um indivíduo selecionado aleatoriamente usar menos de três
substâncias viciantes?
(c) Qual é a probabilidade de que um indivíduo selecionado aleatoriamente tenha usado mais de seis
substâncias viciantes?
(d) Qual é a probabilidade de um indivíduo selecionado aleatoriamente usar entre duas e cinco substâncias
viciantes, inclusive?
4.2.3. Consulte o Exercício 4.2.1. Encontre a média, a variância e o desvio padrão dessa distribuição de frequência.
4.3 A DISTRIBUIÇÃO BINOMIAL 99
TABELA 4.2.4 Número de substâncias viciantes concomitantes usadas por

pacientes em programas de tratamento de jogos de azar selecionados
Número de substâncias usadas Frequência
0 144
1 342
2 142
3 72
4 39
5 20
6 6
7 9
8 2
9 1
Total 777
4.3 A DISTRIBUIÇÃO BINOMIAL
A distribuição binomial é uma das distribuições de probabilidade mais amplamente encontradas na estatística
aplicada. A distribuição é derivada de um processo conhecido como tentativa de Bernoulli, nomeado em
homenagem ao matemático suíço James Bernoulli (1654-1705), que fez contribuições significativas no
campo da probabilidade, incluindo, em particular, a distribuição binomial. Quando um processo ou
experimento aleatório, chamado de ensaio, pode resultar em apenas um de dois resultados mutuamente
exclusivos, como morto ou vivo, doente ou são, termo completo ou prematuro, o ensaio é chamado de
ensaio de Bernoulli.
O Processo de Bernoulli Uma sequência de tentativas de Bernoulli forma um processo de Bernoulli nas
seguintes condições.
1. Cada tentativa resulta em um dos dois resultados possíveis, mutuamente exclusivos. Um dos
resultados possíveis é denotado (arbitrariamente) como um sucesso, e o outro é denotado como um fracasso.
2. A probabilidade de sucesso, denotada por p, permanece constante de tentativa para tentativa. o

probabilidade de falha, 1 p, é denotada por q.
3. As provas são independentes; ou seja, o resultado de qualquer tentativa em particular não é afetado
pelo resultado de qualquer outra tentativa.
EXEMPLO 4.3.1
Estamos interessados em poder calcular a probabilidade de x sucessos em n tentativas de Bernoulli. Por

exemplo, se examinarmos todos os registros de nascimento do Centro Estadual de Estatísticas de Saúde
da Carolina do Norte (A-3) para o ano civil de 2001, descobrimos que 85,8% das gestações tiveram parto na
semana 37 ou depois. Vamos nos referir a isso como um nascimento a termo. Com essa porcentagem,
podemos interpretar a probabilidade de um nascimento registrado na semana 37 ou mais tarde como 0,858.
Se selecionarmos aleatoriamente cinco registros de nascimento dessa população, qual é a probabilidade de
que exatamente três dos registros sejam para nascimentos a termo?
Solução: Designemos a ocorrência de um registro de nascimento a termo (F) como um “sucesso” e apressemos-nos a
acrescentar que um nascimento prematuro (P) não é um fracasso, mas pesquisas médicas indicam que
crianças nascidas em semanas 36 ou mais cedo correm o risco de complicações médicas. Se estivéssemos
procurando por registros de nascimento de partos prematuros, estes seriam designados como sucessos, e
registros de nascimento a termo seriam designados como falhas.
Também será conveniente atribuir o número 1 a um sucesso (registro de nascimento a termo) e o

número 0 a uma falha (registro de parto prematuro).
O processo que eventualmente resulta em um registro de nascimento que consideramos ser um
processo de Bernoulli.
Suponha que os cinco registros de nascimento selecionados resultaram nesta sequência de
nascimentos a termo:
FPFFP
Em forma codificada, escreveríamos isso como
10110
Uma vez que a probabilidade de um sucesso é denotada por p e a probabilidade de uma falha é
denotada por q, a probabilidade da sequência de resultados acima é encontrada por meio da regra de
multiplicação como sendo
Pð1; 0; 1; 1; 0Þ ¼ pqppq ¼ q2 p3
A regra da multiplicação é apropriada para calcular essa probabilidade, pois estamos buscando a
probabilidade de um termo completo, e prematuro, e termo completo, e termo completo, e prematuro, nessa
ordem ou, em outras palavras, a probabilidade conjunta dos cinco eventos. Para simplificar, vírgulas, em
vez de notação de interseção, foram usadas para separar os resultados dos eventos na declaração de
probabilidade.
A probabilidade resultante é a de obter a sequência específica de resultados na ordem mostrada.

Não estamos, entretanto, interessados na ordem de ocorrência dos registros de nascimentos a termo e
prematuros, mas sim, como já foi dito, na probabilidade de ocorrência de exatamente três registros de
nascimentos a termo em cinco selecionados aleatoriamente registros. Em vez de ocorrer na sequência
mostrada acima (chame-a de sequência número 1), três sucessos e duas falhas também podem ocorrer
em qualquer uma das seguintes sequências adicionais:
Sequência Numérica
2 11100
3 10011
4 11010
5 11001
6 10101
7 01110
8 00111
9 01011
10 01101
Cada uma dessas sequências tem a mesma probabilidade de ocorrer, e essa

probabilidade é igual a q2p3, a probabilidade calculada para a primeira sequência
mencionado.
Quando extraímos uma única amostra de tamanho cinco da população especificada,
obtemos apenas uma sequência de sucessos e fracassos. A questão agora é: qual é a
probabilidade de obter o número de sequência 1 ou o número de sequência 2 ou o número de
. . . probabilidades
sequência 10? Pela regra da adição, sabemos que essa
individuais.
probabilidade
No presente
é igualexemplo,
à soma das
precisamos somar os 10q2p3 ou, de forma equivalente, multiplicar q2p3 por 10. Podemos
agora responder à nossa pergunta original: Qual é a probabilidade, em uma amostra aleatória
de tamanho 5, retirada da população especificada, de observar três sucessos (registro de parto
a termo) e dois fracassos (registro de parto prematuro)? Já na população, p ¼ :858; q ¼ ð Þ¼
1 p ð 1 :858 Þ¼ :142 a resposta à questão é
2 3
10ðÞ :142 ð Þ :858 ¼ 10ð Þ :0202 ð Þ¼ :6316 :1276
&
Procedimento de Amostras Grandes: Uso de Combinações Podemos antecipar facilmente que, à medida que
o tamanho da amostra aumenta, listar o número de sequências se torna cada vez mais difícil e tedioso. O que
é necessário é um método fácil de contar o número de sequências. Tal método é fornecido por meio de uma
fórmula de contagem que nos permite determinar rapidamente quantos subconjuntos de objetos podem ser
formados quando usamos nos subconjuntos diferentes números dos objetos que compõem o conjunto do qual
os objetos são selecionados. Quando a ordem dos objetos em um subconjunto é irrelevante, o subconjunto é
chamado de combinação de objetos. Quando a ordem dos objetos em um subconjunto importa, nos referimos
ao subconjunto como uma permutação de objetos. Embora as permutações de objetos sejam frequentemente
usadas na teoria da probabilidade, elas não serão usadas em nossa discussão atual. Se um conjunto consiste
em n objetos e desejamos formar um subconjunto de x objetos a partir desses n objetos, sem considerar a
ordem dos objetos no subconjunto, o resultado é chamado de combinação. Por exemplo, definimos uma
combinação da seguinte maneira quando a combinação é formada tomando x objetos de um conjunto de n
objetos.
DEFINIÇÃO
Uma combinação de n objetos tomados x de cada vez é um subconjunto não ordenado de x

dos n objetos.
O número de combinações de n objetos que podem ser formados tomando x deles em um

o tempo é dado por
n!
nCx ¼ (4.3.1)
x!ðn xÞ!
onde x!, leia-se x fatorial, é o produto de todos os números inteiros de x até 1. Ou seja, x! ¼ x xð Þ 1 ð x 2 ...ð
Þ1 . Notamos que,
registros
por definição,
de
º nascimento
0! ¼ 1:
e Voltemos ao nosso exemplo em que temos uma amostra de n ¼ 5
estão interessados em encontrar a probabilidade de que três deles sejam nascidos a termo.
TABELA 4.3.1 A Distribuição Binomial
Número de sucessos, x Probabilidade, fðxÞ
0 nC0qn0p0
1 nC1qn1p1
2 nC2qn2p2
.. ..
. .
x nCxqnxpx
.. ..
. .
n nCnqnnpn
Total 1
O número de sequências em nosso exemplo é determinado pela Equação 4.3.1 como sendo
5! 54321 120
nC3 ¼ ¼ ¼ ¼ 10
3!ð5 3Þ! ð3 2 1Þð2 1Þ 12
Em nosso exemplo, consideramos x ¼ 3, o número de sucessos, de modo que nx ¼ 2, o número de

falhas. Podemos então escrever a probabilidade de obter exatamente x sucessos em n tentativas como
fðxÞ ¼ nCxqnx px ¼ nCxpx qnx para x ¼ 0; 1; 2; ... n; (4.3.2)
¼ 0; em outro lugar
Essa expressão é chamada de distribuição binomial. Na Equação 4.3.2 fðxÞ ¼ PðX ¼ xÞ, onde X é
a variável aleatória, o número de sucessos em n tentativas. Usamos fðxÞ em vez de PðX ¼ xÞ devido à sua
compacidade e ao seu uso quase universal.
Podemos apresentar a distribuição binomial em forma de tabela como na Tabela 4.3.1.
Estabelecemos o fato de que a Equação 4.3.2 é uma distribuição de probabilidade mostrando o
seguinte:
1. fðxÞ 0 para todos os valores reais de x. Isso decorre do fato de que n e p são ambos não negativos e,
nx
não negativo e, portanto, nCx; px, e ð1 pÞ seu produto portanto,
é maior ou igual a zero.
2. Pf xð Þ¼ 1. Isso é verdadeiro se reconhecermos que P nCxqnxpx é igual a is

n n
½ ð Þþ 1 pp ¼ 1n ¼ 1, a conhecida expansão binomial. Se o binômio ð Þ q þ p expandido, temos
n n Þ
ðÞqþp nð ¼ qn þ nqn1 p1 þ 2 1 qn2 p2 þþ nq1 pn1 þ pn
Se compararmos os termos da expansão, termo a termo, com os fðxÞ da Tabela 4.3.1, vemos que
eles são, termo a termo, equivalentes, pois fð Þ¼ 0 nC0qn0p0 ¼ qn fð Þ¼ 1 nC1qn1p1 ¼ nqn1p
n Þ
nð fð Þ¼ 2 nC2qn2p2 ¼ 2 1 qn2 p2
. . .
. . .
. . .
f nð Þ¼ nCnqnnpn ¼ pn
EXEMPLO 4.3.2
Como outro exemplo do uso da distribuição binomial, os dados do Centro Estadual de Estatísticas de
Saúde da Carolina do Norte (A-3) mostram que 14% das mães admitiram fumar um ou mais cigarros por
dia durante a gravidez. Se uma amostra aleatória de tamanho 10 for selecionada dessa população, qual é
a probabilidade de conter exatamente quatro mães que admitiram fumar durante a gravidez?
Solução: consideramos a probabilidade de uma mãe admitir que fuma como 0,14. Usando
Equação 4.3.2 encontramos
6 4
fðÞ¼ 4 10C4ðÞ :86 ð Þ :14
10!
¼
ð Þ :4045672 ð Þ :0003842
4!6!
¼ :0326 &
Tabela Binomial O cálculo de uma probabilidade usando a Equação 4.3.2 pode ser uma tarefa tediosa se
o tamanho da amostra for grande. Felizmente, as probabilidades para diferentes valores de n, p e x foram
tabuladas, de modo que precisamos apenas consultar uma tabela apropriada para obter a probabilidade
desejada. A Tabela B do Apêndice é uma das muitas tabelas disponíveis. Dá a probabilidade de que X
seja menor ou igual a algum valor especificado. Ou seja, a tabela fornece as probabilidades cumulativas
de x ¼ 0 até algum número positivo especificado de sucessos.
Vamos ilustrar o uso da tabela usando o Exemplo 4.3.2, onde se desejava encontrar a probabilidade
de que x ¼ 4 quando n ¼ 10 ep ¼ :14. Com base em nosso conhecimento de distribuições de probabilidade
cumulativas da seção anterior, sabemos que P xð Þ ¼ 4 pode ser encontrado subtraindo P Xð ÞÞ34de SePna
Xð
Tabela B localizarmos p ¼ :14 para n ¼o10,
último
encontramos
do primeiro dá.P:9927
que com
Xð Þ¼
nosso
:9600
4 :9927
cálculo
¼ :0327,
e Pmanual
Xð
que
Þ¼quase
(discrepância
3 :9600.
concorda
Subtrair
devido ao arredondamento).
Frequentemente estamos interessados em determinar probabilidades, não para valores específicos

de X, mas para intervalos como a probabilidade de que X esteja entre, digamos, 5 e 10. Vamos ilustrar com
um exemplo.
EXEMPLO 4.3.3
Suponha que se saiba que 10% de uma certa população é daltônica. Se uma amostra aleatória de 25
pessoas for retirada dessa população, use a Tabela B no Apêndice para encontrar a probabilidade de que:
(a) Cinco ou menos serão daltônicos.

Solução: Esta probabilidade é uma entrada na tabela. Nenhuma adição ou subtração é

necessário, P Xð Þ¼ 5 :9666.
(b) Seis ou mais serão daltônicos.
Solução: Não podemos encontrar essa probabilidade diretamente na tabela. Para encontrar a resposta,
usamos o conceito de probabilidades complementares. A probabilidade de que seis ou
mais sejam daltônicos é o complemento da probabilidade de que cinco ou menos sejam
daltônicos. Ou seja, esse conjunto é o complemento do conjunto especificado na parte
a; Portanto,
P Xð Þ¼ 6 1 P Xð Þ¼ 5 1:9666 ¼:0334
(c) Entre seis e nove, inclusive, será daltônico.
Solução: encontramos isso subtraindo a probabilidade de que X seja menor ou igual a 5 da

probabilidade de que X seja menor ou igual a 9. Ou seja,
PðÞ¼
6 X 9 P Xð Þ 9 P Xð Þ¼ 5 :9999 :9666 ¼ :0333
(d) Dois, três ou quatro serão daltônicos.
Solução: Esta é a probabilidade de X estar entre 2 e 4 inclusive.
PðÞ¼
2 X 4 P Xð Þ 4 P Xð Þ¼ 1 :9020 :2712 ¼ :6308
&
Usando a Tabela B Quando p > :5 A Tabela B não fornece probabilidades para valores de p maiores
que 0,5. Podemos obter probabilidades da Tabela B, entretanto, redefinindo o problema em termos
da probabilidade de falha, 1 p, em vez de termos da probabilidade de sucesso, p. Como parte da
reformulação, também devemos pensar em termos do número de falhas, nx, em vez do número de
sucessos, x. Podemos resumir esta ideia da seguinte forma:
P Xð ¼ xjn; p > :50 ¼ ºP Xð ¼ n xjn; 1 p Þ (4.3.3)
Em palavras, a Equação 4.3.3 diz: “A probabilidade de que X seja igual a algum valor especificado
dado o tamanho da amostra e uma probabilidade de sucesso maior que 0,5 é igual à probabilidade
de que X seja igual a nx dado o tamanho da amostra e o probabilidade de falha de 1 p:” Para fins
de uso da tabela binomial, tratamos a probabilidade de falha como se fosse a probabilidade de
sucesso. Quando p é maior que 0,5, podemos obter probabilidades cumulativas da Tabela B usando
a seguinte relação:
P Xð Þ xjn; p > :50 ¼ P Xð nxjn; 1 p Þ (4.3.4)
Finalmente, para usar a Tabela B para encontrar a probabilidade de que X seja maior ou igual a algum x quando
P > :5, usamos a seguinte relação:
P Xð Þ xjn; p > :50 ¼ P Xð nxjn; 1 p Þ (4.3.5)

EXEMPLO 4.3.4
De acordo com uma pesquisa realizada em junho de 2003 pelo projeto Massachusetts Health
Benchmarks (A-4), aproximadamente 55% dos residentes responderam “problema sério” à pergunta:
“Algumas pessoas pensam que a obesidade infantil é um problema de saúde nacional. O que você
acha? É um problema muito sério, um pouco problemático, pouco problemático ou nada problemático?”
Supondo que a probabilidade de dar esta resposta à pergunta seja de 0,55 para qualquer residente de
Massachusetts, use a Tabela B para encontrar a probabilidade de que, se 12 residentes forem
escolhidos aleatoriamente:
(a) Exatamente sete responderão “problema sério”.
Solução: Reformulamos o problema da seguinte forma: qual é a probabilidade de um residente

selecionado aleatoriamente dar uma resposta diferente de “problema sério” de
exatamente cinco residentes em 12, se 45% dos residentes derem uma resposta
diferente de “problema sério”. Encontramos a resposta da seguinte forma:
P XðÞ¼¼P5jn
Xð ¼
Þ 12;
5 P pXð
¼ :45 Þ4
¼ :5269 :3044 ¼ :2225
(b) Cinco ou menos famílias responderão “problema sério”.
Solução: A probabilidade que queremos é
P Xð Þ 5jn ¼ 12; p ¼ :55 ¼ P Xð 12 5jn ¼ 12; p ¼ :45 Þ ¼ P Xð

7jn ¼ 12; p 12;
¼ :45
p ¼Þ:45
¼ 1ÞP¼Xð
1 :7393
6jn
:2607
¼¼
(c) Oito ou mais famílias responderão “problema sério”.
Solução: A probabilidade que queremos é
P Xð 8jn ¼ 12; p ¼ :55 P Þ¼

Xð Þ 4jn ¼ 12; p ¼ :45 ¼ :3044 &
A Figura 4.3.1 fornece uma representação visual da solução para as três partes do Exemplo 4.3.4.
Os Parâmetros Binomiais A distribuição binomial tem dois parâmetros, n e p. Eles são parâmetros
no sentido de que são suficientes para especificar uma distribuição binomial. A distribuição binomial
é realmente uma família de distribuições com cada valor possível de n e p designando um membro
diferente da família. A média e a variância da distribuição binomial são m ¼ np e s2 ¼ npð Þ 1 p ,
respectivamente.
A rigor, a distribuição binomial é aplicável em situações onde a amostragem é de uma população
infinita ou de uma população finita com reposição. Uma vez que, na prática, as amostras são geralmente
extraídas sem reposição de populações finitas, surge a questão quanto à adequação da distribuição
binomial nessas circunstâncias. Se o binômio é apropriado ou não, depende de quão drástico é o efeito
dessas condições na constância de p de uma tentativa para outra. É geralmente acordado
FIGURA 4.3.1 Representação esquemática das soluções do Exemplo 4.3.4 (os números relevantes de
sucessos e falhas em cada caso estão circulados).
que quando n é pequeno em relação a N, o modelo binomial é apropriado. Alguns escritores dizem que n é
pequeno em relação a N se N for pelo menos 10 vezes maior que n.
A maioria dos programas de software estatístico permite o cálculo de probabilidades binomiais com
um computador pessoal. O EXCEL, por exemplo, pode ser usado para calcular probabilidades individuais
ou cumulativas para valores especificados de x, n e p. Suponha que desejamos encontrar as probabilidades
individuais para x ¼ 0 até x ¼ 6 quando n ¼ 6 e p ¼ :3. Entramos com os números de 0 a 6 na Coluna 1 e
procedemos conforme mostrado na Figura 4.3.2. Podemos seguir um procedimento semelhante para
encontrar as probabilidades cumulativas. Para esta ilustração, usamos o MINITAB e colocamos os números
de 1 a 6 na Coluna 1. Procedemos conforme mostrado na Figura 4.3.3.
Usando o seguinte comando de célula:
BINOMDIST(A*, 6, .3, false), onde A* é a referência de célula apropriada
Obtemos a seguinte saída:
0 0,117649
1 0,302526
2 0,324135
3 0,185220
4 0,059535
5 0,010206
6 0,000729
FIGURA 4.3.2 Cálculo em Excel de probabilidades binomiais individuais para x ¼ 0 até x ¼ 6 quando n
¼ 6 e p ¼ :3:
EXERCÍCIOS 107
Dados:
C1: 0 1 2 3 4 5 6
Distribuições de probabilidade de cálculo MTB > CDF C1; SUBC>

binômio BINOMIAL 6 0.3.
Escolha Probabilidade cumulativa. Digite 6 em Número de

tentativas. Digite 0,3 em Probabilidade de sucesso. Escolha
a coluna de entrada e digite C1. Clique em OK.
Saída:
Função de distribuição cumulativa
Binômio com n 6ep 0,300000
x P(X < x) 0,1176

0,00 0,4202 0,7443
1,00 0,9295 0,9891
2,00 0,9993 1,0000
3,00
4,00
5,00
6,00
FIGURA 4.3.3 Cálculo do MINITAB de probabilidades binomiais cumulativas para x ¼ 0 até x ¼ 6

quando n ¼ 6 e p ¼ :3.
EXERCÍCIOS
Em cada um dos exercícios a seguir, assuma que N é suficientemente grande em relação a n para que a
distribuição binomial possa ser usada para encontrar as probabilidades desejadas.
4.3.1 Com base nos dados coletados pelo National Center for Health Statistics e disponibilizados ao público no banco de
dados Sample Adult (A-5), uma estimativa da porcentagem de adultos que em algum momento de suas vidas
foram informados de que hipertensão é de 23,53 por cento. Se selecionarmos uma amostra aleatória simples de
20 adultos norte-americanos e presumirmos que a probabilidade de cada um ter sido informado de que tem
hipertensão é de 0,24, encontre a probabilidade de que o número de pessoas na amostra que tenham sido
informadas de que têm hipertensão vai ser:
(a) Exatamente três (b) Três ou mais (d)

(c) Menos de três Entre três e sete, inclusive
4.3.2 Consulte o Exercício 4.3.1. Quantos adultos que foram informados de que têm hipertensão você
espera encontrar em uma amostra de 20?
4.3.3 Consulte o Exercício 4.3.1. Suponha que selecionamos uma amostra aleatória simples de cinco adultos. Use a Equação 4.3.2
para encontrar a probabilidade de que, na amostra, o número de pessoas que foram informadas de que têm hipertensão
seja:
(a) Zero (b) Mais de um (d)

(c) Entre um e três, inclusive (e) Cinco Dois ou menos
4.3.4 O mesmo banco de dados de pesquisa citado no exercício 4.3.1 (A-5) mostra que 32% dos adultos americanos indicaram que
fizeram o teste de HIV em algum momento de suas vidas. Considere uma amostra aleatória simples de 15 adultos
selecionados naquele momento. Encontre a probabilidade de que o número de adultos que fizeram o teste de HIV na
amostra seja:
(a) Três (c) (b) Menos de cinco

Entre cinco e nove, inclusive (e) Seis ou mais (d) Mais de cinco, mas menos de 10
4.3.5 Consulte o Exercício 4.3.4. Encontre a média e a variação do número de pessoas testadas para HIV em amostras
de tamanho 15.
4.3.6 Consulte o Exercício 4.3.4. Suponha que hoje peguemos uma amostra aleatória simples de 25 adultos e descubramos que
dois deles fizeram o teste de HIV em algum momento de suas vidas. Esses resultados seriam surpreendentes? Por que
ou por que não?
4.3.7 Coughlin et al. (A-6) estimou a porcentagem de mulheres que vivem em condados fronteiriços ao longo do sul dos Estados
Unidos com o México (condados designados na Califórnia, Arizona, Novo México e Texas) que têm menos de ensino
médio em 18,7. Suponha que a probabilidade correspondente seja 0,19.
Suponha que selecionamos três mulheres aleatoriamente. Encontre a probabilidade de que o número com menos de um
ensino médio seja:
(a) Exatamente zero (b) Exatamente um

(c) Mais de um (e) (d) Dois ou menos (f)
Dois ou três Exatamente três
4.3.8 Em uma pesquisa com estudantes de enfermagem cursando mestrado, 75 por cento afirmaram que esperam ser promovidos
a uma posição superior dentro de um mês após receberem o diploma. Se essa porcentagem for válida para toda a
população, encontre, para uma amostra de 15, a probabilidade de que o número que espera uma promoção dentro de um
mês após receber seu diploma seja:
(a) Seis (b) Pelo menos sete

(c) Não mais que cinco (d) Entre seis e nove, inclusive
4.3.9 Dados os parâmetros binomiais p ¼ :8 e n ¼ 3, mostre por meio da expansão binomial dada em
Tabela 4.3.1 que Pf xð Þ ¼ 1.
4.4 A DISTRIBUIÇÃO DO VENENO
A próxima distribuição discreta que consideramos é a distribuição de Poisson, nomeada em homenagem ao matemático francês
Simeon Denis Poisson (1781–1840), que geralmente é creditado por publicar sua derivação em 1837. Essa distribuição tem sido
amplamente usada como um
4.4 A DISTRIBUIÇÃO DO VENENO 109
modelo de probabilidade em biologia e medicina. Haight (1) apresenta um catálogo bastante extenso
de tais aplicações no capítulo 7 de seu livro.
Se x é o número de ocorrências de algum evento aleatório em um intervalo de tempo ou espaço
(ou algum volume de matéria), a probabilidade de que x ocorra é dada por
ellx f
xð Þ¼ ; x ¼ 0; 1; 2; ... (4.4.1)
x!
A letra grega l (lambda) é chamada de parâmetro da distribuição e é o número médio de

ocorrências do evento aleatório no intervalo (ou volume). O símbolo e é a constante (até quatro casas
decimais) 2,7183.
Pode-se mostrar que f xð Þ 0 para cada x e que P xf xð Þ¼ 1 de modo que a distribuição
satisfaça os requisitos para uma distribuição de probabilidade.
O Processo de Poisson Vimos que a distribuição binomial resulta de um conjunto de suposições sobre
um processo subjacente que produz um conjunto de observações numéricas.
Esse também é o caso da distribuição de Poisson. As afirmações a seguir descrevem o que é
conhecido como processo de Poisson.
1. As ocorrências dos eventos são independentes. A ocorrência de um evento em um intervalo1 de

espaço ou tempo não tem efeito sobre a probabilidade de uma segunda ocorrência do evento
no mesmo ou em qualquer outro intervalo.
2. Teoricamente, um número infinito de ocorrências do evento deve ser possível no
intervalo.
3. A probabilidade de ocorrência única do evento em um determinado intervalo é

proporcional ao comprimento do intervalo.
4. Em qualquer porção infinitesimalmente pequena do intervalo, a probabilidade de mais de uma
ocorrência do evento é desprezível.
Uma característica interessante da distribuição de Poisson é o fato de que a média e

variância são iguais. Ambos são representados pelo símbolo l.
Quando usar o modelo de Poisson A distribuição de Poisson é empregada como um modelo quando
são feitas contagens de eventos ou entidades que são distribuídas aleatoriamente no espaço ou no
tempo. Pode-se suspeitar que um determinado processo obedece à lei de Poisson, e sob esta hipótese
podem ser calculadas as probabilidades de ocorrência de eventos ou entidades dentro de alguma
unidade de espaço ou tempo. Por exemplo, sob as suposições de que a distribuição de algum parasita
entre membros individuais do hospedeiro segue a lei de Poisson, pode-se, com conhecimento do
parâmetro l, calcular a probabilidade de que um hospedeiro individual selecionado aleatoriamente
produzirá x número de parasitas. Em um capítulo posterior, aprenderemos como decidir se a suposição
de que um processo especificado obedece à lei de Poisson é plausível. Um uso adicional da distribuição
de Poisson na prática ocorre quando n é grande e p é pequeno. Neste caso, a distribuição de Poisson
pode ser usada para
1
Para simplificar, a distribuição de Poisson é discutida em termos de intervalos, mas outras unidades, como um volume de
matéria, estão implícitas.
aproxime a distribuição binomial. Em outras palavras,

ell x!
nCxpx qnx ; x ¼ 0; 1; 2; ...
onde l ¼ np:
Para ilustrar o uso da distribuição de Poisson para calcular probabilidades, vamos
considere os exemplos a seguir.
EXEMPLO 4.4.1
Em um estudo de anafilaxia induzida por drogas entre pacientes que tomavam brometo de rocurônio
como parte de sua anestesia, Laake e Røttingen (A-7) descobriram que a ocorrência de anafilaxia
seguia um modelo de Poisson com l ¼ 12 incidentes por ano na Noruega. Encontre a probabilidade
de que no próximo ano, entre os pacientes que receberam rocurônio, exatamente três apresentarão
anafilaxia.
Solução: Pela Equação 4.4.1, descobrimos que a resposta é
e12123
P Xð Þ¼ ¼ 3 ¼ :00177 3!
&
EXEMPLO 4.4.2
Consulte o Exemplo 4.4.1. Qual é a probabilidade de que pelo menos três pacientes no próximo ano
apresentem anafilaxia se o rocurônio for administrado com anestesia?
Solução: Podemos usar o conceito de eventos complementares neste caso. Como P Xð é o Þ2
complemento de P Xð Þ 3 , temos
P Xð Þ¼ 3 1 Þþ ¼ 0 P Xð Þþ ¼ 1 P Xð Þ ¼ 2 e12120
1 P Xð Þ¼ 2 ½ P Xð
e12121 e12122 þ þ
¼1
0! 1! 2!
¼1 ½ :00000614 þ :00007373 þ :00044238
¼ 1:00052225
¼:99947775
&
Nos exemplos anteriores, as probabilidades foram avaliadas diretamente da equação.

Podemos, no entanto, usar a Tabela C do Apêndice, que fornece probabilidades cumulativas para
vários valores de l e X.
EXEMPLO 4.4.3
No estudo de um determinado organismo aquático, um grande número de amostras foi retirado de

uma lagoa, e o número de organismos em cada amostra foi contado. O número médio de
4.4 A DISTRIBUIÇÃO DO VENENO 111
organismos por amostra foi dois. Supondo que o número de organismos segue uma distribuição de Poisson,
encontre a probabilidade de que a próxima amostra coletada contenha um ou menos organismos.
Solução: Na Tabela C vemos que quando l ¼ 2, a probabilidade de X 1 é 0,406. Isto é, Þ¼ 1j2 :406.
P Xð &
EXEMPLO 4.4.4
Consulte o Exemplo 4.4.3. Encontre a probabilidade de que a próxima amostra coletada contenha
exatamente três organismos.
Solução:
P Xð Þ¼ ¼ 3j2 P Xð Þ 3 P Xð Þ¼ 2 :857 :677 ¼ :180

&
Dados:
C1: 0 1 2 3 4 5 6
:xob golaiD nammoc noisseS :d
Distribuições de probabilidade de cálculo de Poisson MTB > PDF C1;

SUBC> Poisson .70.
Escolha Probabilidade. Digite 0,70 em Média. Escolha a coluna de entrada
e digite C1. Clique em OK.
Saída:
Função densidade de probabilidade
Poisson com mu 0,700000
x P(X x)
0,00 0,4966
1,00 0,3476
2,00 0,1217
3,00 0,0284
4,00 0,0050
5,00 0,0007
6,00 0,0001
FIGURA 4.4.1 Cálculo do MINITAB de probabilidades individuais de Poisson para x ¼ 0 até x ¼ 6 e l

¼:7.
Usando comandos encontrados em:
Calculadora de outras probabilidades de análise
0 <= X Prob(x <= X)

0 0,4966
1 0,8442
2 0,9659
3 0,9942
4 0,9992
5 0,9999
6 1,0000
FIGURA 4.4.2 Cálculo do MINITAB de probabilidades de Poisson cumulativas para x ¼ 0

até x ¼ 6 e l ¼ :7.
EXEMPLO 4.4.5
Consulte o Exemplo 4.4.3. Encontre a probabilidade de que a próxima amostra coletada contenha mais
de cinco organismos.
Solução: Como o conjunto de mais de cinco organismos não inclui cinco, estamos perguntando pela
probabilidade de seis ou mais organismos serem observados. Isso é obtido subtraindo a
probabilidade de observar cinco ou menos de um.
Isso é,
P XðÞ¼ > 5j2 1 P XðÞ¼ 5 1:983 ¼:017

&
As probabilidades de Poisson podem ser obtidas na maioria dos pacotes de software estatístico. Para
ilustrar o uso do MINITAB para esse propósito, suponha que desejamos encontrar as probabilidades
individuais para x ¼ 0 até x ¼ 6 quando l ¼ :7. Entramos com os valores de x na Coluna 1 e procedemos
como mostrado na Figura 4.4.1. Obtemos as probabilidades cumulativas para os mesmos valores de x e
l conforme mostrado na Figura 4.4.2.
EXERCÍCIOS
4.4.1 Singh et al. (A-8) analisou a ocorrência de hemangioma capilar retiniano (RCH) em pacientes com
doença de von Hippel–Lindau (VHL). RCH é um tumor vascular benigno da retina. Usando uma revisão
retrospectiva consecutiva de séries de casos, os pesquisadores descobriram que o número de tumores RCH
4.5 DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUA 113
os incidentes seguiram uma distribuição de Poisson com l ¼ 4 tumores por olho para pacientes com VHL. Usando este
modelo, encontre a probabilidade de que em um paciente com VHL selecionado aleatoriamente: (a) Existem exatamente
cinco ocorrências de tumores por olho. (b) Há mais de cinco ocorrências de tumores por olho. (c) Há menos de cinco
ocorrências de tumores por olho. (d) Há entre cinco e sete ocorrências de tumores por olho, inclusive.
4.4.2 Tubert-Bitter et al. (A-9) constatou que o número de reações gastrointestinais graves relatadas ao Comitê Britânico de
Segurança da Medicina foi de 538 para 9.160.000 prescrições do antiinflamatório piroxicam. Isso corresponde a uma taxa
de 0,058 reações gastrointestinais por 1.000 prescrições. Usando um modelo de Poisson para probabilidade, com l = 06,
encontre a probabilidade de (a) Exatamente uma reação gastrointestinal em 1.000 prescrições (b) Exatamente duas
reações gastrointestinais em 1.000 prescrições (c) Nenhuma reação gastrointestinal em 1.000 prescrições (d) Em pelo
menos uma reação gastrointestinal em 1000 prescrições
4.4.3 Se o número médio de acidentes graves por ano em uma grande fábrica (onde o número de empregados
permanece constante) é cinco, encontre a probabilidade de que no ano atual haverá:
(a) Exatamente sete acidentes (c) (b) Dez ou mais acidentes (d)
Nenhum acidente Menos de cinco acidentes
4.4.4 Em um estudo sobre a eficácia de um inseticida contra um determinado inseto, uma grande área de terra foi pulverizada.
Mais tarde, a área foi examinada em busca de insetos vivos, selecionando quadrados aleatoriamente e contando o
número de insetos vivos por quadrado. A experiência anterior mostrou que o número médio de insetos vivos por quadrado
após a pulverização é de 0,5. Se o número de insetos vivos por quadrado segue uma distribuição de Poisson, encontre a
probabilidade de que um quadrado selecionado contenha:
(a) Exatamente um inseto vivo (b) Nenhum inseto vivo

(c) Exatamente quatro insetos vivos (d) Um ou mais insetos vivos
4.4.5 Em certa população, uma média de 13 novos casos de câncer de esôfago são diagnosticados a cada ano. Se a incidência
anual de câncer de esôfago segue uma distribuição de Poisson, encontre a probabilidade de que em um determinado ano
o número de novos casos diagnosticados de câncer de esôfago seja:
(a) Exatamente (b) Pelo menos oito

10 (c) Não mais que 12 (d) Entre nove e 15 anos, inclusive
(e) Menos que sete
4.5 DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUA
As distribuições de probabilidade consideradas até agora, a binomial e a de Poisson, são

distribuições de variáveis discretas. Vamos agora considerar distribuições de variáveis aleatórias
contínuas. No Capítulo 1 afirmamos que uma variável contínua é aquela que pode assumir
qualquer valor dentro de um intervalo especificado de valores assumidos pela variável.
Conseqüentemente, entre quaisquer dois valores assumidos por uma variável contínua, existe
um número infinito de valores.
Para nos ajudar a entender a natureza da distribuição de uma variável aleatória contínua,
consideremos os dados apresentados na Tabela 1.4.1 e na Figura 2.3.2. Na tabela temos 189
valores da variável aleatória idade. O histograma da Figura 2.3.2 foi construído localizando pontos
especificados em uma linha que representa a medida de interesse e erguendo uma série de
retângulos, cujas larguras eram as distâncias entre dois pontos especificados na linha e cujas
alturas representavam o número de valores de a variável caindo entre os dois pontos especificados.
Os intervalos definidos por quaisquer dois pontos especificados consecutivos são chamados de
intervalos de classe. Conforme observado no Capítulo 2, as subáreas do histograma correspondem
às frequências de ocorrência dos valores da variável entre os limites da escala horizontal dessas
subáreas. Isso fornece uma maneira pela qual a frequência relativa de ocorrência de valores entre
quaisquer dois pontos especificados pode ser calculada: apenas determine a proporção da área
total do histograma entre os pontos especificados. Isso pode ser feito de maneira mais conveniente
consultando as colunas de frequência relativa ou frequência relativa cumulativa da Tabela 2.3.2.
Imagine agora a situação em que o número de valores de nossa variável aleatória é muito
grande e a largura de nossos intervalos de classe é muito pequena. O histograma resultante pode
ser semelhante ao mostrado na Figura 4.5.1.
Se fôssemos conectar os pontos médios das células do histograma na Figura 4.5.1 para
formar um polígono de frequência, claramente teríamos uma figura muito mais suave do que o
polígono de frequência da Figura 2.3.4.
Em geral, como o número de observações, n, se aproxima do infinito, e a largura dos
intervalos de classe se aproxima de zero, o polígono de frequência se aproxima de uma curva
suave, como mostrado na Figura 4.5.2. Essas curvas suaves são usadas para representar
graficamente as distribuições de variáveis aleatórias contínuas. Isso tem algumas consequências
importantes quando lidamos com distribuições de probabilidade. Primeiro, a área total sob a curva
é igual a um, como aconteceu com o histograma, e a frequência relativa de ocorrência de valores
entre quaisquer dois pontos no eixo x é igual à área total delimitada pela curva, o x -eixo e linhas
perpendiculares erguidas nos dois pontos no eixo x. Consulte a Figura 4.5.3. o
f (x)
FIGURA 4.5.1 Um histograma resultante de um grande número de valores e

pequenos intervalos de classe.
4.5 DISTRIBUIÇÕES DE PROBABILIDADE CONTÍNUA 115
f (x)
FIGURA 4.5.2 Representação gráfica de uma distribuição

contínua.
probabilidade de qualquer valor específico da variável aleatória é zero. Isso parece lógico, pois um
valor específico é representado por um ponto no eixo x e a área acima de um ponto é zero.
Encontrando a área sob uma curva suave Com um histograma, como vimos, subáreas de interesse
podem ser encontradas adicionando áreas representadas pelas células. Não temos células no
caso de uma curva suave, então devemos buscar um método alternativo para encontrar subáreas.
Tal método é fornecido pelo cálculo integral. Para encontrar a área sob uma curva suave entre
quaisquer dois pontos a e b, a função de densidade é integrada de a até b. Uma função de
densidade é uma fórmula usada para representar a distribuição de uma variável aleatória contínua.
A integração é o caso limite da soma, mas não realizaremos nenhuma integração, pois o nível de
matemática envolvido está além do escopo deste livro. Como veremos mais adiante, para todas as
distribuições contínuas que consideraremos, haverá uma maneira mais fácil de encontrar as áreas
sob suas curvas.
Embora a definição de uma distribuição de probabilidade para uma variável aleatória
contínua tenha sido implícita na discussão anterior, a título de resumo, nós a apresentamos de uma
forma mais compacta como segue.
DEFINIÇÃO
Uma função não negativa f (x) é chamada de distribuição de probabilidade

(às vezes chamada de função de densidade de probabilidade) da variável
aleatória contínua X se a área total limitada por sua curva e o eixo x for igual a 1 e se
a subárea sob a curva limitada pela curva, o eixo x e as perpendiculares erguidas em
quaisquer dois pontos a e b dão a probabilidade de que X esteja entre os pontos a e
b.
f (x)
uma b x
FIGURA 4.5.3 Gráfico de uma distribuição contínua

mostrando a área entre a e b.
Assim, a probabilidade de uma variável aleatória contínua assumir valores entre a e b é denotada
por P að Þ < X < b .
4.6 A DISTRIBUIÇÃO NORMAL
Chegamos agora à distribuição mais importante de todas as estatísticas — a distribuição normal. A

fórmula dessa distribuição foi publicada pela primeira vez por Abraham De Moivre (1667–1754) em 12
de novembro de 1733. Muitos outros matemáticos figuram com destaque na história da distribuição
normal, incluindo Carl Friedrich Gauss (1777–1855). A distribuição é freqüentemente chamada de
distribuição Gaussiana em reconhecimento a suas contribuições.
A densidade normal é dada por

1 2
=2s2
xm f xð Þ¼ 2p pseð Þ
ffiffiffiffiff
; 1<x<1 (4.6.1)
Na Equação 4.6.1, p e e são as constantes familiares, 3,14159 . . , . e 2,71828

. . . respectivamente, que são freqüentemente encontrados em matemática. Os dois parâmetros da
distribuição são m, a média, e s, o desvio padrão. Para nossos propósitos, podemos pensar em m e s
de uma distribuição normal, respectivamente, como medidas de tendência central e dispersão conforme
discutido no Capítulo 2. Como, entretanto, uma variável aleatória normalmente distribuída é contínua e
assume valores entre 1 e þ1, sua média e desvio padrão podem ser definidos com mais rigor; mas tais
definições não podem ser dadas sem o uso de cálculo. O gráfico da distribuição normal produz a
familiar curva em forma de sino mostrada na Figura 4.6.1.
Características da distribuição normal A seguir estão algumas características importantes da distribuição

normal.
1. É simétrico em relação à sua média, m. Como é mostrado na Figura 4.6.1, a curva em qualquer
lado de m é uma imagem espelhada do outro lado.
2. A média, a mediana e a moda são todas iguais.
3. A área total sob a curva acima do eixo x é uma unidade quadrada. Essa característica decorre do
fato de que a distribuição normal é uma distribuição de probabilidade.
Devido à simetria já mencionada, 50% da área está à direita de uma perpendicular erguida na
média e 50% está à esquerda.
ÿ x
FIGURA 4.6.1 Gráfico de uma distribuição normal.

4.6 A DISTRIBUIÇÃO NORMAL 117
.68
.16 1ÿ 1ÿ .16
ÿ _ 1ÿÿÿ + 1ÿ (a) x
0,95
0,025 0,025
2ÿ 2ÿ
ÿ _ 2ÿÿÿ + 2ÿ x
(b)
0,997
3ÿ 3ÿ
.0015 .0015
ÿ _ 3ÿÿÿ + 3ÿ (c) x
FIGURA 4.6.2 Subdivisão da área sob a curva normal

(as áreas são aproximadas).
4. Se erguermos perpendiculares a uma distância de 1 desvio padrão da média em ambas as

direções, a área delimitada por essas perpendiculares, o eixo x e a curva será de
aproximadamente 68% da área total. Se estendermos esses limites laterais a uma distância
de dois desvios padrão em cada lado da média, aproximadamente 95% da área será cercada,
e estendê-los a uma distância de três desvios padrão fará com que aproximadamente 99,7%
da área total seja cercada. . Essas áreas aproximadas são ilustradas na Figura 4.6.2.
5. A distribuição normal é completamente determinada pelos parâmetros m e s. Em outras

palavras, uma distribuição normal diferente é especificada para cada valor diferente de m e s.
Diferentes valores de m deslocam o gráfico da distribuição ao longo do eixo x, conforme
mostrado na Figura 4.6.3. Diferentes valores de s determinam o grau de nivelamento ou pico
do gráfico da distribuição, conforme mostrado na Figura 4.6.4. Devido às características
desses dois parâmetros, m é frequentemente referido como um parâmetro de localização e s
é frequentemente referido como um parâmetro de forma.
ÿ1 ÿ2 ÿ3 x
ÿ1 < ÿ2 < ÿ3
FIGURA 4.6.3 Três distribuições normais com médias diferentes, mas a mesma quantidade de
variabilidade.
ÿ1
ÿ2
ÿ3
ÿ1 < ÿ2 < ÿ3 x
FIGURA 4.6.4 Três distribuições normais com diferentes desvios padrão, mas o
mesma média.
A distribuição normal padrão A última característica mencionada da distribuição normal implica

que a distribuição normal é realmente uma família de distribuições em que um membro é
diferenciado de outro com base nos valores de m e s. O membro mais importante desta família é
a distribuição normal padrão ou distribuição normal unitária, como às vezes é chamada, porque
tem uma média de 0 e um desvio padrão de 1. Ela pode ser obtida da Equação 4.6.1 criando uma
distribuição aleatória variável.
z ¼ ð Þ xm =s (4.6.2)
A equação para a distribuição normal padrão é escrita
1
f zð Þ¼ ffiffiffiffiff ez2=2 ; 1<z<1 (4.6.3)
2p p
O gráfico da distribuição normal padrão é mostrado na Figura 4.6.5.

A transformação z será útil nos exemplos e aplicações a seguir. Este valor de z denota,
para um valor de uma variável aleatória, o número de desvios padrão que o valor cai acima de
ðþzÞ ou abaixo de ðzÞ a média, que neste caso é 0. Por exemplo, uma transformação z que
produz um valor de z ¼ 1 indica que o valor de x usado na transformação é 1 desvio padrão acima
de 0. Um valor de z ¼ 1 indica que o valor de x usado na transformação é 1 desvio padrão abaixo
de 0. Esta propriedade é ilustrada nos exemplos de Seção 4.7.
ÿ=1
µ=0 z
FIGURA 4.6.5 A distribuição normal padrão.
0 z z
0
FIGURA 4.6.6 Área dada pela Tabela D do Apêndice.
Para encontrar a probabilidade de que z assuma um valor entre quaisquer dois pontos no
eixo z, digamos, z0 e z1, devemos encontrar a área delimitada por perpendiculares erguidas
nesses pontos, a curva e o eixo horizontal. Como mencionamos anteriormente, as áreas sob a
curva de uma distribuição contínua são encontradas integrando a função entre dois valores da
variável. No caso da normal padrão, então, para encontrar a área entre z0 e z1 diretamente,
precisaríamos calcular a seguinte integral:
z1 1
ffiffiffiffiff
ez2=2 dz
Zz0 2 p p
Embora não exista uma solução de forma fechada para a integral, podemos usar métodos
numéricos de cálculo para aproximar as áreas desejadas abaixo da curva com a precisão
desejada. Felizmente, não temos que nos preocupar com tais assuntos, pois existem tabelas
disponíveis que fornecem os resultados de qualquer integração que nos interesse. A Tabela D
no Apêndice é um exemplo dessas tabelas. No corpo da Tabela D encontram-se as áreas sob a
curva entre 1 e os valores de z mostrados na coluna mais à esquerda da tabela. A área
sombreada da Figura 4.6.6 representa a área listada na tabela entre 1 e z0, onde z0 é o valor
especificado de z.
Agora ilustramos o uso da Tabela D com vários exemplos.
EXEMPLO 4.6.1
Dada a distribuição normal padrão, encontre a área sob a curva, acima do eixo z entre z ¼ 1 e z
¼ 2.
0 2 z
FIGURA 4.6.7 A distribuição normal padrão mostrando a área

entre z ¼ 1 e z ¼ 2.
Solução: Será útil fazer um desenho da distribuição normal padrão e sombrear a área desejada, como na
Figura 4.6.7. Se localizarmos z ¼ 2 na Tabela D e lermos a entrada correspondente no corpo
da tabela, descobriremos que a área desejada é 0,9772. Podemos interpretar esta área de
várias maneiras. Podemos interpretá-lo como a probabilidade de que az escolhido
aleatoriamente da população de z's terá um valor entre 1 e 2. Também podemos interpretá-lo
como a frequência relativa de ocorrência (ou proporção) de valores de z entre 1 e 2, ou
podemos dizer que 97,72 por cento dos z's têm um valor entre 1 e 2.
&
EXEMPLO 4.6.2
Qual é a probabilidade de que az escolhido aleatoriamente da população de z's tenha um valor entre 2:55 e
þ2:55?
Solução: A Figura 4.6.8 mostra a área desejada. A Tabela D nos dá a área entre 1 e 2,55, que é encontrada
localizando-se 2,5 na coluna mais à esquerda da tabela e, em seguida, movendo-se até
chegarmos à entrada na coluna encabeçada por 0,05. Descobrimos que esta área é 0,9946.
Se olharmos para a imagem que desenhamos, veremos que esta é mais área do que o
desejado. Precisamos subtrair de 0,9946 a área à esquerda de 2:55. A referência à Tabela D
mostra que a área à esquerda da
2:55 é 0,0054. Assim, a probabilidade desejada é
Pð 2:55 < z < 2:55 ¼ :9946

º :0054 ¼ :9892
_2,55 0 2,55 x
FIGURA 4.6.8 Curva normal padrão mostrando Pð Þ

2:55 < z < 2:55 . &
_2,74 0 1.53 z
FIGURA 4.6.9 Curva normal padrão mostrando a proporção de

valores z entre z ¼ 2:74 e z ¼ 1:53.
Suponha que nos pediram para encontrar a probabilidade de z estar entre 2:55 e 2,55 inclusive. A
probabilidade desejada é expressa como Pð Þ 2:55 z 2:55 . Visto
2:55que,
z 2:55
como
¼ Pð
notamos
2:55
zð Þ¼
< zna¼
< Seção
2:55
z0 0 ¼
; Pð
4.5,
:9892.
ÞP
º
EXEMPLO 4.6.3
Que proporção de valores z está entre 2:74 e 1,53?
Solução: A Figura 4.6.9 mostra a área desejada. Encontramos na Tabela D que a área
entre 1 e 1,53 é 0,9370, e a área entre 1 e 2:74 é 0,0031. Para
obter a probabilidade desejada, subtraímos 0,0031 de 0,9370. Isso é,
Pð 2:74 z 1:53 ¼ :9370º :0031 ¼ :9339 &
EXEMPLO 4.6.4
Dada a distribuição normal padrão, encontre P zð Þ 2:71.
Solução: A área desejada é mostrada na Figura 4.6.10. Obtemos a área à direita de z

¼ 2:71 subtraindo a área entre 1 e 2,71 de 1. Assim,
P zð Þ¼ 2:71 1 P zð Þ 2:71
¼ 1:9966
¼ :0034
0 2.71 z
FIGURA 4.6.10 Distribuição normal padrão mostrando P zð

Þ 2:71 .
&
EXEMPLO 4.6.5
Dada a distribuição normal padrão, encontre Pð Þ :84 z 2:45 .
Solução: A área que procuramos é mostrada na Figura 4.6.11. Primeiro obtemos a

área entre 1 e 2,45 e disso subtraímos a área entre 1 e 0,84.
Em outras palavras,
PðÞ
P zð
:84 z 2:45 ¼ Þ 2:45 P zð Þ :84
¼ :9929 :7995
¼:1934
0 .84 2.45 z
FIGURA 4.6.11 Curva normal padrão mostrando

Pð:84 z 2:45 . º
&
EXERCÍCIOS
Dada a distribuição normal padrão, encontre:

4.6.1 A área sob a curva entre z ¼ 0 e z ¼ 1:43
4.6.2 A probabilidade de az escolhido aleatoriamente terá um valor entre z ¼ 2:87 ez ¼ 2:64
4.6.3 P zð Þ :55 4.6.4 P zð Þ :55 4.6.6
4.6.5 P zð Þ < 2:33 P zð Þ < 2:33
4.6.7 Pð 1:96 z 1:96 Þ Þ 4.6.8 Pð 2:58 z 2:58 Þ
4.6.9 Pð 1:65 z 1:65 4.6.10 P zð Þ ¼ :74
Dadas as seguintes probabilidades, encontre z1:
4.6.11 P zð Þ¼ z1 :0055 4.6.12 Pð 2:67 z z1 ¼ :9718

º
4.6.13 P zð Þ¼ > z1 :0384 4.6.14 P zð 1 z 2:98 ¼ :1117º
4.6.15 Pð Þ z1 z z1 ¼ :8132
4.7 APLICAÇÕES DE DISTRIBUIÇÃO NORMAL
Embora sua importância no campo da estatística seja indiscutível, deve-se perceber que a distribuição
normal não é uma lei que seja cumprida por todas as características mensuráveis que ocorrem na
natureza. É verdade, no entanto, que muitas dessas características são aproximadamente
4.7 APLICAÇÕES DE DISTRIBUIÇÃO NORMAL 123
distribuído normalmente. Conseqüentemente, embora nenhuma variável encontrada na prática seja

precisamente distribuída normalmente, a distribuição normal pode ser usada para modelar a
distribuição de muitas variáveis que são de interesse. Usar a distribuição normal como um modelo
nos permite fazer declarações de probabilidade úteis sobre algumas variáveis muito mais
convenientemente do que seria o caso se algum modelo mais complicado tivesse que ser usado.
A estatura humana e a inteligência humana são frequentemente citadas como exemplos de
variáveis com distribuição aproximadamente normal. Por outro lado, muitas distribuições relevantes
para a área da saúde não podem ser descritas adequadamente por uma distribuição normal. Sempre
que se sabe que uma variável aleatória é aproximadamente normalmente distribuída, ou quando, na
ausência de conhecimento completo, é considerado razoável fazer essa suposição, o estatístico é
tremendamente auxiliado em seus esforços para resolver problemas práticos relativos a essa
variável. . Tenha em mente, no entanto, que “normal” neste contexto refere-se às propriedades
estatísticas de um conjunto de dados e de forma alguma conota normalidade no sentido de saúde ou
condição médica.
Existem várias outras razões pelas quais a distribuição normal é tão importante em estatística,
e elas serão consideradas oportunamente. Por ora, vejamos como podemos responder a questões
simples de probabilidade sobre variáveis aleatórias quando sabemos, ou estamos dispostos a
assumir, que elas são, pelo menos, aproximadamente normalmente distribuídas.
EXEMPLO 4.7.1
O Uptimer é um monitor de atividade leve e personalizado, operado por bateria, que registra a
quantidade de tempo que um indivíduo passa na posição vertical. Em um estudo com crianças de 8 a
15 anos, Eldridge et al. (A-10) estudou 529 crianças com desenvolvimento normal, cada uma usando
o Uptimer continuamente por um período de 24 horas que incluiu um dia escolar típico. Os
pesquisadores descobriram que a quantidade de tempo que as crianças passaram na posição vertical
seguiu uma distribuição normal com média de 5,4 horas e desvio padrão de 1,3 horas. Suponha que
essa descoberta se aplique a todas as crianças de 8 a 15 anos de idade. Encontre a probabilidade de
que uma criança selecionada aleatoriamente passe menos de 3 horas na posição vertical em um período de 24 h
Solução: Primeiro vamos desenhar a distribuição e sombrear a área correspondente

à probabilidade de interesse. Isso foi feito na Figura 4.7.1.
ÿ = 1,3
x
3.0 µ = 5,4
FIGURA 4.7.1 Distribuição normal para distribuição

aproximada da quantidade de tempo que as crianças
passaram na posição ereta (média e desvio padrão estimados).
ÿ = 1,3
x
3.0 5.4
ÿ=1
z
_1,85 0
FIGURA 4.7.2 Distribuição normal do tempo gasto na posição

vertical (x) e a distribuição normal padrão (z).
Se nossa distribuição fosse a distribuição normal padrão com média 0 e

desvio padrão 1, poderíamos usar a Tabela D e encontrar a probabilidade com
pouco esforço. Felizmente, é possível que qualquer distribuição normal seja
facilmente transformada em normal padrão.
O que fazemos é transformar todos os valores de X em valores correspondentes
de z. Isso significa que a média de X deve se tornar 0, a média de z. Na Figura
4.7.2 ambas as distribuições são mostradas. Devemos determinar qual valor de
z, digamos, z0, corresponde a um x de 3,0. Isso é feito usando a fórmula
ð Þ xm
4.6.2,
z =s,
¼
que transforma qualquer valor de x em qualquer distribuição normal no valor
correspondente de z na distribuição normal padrão. Para o presente exemplo
temos
3:0 5:4 ¼
z¼ 1:85
1:3
O valor de z0 que buscamos, então, é 1:85. &
Examinemos essas relações mais de perto. Vê-se que a distância da média, 5,4, ao valor x
de interesse, 3,0, é 3:0 5:4 ¼ 2:4, que é uma distância de 1,85 desvios padrão. Quando
transformamos valores x em valores z, a distância do valor z de interesse de sua média, 0, é
igual à distância do valor x correspondente de sua média, 5,4, em unidades de desvio padrão.
Vimos que esta última distância é de 1,85 desvios padrão. Na distribuição z um desvio padrão
é igual a 1, e conseqüentemente o ponto na escala z localizado a uma distância de 1,85
desvios padrão abaixo de 0 é z ¼ 1:85, resultado obtido pelo emprego da fórmula. por
consultoria
4.7 APLICAÇÕES DE DISTRIBUIÇÃO NORMAL 125
Tabela D, descobrimos que a área à esquerda de z ¼ 1:85 é 0,0322. Podemos resumir essa discussão da
seguinte forma:
3:0 5:4
P xð Þ¼ < 3:0 P z < ¼ P zð Þ¼ < 1:85 :0322
1:3
Para responder à pergunta original, dizemos que a probabilidade é de 0,0322 de que uma criança
selecionada aleatoriamente tenha um tempo de atividade inferior a 3,0 horas.
EXEMPLO 4.7.2
Diskin et ai. (A-11) estudou metabólitos respiratórios comuns, como amônia, acetona, isopreno, etanol e
acetaldeído em cinco indivíduos durante um período de 30 dias. Todos os dias, amostras de respiração
eram coletadas e analisadas no início da manhã, na chegada ao laboratório.
Para o indivíduo A, uma mulher de 27 anos, a concentração de amônia em partes por bilhão (ppb) seguiu
uma distribuição normal ao longo de 30 dias com média 491 e desvio padrão 119.
Qual é a probabilidade de que, em um dia aleatório, a concentração de amônia do indivíduo esteja entre
292 e 649 ppb?
Solução: Na Figura 4.7.3 são mostradas a distribuição das concentrações de amônia e a distribuição z para
a qual transformamos os valores originais para determinar as probabilidades desejadas.
Encontramos o valor z correspondente a um x de 292 por
292 491 ¼
z¼ 1:67
119
ÿ = 119
292 491 649 x
ÿ=1
_1,67 0 1.33 z
FIGURA 4.7.3 Distribuição da concentração de amônia (x) e

a correspondente distribuição normal padrão (z).
Da mesma forma, para x ¼ 649 temos
649 491 ¼
z¼ 1:33
119
Na Tabela D, descobrimos que a área entre 1 e 1:67 é 0,0475 e a área entre 1 e

1,33 é 0,9082. A área desejada é a diferença entre elas, :9082 :0475 ¼ :8607.
Para resumir,
292 491 649 491

PðÞ 292 x 649 ¼ P z
119 119
¼ Pð 1:67 z 1:33 Þ
¼ Pð Þ 1 z 1:33 Pð 1z 1:67Þ
¼ :9082 :0475
¼ :8607
A probabilidade pedida em nossa pergunta original, então, é 0,8607. &
EXEMPLO 4.7.3
Em uma população de 10.000 crianças descritas no Exemplo 4.7.1, quantas você esperaria que
ficassem de pé por mais de 8,5 horas?
Solução: primeiro encontramos a probabilidade de que uma criança selecionada aleatoriamente

a população ficaria em pé por mais de 8,5 horas. Isso é,
8:5 5:4
P xð Þ¼ 8:5 P z ¼ P zð Þ¼ 2:38 1:9913 ¼:0087
1:3
De 10.000 pessoas, esperaríamos 10; 000ð Þ¼ :0087 87 para passar mais de

8,5 horas em pé. &
Podemos usar o MINITAB para calcular probabilidades normais padrão cumulativas. Suponha
que desejamos encontrar as probabilidades cumulativas para os seguintes valores de z : 3; 2;
1; 0; 1; 2; e 3. Entramos com os valores de z na Coluna 1 e procedemos como mostrado na
Figura 4.7.4.
As duas seções anteriores se concentraram extensivamente na distribuição normal, a
distribuição de probabilidade contínua mais importante e usada com mais frequência. Embora
muito do que será abordado nos próximos capítulos use essa distribuição, ela não é a única
distribuição de probabilidade contínua importante. Apresentaremos várias outras distribuições
contínuas mais adiante no texto, a saber, a distribuição t, a distribuição qui-quadrado e a
distribuição F. Os detalhes dessas distribuições serão discutidos nos capítulos em que
precisamos deles para testes inferenciais.
EXERCÍCIOS 127
Dados:
C1: -3 -2 -1 0 1 2 3
:xob golaiD nammoc noisseS :d
Distribuições de probabilidade de cálculo normais MTB > CDF C1; SUBC>

Normal 0 1.
Escolha Probabilidade cumulativa. Escolha a coluna de
entrada e digite C1. Clique em OK.
Saída:
Função de distribuição cumulativa
Normal com média 1,00000 0 e padrão

desvio
x P(X < x)
3,0000 0,0013
2,0000 0,0228
1,0000 0,1587
0,0000 0,5000
1,0000 0,8413
2,0000 0,9772
3,0000 0,9987
FIGURA 4.7.4 Cálculo do MINITAB de probabilidades normais padrão cumulativas.
EXERCÍCIOS
4.7.1 Para outro sujeito (um homem de 29 anos) no estudo de Diskin et al. (A-11), os níveis de acetona apresentaram
distribuição normal com média de 870 e desvio padrão de 211 ppb. Encontre a probabilidade de que em um
determinado dia o nível de acetona do sujeito esteja: (a) Entre 600 e 1.000 ppb (b) Acima de 900 ppb (c)
Abaixo de 500 ppb (d) Entre 900 e 1.100 ppb
4.7.2 No estudo das impressões digitais, uma característica quantitativa importante é a contagem total de cristas para
os 10 dedos de um indivíduo. Suponha que as contagens totais de indivíduos em uma certa população sejam
aproximadamente normalmente distribuídas com uma média de 140 e um desvio padrão de 50. Encontre a
probabilidade de que um indivíduo escolhido aleatoriamente dessa população tenha uma contagem de cristas
de: (a) 200 ou mais (b) Menos de 100
(c) Entre 100 e 200

(d) Entre 200 e 250
(e) Em uma população de 10.000 pessoas, quantas você esperaria ter uma contagem de cristas de 200 ou
mais?
4.7.3 Uma das variáveis coletadas nos dados do Registro de Nascimento da Carolina do Norte (A-3) são os quilos
ganhos durante a gravidez. De acordo com dados de todo o registro de 2001, o número de quilos ganhos
durante a gravidez foi aproximadamente distribuído normalmente com média de 30,23 quilos e desvio
padrão de 13,84 quilos. Calcule a probabilidade de uma mãe selecionada aleatoriamente na Carolina do
Norte em 2001 ganhar:
(a) Menos de 15 libras durante a gravidez (c) (b) Mais de 40 libras (d)
Entre 14 e 40 libras (e) Entre 10 e 20 libras Menos de 10 libras
4.7.4 Suponha que o tempo médio de permanência em um hospital de doenças crônicas de um determinado tipo de paciente
seja de 60 dias com um desvio padrão de 15. Se for razoável supor uma distribuição aproximadamente normal dos
tempos de permanência, encontre a probabilidade de que um paciente selecionado deste grupo terá um tempo de permanência:
(a) Mais de 50 dias (c) (b) Menos de 30 dias

Entre 30 e 60 dias (d) Mais de 90 dias
4.7.5 Se os valores de colesterol total para uma certa população são aproximadamente normalmente distribuídos
com uma média de 200 mg = 100 ml e um desvio padrão de 20 mg = 100 ml, encontre a probabilidade de
que um indivíduo escolhido aleatoriamente dessa população tenha um valor de colesterol:
(a) Entre 180 e 200 mg=100 ml (c) (b) Superior a 225 mg=100 ml (d)
Menos de 150 mg=100 ml Entre 190 e 210 mg=100 ml
4.7.6 Dada uma população normalmente distribuída com média de 75 e variância de 625, encontre:
(a) Pð Þxð50
Þ x< 100
60 (e)
(c) P (b) P xð Þ > 90
Pð Þ 30 x 110 (d) P xð Þ 85
4.7.7 Os pesos de uma certa população de mulheres adultas jovens são aproximadamente distribuídos normalmente
com uma média de 132 libras e um desvio padrão de 15. Encontre a probabilidade de que um sujeito
selecionado aleatoriamente dessa população pesará:
(a) Mais de 155 libras (c) (b) 100 libras ou menos

Entre 105 e 145 libras
4.8 RESUMO
Neste capítulo, os conceitos de probabilidade descritos no capítulo anterior são desenvolvidos. Os conceitos de variáveis
aleatórias discretas e contínuas e suas distribuições de probabilidade são discutidos. Em particular, duas distribuições de
probabilidade discretas, a binomial e a de Poisson, e uma distribuição de probabilidade contínua, a normal, são examinadas em
detalhes consideráveis. Vimos como essas distribuições teóricas nos permitem fazer afirmações probabilísticas sobre certas
variáveis aleatórias que interessam ao profissional de saúde.
Fórmula
4.2.1 Média de uma distribuição m ¼ PxpðxÞ

de frequência
4.2.2 2
Variância de uma distribuição s2 ¼ Pðx mÞ pðxÞ
de frequência ou
s2 ¼ Px2p xð Þ m2
4.3.1 Combinação de objetos n!
nCx ¼ x!ðn 1Þ!
4.3.2 Função de distribuição binomial fðxÞ ¼ n Cxpxqnx; x ¼ 0; 1; 2; ...
4.3.3–4.3.5 Igualdades de probabilidade PðX ¼ xjn; p :50Þ ¼ PðX ¼ n xjn; 1 pÞ

binomial tabeladas
PðX xjn; p > :50Þ ¼ PðX n xjn; 1 pÞ
PðX xjn; p > :50Þ ¼ PðX n xjn; 1 pÞ
4.4.1 Função de distribuição de Poisson ellx

fðxÞ ¼ x ¼ 0; 1; 2;
; ... x!
4.6.1 Função de distribuição normal 1<x<1

1 2
eðxmÞ =2s2
fðxÞ ¼ fffiffiffiffiffiffiff
; 1<m<1s>0
2ps p
4.6.2 transformação z Xm
z¼
s
4.6.3 Função de distribuição normal 1

fðzÞ ¼ ffiffiffiffiff
ez2=2 ; 1<z<1
padrão 2p p
Tecla de símbolo nCx ¼ uma combinação de n eventos tomados x de cada vez

e ¼ constante de Euler ¼ 2:71828 ...
fðxÞ ¼ função de xl ¼ o
parâmetro da distribuição de Poisson n ¼ tamanho da
amostra ou o número total de vezes que um processo ocorre p ¼ probabilidade
binomial de “sucesso” pðxÞ ¼ probabilidade discreta da variável aleatória X
q ¼ 1 p ¼ probabilidade binomial de “falha” p ¼ pi ¼ constante ¼ 3:14159 ...
s ¼ desvio padrão populacional s2 ¼ variância populacional m ¼ média
populacional x ¼ uma quantidade de valor individual de XX ¼ variável
aleatória
z ¼ transformação normal padrão

1. O que é uma variável aleatória discreta? Dê três exemplos que são de interesse para a saúde
profissional.
2. O que é uma variável aleatória contínua? Dê três exemplos de interesse do profissional de saúde.
3. Defina a distribuição de probabilidade de uma variável aleatória discreta.
4. Defina a distribuição de probabilidade de uma variável aleatória contínua.
5. O que é uma distribuição de probabilidade cumulativa?
6. O que é um ensaio de Bernoulli?
7. Descreva a distribuição binomial.
8. Dê um exemplo de uma variável aleatória que você acha que segue uma distribuição binomial.
9. Descreva a distribuição de Poisson.
10. Dê um exemplo de uma variável aleatória que você acha que é distribuída de acordo com a lei de Poisson.
11. Descreva a distribuição normal.
12. Descreva a distribuição normal padrão e diga como ela é usada em estatística.
13. Dê um exemplo de uma variável aleatória que você acha que é, pelo menos aproximadamente, normalmente distribuída.
14. Usando os dados de sua resposta à Questão 13, demonstre o uso da distribuição normal padrão
em responder a questões de probabilidade relacionadas à variável selecionada.
15. Kanjanarat et al. (A-12) estimam que a taxa de eventos adversos a medicamentos (ADEs) evitáveis em hospitais seja de 35,2
por cento. EAMs evitáveis geralmente resultam de cuidados inadequados ou erros de medicação, que incluem erros de
comissão e erros de omissão. Suponha que 10 pacientes hospitalares com EAM sejam escolhidos aleatoriamente. Seja p
= 35 e calcule a probabilidade de que: (a) Exatamente sete desses eventos relacionados a drogas fossem evitáveis (b)
Mais da metade desses eventos relacionados a drogas fossem evitáveis (c) Nenhum desses eventos relacionados a
drogas fosse evitável (d) Entre três e seis inclusive eram evitáveis
16. Em uma pesquisa realizada pelo Pew Research Center em 2003 (A-13), uma amostra nacional de adultos respondeu à
seguinte pergunta: “Em suma, você é totalmente a favor, a favor, se opõe ou se opõe fortemente a . . tornando legal para .
os médicos dar aos pacientes terminais os meios para acabar com suas vidas?” Os resultados mostraram que 43% dos
participantes da amostra responderam “fortemente a favor” ou “a favor” a esta pergunta.
Se 12 sujeitos representados por esta amostra forem escolhidos aleatoriamente, calcule a probabilidade de que: (a)
Exatamente dois dos entrevistados respondam “favorece fortemente” ou “favorece” (b) Não mais do que dois dos
respondentes respondem “favorece fortemente” ou “favor” (c) Entre cinco e nove inclusive responda “favorece
fortemente” ou “favorece”
17. Em um estudo de Thomas et al. (A-14) a distribuição de Poisson foi usada para modelar o número de pacientes por mês
encaminhados a um oncologista. Os pesquisadores usam uma taxa de 15,8 pacientes por mês que são encaminhados ao
oncologista. Use a Tabela C no Apêndice e uma taxa de 16 pacientes por mês para calcular a probabilidade de que em um
mês: (a) Exatamente 10 pacientes sejam encaminhados a um oncologista (b) Entre cinco e 15 inclusive sejam encaminhados
a um oncologista (c) Mais de 10 são encaminhados para um oncologista
(d) Menos de oito são encaminhados para um oncologista (e)
Menos de 12, mas mais de oito são encaminhados para um oncologista
18. Em média, dois alunos por hora se apresentam para tratamento no pronto-socorro de uma grande escola primária
escola.
(a) Qual é a probabilidade de que, durante uma determinada hora, três alunos venham ao pronto-socorro para
tratamento?
(b) Qual é a probabilidade de que, durante uma determinada hora, dois ou menos alunos se apresentem na sala de primeiros
socorros? (c) Qual é a probabilidade de que, durante uma determinada hora, entre três e cinco alunos, inclusive, se apresentem no
pronto-socorro?
19. Uma pesquisa da Harris Interactive realizada no outono de 2002 (A-15) por meio de uma pesquisa telefônica nacional com adultos
perguntou: “Você acha que os adultos devem ter permissão para usar maconha legalmente para fins médicos se o médico
prescrever, ou você acha que a maconha deve permanecer ilegal mesmo para fins médicos?”
Os resultados mostraram que 80% dos entrevistados responderam “sim” à pergunta acima. Supondo que 80% dos americanos
diriam “sim” à pergunta acima, encontre a probabilidade, quando oito americanos são escolhidos aleatoriamente, de que:
(a) Seis ou menos disseram “Sim” (c) (b) Sete ou mais disseram “Sim” (d)
Todos os oito disseram “Sim” (e) Menos de quatro disseram “Sim”
Entre quatro e sete, inclusive, disseram “Sim”
20. Em um estudo sobre a relação entre a vacinação contra o sarampo e a síndrome de Guillain-Barre (SGB), Silveira et al. (A-16) usou um
modelo de Poisson no exame da ocorrência de GBS durante os períodos de latência após as vacinações. Eles conduziram seu
estudo na Argentina, Brasil, Chile e Colômbia.
Eles descobriram que, durante o período latente, a taxa de GBS foi de 1,28 casos por dia. Usando essa estimativa arredondada
para 1,3, encontre a probabilidade em um determinado dia de:
(a) Nenhum caso de GBS (b) Pelo menos um caso de GBS

(c) Menos de cinco casos de GBS
21. Os QIs de indivíduos admitidos em uma escola estadual para deficientes mentais são aproximadamente distribuídos normalmente com
uma média de 60 e um desvio padrão de 10. (a) Encontre a proporção de indivíduos com QIs acima de 75. (b) O que é a
probabilidade de um indivíduo escolhido ao acaso ter um QI entre 55 e 75? (c) Encontre Pð Þ 50 X 70 :
22. Um supervisor de enfermagem descobriu que os enfermeiros da equipe completam, em média, uma determinada tarefa em 10 minutos.
Se os tempos necessários para completar a tarefa são aproximadamente normalmente distribuídos com um desvio padrão de 3
minutos, encontre:
(a) A proporção de enfermeiras que completam a tarefa em menos de 4 minutos (b) A proporção
de enfermeiras que requerem mais de 5 minutos para completar a tarefa (c) A probabilidade de que uma
enfermeira que acabou de receber a tarefa a complete dentro de 3 minutos
23. As pontuações feitas em um determinado teste de aptidão por estudantes de enfermagem são aproximadamente distribuídas
normalmente com uma média de 500 e uma variação de 10.000.
(a) Qual a proporção daqueles que tiram notas abaixo de 200? (b) Uma pessoa está
prestes a fazer o teste. Qual é a probabilidade de que ele ou ela faça uma pontuação de
650 ou mais?
(c) Que proporção de pontuações está entre 350 e 675?
24. Dada uma variável binomial com média de 20 e variância de 16, encontre n e p.
25. Suponha que uma variável X seja normalmente distribuída com um desvio padrão de 10. Dado que 0,0985 dos valores
de X são maiores que 70, qual é o valor médio de X?
26. Dada a variável aleatória normalmente distribuída X, encontre o valor numérico de k tal que
Pð Þ m ks X m þ ks ¼ :754.
27. Dada a variável aleatória normalmente distribuída X com média 100 e desvio padrão 15, encontre o
valor numérico de k tal que:
(a) P Xð Þ¼ k :0094 (b) P

Xð Þ¼ k :1093 (c) Pð
100 X k ¼ :4778 (d) P k0
ð Þ Þ¼ X k :9660, onde k0 ek são equidistantes de m
28. Dada a variável aleatória normalmente distribuída X com s ¼ 10 e P Xð Þ¼ 40 :0080, encontre m.
31. Dada a variável aleatória normalmente distribuída X com m ¼ 25 e P Xð Þ¼ 10 :0778, encontre s.
32. Dada a variável aleatória normalmente distribuída X com m ¼ 30 e P Xð Þ¼ 50 :9772, encontre s.
33. Explique por que cada uma das seguintes medições é ou não o resultado de um teste de Bernoulli: (a) O sexo
de um recém-nascido (b) A classificação da condição de um paciente hospitalar como estável, crítico,
regular, bom ou ruim (c) O peso em gramas de um recém-nascido
34. Explique por que cada uma das medições a seguir é ou não o resultado de um teste de Bernoulli: (a) O número
de procedimentos cirúrgicos realizados em um hospital em uma semana (b) A temperatura de um paciente
do hospital em graus Celsius (c) Um hospital sinais vitais do paciente registrados como normais ou não
normais
35. Explique por que cada uma das seguintes distribuições é ou não uma distribuição de probabilidade:
(uma) (b)
x P XðÞ ¼ x x P XðÞ ¼ x
0 0,15 0 0,15
1 0,25 1 0,20
2 0,10 2 0,30
3 0,25 3 0,10
4 0,30
(c) (d)
x P XðÞ ¼ x x P XðÞ ¼ x
0 0,15 0,15
1 0:20 1 0,30
2 0,30 01 0,20
3 0,20 2 0,15
4 0,15 0,10
34 0,10
REFERÊNCIAS 133
REFERÊNCIAS
1. FRANK A. HAIGHT, Handbook of the Poisson Distribution, Wiley, Nova York, 1967.
A-1. DAVID H. HOLBEN, MEGAN C. MCCLINCY e JOHN P. HOLCOMB, “Status de Segurança Alimentar de Famílias em Appalachian Ohio
com Crianças em Head Start,” Journal of American Dietetic Association, 104 (2004), 238–241.
A-2. CHAD L. CROSS, BO BERNHARD, ANNE ROTHWEILER, MELANIE MULLIN e ANNABELLE JANAIRO, “Pesquisa e
Avaliação do Problema de Jogo: Relatório Anual de Nevada, abril de 2006–abril de 2007,” Relatório Final de Doação para
a Divisão de Saúde e Serviços Humanos de Nevada.
A-3. Centro Estadual de Estatísticas de Saúde da Carolina do Norte e Instituto Howard W. Odum de Pesquisa em Ciências Sociais da
Universidade da Carolina do Norte em Chapel Hill. Dados de nascimento definidos para 2001 encontrados em www.irss.unc.edu/ncvital/
bfd1down.html . Todos os cálculos foram realizados por John Holcomb e não representam as conclusões do Centro ou Instituto.
A-4. Pesquisa da Universidade de Massachusetts, realizada de 29 de maio a 2 de junho de 2003. Dados fornecidos pela Massachusetts Health
Referências. http://www.healthbenchmarks.org/Poll/June2003Survey.cfm.
A-5. Centro Nacional de Estatísticas de Saúde (2001) Documentação de Arquivo de Dados, Pesquisa de Entrevistas de Saúde Nacional, CD
Série 10, No. 16A, Centro Nacional de Estatísticas de Saúde, Hyattsville, Maryland. Todos os cálculos são de responsabilidade de
John Holcomb e não refletem os esforços do NCHS.
A-6. STEVEN S. COUGHLIN, ROBERT J. UHLER, THOMAS RICHARDS e KATHERINE M. WILSON, “Práticas de triagem de
câncer de mama e colo do útero entre mulheres hispânicas e não hispânicas que residem perto da fronteira entre os
Estados Unidos e o México, 1999–2000,” Family Community Health , 26 (2003), 130–139.
A-7. JH LAAKE e JA RøTTINGEN, "Rocurônio e anafilaxia - um desafio estatístico", Acta Anasthesio logica Scandinavica, 45 (2001), 1196–
1203.
A-8. ARUN D. SINGH, MAHNAZ NOURI, CAROL L. SHIELDS, JERRY A. SHIELDS e ANDREW F. SMITH, “Retinal Capillary
Hemangioma,” Ophthalmology, 10 (2001), 1907–1911.
A-9. PASCALE TUBERT-BITTER, BERNARD BEGAUD, YOLA MORIDE, ANICET CHASLERIE e FRANCOISE HARAMBURU,
“Comparando a Toxicidade de Duas Drogas na Estrutura de Relato Espontâneo: Uma Abordagem de Intervalo de
Confiança,” Journal of Clinical Epidemiology, 49 (1996), 121– 123.
A-10. B. ELDRIDGE, M. GALEA, A. MCCOY, R. WOLFE, H. e K. GRAHAM, “Uptime Normative Values in Children Aged 8 to 15 Years,”
Developmental Medicine and Child Neurology, 45 (2003), 189– 193.
A-11. ANN M. DISKIN, PATRIK S9PANEL e DAVID SMITH, “Variação de Tempo de Amônia, Acetona, Isopreno e Etanol na
Respiração: Um estudo Quantitativo SIFT-MS durante 30 dias,” Medição Fisiológica, 24 (2003), 107–119.
A-12. PENKARN KANJANARAT, ALMUT G. WINTERSTEIN, THOMAS E. JOHNS, RANDY C. HATTON, RICARDO GONZALEZ-
ROTHI e RICHARD SEGAL, “Nature of Preventable Adverse Drug Events in Hospitals: A Literature Review,” American
Journal of Health-System Pharmacy, 60 (2003), 1750-1759.
A-13. Pesquisa do Pew Research Center realizada pela Princeton Survey Research Associates, de 24 de junho a 8 de julho de 2003. Dados
fornecidos pelo Roper Center for Public Opinion Research. www.kaisernetwork.org/health_poll/hpoll_index. cfm.
A-14. SJ THOMAS, MV WILLIAMS, NG BURNET e CR BAKER, “Quanta capacidade excedente é necessária para
Keep Low Waiting Times?”, Clinical Oncology, 13 (2001), 24–28.
A-15. Time, pesquisa da Cable News Network realizada pela Harris Associates, 22–23 de outubro de 2002. Dados fornecidos pela
Centro Roper para Pesquisa de Opinião Pública. www.kaisernetwork.org/health_poll/hpoll_index.cfm.
A-16. CLAUDIO M. DA SILVEIRA, DAVID M. SALISBURY e CIRO A DE QUADROS, “Saramles Vaccination and Guillain-Barre
Syndrome,” The Lancet, 349 (1997), 14–16.
CAPÍTULO 5
ALGUMAS AMOSTRAS IMPORTANTES

DISTRIBUIÇÕES
Este capítulo une os fundamentos da estatística aplicada: medidas descritivas,

probabilidade básica e procedimentos inferenciais. Este capítulo também inclui uma
discussão de um dos teoremas mais importantes da estatística, o teorema do limite
central. Os alunos podem achar útil revisitar este capítulo de vez em quando enquanto
estudam os capítulos restantes do livro.
TÓPICOS
5.1 INTRODUÇÃO
5.2 DISTRIBUIÇÕES DE AMOSTRAGEM
5.3 DISTRIBUIÇÃO DA MÉDIA DA AMOSTRA
5.4 DISTRIBUIÇÃO DA DIFERENÇA ENTRE DUAS MÉDIAS DE AMOSTRAS
5.5 DISTRIBUIÇÃO DA PROPORÇÃO DA AMOSTRA
5.6 DISTRIBUIÇÃO DA DIFERENÇA ENTRE DUAS PROPORÇÕES DE AMOSTRAS
5.7 RESUMO
Depois de estudar este capítulo, o aluno será capaz de 1.

construir uma distribuição amostral de uma estatística. 2. entender como usar
uma distribuição amostral para calcular probabilidades básicas. 3. compreender o teorema do limite central e
quando aplicá-lo. 4. entender os conceitos básicos de amostragem com reposição e sem
substituição.
5.1 INTRODUÇÃO
Antes de examinarmos o assunto deste capítulo, vamos revisar os pontos altos do que
cobrimos até agora. O Capítulo 1 apresenta algumas estatísticas básicas e úteis
134
5.2 DISTRIBUIÇÕES DE AMOSTRAGEM 135
vocabulário e discute os conceitos básicos de coleta de dados. No Capítulo 2, são enfatizadas a organização e
a sumarização dos dados. É aqui que encontramos os conceitos de tendência central e dispersão e aprendemos
como calcular suas medidas descritivas. No Capítulo 3, somos apresentados às ideias fundamentais de
probabilidade e, no Capítulo 4, consideramos o conceito de distribuição de probabilidade. Esses conceitos são
fundamentais para a compreensão da inferência estatística, o tópico que abrange a maior parte deste livro.
Este capítulo serve como uma ponte entre o material anterior, que é essencialmente descritivo por
natureza, e a maioria dos tópicos restantes, que foram selecionados na área de inferência estatística.
5.2 DISTRIBUIÇÕES DE AMOSTRAGEM
O tópico deste capítulo são as distribuições amostrais. A importância de uma compreensão clara das distribuições
amostrais não pode ser subestimada, pois esse conceito é a chave para entender a inferência estatística. As
distribuições de amostragem servem a dois propósitos: (1) elas nos permitem responder questões de
probabilidade sobre estatísticas de amostra e (2) fornecem a teoria necessária para tornar válidos os
procedimentos de inferência estatística. Neste capítulo, usamos distribuições amostrais para responder a
questões de probabilidade sobre estatísticas amostrais. Lembramos do Capítulo 2 que uma estatística amostral
é uma medida descritiva, como média, mediana, variância ou desvio padrão, calculada a partir dos dados de
uma amostra. Nos capítulos seguintes, veremos como as distribuições amostrais tornam válidas as inferências
estatísticas.
Começamos com a seguinte definição.
DEFINIÇÃO
A distribuição de todos os valores possíveis que podem ser assumidos por alguma
estatística, calculada a partir de amostras do mesmo tamanho extraídas aleatoriamente da
mesma população, é chamada de distribuição amostral dessa estatística.
Distribuições de amostragem: construção As distribuições de amostragem podem ser construídas empiricamente

ao amostrar de uma população discreta e finita. Para construir uma distribuição amostral procedemos da seguinte
forma:
1. De uma população finita de tamanho N, extraia aleatoriamente todas as amostras possíveis de tamanho n.
2. Calcule a estatística de interesse para cada amostra.

3. Liste em uma coluna os diferentes valores observados distintos da estatística e, em outra coluna, liste a
frequência correspondente de ocorrência de cada valor observado distinto da estatística.
A construção real de uma distribuição amostral é um empreendimento formidável se a população for de

tamanho apreciável e é uma tarefa impossível se a população for infinita.
Nesses casos, as distribuições amostrais podem ser aproximadas tomando um grande número de amostras de
um determinado tamanho.
136 CAPÍTULO 5 ALGUMAS DISTRIBUIÇÕES DE AMOSTRAGEM IMPORTANTES
Distribuições amostrais: características importantes Normalmente estamos interessados em

saber três coisas sobre uma determinada distribuição amostral: sua média, sua variância e sua
forma funcional (como ela se parece quando representada graficamente).
Podemos reconhecer a dificuldade de construir uma distribuição amostral de acordo com
os passos dados acima quando a população é grande. Também nos deparamos com um problema
ao considerar a construção de uma distribuição amostral quando a população é infinita. O melhor
que podemos fazer experimentalmente neste caso é aproximar a distribuição amostral de uma
estatística.
Ambos os problemas podem ser evitados por meio da matemática. Embora os
procedimentos envolvidos não sejam compatíveis com o nível matemático deste livro, as
distribuições amostrais podem ser derivadas matematicamente. O leitor interessado pode
consultar um dos muitos livros didáticos de estatística matemática, por exemplo, Larsen e
Marx (1) ou Rice (2).
Nas seções a seguir, algumas das distribuições de amostragem encontradas com
mais frequência são discutidas.
5.3 DISTRIBUIÇÃO DA MÉDIA DA AMOSTRA
Uma distribuição de amostragem importante é a distribuição da média da amostra. Vejamos

como podemos construir a distribuição amostral seguindo os passos descritos na seção
anterior.
EXEMPLO 5.3.1
Suponha que tenhamos uma população de tamanho N ¼ 5, consistindo de cinco crianças de

idade que são pacientes ambulatoriais em um centro comunitário de saúde mental. As idades
são as seguintes: x1 ¼ 6; x2 ¼ 8; x3 ¼ 10; x4 ¼ 12 e x5 ¼ 14. A média, m, desta população
é igual a Pxi=N ¼ 10 e a variância é
2 40
PðÞxs2
m¼ ¼ ¼8
N 5
Vamos calcular outra medida de dispersão e designá-la por S maiúsculo como segue:
2 40
PðÞx m
S2 ¼ ¼ ¼ 10
N1 4
Voltaremos a nos referir a essa quantidade no próximo capítulo. Desejamos construir a

distribuição amostral da média amostral, x, com base em amostras de tamanho n ¼ 2 extraídas
dessa população.
Solução: Vamos extrair todas as amostras possíveis de tamanho n ¼ 2 dessa população. Essas
amostras, juntamente com suas médias, são apresentadas na Tabela 5.3.1.
5.3 DISTRIBUIÇÃO DA MÉDIA DA AMOSTRA 137
TABELA 5.3.1 Todas as amostras possíveis de tamanho n ¼ 2 de uma população de tamanho N ¼ 5. Amostras acima ou
abaixo do resultado da diagonal principal quando a amostragem é sem reposição. Médias de amostra estão entre parênteses
Segundo Sorteio
6 8 10 12 14
6 6, 6 6, 8 6, 10 6, 12 6, 14
(6) (7) (8) (9) (10)
8 8, 6 8, 8 8, 10 8, 12 8, 14
(7) (8) (9) (10) (11)
Primeiro Sorteio 10 10, 6 10, 8 10, 10 10, 12 10, 14
(8) (9) (10) (11) (12)
12 12, 6 12, 8 12, 10 12, 12 12, 14
(9) (10) (11) (12) (13)
14 14, 6 14, 8 14, 10 14, 12 14, 14
(10) (11) (12) (13) (14)
TABELA 5.3.2 Distribuição Amostral

de x Calculado a partir das Amostras na
Tabela 5.3.1
Relativo
x Frequência Frequência
6 1 1/25
7 2 25/02
8 3 25/03
9 4 25/04
10 5 25/05
11 4 25/04
12 3 25/03
13 2 25/02
14 1 25/01
Total 25 25/25
Vemos neste exemplo que, quando a amostragem é com reposição,

existem 25 amostras possíveis. Em geral, quando a amostragem é com
reposição, o número de amostras possíveis é igual a Nn .
Podemos construir a distribuição amostral de x listando os diferentes
valores de x em uma coluna e sua frequência de ocorrência em outra, como na
Tabela 5.3.2. &
Vemos que os dados da Tabela 5.3.2 satisfazem os requisitos para uma distribuição
de probabilidade. As probabilidades individuais são todas maiores que 0 e sua soma é igual
a 1.
FIGURA 5.3.1 Distribuição da população e distribuição amostral de x.
Foi afirmado anteriormente que geralmente estamos interessados na forma funcional de uma
distribuição amostral, sua média e sua variância. Agora consideramos essas características para a
distribuição amostral da média amostral, x.
Distribuição amostral de x: forma funcional Vejamos a distribuição de x plotada como um histograma,

junto com a distribuição da população, ambas mostradas na Figura 5.3.1. Notamos a diferença radical
na aparência entre o histograma da população e o histograma da distribuição amostral de x. Enquanto
o primeiro é distribuído uniformemente, o último sobe gradualmente até um pico e depois cai com
simetria perfeita.
Distribuição amostral de x: média Agora vamos calcular a média, que chamaremos de mx, de nossa
distribuição amostral. Para fazer isso, adicionamos as 25 médias amostrais e dividimos por 25. Assim,
Pxi 6 þ 7 þ 7 þ 8 þþ 14 250
mx¼ ¼ ¼ ¼ 10
Nn 25 25
Notamos com interesse que a média da distribuição amostral de x tem o mesmo

valor como a média da população original.
Distribuição Amostral de x: Variância Finalmente, podemos calcular a variância de x, que chamamos de s2 da

seguinte forma: x
¼
P xiðmx Þ2
2x
Nn
2 2 2 2
¼
ð Þ 6 10 þ ð Þ 7 10 þ ð Þ 7 10 25 þþ ð Þ 14 10
100
¼ ¼4
25
Notamos que a variância da distribuição amostral não é igual à variância da população. É interessante observar,
entretanto, que a variância da distribuição amostral é igual à variância populacional dividida pelo tamanho da
amostra utilizada para obter a distribuição amostral. Isso é,
s2
s2x ¼
¼ 8¼42
n
ffiffiffi
2 ffiffiffi
A raiz quadrada da variância da distribuição amostral, erro padrão da média ou,

sp x ¼ s = np é chamado de
simplesmente, o erro padrão.
Esses resultados não são coincidências, mas são exemplos das características das distribuições
amostrais em geral, quando a amostragem é com reposição ou quando a amostragem é de uma população
infinita. Para generalizar, distinguimos entre duas situações: amostragem de uma população normalmente
distribuída e amostragem de uma população não normalmente distribuída.
Distribuição amostral de x: amostragem de populações normalmente distribuídas Quando a amostragem é de

uma população normalmente distribuída, a distribuição da média amostral possuirá as seguintes propriedades:
1. A distribuição de x será normal.
2. A média, mx, da distribuição de x será igual à média da população de

quais as amostras foram retiradas.
3. A variância, s2 x da distribuição de x será igual à variância da população
dividida pelo tamanho da amostra.
Amostragem de populações com distribuição não normal Para o caso em que a amostragem é de uma
população com distribuição não normal, nos referimos a um importante teorema matemático conhecido como
teorema do limite central. A importância deste teorema na inferência estatística pode ser resumida na seguinte
declaração.
O teorema do limite central
Dada uma população de qualquer forma funcional não normal com média m e variância finita
s2, a distribuição amostral de x, calculada a partir de amostras de tamanho n dessa
população, terá média m e variância s2=n e será aproximadamente normalmente distribuída
quando o tamanho da amostra é grande.
Uma formulação matemática do teorema do limite central é que a distribuição de
xms =
ffiffiffi
np
se aproxima de uma distribuição normal com média 0 e variância 1 como n ! 1. Observe que o teorema do limite
central nos permite amostrar de populações não normalmente distribuídas com uma garantia de aproximadamente
os mesmos resultados que seriam obtidos se as populações fossem normalmente distribuídas, desde que
tomemos uma grande amostra.
A importância disso ficará evidente mais tarde, quando aprendermos que uma distribuição amostral
normalmente distribuída é uma ferramenta poderosa na inferência estatística. No caso da média amostral, temos
a garantia de pelo menos uma distribuição amostral aproximadamente normalmente distribuída sob três
condições: (1) quando a amostragem é de uma população normalmente distribuída; (2) quando a amostragem é
de uma população com distribuição não normal e nossa amostra é grande; e (3) quando a amostragem é de
uma população cuja forma funcional é desconhecida para nós, desde que nosso tamanho de amostra seja
grande.
A questão lógica que surge neste ponto é: qual deve ser o tamanho da amostra para que o teorema do
limite central seja aplicado? Não há uma resposta única, pois o tamanho da amostra necessária depende da
extensão da não normalidade presente na população. Uma regra prática afirma que, na maioria das situações
práticas, uma amostra de tamanho 30 é satisfatória. Em geral, a aproximação da normalidade da distribuição
amostral de x torna-se cada vez melhor à medida que o tamanho da amostra aumenta.
Amostragem sem reposição Os resultados anteriores foram dados com base na suposição de que a amostragem
é com reposição ou que as amostras são retiradas de populações infinitas. Em geral, não amostramos com
reposição e, na maioria das situações práticas, é necessário amostrar de uma população finita; portanto,
precisamos nos familiarizar com o comportamento da distribuição amostral da média amostral nessas condições.
Antes de fazer qualquer declaração geral, vamos olhar novamente para os dados da Tabela 5.3.1. As médias
amostrais que resultam quando a amostragem é sem reposição são as que estão acima da diagonal principal,
que são as mesmas que estão abaixo da diagonal principal, se ignorarmos a ordem em que as observações
foram feitas. Vemos que existem 10 amostras possíveis. Em geral, ao extrair amostras de tamanho n de uma
população finita de tamanho N sem reposição e ignorar a ordem na qual os valores da amostra são extraídos, o
número de amostras possíveis é dado pela combinação de N coisas tomadas n de cada vez. Em nosso presente
exemplo temos
N! 5! 5 4 3! ¼
¼ ¼
NCn ¼ 10 amostras possíveis:
n!ð Þ N n ! 2!3! 2!3!
A média das 10 médias amostrais é
Pxim 7 þ 8 þ 9 þþ 13 100
x¼ ¼ ¼ ¼ 10
NCn 10 10
Vemos que mais uma vez a média da distribuição amostral é igual à população
significar.
A variância dessa distribuição amostral é
P xið mx Þ2
30
s2x ¼
¼ ¼3
NCn 10
e notamos que desta vez a variância da distribuição amostral não é igual à variância da população
dividida pelo tamanho da amostra, pois s2 ¼ 3 6¼ 8=2 ¼ 4. Existe,x entretanto, uma
interessante querelação
descobrimos
multiplicando s2 =n por ð Þ N n =ð Þ N 1 Ou seja,
.
s2 N n 8 52¼
¼ 3
n N1 2 4
Este resultado nos diz que se multiplicarmos a variância da distribuição amostral que seria obtida
se a amostragem fosse com reposição, pelo fator ð Þ N n =ð Þ N 1 obtemos
da distribuição
oresulta
valoramostral
da
quando
, amostragem
variância
que
é sem reposição. Podemos generalizar esses resultados com a seguinte afirmação.
Quando a amostragem é sem reposição de uma população finita, a distribuição

amostral de x terá média m e variância
s2 N n
s2x ¼
n N1
Se o tamanho da amostra for grande, aplica-se o teorema do limite central e a amostragem

distribuição de x será aproximadamente normalmente distribuída.
A Correção da População Finita O fator ð Þ N n =ð Þ N 1 é chamado de correção da população

finita e pode ser ignorado quando o tamanho da amostra é pequeno em comparação com o
tamanho da população. Quando a população é muito maior que a amostra, a diferença entre
s2=ne s2 ð Þ =n ½ ð Þ N n =ð Þ N 1 será10.000
desprezível.
a população
e uma Imagine
amostra
Multiplicar
finitauma
dessa
000
s2=n
população
25população
=ð
porÞ¼
0,9976
9999
dede
tamanho
étamanho
:9976.
a correção
25;
seria igual a 10 ð quase equivalente a multiplicá-lo por 1. A maioria dos estatísticos praticantes
amostra seja superior a 5% do tamanho
; não usa
da população.
a ºcorreção de população finita, a menos que a
Ou seja, a correção de população finita é normalmente ignorada quando n=N :05.
A distribuição amostral de x: um resumo Vamos resumir as características da distribuição amostral

de x sob duas condições.
1. A amostragem é de uma população normalmente distribuída com uma população conhecida

variância:
(a) mx ¼ m ffiffiffi
(b) sx ¼ s= np
(c) A distribuição amostral de x é normal.
2. A amostragem é de uma população distribuída não normalmente com uma variância populacional conhecida:
(a) mx ¼ m (b) ffiffiffi
quando n=N :05

sx ¼ s= np ;
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
ffiffiffi
Nn
sx ¼ s=ðnp º por outro lado
N1r;
(c) A distribuição amostral de x é aproximadamente normal.
Aplicações Como veremos nos próximos capítulos, o conhecimento e a compreensão das distribuições amostrais
serão necessários para a compreensão dos conceitos de inferência estatística. A aplicação mais simples de nosso
conhecimento da distribuição amostral da média amostral é calcular a probabilidade de obter uma amostra com
uma média de alguma magnitude especificada. Vamos ilustrar com alguns exemplos.
EXEMPLO 5.3.2
Suponha que se saiba que em uma certa grande população humana o comprimento do crânio é aproximadamente
distribuído normalmente com uma média de 185,6 mm e um desvio padrão de 12,7 mm.
Qual é a probabilidade de que uma amostra aleatória de tamanho 10 dessa população tenha uma média maior que
190?
Solução: Sabemos que a única amostra em consideração é uma de todas as possíveis amostras de tamanho 10
que podem ser extraídas da população, de modo que a média que ela produz é um dos x que
constituem a distribuição amostral de x que, teoricamente, poderia ser derivado dessa população.
Quando dizemos que a população é aproximadamente normalmente distribuída,

assumimos que a distribuição amostral de x será, para todos os propósitos práticos, normalmente
distribuída. Também sabemos que a média e o desvio padrão da distribuição amostral são iguais
a 185,6 e
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
ffiffiffiffiff
2
=10ðÞ
q 12:7 10 p ¼ 4:0161, respectivamente. Assumimos que o pop ¼ 12:7=
ulação é grande em relação à amostra, de modo que a correção da população finita pode ser
ignorada.
Aprendemos no Capítulo 4 que sempre que tivermos uma variável aleatória normalmente
distribuída, podemos facilmente transformá-la na distribuição normal padrão. Nossa variável
aleatória agora é x, a média de sua distribuição é mx e seu desvio padrão é sx ¼ s= np . ffiffiffi
Modificando adequadamente a fórmula fornecida anteriormente,

para transformar
chegamos
a distribuição
à seguinte
normalfórmula
de x na
distribuição normal padrão:
x mx z
¼ nps= ffiffiffi
(5.3.1) &
A probabilidade que responde à nossa pergunta é representada pela área à direita de x ¼ 190 sob a curva da
distribuição amostral. Esta área é igual à área à direita de
190 185:6 4:4

z¼ ¼ ¼ 1:10
4:0161 4:0161
FIGURA 5.3.2 Distribuição populacional, distribuição amostral e distribuição normal padrão,

Exemplo 5.3.2: (a) distribuição populacional; (b) distribuição amostral de x para amostras de
tamanho 10; (c) distribuição normal padrão.
Consultando a tabela normal padrão, descobrimos que a área à direita de 1,10 é 0,1357; portanto,
dizemos que a probabilidade é de 0,1357 de que uma amostra de tamanho 10 terá uma média
maior que 190.
A Figura 5.3.2 mostra a relação entre a população original, a distribuição amostral de x e a
distribuição normal padrão.
EXEMPLO 5.3.3
Se a média e o desvio padrão dos valores de ferro sérico para homens saudáveis são 120 e 15
microgramas por 100 ml, respectivamente, qual é a probabilidade de que uma amostra aleatória de
50 homens normais produza uma média entre 115 e 125 microgramas por 100 ml?
Solução: A forma funcional da população de valores de ferro sérico não é especificada, mas como
temos um tamanho de amostra maior que 30, fazemos uso da central
teorema do limite e transforme a distribuição amostral aproximadamente normal

resultante de x (que tem uma média de 120 e um desvio padrão de 50 p ¼
ffiffiffiffiff
2:1213) para a normal padrão. A probabilidade que procuramos é 15 =
115 120 125 120

PðÞ 115 x 125 ¼ P z
2:12 2:12
¼ Pð Þ 2:36 z 2:36
¼ :9909 :0091 ¼
:9818 &
EXERCÍCIOS
5.3.1 A Pesquisa Nacional de Saúde e Nutrição de 1988–1994 (NHANES III, A-1) estimou que o nível médio de colesterol
sérico para mulheres dos EUA com idade entre 20–74 anos é de 204 mg/dl. A estimativa do desvio padrão foi de
aproximadamente 44. Usando essas estimativas como média m e desvio padrão s para a população dos EUA,
considere a distribuição amostral da média amostral com base em amostras de tamanho 50 extraídas de mulheres
nessa faixa etária. Qual é a média da distribuição amostral? O erro padrão?
5.3.2 O estudo citado no Exercício 5.3.1 relatou um nível médio estimado de colesterol sérico de 183 para mulheres de 20 a
29 anos. O desvio padrão estimado foi de aproximadamente 37. Use essas estimativas como a média m e o desvio
padrão s para a população dos EUA. Se uma amostra aleatória simples de tamanho 60 for retirada dessa população,
encontre a probabilidade de que o nível médio de colesterol sérico da amostra seja:
(a) Entre 170 e 195 (c) Maior (b) Abaixo de 175

que 190
5.3.3 Se os valores de ácido úrico em homens adultos normais são aproximadamente normalmente distribuídos com média e
desvio padrão de 5,7 e 1 mg por cento, respectivamente, encontre a probabilidade de que uma amostra de tamanho
9 produza uma média: (a) Maior que 6 (c) Menos de 5,2
(b) Entre 5 e 6
5.3.4 Wright et al. [A-2] usou a Pesquisa Nacional de Saúde e Nutrição de 1999–2000 (NHANES) para estimar a ingestão
alimentar de 10 nutrientes essenciais. Um desses nutrientes era o cálcio (mg). Eles encontraram em todos os adultos
de 60 anos ou mais uma ingestão diária média de cálcio de 721 mg com um desvio padrão de 454. Usando esses
valores para a média e o desvio padrão para a população dos EUA, encontre a probabilidade de que uma amostra
aleatória de tamanho 50 tenha uma média: (a) Superior a 800 mg (c) Entre 700 e 850 mg
(b) Menos de 700 mg
5.3.5 No estudo citado no Exercício 5.3.4, os pesquisadores descobriram que a ingestão média de sódio em homens e
mulheres com 60 anos ou mais é de 2.940 mg com um desvio padrão de 1.476 mg. Use esses valores para a média
e o desvio padrão da população dos EUA e encontre a probabilidade de que uma amostra aleatória de 75 pessoas da
população tenha uma média: (a) Menos de 2.450 mg (b) Mais de 3.100 mg (c) Entre 2.500 e 3300 mg (d) Entre 2500
e 2900 mg
5.4 DISTRIBUIÇÃO DA DIFERENÇA ENTRE DUAS AMOSTRAS MÉDIAS 145
5.3.6 Dada uma população normalmente distribuída com média de 100 e desvio padrão de 20, encontre o
seguintes probabilidades com base em uma amostra de tamanho 16:
(a) Pð Þ
(c)x Pð
100Þ (b) PðÞ x 110
96 x 108
5.3.7 Dado m ¼ 50; s = 16 e n = 64, encontre:
(a) Pð Þ
Pð45Þ xx 55
< 47
(c) (b) Pð Þ
(d)x Pð
> 53
Þ 49 x 56
5.3.8 Suponha que uma população consista nos seguintes valores: 1, 3, 5, 7, 9. Construa a distribuição amostral
de x com base em amostras de tamanho 2 selecionadas sem reposição. Encontre a média e a variância
da distribuição amostral.
5.3.9 Use os dados do Exemplo 5.3.1 para construir a distribuição amostral de x com base em amostras de
tamanho 3 selecionadas sem reposição. Encontre a média e a variância da distribuição amostral.
5.3.10 Use os dados citados no Exercício 5.3.1. Imagine que pegamos amostras de tamanho 5, 25, 50, 100 e 500
das mulheres nessa faixa etária. (a) Calcule o erro padrão para cada um desses cenários de amostragem.
(b) Discuta como o tamanho da amostra afeta as estimativas de erro padrão calculadas na parte (a) e as
possíveis implicações que isso pode ter na prática estatística.
5.4 DISTRIBUIÇÃO DA DIFERENÇA ENTRE DUAS MÉDIAS DE

AMOSTRAS
Frequentemente o interesse por uma investigação está centrado em duas populações.

Especificamente, um investigador pode querer saber algo sobre a diferença entre duas
médias populacionais. Em uma investigação, por exemplo, um pesquisador pode querer
saber se é razoável concluir que duas médias populacionais são diferentes. Em outra
situação, o pesquisador pode desejar saber a magnitude da diferença entre duas médias
populacionais. Uma equipe de pesquisa médica, por exemplo, pode querer saber se o nível
médio de colesterol sérico é ou não mais alto em uma população de trabalhadores de
escritório sedentários do que em uma população de trabalhadores. Se os pesquisadores
forem capazes de concluir que as médias populacionais são diferentes, eles podem querer
saber o quanto elas diferem. O conhecimento da distribuição amostral da diferença entre duas médias é
Amostragem de populações normalmente distribuídas O exemplo a seguir ilustra a construção

e as características da distribuição amostral da diferença entre médias amostrais quando a
amostragem é de duas populações normalmente distribuídas.
EXEMPLO 5.4.1
Suponha que temos duas populações de indivíduos – uma população (população 1)

experimentou alguma condição considerada associada ao retardo mental e a outra população
(população 2) não experimentou a condição. A distribuição de
Acredita-se que os escores de inteligência em cada uma das duas populações sejam aproximadamente
normalmente distribuídos com um desvio padrão de 20.
Suponha, ainda, que tomamos uma amostra de 15 indivíduos de cada população e calculamos para
cada amostra o escore médio de inteligência com os seguintes resultados: x1 ¼ 92 e x2 ¼ 105. Se não
houver diferença entre as duas populações, com relação a suas verdadeiras pontuações médias de
inteligência, qual é a probabilidade de observar uma diferença tão grande ou maior ð Þ x1 x2 entre as
médias das amostras?
Solução: Para responder a esta pergunta, precisamos saber a natureza da distribuição amostral da
estatística relevante, a diferença entre duas médias amostrais, x1 x2. Observe que
buscamos uma probabilidade associada à diferença entre duas médias amostrais em vez
de uma única média. &
Distribuição Amostral de x1 x2: Construção Embora, na prática, não tentemos construir a distribuição
amostral desejada, podemos conceituar a maneira pela qual isso pode ser feito quando a amostragem é
de populações finitas. Começaríamos selecionando da população 1 todas as amostras possíveis de
tamanho 15 e calculando a média para cada amostra. Sabemos que haveria N1Cn1 amostras em que N1
é o tamanho da população e n1 ¼ 15. Da mesma forma, selecionaríamos todas as amostras possíveis de
tamanho 15 da população 2 e calcularíamos a média para cada uma dessas amostras. Em seguida,
pegaríamos todos os pares possíveis de médias amostrais, um da população 1 e outro da população 2, e
calcularíamos a diferença. A Tabela 5.4.1 mostra os resultados de seguir este procedimento. Observe que
os 1s e 2s na última linha desta tabela não são expoentes, mas indicadores da população 1 e 2,
respectivamente.
Distribuição Amostral de x1 x2: Características É a distribuição das diferenças entre médias amostrais que
buscamos. Se plotássemos as diferenças amostrais em relação à sua frequência de ocorrência, obteríamos
uma distribuição normal com média igual a m1 m2, a diferença entre as duas médias populacionais e uma
variância igual a s2 1=n1 þ s2 2=n2 .
Ou seja, o erro padrão da diferença entre
TABELA 5.4.1 Tabela de trabalho para construir a distribuição da diferença entre duas médias amostrais
Amostras Amostras Amostra Amostra Tudo possível

de de Meios Meios Diferenças
População 1 População 2 População 1 População 2 Entre Meios
n11 n12 x11 x12 x11 x12

n21 n22 x21 x22 x11 x22
n31 n32 x31 x32 x11 x32
nN1Cn1 1 nN2Cn2 2 xN1Cn1 1 xN2Cn2 2 xN1Cn1 1 xN2Cn2 2

5.4 DISTRIBUIÇÃO DA DIFERENÇA ENTRE DUAS AMOSTRAS MÉDIAS 147
FIGURA 5.4.1 Gráfico da distribuição amostral de x1 x2 quando não há diferença entre médias
populacionais, Exemplo 5.4.1.
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
as médias amostrais seriam iguais às s2 1=n1 þ s2 2=n2 . Deve-se notar que esses
q
propriedades transmitem dois pontos importantes. Primeiro, as médias de duas distribuições podem ser
subtraídas uma da outra ou somadas, usando operações aritméticas padrão.
Em segundo lugar, uma vez que a variância geral da distribuição amostral será afetada por ambas as
distribuições contribuintes, as variâncias sempre serão somadas, mesmo que estejamos interessados na
diferença das médias. Este último fato assume que as duas distribuições são independentes uma da outra.
Para o nosso exemplo, teríamos uma distribuição normal com média 0 (se não houver diferença entre
as duas médias populacionais) e variância de ½ð Þ 20
2 2
=15þ½ð Þ 20 =15 ¼ 53:3333. O gráfico da distribuição amostral é mostrado em
Figura 5.4.1.
Convertendo para z Sabemos que a distribuição normal descrita no Exemplo 5.4.1 pode ser transformada em
distribuição normal padrão por meio da modificação de uma fórmula previamente aprendida. A nova fórmula é
a seguinte:
x1 x2
ð º ð m1 m2 º
z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
(5.4.1)
s21 s2 þ 2
n2 n1
s
A área sob a curva de x1 x2 correspondente à probabilidade que procuramos é a área à esquerda

de x1 x2 ¼ 92 105 ¼ 13. O valor z correspondente a 13, assumindo que não há diferença entre as
médias populacionais, é
13 0 13 13
¼ fffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ ¼ 1:78
2 2 53:3p 7:3
ðÞ ðÞ
º
20 15 20 15
s
Consultando a Tabela D, descobrimos que a área sob a curva normal padrão à esquerda de 1:78 é igual a
0,0375. Em resposta à nossa pergunta original, dizemos que se não houver
diferença entre médias populacionais, a probabilidade de obter uma diferença entre médias amostrais
tão grande quanto ou maior que 13 é 0,0375.
Amostragem de Populações Normais O procedimento que acabamos de seguir é válido mesmo

quando os tamanhos das amostras, n1 e n2, são diferentes e quando as variâncias da população, s2
e s2 têm valores
1
resumidos
diferentes.
2
daOs
seguinte
resultados
forma.
teóricos em que se baseia este procedimento podem ser
Dadas duas populações normalmente distribuídas com médias m1 e m2 e variâncias s2 e s2 1

2, respectivamente, a distribuição amostral da diferença, x1 x2, entre as médias de
amostras independentes de tamanho n1 e n2 retiradas dessas populações é
normalmente distribuído com média m1 m2 e variância q s2 1=n1 þ s2 2=n2 .
Amostragem de populações não normais Muitas vezes, um pesquisador se depara com um ou outro
dos seguintes problemas: a necessidade de (1) amostragem de populações não normalmente
distribuídas ou (2) amostragem de populações cujas formas funcionais não são conhecidas. Uma
solução para esses problemas é coletar amostras grandes, pois quando os tamanhos das amostras
são grandes, aplica-se o teorema do limite central e a distribuição da diferença entre duas médias
amostrais é pelo menos aproximadamente distribuída normalmente com uma média igual a m1 m2 e
uma variância de s2 1=n1 þ s2 2=n2 . Para encontrar
probabilidades associadas a valores específicos da estatística, então, nosso procedimento seria o
mesmo dado quando a amostragem é de populações normalmente distribuídas.
EXEMPLO 5.4.2
Suponha que tenha sido estabelecido que para um determinado tipo de cliente a duração média de
uma visita domiciliar por uma enfermeira de saúde pública é de 45 minutos com um desvio padrão
de 15 minutos, e que para um segundo tipo de cliente a visita domiciliar média é de 30 minutos longo
com um desvio padrão de 20 minutos. Se uma enfermeira visita aleatoriamente 35 clientes da
primeira população e 40 da segunda população, qual é a probabilidade de que a duração média da
visita domiciliar difira entre os dois grupos em 20 minutos ou mais?
Solução: Nenhuma menção é feita sobre a forma funcional das duas populações, então vamos
assumir que esta característica é desconhecida, ou que as populações não são
normalmente distribuídas. Como os tamanhos amostrais são grandes (maiores que
30) em ambos os casos, utilizamos os resultados do teorema do limite central para
responder à questão colocada. Sabemos que a diferença entre as médias amostrais
é pelo menos aproximadamente distribuída normalmente com a seguinte média e
variância:
mx1x2 ¼ m1 m2 ¼ 45 30 ¼ 15
2 2
s21 þ n2s22 ðÞ ðÞ
s2
¼
¼ 20 þ 40 ¼ 16:4286
x1x2 15 35
n1
EXERCÍCIOS 149
FIGURA 5.4.2 Distribuição amostral de x1 x2 e a distribuição normal padrão correspondente,

exemplo de visita domiciliar.
A área sob a curva de x1 x2 que procuramos é a área à direita de 20.

O valor correspondente de z na normal padrão é
ðx1 x2 º ð Þ m1 m2 20 15 5
¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ ¼ 1:23
16:4286p 4:0532
s21 s2 þ 2
n2n1s
Na Tabela D, descobrimos que a área à direita de z ¼ 1:23 é 1:8907

¼:1093. Dizemos, então, que a probabilidade das visitas aleatórias da
enfermeira resultarem em uma diferença entre as duas médias igual ou
superior a 20 minutos é de 0,1093. A curva de x1 x2 e a curva normal
padrão correspondente são mostradas na Figura 5.4.2. &
EXERCÍCIOS
5.4.1 O estudo citado nos Exercícios 5.3.1 e 5.3.2 fornece os seguintes dados sobre os níveis séricos de colesterol em
mulheres americanas:
População Idade Média Desvio Padrão
UMA 20–29 183 37.2

B 30–39 189 34,7
Use essas estimativas como média m e desvio padrão s para as respectivas populações dos EUA.
Suponha que selecionamos uma amostra aleatória simples de tamanho 50 independentemente de cada população.
Qual é a probabilidade de que a diferença entre as médias amostrais xB xA seja maior que 8?
5.4.2 No estudo citado nos Exercícios 5.3.4 e 5.3.5, os níveis de cálcio em homens e mulheres com 60 anos ou mais estão
resumidos na tabela a seguir:
Desvio Padrão Médio
Homens 797 482

Mulheres 660 414
Use essas estimativas como média m e desvio padrão s para as populações dos EUA para essas faixas etárias. Se
tomarmos uma amostra aleatória de 40 homens e 35 mulheres, qual é a probabilidade de obter uma diferença entre
as médias amostrais de 100 mg ou mais?
5.4.3 Dadas duas populações normalmente distribuídas com médias e variâncias iguais de s2 1
¼ 100 e
s22 ¼ 80, qual é a probabilidade de que amostras de tamanho n1 ¼ 25 e n2 ¼ 16 produzam um valor
de x1 x2 maior ou igual a 8?
5.4.4 Dadas duas populações normalmente distribuídas com médias e variâncias iguais de s2 ¼ 240 e 1
s2de¼2350, qual
x1 x2 tãoégrande
a probabilidade de que
ou maior que 12?amostras de tamanho n1 ¼ 40 e n2 ¼ 35 produzam um valor
5.4.5 Para uma população de meninos de 17 anos e meninas de 17 anos, as médias e desvios padrão, respectivamente, de
seus valores de dobra cutânea subescapular são os seguintes: meninos, 9,7 e 6,0; meninas, 15,6 e 9,5. Amostras
aleatórias simples de 40 meninos e 35 meninas são selecionadas das populações. Qual é a probabilidade de que a
diferença entre as médias amostrais xmeninas xmeninos seja maior que 10?
5.5 DISTRIBUIÇÃO DA PROPORÇÃO DA

AMOSTRA
Nas seções anteriores, lidamos com as distribuições amostrais de estatísticas calculadas a partir
de variáveis medidas. Frequentemente estamos interessados, no entanto, na distribuição amostral
de uma estatística, como uma proporção amostral, que resulta de contagens ou dados de
frequência.
EXEMPLO 5.5.1
Os resultados [A-3] da Pesquisa Nacional de Saúde e Nutrição de 2009–2010 (NHANES) mostram

que 35,7% dos adultos americanos com 20 anos ou mais são obesos (obesos definidos com
índice de massa corporal maior ou igual a 30,0). Designamos essa proporção populacional como
p ¼ :357. Se selecionarmos aleatoriamente 150 indivíduos dessa população, qual é a probabilidade
de que a proporção de obesos na amostra chegue a 0,40?
Solução: Para responder a esta pergunta, precisamos conhecer as propriedades da distribuição

amostral da proporção amostral. Designaremos a proporção amostral pelo símbolo
^p.
5.5 DISTRIBUIÇÃO DA PROPORÇÃO DA AMOSTRA 151
Você reconhecerá a semelhança entre este exemplo e aqueles

apresentados na Seção 4.3, que tratou da distribuição binomial. A variável
obesidade é uma variável dicotômica, pois um indivíduo pode ser classificado
em uma ou outra de duas categorias mutuamente exclusivas: obeso ou não
obeso. Na Seção 4.3, recebemos informações semelhantes e fomos solicitados
a encontrar o número com a característica de interesse, enquanto aqui
estamos buscando a proporção na amostra que possui a característica de interesse.
Poderíamos com uma tabela de probabilidades binomial suficientemente grande,
como a Tabela B, determinar a probabilidade associada ao número correspondente
à proporção de interesse. Como veremos, isso não será necessário, pois existe
um procedimento alternativo, quando os tamanhos das amostras são grandes, que
geralmente é mais conveniente. &
Distribuição Amostral de p^: Construção A distribuição amostral de uma proporção amostral

seria construída experimentalmente exatamente da mesma maneira que foi sugerida no
caso da média aritmética e da diferença entre duas médias.
Da população, que supomos ser finita, tomaríamos todas as amostras possíveis de um
determinado tamanho e, para cada amostra, calcularíamos a proporção da amostra, ^p. Em
seguida, prepararíamos uma distribuição de frequência de ^p listando os diferentes valores
distintos de ^p junto com suas frequências de ocorrência. Essa distribuição de frequência
(assim como a correspondente distribuição de frequência relativa) constituiria a distribuição
amostral de ^p.
Distribuição amostral de p^: características Quando o tamanho da amostra é grande, a

distribuição das proporções da amostra é aproximadamente distribuída normalmente em
virtude do teorema do limite central. A média da distribuição, m^p, ou seja, a média de todas
as possíveis proporções amostrais, será igual à verdadeira proporção da população, p, e a
variância da distribuição, s2 será igual a pð Þ 1 p = n ou ^p,
pq=n, onde q ¼
a questões de1probabilidade
p. Para responder
p, usamos
sobre
a seguinte fórmula:
^pp
z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
(5.5.1)
pðÞ 1 p
nº
A questão que surge agora é: qual deve ser o tamanho da amostra para que o uso
da aproximação normal seja válido? Um critério amplamente utilizado é que tanto np quanto
nð 1 p devem
º ser maiores que 5, e seguiremos essa regra neste texto.
Estamos agora em condições de responder à questão da obesidade na amostra de
150 indivíduos de uma população em que 35,7 por cento são obesos. Como np e nð Þ 1 p
sãoð maiores
Þ :643
normalmente
=150
que ¼
5 150
:00153.
distribuído
ð podemos
A probabilidade
com
Þ
dizer
:357
média
que,
¼ que
m^p;
53:6
neste
procuramos
e¼150
caso,
p ¼:643
:357
^p é , que
¼eaproximadamente
a96:5
s2
área
¼ pð
sob
Þ ^p
1 paestá
=n
curva
¼àðdireita
de
Þ :357
^p
de 0,40. Esta área é igual à área sob o padrão
curva normal à direita de
^pp :40 :357 ¼

z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
1:10
pð Þ 1 p :00153p
nº
A transformação para a distribuição normal padrão foi realizada da maneira usual. O valor de z é
encontrado dividindo-se a diferença entre um valor de uma estatística e sua média pelo erro padrão da
estatística. Usando a Tabela D, descobrimos que a área à direita de z ¼ 1:10 é 1:8643 ¼:1357. Podemos
dizer, então, que a probabilidade de observar ^p :40 em uma amostra aleatória de tamanho n ¼ 150 de
uma população em que p ¼ :357 é 0,1357.
Correção para Continuidade A aproximação normal pode ser melhorada usando a correção para
continuidade, um dispositivo que faz um ajuste para o fato de que uma distribuição discreta está sendo
aproximada por uma distribuição contínua. Suponha que façamos x ¼ n^p, o número na amostra com a
característica de interesse quando a proporção é ^p. Para aplicar a correção de continuidade, calculamos
x þ :5
p
n (5.5.2)
zc ¼ fffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
; para x < np
pq=np
ou
x :5
p
n (5.5.3)
zc ¼ fffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
; para x > np
pq=np
onde q ¼ 1 p. A correção para continuidade não fará muita diferença quando n for grande. No exemplo
acima n^p ¼ 150ð Þ¼ :4 60, e
60:5
:357
150
zc ¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ 1:01
pð Þ :357 ð Þ :643 =150
e Pð Þ¼:8461
^p :40¼1:1539, um resultado não muito diferente daquele obtido sem a correção de continuidade.
Esse ajuste geralmente não é feito manualmente, pois a maioria dos programas estatísticos de computador
aplica automaticamente a correção de continuidade apropriada quando necessário.
EXEMPLO 5.5.2
Blanche Mikhail [A-4] estudou o uso de cuidados pré-natais entre mulheres afro-americanas de baixa
renda. Ela descobriu que apenas 51 por cento dessas mulheres tiveram cuidados pré-natais adequados.
Vamos supor que, para uma população de mulheres afro-americanas de baixa renda semelhante,
EXERCÍCIOS 153
51 por cento tiveram pré-natal adequado. Se 200 mulheres dessa população forem sorteadas aleatoriamente, qual
é a probabilidade de que menos de 45% tenham recebido assistência pré-natal adequada?
Solução: Podemos assumir que a distribuição amostral de ^p é aproximadamente distribuída normalmente com
m^p ¼ :51 e s2 ¼ ð Þ :51 ð Þ :49 =200 ¼^p:00125. nós calculamos
:45 :51 :06

z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ ¼ 1:70 :0353
:00125p
A área à esquerda de 1:70 sob a curva normal padrão é 0,0446.
Portanto, Pð Þ¼ ^p :45 P zð Þ¼ 1:70 :0446. &
EXERCÍCIOS
5.5.1 Smith e outros. [A-5] realizou uma análise retrospectiva dos dados de 782 pacientes elegíveis admitidos com infarto
do miocárdio em um serviço cardíaco de 46 leitos. Desses pacientes, 248 (32 por cento) relataram um infarto do
miocárdio anterior. Use 0,32 como a proporção da população. Suponha que 50 indivíduos sejam escolhidos
aleatoriamente da população. Qual é a probabilidade de mais de 40% relatarem infartos do miocárdio anteriores?
5.5.2 No estudo citado no Exercício 5.5.1, 13 por cento dos pacientes no estudo relataram episódios anteriores de acidente
vascular cerebral ou ataque isquêmico transitório. Use 13 por cento como a estimativa da prevalência de acidente
vascular cerebral ou ataque isquêmico transitório na população. Se 70 indivíduos forem escolhidos aleatoriamente
da população, qual é a probabilidade de que 10% ou menos relatem uma incidência de acidente vascular cerebral
ou ataque isquêmico transitório?
5.5.3 No relatório NHANES de 1999-2000, os pesquisadores estimaram que 64% dos adultos americanos com idades entre
20 e 74 anos estavam acima do peso ou obesos (sobrepeso: IMC 25-29, obesos: IMC 30 ou mais). Use esta
estimativa como a proporção da população para adultos dos EUA com idades entre 20 e 74 anos. Se 125 indivíduos
forem selecionados aleatoriamente da população, qual é a probabilidade de que 70% ou mais tenham sobrepeso
ou obesidade?
5.5.4 Gallagher et al. [A-6] relataram um estudo para identificar fatores que influenciam a frequência de mulheres em
programas de reabilitação cardíaca. Eles descobriram que, 12 semanas após a alta, apenas 64% das mulheres
elegíveis frequentavam esses programas. Usando 64 por cento como uma estimativa da porcentagem de
comparecimento de todas as mulheres elegíveis, encontre a probabilidade de que em uma amostra de 45 mulheres
selecionadas aleatoriamente da população de mulheres elegíveis, menos de 50 por cento compareceriam
programas.
5.5.5 Dada uma população em que p ¼ :6 e uma amostra aleatória dessa população de tamanho 100, encontre:
(a) Pð ^p :65 Þ (b) Pð ^p :58 Þ

(c) Pð :56
Þ ^p :63
5.5.6 Sabe-se que 35 por cento dos membros de uma determinada população sofrem de uma ou mais doenças crônicas.
Qual é a probabilidade de que, em uma amostra de 200 indivíduos selecionados aleatoriamente dessa população,
80 ou mais tenham pelo menos uma doença crônica?
5.6 DISTRIBUIÇÃO DA DIFERENÇA ENTRE DUAS PROPORÇÕES DE

AMOSTRAS
Freqüentemente, há duas proporções populacionais nas quais estamos interessados e desejamos

avaliar a probabilidade associada a uma diferença nas proporções calculadas a partir de amostras
extraídas de cada uma dessas populações. A distribuição amostral relevante é a distribuição da
diferença entre as duas proporções amostrais.
Distribuição Amostral de p^1 p^2: Características As características desta

distribuição amostral podem ser resumidas da seguinte forma:
Se amostras aleatórias independentes de tamanho n1 e n2 forem retiradas de duas
populações de variáveis dicotômicas onde as proporções de observações com a
característica de interesse nas duas populações são p1 e p2, respectivamente, a
distribuição da diferença entre as proporções da amostra,
normal
^p1 ^p2,
comémédia
aproximadamente
m^p1^p2 ¼ p1 p2
e variância
p1 1 p1 ð Þ p2 1 p2 ð Þ
s2
¼
º
^p1^p2
n1 n2
quando n1 e n2 são grandes.
Consideramos n1 e n2 suficientemente grandes quando n1p1; n2p2; n1 1 p1 ð Þ e n2 1 p2 ð Þ

são todos maiores que 5.
Distribuição amostral de p^1 p^2: construção Para construir fisicamente a

distribuição amostral da diferença entre duas proporções amostrais,
procederíamos da maneira descrita na Seção 5.4 para construir a distribuição
amostral da diferença entre duas médias.
Dadas duas populações suficientemente pequenas, pode-se extrair, da população 1, todas as
amostras aleatórias simples possíveis de tamanho n1 e calcular, de cada conjunto de dados amostrais,
a proporção amostral ^p1. Da população 2, seria possível extrair independentemente todas as amostras
aleatórias simples possíveis de tamanho n2 e calcular, para cada conjunto de dados amostrais, a
proporção amostral ^p2. Um calcularia as diferenças entre todos os pares possíveis de proporções de
amostra, onde um número de cada par era um valor de ^p1 e o outro um valor de ^p2.
A distribuição amostral da diferença entre proporções amostrais, então, consistiria em todas essas
diferenças distintas, acompanhadas por suas frequências (ou frequências relativas) de ocorrência. Para
grandes populações finitas ou infinitas, pode-se aproximar a distribuição amostral da diferença entre as
proporções amostrais desenhando um grande número de amostras aleatórias simples independentes
e procedendo da maneira que acabamos de descrever.
5.6 DISTRIBUIÇÃO DA DIFERENÇA ENTRE DUAS PROPORÇÕES DE AMOSTRAS 155
Para responder a perguntas de probabilidade sobre a diferença entre duas proporções amostrais
ções, então, usamos a seguinte fórmula:
ð ^p1 ^p2 Þ p1
ð p2 Þ
z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
(5.6.1)
p1 1 p1 ð Þ p2 1 p2 ð þº
r n1 n2
EXEMPLO 5.6.1
A Pesquisa Nacional de Saúde de 1999, divulgada em 2003 [A-7], relatou que 28 por cento
dos indivíduos que se autoidentificam como brancos disseram ter sentido dor lombar durante
os três meses anteriores à pesquisa. Entre os indivíduos de origem hispânica, 21 por cento
relataram dor lombar. Vamos assumir que 0,28 e 0,21 são as proporções para as respectivas
raças que relatam dor lombar nos Estados Unidos. Qual é a probabilidade de que amostras
aleatórias independentes de tamanho 100 retiradas de cada uma das populações produzam
um valor de ^p1 ^p2 tão grande quanto 0,10?
Solução: Assumimos que a distribuição amostral de ^p1 ^p2 é aproximadamente normal

com média
m^p1^p2 ¼ :28 :21 ¼ :07

e variância
ð Þ :28 ð Þ :72 ð Þ :21 ð Þ :79 þ

s2 ¼
100 100
^p1^p2
¼:003675
A área correspondente à probabilidade que procuramos é a área sob a curva de

^p1 ^p2 à direita de 0,10. A transformação para a distribuição normal padrão dá
ð ^p1 Þ p1ðp2 Þ ^p2 :10 :07

z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ :49
ð p1 1 p1 Þ þ p2 1 p2 ð Þ :003675p
r n1 n2
Consultando a Tabela D, descobrimos que a área sob a curva normal padrão

que fica à direita de z ¼ :49 é 1 :6879 ¼ :3121. A probabilidade de observar uma
diferença tão grande quanto 0,10 é, então, 0,3121. &
EXEMPLO 5.6.2
Na Pesquisa Nacional de Saúde de 1999 [A-7], os pesquisadores descobriram que entre os adultos
americanos com 75 anos ou mais, 34% haviam perdido todos os dentes naturais e, entre os adultos
americanos de 65 a 74 anos, 26% haviam perdido todos os dentes naturais. Suponha que essas proporções
sejam os parâmetros para os Estados Unidos nessas faixas etárias. Se uma amostra aleatória de 200 adultos
com idades entre 65 e 74 anos e uma amostra aleatória independente de 250 adultos com 75 anos ou mais forem retirad
Para essas populações, encontre a probabilidade de que a diferença em porcentagem da perda total de dentes
naturais seja inferior a 5% entre as duas populações.
Solução: Assumimos que a distribuição amostral ^p1 ^p2 é aproximadamente normal.

A diferença média nas proporções daqueles que perdem todos os dentes é
m^p1^p2 ¼ :34 :26 ¼ :08
e a variância é
p1 1 p1 ð Þ p2 1 p2 ð Þ þ ð Þ :34 ð Þ :66 ð Þ :26 ð Þ :74

s2 ¼ ¼
200 ¼ :00186 þ 250
^p1^p2
n1 n2
A área de interesse sob a curva de ^p1 correspondente ^p2 é aquele à esquerda de 0,05. o
ao valor z é
:05 ð Þ :08 ¼
z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
:70
:00186p
Consultando a Tabela D, descobrimos que a área à esquerda de z ¼ :70 é 0,2420.&
EXERCÍCIOS
5.6.1 De acordo com o 2000 US Census Bureau [A-8], em 2000, 9,5 por cento das crianças no estado de Ohio não eram
cobertas por seguro de saúde privado ou governamental. No estado vizinho da Pensilvânia, 4,9% das crianças não
tinham cobertura de seguro saúde. Suponha que essas proporções sejam parâmetros para as populações infantis
dos respectivos estados. Se uma amostra aleatória de crianças de tamanho 100 for retirada da população de Ohio e
uma amostra aleatória independente de tamanho 120 for retirada da população da Pensilvânia, qual é a probabilidade
de que as amostras produzam uma diferença, ^p1 ^p2 de 0,09 ou mais?
5.6.2 No relatório citado no Exercício 5.6.1 [A-8], o Census Bureau afirmou que, para os americanos na faixa etária de 18 a
24 anos, 64,8% tinham seguro de saúde privado. Na faixa etária de 25 a 34 anos, o percentual foi de 72,1. Suponha
que essas porcentagens sejam os parâmetros populacionais nessas faixas etárias para os Estados Unidos. Suponha
que selecionamos uma amostra aleatória de 250 americanos da faixa etária de 18 a 24 anos e uma amostra aleatória
independente de 200 americanos da faixa etária de 25 a 34 anos; encontre a probabilidade de que ^p2
^p1 é inferior a 6 por cento.
5.6.3 A partir dos resultados de uma pesquisa realizada pelo Bureau of Labor Statistics dos EUA [A-9], estimou-se que 21 por
cento dos trabalhadores empregados no Nordeste participaram de programas de benefícios de saúde que incluíam
cuidados com a visão. A porcentagem no Sul foi de 13 por cento. Suponha que essas porcentagens sejam parâmetros
populacionais para as respectivas regiões dos EUA. Suponha que selecionamos uma amostra aleatória simples de
tamanho 120 trabalhadores do nordeste e uma amostra aleatória simples independente de 130 trabalhadores do sul.
Qual é a probabilidade de que a diferença entre as proporções da amostra, ^p1 ^p2, esteja entre 0,04 e 0,20?
5.7 RESUMO
Este capítulo trata de distribuições amostrais. O conceito de distribuição amostral é introduzido e as

seguintes distribuições amostrais importantes são abordadas:
1. A distribuição de uma única amostra média.

2. A distribuição da diferença entre duas médias amostrais.
3. A distribuição de uma proporção amostral.
4. A distribuição da diferença entre duas proporções amostrais.
Enfatizamos a importância deste material e instamos os leitores a se certificarem de que o

compreenderam antes de prosseguir para o próximo capítulo.
Nome do Número da Fórmula Fórmula
5.3.1 transformação z para a média da amostra Xmx

Z¼ ffiffiffi
s = np
5.4.1 transformação z para diferença m1 m2

Z ¼ X1 X ð Þ 2 ð
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
º
entre dois meios
s21 s22
þ
n1
n2 s
5.5.1 transformação z para proporção ^pp

Z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
de amostra pðÞ 1 p
nº
5.5.2 Correção de continuidade quando x < np x þ :5

p
n
Zc ¼ fffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
pq=np
5.5.3 Correção de continuidade quando x > np X þ :5

þp
n
Zc ¼ fffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
pq=np
5.6.1 transformação z para diferença ð ^p1 ^p2p1

ð p2
Þ Þ
Zc ¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
entre duas proporções p1 1 p1 ð Þ p2 1 p2 ð º

º
r n1 n2
Tecla de símbolo mi ¼ média da população i mx

¼ média da distribuição amostral se x ni ¼
tamanho da amostra para a amostra i da população i pi
¼ proporção da população i ^pi ¼ proporção da amostra
i da população i s2 ¼ variância da população i
eu
Xi ¼ média da amostra i da população iz ¼

variável aleatória normal padrão
1. O que é uma distribuição amostral?
2. Explique como uma distribuição amostral pode ser construída a partir de uma população finita.
3. Descreva a distribuição amostral da média amostral quando a amostragem for com reposição de um
população normalmente distribuída.
4. Explique o teorema do limite central.
5. Como a distribuição amostral da média amostral, quando a amostragem é sem reposição, difere da distribuição
amostral obtida quando a amostragem é com reposição?
6. Descreva a distribuição amostral da diferença entre duas médias amostrais.
7. Descreva a distribuição amostral da proporção da amostra quando amostras grandes são coletadas.
8. Descreva a distribuição amostral da diferença entre duas médias amostrais quando grandes amostras
são desenhados.
9. Explique o procedimento que você seguiria na construção da distribuição amostral da diferença

entre proporções amostrais com base em grandes amostras de populações finitas.
10. Suponha que se saiba que o tempo de resposta de indivíduos saudáveis a um determinado estímulo é uma variável
aleatória normalmente distribuída com média de 15 segundos e variância de 16. Qual é o
probabilidade de que uma amostra aleatória de 16 indivíduos tenha um tempo médio de resposta de 12 segundos
ou mais?
11. Janssen et al. [A-10] estudou americanos com 60 anos ou mais. Eles estimaram que o índice médio de massa corporal
de mulheres com mais de 60 anos com músculo esquelético normal é de 23,1 com um desvio padrão de 3,7.
Usando esses valores como a média populacional e o desvio padrão para mulheres acima de 60 anos com índice
muscular esquelético normal, encontre a probabilidade de que 45 mulheres selecionadas aleatoriamente nessa
faixa etária com índice muscular esquelético normal tenham um IMC médio maior que 25.
12. No estudo citado no Exercício de Revisão 11, os pesquisadores relataram que o IMC médio para homens com 60 anos
ou mais com índice muscular esquelético normal é de 24,7 com um desvio padrão de 3,3. Usando esses valores
como a média populacional e o desvio padrão, encontre a probabilidade de que 50 homens selecionados
aleatoriamente nessa faixa etária com índice muscular esquelético normal tenham um IMC médio menor que 24.
13. Usando as informações dos Exercícios de Revisão 11 e 12, encontre a probabilidade de que a diferença na média de
IMC para 45 mulheres e 50 homens selecionados independentemente e aleatoriamente das respectivas populações
exceda 3.
14. Nos resultados publicados por Wright et al. [A-2] com base nos dados do estudo NHANES de 1999–2000 mencionados
nos Exercícios 5.4.1 e 5.4.2, os investigadores relataram seus exames dos níveis de ferro. O nível médio de ferro
para mulheres de 20 a 39 anos foi de 13,7 mg com um desvio padrão estimado de 8,9 mg. Usando-os como valores
populacionais para mulheres de 20 a 39 anos, encontre a probabilidade de que uma amostra aleatória de 100
mulheres tenha um nível médio de ferro inferior a 12 mg.
15. Consulte o Exercício de revisão 14. O nível médio de ferro para homens entre 20 e 39 anos é de 17,9 mg com um
desvio padrão estimado de 10,9 mg. Usando 17,9 e 10,9 como parâmetros populacionais, encontre a probabilidade
de que uma amostra aleatória de 120 homens tenha um nível médio de ferro superior a 19 mg.
16. Usando as informações dos Exercícios de Revisão 14 e 15 e assumindo amostras aleatórias independentes de tamanho
100 e 120 para mulheres e homens, respectivamente, encontre a probabilidade de que a diferença nos níveis médios
de ferro da amostra seja maior que 5 mg.
17. Os resultados da Pesquisa Nacional de Saúde de 1999 divulgada em 2003 [A-7] mostraram que entre os adultos
americanos com 60 anos ou mais, 19% foram informados por um médico ou outro profissional de saúde que tinham
algum tipo de câncer. Se usarmos essa porcentagem para todos os adultos de 65 anos ou mais que vivem nos
Estados Unidos, qual é a probabilidade de que, entre 65 adultos escolhidos aleatoriamente, mais de 25% tenham
sido informados por seu médico ou algum outro profissional de saúde que eles têm câncer?
18. Consulte o Exercício de revisão 17. A taxa de câncer relatada para mulheres com 65 anos ou mais é de 17%. Usando
essa estimativa como a porcentagem real de todas as mulheres com 65 anos ou mais que foram informadas por um
profissional de saúde que têm câncer, encontre a probabilidade de que, se 220 mulheres forem selecionadas
aleatoriamente da população, mais de 20% tenham sido disseram que têm câncer.
19. Consulte o Exercício de revisão 17. A taxa de câncer para homens com 65 anos ou mais é de 23%. Use essa estimativa
como a porcentagem de todos os homens com 65 anos ou mais que foram informados por um profissional de saúde
que têm câncer. Encontre a probabilidade de que, entre 250 homens selecionados aleatoriamente, menos de 20%
tenham sido informados de que têm câncer.
20. Use as informações dos Exercícios de Revisão 18 e 19 para encontrar a probabilidade de que a diferença nas
porcentagens de câncer entre homens e mulheres seja inferior a 5% quando 220 mulheres e 250 homens com 65
anos ou mais são selecionados aleatoriamente.
21. Quantas amostras aleatórias simples (sem reposição) de tamanho 5 podem ser selecionadas de uma população
tamanho 10?
22. O NHANES de 1999–2000 [A-7] estima que, entre os adultos de 18 anos ou mais, 53% nunca fumaram. Suponha que
a proporção de adultos americanos que nunca fumaram seja de 0,53. Considere a distribuição amostral da proporção
amostral com base em amostras aleatórias simples de tamanho 110 extraídas dessa população. Qual é a forma
funcional da distribuição amostral?
23. Consulte o Exercício 22. Calcule a média e a variância da distribuição amostral.
24. Consulte o Exercício 22. Qual é a probabilidade de que uma única amostra aleatória simples de tamanho 110 extraída
dessa população produzirá uma proporção amostral menor que 0,50?
25. Em uma população de indivíduos que morreram de câncer de pulmão após exposição ao amianto, verificou-se que o
número médio de anos decorridos entre a exposição e a morte foi de 25. O desvio padrão foi de 7 anos. Considere
a distribuição amostral de médias amostrais com base em amostras de tamanho 35 extraídas dessa população.
Qual será a forma da distribuição amostral?
26. Consulte o Exercício 25. Qual será a média e a variância da distribuição amostral?
27. Consulte o Exercício 25. Qual é a probabilidade de que uma única amostra aleatória simples de tamanho 35 retirada
dessa população produza uma média entre 22 e 29?
28. Para cada uma das seguintes populações de medições, indique se a distribuição amostral da média amostral é
normalmente distribuída, aproximadamente normalmente distribuída ou não aproximadamente normalmente
distribuída quando calculada a partir de amostras de tamanho (A) 10, (B) 50 e (C) 200. (a) O logaritmo das razões
metabólicas. A população é normalmente distribuída. (b) Tônus vagal em repouso em adultos saudáveis. A
população é normalmente distribuída. (c) Ação da insulina em indivíduos obesos. A população não é normalmente
distribuída.
29. Para cada uma das seguintes situações de amostragem, indique se a distribuição amostral da
proporção da amostra pode ser aproximada por uma distribuição normal e explique por que ou não.
(a) p ¼ :50; n ¼ 8 (b) p ¼ :40; n ¼ 30

(c) p ¼ :10; n ¼ 30 (d) p ¼ :01; n ¼ 1000
(e) p ¼ :90; n ¼ 100 (f) p ¼ :05; n ¼ 150
REFERÊNCIAS
1. RICHARD J. LARSEN e MORRIS L. MARX, Uma Introdução à Estatística Matemática e Suas Aplicações, 2ª ed.,
Prentice-Hall, Englewood Cliffs, NJ, 1986.
2. JOHN A. RICE, Mathematical Statistics and Data Analysis, 2ª ed., Duxbury, Belmont, CA, 1995.
A-1. Terceira Pesquisa Nacional de Saúde e Nutrição, NHANES III (1988–94), Tabela 2. Centro Nacional de Estatísticas de Saúde, Divisão
de Serviços de Dados, Hyattsville, MD. Disponível em http://www.cdc.gov/nchs/about/major/nhanes/datatblelink.htm .
A-2. JACQUELINE D. WRIGHT, CHIA-YIH WANG, JOCELYN KENNEDY-STEPHENSON e R. BETHENE ERVIN , “Dietary Intake
of Ten Key Nutrients for Public Health, Estados Unidos: 1999–2000,” National Center for Health Statistics. Dados avançados
de estatísticas vitais e de saúde, nº 334 (2003).
A-3. CYNTHIA L. OGDEN, MARGARET D. CARROLL, BRIAN K. KIT e KATHERINE M. FLEGAL, “Prevalence of Obesity in the United
States, 2009–2010,” National Center for Health Statistics, Data Brief No. 82, http:/ /www.cdc.gov/nchs/data/databriefs/db82.pdf .
A-4. BLANCHE MIKHAIL, “Utilização de cuidados pré-natais entre mulheres afro-americanas de baixa renda”, Journal of
Community Health Nursing, 17 (2000), 235–246.
A-5. JAMES P. SMITH, RAJENDRA H. MEHTA, SUGATA K. DAS, THOMAS TSAI, DEAN J. KARAVITE, PAMELA L. RUSMAN,
DAVID BRUCKMAN e KIM A. EAGLE, “Effects of End-of-Month Admission on Length of Stay e qualidade do atendimento
entre pacientes internados com infarto do miocárdio,” American Journal of Medicine, 113 (2002), 288–293.
A-6. ROBYN GALLAGHER, SHARON MCKINLEY e KATHLEEN DRACUP, “Predictor's of Women's Attendance at Cardiac
Programas de reabilitação”, Progress in Cardiovascular Nursing, 18 (2003), 121–126.
A-7. JR PLEIS e R. COLES, “Resumo das Estatísticas de Saúde para Adultos dos EUA: Pesquisa Nacional de Entrevistas de Saúde, 1999,”
Centro Nacional de Estatísticas de Saúde. Estatísticas vitais e de saúde, 10 (212), (2003).
A-8. US Census Bureau, Current Population Reports, P60–215, conforme relatado em Statistical Abstract of the United States: 2002 (118ª
edição), US Bureau of the Census, Washington, DC, 2002, Table No. 137–138.
A-9. US Bureau of Labor Statistics, News, USDL 01–473, conforme relatado em Statistical Abstract of the United States: 2002 (118ª edição),
US Bureau of the Census, Washington, DC, 2002, Tabela nº 139.
A-10. IAN JANSSEN, STEVEN B. HEYMSFIELD e ROBERT ROSS, “Baixa massa muscular esquelética relativa (sacopenia) em
pessoas idosas está associada a comprometimento funcional e incapacidade física”, Journal of the American Geriatrics
Society, 50 (2002), 889–896.
CAPÍTULO 6
ESTIMATIVA
Este capítulo aborda a estimativa, um dos dois tipos de inferência estatística.

Conforme discutido em capítulos anteriores, as estatísticas, como médias e
variâncias, podem ser calculadas a partir de amostras retiradas de populações.
Essas estatísticas servem como estimativas dos parâmetros populacionais
correspondentes. Esperamos que essas estimativas difiram em algum valor dos parâmetros q
Este capítulo apresenta procedimentos de estimativa que levam em conta essas
diferenças, fornecendo assim uma base para procedimentos de inferência estatística
discutidos nos capítulos restantes do livro.
TÓPICOS
6.1 INTRODUÇÃO
6.2 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA POPULAÇÃO
6.3 A DISTRIBUIÇÃO t
6.4 INTERVALO DE CONFIANÇA PARA A DIFERENÇA ENTRE DUAS POPULAÇÕES

MEIOS
6.5 INTERVALO DE CONFIANÇA PARA UMA PROPORÇÃO DA POPULAÇÃO
6.6 INTERVALO DE CONFIANÇA PARA A DIFERENÇA ENTRE DUAS POPULAÇÕES

PROPORÇÕES
6.7 DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA ESTIMAR MEIOS
6.8 DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA ESTIMATIVA DE PROPORÇÕES
6.9 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA DE UM NORMALMENTE DISTRIBUÍDO

POPULAÇÃO
6.10 INTERVALO DE CONFIANÇA PARA A RAZÃO DAS VARIÂNCIAS DE DOIS

POPULAÇÕES NORMALMENTE DISTRIBUÍDAS
6.11 RESUMO
161
162 CAPÍTULO 6 ESTIMATIVA
Depois de estudar este capítulo, o aluno 1. entenderá a

importância e os princípios básicos da estimativa. 2. ser capaz de calcular estimativas
de intervalo para uma variedade de parâmetros. 3. ser capaz de interpretar um intervalo de
confiança de uma perspectiva prática e probabilística
ponto de vista.
4. entender as propriedades básicas e usos da distribuição t, distri qui-quadrado
butição e distribuição F.
6.1 INTRODUÇÃO
Chegamos agora a uma consideração de estimativa, a primeira das duas áreas gerais de inferência
estatística. A segunda área geral, teste de hipóteses, é examinada no próximo capítulo.
Aprendemos no Capítulo 1 que a estatística inferencial é definida da seguinte maneira.
DEFINIÇÃO
A inferência estatística é o procedimento pelo qual chegamos a uma conclusão sobre

uma população com base nas informações contidas em uma amostra extraída dessa
população.
O processo de estimação implica calcular, a partir dos dados de uma amostra, alguma estatística
que se oferece como uma aproximação do parâmetro correspondente da população da qual a amostra foi
extraída.
A lógica por trás da estimativa no campo das ciências da saúde baseia-se na suposição de que os
trabalhadores desse campo têm interesse nos parâmetros, como médias e proporções, de várias
populações. Se for esse o caso, há uma boa razão pela qual se deve confiar em procedimentos de
estimativa para obter informações sobre esses parâmetros. Muitas populações de interesse, embora
finitas, são tão grandes que um exame de 100% seria proibitivo do ponto de vista de custo.
Suponha que o administrador de um grande hospital esteja interessado na idade média dos
pacientes internados em seu hospital durante um determinado ano. Ele pode considerar muito caro
examinar os registros de todos os pacientes admitidos durante aquele ano em particular e,
consequentemente, optar por examinar uma amostra dos registros a partir da qual pode calcular uma
estimativa da idade média dos pacientes admitidos naquele ano.
Um clínico geral pode estar interessado em saber que proporção de um determinado tipo de
indivíduo, tratado com um determinado medicamento, sofre efeitos colaterais indesejáveis.
Sem dúvida, seu conceito de população consiste em todas as pessoas que já foram ou serão tratadas com
essa droga. Adiar uma conclusão até que toda a população tenha sido observada pode ter um efeito
adverso em sua prática.
Esses dois exemplos implicaram um interesse em estimar, respectivamente, uma média populacional
e uma proporção populacional. Outros parâmetros, cuja estimativa abordaremos neste capítulo, são a
diferença entre duas médias, a diferença entre duas proporções, a variância da população e a razão de
duas variâncias.
6.1 INTRODUÇÃO 163
Descobriremos que, para cada um dos parâmetros que discutimos, podemos calcular dois tipos de
estimativa: uma estimativa pontual e uma estimativa de intervalo.
DEFINIÇÃO
Uma estimativa pontual é um valor numérico único usado para estimar o

parâmetro populacional correspondente.
DEFINIÇÃO
Uma estimativa de intervalo consiste em dois valores numéricos que definem uma
faixa de valores que, com um grau de confiança especificado, provavelmente
inclui o parâmetro que está sendo estimado.
Esses conceitos serão desenvolvidos nas seções seguintes.
Escolhendo um Estimador Apropriado Observe que um único valor calculado foi referido como uma
estimativa. A regra que nos diz como calcular esse valor, ou estimativa, é chamada de estimador.
Os estimadores geralmente são apresentados como fórmulas. Por exemplo,
Pxi
x¼
n
é um estimador da média populacional, m. O único valor numérico que resulta da avaliação dessa
fórmula é chamado de estimativa do parâmetro m.
Em muitos casos, um parâmetro pode ser estimado por mais de um estimador. Por exemplo,
poderíamos usar a mediana da amostra para estimar a média da população. Como, então, decidimos
qual estimador usar para estimar um determinado parâmetro? A decisão é baseada em uma medida
objetiva ou conjunto de critérios que refletem alguma propriedade desejada de um estimador
particular. Quando medidos em relação a esses critérios, alguns estimadores são melhores que outros.
Um desses critérios é a propriedade de imparcialidade.
DEFINIÇÃO
Um estimador, digamos, T, do parâmetro u é considerado um estimador imparcial de u

se E(T) = u.
Lê-se E(T), “o valor esperado de T”. Para uma população finita, E(T) é obtido tomando o valor
médio de T calculado de todas as amostras possíveis de um determinado tamanho que podem ser
extraídas da população. Ou seja, E Tð Þ¼ mT . Para uma população infinita, E(T) é
definido em termos de cálculo.
No capítulo anterior, vimos que a média amostral, a proporção amostral, a diferença entre
duas médias amostrais e a diferença entre duas proporções amostrais são estimativas imparciais de
seus parâmetros correspondentes. Essa propriedade estava implícita quando se dizia que os
parâmetros eram as médias das respectivas distribuições amostrais. Por exemplo, como a média da
distribuição amostral de x é igual a m, sabemos que x é um estimador imparcial de m. Os outros
critérios de bons estimadores não
ser discutido neste livro. O leitor interessado os encontrará abordados em detalhes na maioria dos textos
de estatística matemática.
Populações amostradas e populações-alvo O pesquisador em saúde que usa procedimentos de inferência

estatística deve estar ciente da diferença entre dois tipos de população — a população amostrada e a
população-alvo.
DEFINIÇÃO
A população amostrada é a população da qual realmente se extrai uma amostra.
DEFINIÇÃO A
população-alvo é a população sobre a qual se deseja fazer uma inferência.
Essas duas populações podem ou não ser iguais. Os procedimentos de inferência estatística
permitem fazer inferências sobre populações amostradas (desde que métodos de amostragem adequados
tenham sido empregados). Somente quando a população-alvo e a população amostrada são iguais é
possível usar procedimentos de inferência estatística para chegar a conclusões sobre a população-alvo.
Se a população amostrada e a população-alvo forem diferentes, o pesquisador pode chegar a conclusões
sobre a população-alvo apenas com base em considerações não estatísticas.
Suponha, por exemplo, que um pesquisador deseja avaliar a eficácia de algum método para o
tratamento da artrite reumatóide. A população-alvo consiste em todos os pacientes que sofrem da doença.
Não é prático extrair uma amostra dessa população. O pesquisador pode, no entanto, selecionar uma
amostra de todos os pacientes com artrite reumatóide atendidos em alguma clínica específica.
Esses pacientes constituem a população amostrada e, se métodos de amostragem adequados forem
usados, inferências sobre essa população amostrada podem ser feitas com base nas informações da
amostra. Se o pesquisador deseja fazer inferências sobre todos os que sofrem de artrite reumatóide, ele
ou ela deve confiar em meios não estatísticos para fazê-lo. Talvez o pesquisador saiba que a população
amostrada é semelhante, com relação a todas as características importantes, à população-alvo. Ou seja,
o pesquisador pode saber que idade, sexo, gravidade da doença, duração da doença e assim por diante
são semelhantes em ambas as populações. E com base nesse conhecimento, o pesquisador pode estar
disposto a extrapolar suas descobertas para a população-alvo.
Em muitas situações, a população amostrada e a população-alvo são idênticas; quando este é o
caso, as inferências sobre a população-alvo são diretas. O pesquisador, no entanto, deve estar ciente de
que nem sempre é assim e não cair na armadilha de fazer inferências infundadas sobre uma população
diferente da amostrada.
Amostras aleatórias e não aleatórias Nos exemplos e exercícios deste livro, supomos que os dados
disponíveis para análise vieram de amostras aleatórias. A validade estrita dos procedimentos estatísticos
discutidos depende dessa suposição. Em muitos casos, em aplicações do mundo real, é impossível ou
impraticável usar amostras verdadeiramente aleatórias. Em experimentos com animais, por exemplo, os
pesquisadores geralmente usam quaisquer animais disponíveis de fornecedores ou de seus próprios
reprodutores. Se os pesquisadores tivessem que depender de
6.2 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA POPULAÇÃO 165
material selecionado aleatoriamente, muito poucas pesquisas desse tipo seriam realizadas. Novamente,
considerações não estatísticas devem desempenhar um papel no processo de generalização. Os
pesquisadores podem argumentar que as amostras realmente usadas são equivalentes a amostras
aleatórias simples, uma vez que não há razão para acreditar que o material realmente usado não seja
representativo da população sobre a qual as inferências são desejadas.
Em muitos projetos de pesquisa em saúde, são empregadas amostras de conveniência, em vez
de amostras aleatórias. Os pesquisadores podem ter que confiar em voluntários ou em assuntos
prontamente disponíveis, como alunos em suas aulas. As amostras obtidas de tais fontes são exemplos
de amostras de conveniência. Novamente, as generalizações devem ser feitas com base em
considerações não estatísticas. As consequências de tais generalizações, no entanto, podem ser úteis
ou podem variar de enganosas a desastrosas.
Em algumas situações é possível introduzir randomização em um experimento mesmo que os
sujeitos disponíveis não sejam selecionados aleatoriamente de uma população bem definida. Ao comparar
dois tratamentos, por exemplo, cada sujeito pode ser designado aleatoriamente para um ou outro dos
tratamentos. As inferências em tais casos se aplicam aos tratamentos e não aos sujeitos e, portanto, as
inferências são válidas.
6.2 INTERVALO DE CONFIANÇA PARA A MÉDIA

DE UMA POPULAÇÃO
Suponha que os pesquisadores desejem estimar a média de alguma população normalmente distribuída.
Eles extraem uma amostra aleatória de tamanho n da população e calculam x, que usam como uma
estimativa pontual de m. Embora esse estimador de m possua todas as qualidades de um bom estimador,
sabemos que, como a amostragem aleatória envolve inerentemente o acaso, não se pode esperar que x
seja igual a m.
Seria muito mais significativo, portanto, estimar m por um intervalo que
de alguma forma comunica informações sobre a provável magnitude de m.
Distribuições amostrais e estimativas Para obter uma estimativa por intervalo, devemos recorrer ao nosso
conhecimento de distribuições amostrais. No presente caso, como estamos preocupados com a média
amostral como um estimador da média populacional, devemos lembrar o que sabemos sobre a
distribuição amostral da média amostral.
No capítulo anterior, aprendemos que se a amostragem for de uma população normalmente
distribuída, a distribuição amostral da média amostral será normalmente distribuída com uma média mx
igual à média populacional m e uma variância s2 igual a s2=n. Poderíamos plotar a distribuição amostral
x se soubéssemos apenas onde
localizá-la no eixo x. Do nosso conhecimento de distribuições normais, em geral, sabemos ainda mais
sobre a distribuição de x neste caso. Sabemos, por exemplo, que independentemente de onde a
distribuição de x esteja localizada, aproximadamente 95% dos possíveis valores de x que constituem a
distribuição estão dentro de dois desvios padrão da média. Os dois pontos que estão a dois desvios
padrão da média são m 2sx e m + 2sx, de modo que o intervalo m 2sx conterá aproximadamente 95%
dos valores possíveis de x. Sabemos que m e, portanto, mx, são desconhecidos, mas podemos colocar
arbitrariamente a distribuição amostral de x no eixo x.
Como não sabemos o valor de m, a expressão m 2sx não realiza muita coisa. No entanto, temos
uma estimativa pontual de m, que é x. seria
(1 _ ÿ) = 0,95
ÿ/2 ÿ/2
2ÿx 2ÿx
ÿ x
x1
x2
x3
x4
x5
FIGURA 6.2.1 O intervalo de confiança de 95% para m.
útil construir um intervalo em torno dessa estimativa pontual de m? A resposta é sim. Suponha
que construímos intervalos sobre cada valor possível de x calculado a partir de todas as
amostras possíveis de tamanho n da população de interesse. Teríamos um grande número
de intervalos da forma x 2sx com larguras todas iguais à largura do intervalo em torno do m
desconhecido. Aproximadamente 95 por cento desses intervalos teriam centros caindo dentro
do intervalo 2sx em torno de m. Cada um dos intervalos cujos centros estão dentro de 2sx de
m conteria m. Esses conceitos são ilustrados na Figura 6.2.1, na qual vemos que x; x3 e x4
estão todos dentro do intervalo em torno de m e, conseqüentemente, os intervalos 2sx sobre
essas médias de amostra incluem o valor de m. As médias amostrais x2 e x5 não estão dentro
do intervalo 2sx sobre m, e os intervalos 2sx sobre eles não incluem m.
EXEMPLO 6.2.1
Suponha que um pesquisador, interessado em obter uma estimativa do nível médio de alguma
enzima em uma determinada população humana, pegue uma amostra de 10 indivíduos,
determine o nível da enzima em cada um e calcule uma média amostral de x ¼ 22. Suponha
ainda sabe-se que a variável de interesse tem distribuição aproximadamente normal com
variância de 45. Queremos estimar m.
Solução: Um intervalo de confiança aproximado de 95 por cento para m é dado por
x 2sx
ffiffiffiffiff
45
22 2
10 r
22 2ð2:1213Þ
17:76; 26:24 &
Componentes da estimativa de intervalo Vamos examinar a composição da estimativa de intervalo

construída no Exemplo 6.2.1. Ele contém em seu centro a estimativa pontual de m. O 2 reconhecemos
como um valor da distribuição normal padrão que nos diz em quantos erros padrão estão
aproximadamente 95% dos valores possíveis de x.
Este valor de z é referido como o coeficiente de confiabilidade. O último componente, sx, é o erro
padrão ou desvio padrão da distribuição amostral de x. Em geral, então, uma estimativa de intervalo
pode ser expressa da seguinte forma:
estimador ð coeficiente de confiabilidade Þ ð erro padrão Þ (6.2.1)
Em particular, quando a amostragem é de uma distribuição normal com variância conhecida, um

estimativa de intervalo para m pode ser expressa como
x zð Þ 1a=2 sx (6.2.2)
da área sob
Þ 1a=2
sua curva.
é o valor de z à esquerda do qual está 1 a=2 e à direita do qual está onde zð a=2
Interpretando Intervalos de Confiança Como interpretamos o intervalo dado pela Expressão 6.2.2? No
presente exemplo, onde o coeficiente de confiabilidade é igual a 2, dizemos que em amostragem
repetida aproximadamente 95% dos intervalos construídos pela Expressão 6.2.2 incluirão a média da
população. Essa interpretação é baseada na probabilidade de ocorrência de diferentes valores de x.
Podemos generalizar esta interpretação se designarmos a área total sob a curva de x que está fora do
intervalo m 2sx como a e a área dentro do intervalo como 1 a e dermos a seguinte interpretação
probabilística da Expressão 6.2.2.
Interpretação probabilística
Em amostragem repetida, de uma população normalmente distribuída com um desvio padrão
conhecido, 100 1ð Þ longo
a por cento
prazo,de todos os
a média intervalos da
populacional m. forma x zð Þ 1a=2 sx incluirão, a
A quantidade 1 a, neste caso 0,95, é chamada de coeficiente de confiança (ou nível de

confiança), e o intervalo x zð Þ 1a=2
Þ¼sx1éachamado
:95, o intervalo
de intervalo
é chamado
de confiança
de intervalo
para de
m. confiança
Quando ð
de 95% para m. No presente exemplo, dizemos que temos 95% de confiança de que a média da
população está entre 17,76 e 26,24. Isso é chamado de interpretação prática da Expressão 6.2.2.
Em geral, pode ser expresso da seguinte forma.
Interpretação prática
Quando a amostragem é de uma população normalmente distribuída com desvio padrão
conhecido, estamos 100 1ð ÞÞa1a=2
por cento
sx, contém
confiantes
a média
de que
populacional
o único intervalo
m. x zðcalculado,
No exemplo dado aqui, podemos preferir, em vez de 2, o valor mais exato de z, 1,96,
correspondente a um coeficiente de confiança de 0,95. Os pesquisadores podem usar qualquer
coeficiente de confiança que desejarem; os valores usados com mais frequência são 0,90, 0,95 e 0,99,
que têm fatores de confiabilidade associados, respectivamente, de 1,645, 1,96 e 2,58.
Precisão A quantidade obtida pela multiplicação do fator de confiabilidade pelo erro padrão da média é
chamada de precisão da estimativa. Essa quantidade também é chamada de margem de erro.
EXEMPLO 6.2.2
Um fisioterapeuta desejava estimar, com 99% de confiança, a força média máxima de um determinado
músculo em um determinado grupo de indivíduos. Ele está disposto a assumir que as pontuações de
força são aproximadamente distribuídas normalmente com uma variância de 144. Uma amostra de 15
indivíduos que participaram do experimento rendeu uma média de 84,3.
Solução: O valor z correspondente a um coeficiente de confiança de 0,99 é encontrado na Tabela D do

Apêndice como 2,58. Este é o nosso coeficiente de confiabilidade. O erro padrão é 15 p
ffiffiffiffiff
¼ 3:0984. Nosso intervalo de confiança de 99% para m, então, é sx ¼ 12=
84:3 2:58ð3:0984Þ
84:3 8:0
76:3; 92:3
Dizemos que temos 99% de confiança de que a média da população está entre 76,3 e
92,3, pois, em amostragem repetida, 99% de todos os intervalos que poderiam ser
construídos da maneira descrita incluiriam a média da população.
&
São bastante raras as situações em que a variável de interesse tem distribuição aproximadamente normal
com variância conhecida. O propósito dos exemplos anteriores, que assumiram que essas condições
ideais existiam, foi estabelecer o embasamento teórico para a construção de intervalos de confiança para
médias populacionais. Na maioria das situações práticas, ou as variáveis não são aproximadamente
distribuídas normalmente ou as variâncias populacionais não são conhecidas ou ambas. O Exemplo 6.2.3
e a Seção 6.3 explicam os procedimentos que estão disponíveis para uso em situações não ideais, mas
mais comuns.
Amostragem de populações não normais Conforme observado, nem sempre será possível ou prudente
assumir que a população de interesse é normalmente distribuída. Graças ao teorema do limite central,
isso não nos impedirá se formos capazes de selecionar uma amostra grande o suficiente. Aprendemos
que, para amostras grandes, a distribuição amostral de x é aproximadamente distribuída normalmente,
independentemente de como a população principal é distribuída.
EXEMPLO 6.2.3
A pontualidade dos pacientes no cumprimento das consultas é de interesse de uma equipe de pesquisa.
Em um estudo sobre o fluxo de pacientes nos consultórios de clínicos gerais, verificou-se que uma
amostra de 35 pacientes estava 17,2 minutos atrasada para as consultas, em média. Pesquisas anteriores
mostraram que o desvio padrão era de cerca de 8 minutos. A distribuição da população foi sentida como
não normal. Qual é o intervalo de confiança de 90% para m, a quantidade média real de atrasos em
compromissos?
Solução: Como o tamanho da amostra é bastante grande (maior que 30) e como o desvio padrão da população
é conhecido, utilizamos o teorema do limite central e assumimos que a distribuição amostral de
x é aproximadamente distribuída normalmente. Na Tabela D do Apêndice, descobrimos que o
coeficiente de confiabilidade correspondente a um coeficiente de confiança de 0,90 é cerca de
1,645, se interpolarmos. O 35 p ¼ 1:3522, de modo que nosso erro padrão de confiança de 90
ffiffiffiffiff
por cento é sx ¼ 8= intervalo para m é
17:2 1:645 1ð Þ :3522

17:2 2:2
15:00; 19:4 &
Frequentemente, quando a amostra é grande o suficiente para a aplicação do teorema do limite central, a
variância da população é desconhecida. Nesse caso, usamos a variância da amostra como um substituto para
a variância da população desconhecida na fórmula para construir um intervalo de confiança para a média da
população.
Análise de computador Quando os intervalos de confiança são desejados, muito tempo pode ser economizado
se usarmos um computador, que pode ser programado para construir intervalos a partir de dados brutos.
EXEMPLO 6.2.4
A seguir estão os valores de atividade (micromoles por minuto por grama de tecido) de uma determinada enzima
medida em tecido gástrico normal de 35 pacientes com carcinoma gástrico.
.360 1.189 .614 0,788 .273 2.464 0,571

1.827 .537 .374 .449 .262 .448 0,971
.372 0,898 .411 .348 1.925 0,550 0,622
.610 .319 .406 .413 0,767 0,385 0,674
.521 .603 .533 .662 1.177 .307 1.499
Desejamos usar o pacote de software de computador MINITAB para construir um intervalo de confiança de
95% para a média da população. Suponha que saibamos que a variância da população é 0,36.
Não é necessário assumir que a população amostrada de valores é normalmente distribuída, pois o tamanho da
amostra é suficientemente grande para a aplicação do teorema do limite central.
Solução: Inserimos os dados na Coluna 1 e procedemos conforme a Figura 6.2.2 . Essas

instruções informam ao computador que o fator de confiabilidade é z, que um intervalo de
confiança de 95% é desejado, que o desvio padrão da população é 0,6 e que os dados estão
na coluna 1. A saída nos diz que a média amostral é 0,718 , o desvio padrão da amostra é
0,511 e o erro padrão da média, 35 p ¼ :101. s= np é :6=
ffiffiffi
ffiffiffiffiff
&
Temos 95% de confiança de que a média populacional está entre 0,519 e 0,917. Intervalos de confiança
podem ser obtidos através do uso de muitos outros pacotes de software. Os usuários do SAS®, por exemplo,
podem querer usar a saída do PROC MEANS ou
PROC UNIVARIATE para construir intervalos de confiança.
Stat Estatísticas básicas 1-amostra z BTT > ZINTERVAL 95 .6 C1
Digite C1 em Amostras em Colunas.

Digite 0,6 em Desvio padrão. Clique em OK.
Saída:
Uma Amostra Z: C1
O desvio padrão assumido 0,600
Variável N Significar StDev SE Média 95,0% CI (0,519,

MicMoles 35 0,718 0,511 0,101 0,917)
FIGURA 6.2.2 Procedimento do MINITAB para construir um intervalo de confiança de 95% para
uma média populacional, Exemplo 6.2.4.
Estimativas alternativas de tendência central Conforme observado anteriormente, a média é sensível a valores
extremos - aqueles valores que se desviam consideravelmente da maioria das medições em um conjunto de
dados. Às vezes, eles são chamados de outliers. Também observamos anteriormente que a mediana, por não
ser tão sensível a medições extremas, às vezes é preferível à média como medida de tendência central quando
estão presentes outliers. Pela mesma razão, podemos preferir usar a mediana da amostra como um estimador
da mediana da população quando desejamos fazer uma inferência sobre a tendência central de uma população.
Não só podemos usar a mediana da amostra como uma estimativa pontual da mediana da população, mas
também podemos construir um intervalo de confiança para a mediana da população. A fórmula não é fornecida
aqui, mas pode ser encontrada no livro de Rice (1).
Estimadores de média aparada que são insensíveis a outliers são chamados de estimadores robustos. Outra
medida robusta e estimador de tendência central é a média aparada. Para um conjunto de dados de amostra
contendo n medições, calculamos a média aparada de 100% da seguinte forma:
1. Solicite as medições.
2. Descarte os 100% menores e os 100% maiores das medições.

O valor recomendado de a é algo entre 0,1 e 0,2.
3. Calcule a média aritmética das medições restantes.
Observe que a mediana pode ser considerada como uma média aparada de 50%.
EXERCÍCIOS
Para cada um dos exercícios a seguir, construa intervalos de confiança de 90, 95 e 99 por cento para
a média da população e estabeleça as interpretações práticas e probabilísticas de cada um. Indique
qual interpretação você acha que seria mais apropriada para usar ao discutir intervalos de confiança com
6.3 A DISTRIBUIÇÃO t 171
alguém que não tenha feito curso de estatística e explique o motivo de sua escolha. Explique por que os três
intervalos que você construiu não têm a mesma largura. Indique qual dos três intervalos você preferiria usar
como estimativa da média populacional e justifique sua escolha.
6.2.1. Desejamos estimar o número médio de batimentos cardíacos por minuto para uma determinada população. O
número médio de batimentos cardíacos por minuto para uma amostra de 49 indivíduos foi de 90. Suponha que
esses 49 pacientes constituam uma amostra aleatória e que a população seja normalmente distribuída com um
desvio padrão de 10.
6.2.2. Desejamos estimar o nível sérico médio de bilirrubina indireta de lactentes de 4 dias de idade. A média para uma
amostra de 16 lactentes foi de 5,98 mg/100 cc. Suponha que os níveis de bilirrubina em lactentes de 4 dias de
vida tenham uma distribuição aproximadamente normal com um desvio padrão de 3,5 mg/100 cc.
6.2.3. Em um estudo de internação realizado por vários hospitais cooperantes, uma amostra aleatória de 64 pacientes
com úlcera péptica foi selecionada de uma lista de todos os pacientes com úlcera péptica já internados nos
hospitais participantes e a duração da internação por internação foi determinada para cada um. O tempo médio
de internação encontrado foi de 8,25 dias. O desvio padrão da população é conhecido por ser de 3 dias.
6.2.4. Uma amostra de 100 homens adultos aparentemente normais, com 25 anos de idade, apresentava pressão arterial sistólica média de
125. Acredita-se que o desvio padrão da população seja 15.
6.2.5. Alguns estudos sobre a doença de Alzheimer (DA) mostraram aumento na produção de 14CO2 em pacientes com
a doença. Em um desses estudos, os seguintes valores de 14CO2 foram obtidos de 16 amostras de biópsia
neocortical de pacientes com DA.
1009 1280 1180 1255 1547 2352 1956 1080 1776 1767 1680 2050 1452
2857 3100 1621
Suponha que a população de tais valores seja normalmente distribuída com um desvio padrão de 350.
6.3 A DISTRIBUIÇÃO t
Na Seção 6.2, foi delineado um procedimento para construir um intervalo de confiança para
uma média populacional. O procedimento requer conhecimento da variância da população
da qual a amostra é extraída. Pode parecer um tanto estranho que alguém possa ter
conhecimento da variância populacional e não saber o valor da média populacional. De fato,
é comum, em situações como as apresentadas, que a variância da população, assim como a
média da população, seja desconhecida. Essa condição apresenta um problema com relação
à construção de intervalos de confiança. Embora, por exemplo, a estatística
xmz ¼
ffiffiffi
s=np
é normalmente distribuído quando a população é normalmente distribuída e é pelo menos

aproximadamente normalmente distribuído quando n é grande, independentemente da forma
funcional da população, não podemos fazer uso desse fato porque s é desconhecido. No
entanto, nem tudo está perdido, e a solução mais lógica para o problema é a seguida. Usamos
o desvio padrão amostral
2
s¼ xi x =ðÞ n 1
q XðÞ
para substituir s. Quando o tamanho da amostra é grande, digamos, maior que 30, nossa fé em s como uma
aproximação de s é geralmente substancial, e podemos estar adequadamente justificados em usar a teoria da
distribuição normal para construir um intervalo de confiança para a média da população. Nesse caso,
procedemos conforme instruído na Seção 6.2.
É quando temos amostras pequenas que se torna obrigatório encontrarmos um
procedimento alternativo para a construção de intervalos de confiança.
Como resultado do trabalho de Gosset (2), escrevendo sob o pseudônimo de “Student”, uma alternativa,
conhecida como distribuição t de Student, geralmente abreviada para distribuição t, está disponível para nós.
a quantidade
xmt ¼
ffiffiffi
(6.3.1)
nps=
segue essa distribuição.
Propriedades da Distribuição t A distribuição t tem as seguintes propriedades.
1. Tem uma média de 0.
2. É simétrico em relação à média.
3. Em geral, tem uma variância maior que 1, mas a variância se aproxima de 1 conforme o tamanho da
amostra aumenta. Para df > 2, a variância da distribuição t é df =ð Þ df 2 onde df são os graus de
liberdade. , t como ð Þ já
distribuição
Alternativamente, n1que
=ðaqui
Þ n 3df. ¼ n 1 para n > 3, podemos escrever a variância da
4. A variável t varia de 1 a þ1.
5. A distribuição t é, na verdade, uma família de distribuições, pois existe um . Nós

2
distribuição para cada valor de amostra de n 1, o divisor usado no cálculo lembra que n 1 é
referido como graus de liberdade. A Figura 6.3.1 mostra distribuições t correspondentes a vários valores
de graus de liberdade.
Graus de liberdade = 30
FIGURA 6.3.1 A distribuição t para diferentes valores de graus de liberdade.

6.3 A DISTRIBUIÇÃO t 173
Distribuição normal
t distribuição
FIGURA 6.3.2 Comparação da distribuição normal e distribuição t.
6. Em comparação com a distribuição normal, a distribuição t é menos pontiaguda no centro e tem caudas
mais grossas. A Figura 6.3.2 compara a distribuição t com a normal.
7. A distribuição t se aproxima da distribuição normal quando n 1 se aproxima do infinito.
A distribuição t, como a normal padrão, foi extensivamente tabulada. Uma dessas tabelas é dada como
Tabela E no Apêndice. Como veremos, devemos levar em consideração tanto o coeficiente de confiança
quanto os graus de liberdade ao usar a tabela da distribuição t.
Você pode usar o MINITAB para representar graficamente a distribuição t (para valores de graus de
liberdade especificados) e outras distribuições. Depois de designar o eixo horizontal seguindo as instruções
na caixa Set Patterned Data, escolha o caminho de menu Calc e depois Probability Distributions. Por fim,
clique na distribuição desejada e siga as instruções. Use a caixa de diálogo Plotar para plotar o gráfico.
Intervalos de confiança usando t O procedimento geral para construir intervalos de confiança não é afetado
por termos que usar a distribuição t em vez da distribuição normal padrão. Ainda fazemos uso da relação
expressa por
estimador ð Þ coeficiente de confiabilidade ð Þ erro padrão do estimador
O que é diferente é a fonte do coeficiente de confiabilidade. Agora é obtido da tabela da distribuição t em vez
da tabela da distribuição normal padrão. Para ser mais específico, quando a amostragem é de uma distribuição
normal cujo desvio padrão, s, é desconhecido, o intervalo de confiança de 100 1ð Þ a porcentagem para a
média da população,m, é dado por
s
x tð Þ 1a=2
ffiffiffi
(6.3.2)
np
Enfatizamos que um requisito para o uso estritamente válido da distribuição t é que a amostra deve ser
extraída de uma distribuição normal. A experiência tem mostrado, no entanto, que desvios moderados deste
requisito podem ser tolerados. Como consequência, a distribuição t é usada mesmo quando se sabe que a
população-mãe se desvia um pouco da normalidade. A maioria dos pesquisadores exige que uma suposição
de, pelo menos, uma distribuição populacional em forma de monte seja sustentável.
EXEMPLO 6.3.1
Maffulli et ai. (A-1) estudou a eficácia das terapias precoces de sustentação de peso e mobilização do
tornozelo após o reparo agudo de uma ruptura do tendão de Aquiles. Uma das variáveis
eles mediram após o tratamento foi a força isométrica do músculo gastrocsoleus. Em 19 sujeitos, a força
isométrica média do membro operado (em newtons) foi de 250,8 com desvio padrão de 130,9. Assumimos
que esses 19 pacientes constituem uma amostra aleatória de uma população de indivíduos semelhantes.
Desejamos usar esses dados de amostra para estimar para a população a força isométrica média após a
cirurgia.
Solução: Podemos usar a média da amostra, 250,8, como uma estimativa pontual da média da população,
mas, como o desvio padrão da população é desconhecido, devemos supor que a população
de valores seja pelo menos aproximadamente distribuída normalmente antes de construir
um intervalo de confiança para m . Vamos supor que tal suposição seja razoável e que um
intervalo de confiança de 95% seja desejado. Temos nosso estimador, x, e nosso erro
padrão é 19 p ¼ 30:0305. Precisamos agora encontrar a confiabilidade s= np ¼ 130:9=
ffiffiffi
ffiffiffiffiff
e nsob
1 ¼a18
curva
graus t coeficiente,
dede para
liberdade. o valorum
ser igualmente
Como de t associado
dividida
intervalo
entre aasum coeficiente
de confiança
duas de 95%dedeixa
confiança
extremidades, deárea
precisamos
0,05 da 0,95
do
valor de t à direita do qual está 0,025 da área. Localizamos no Apêndice Tabela E a coluna
intitulada t:975. Este é o valor de t à esquerda do qual fica 0,975 da área sob a curva. A área
à direita deste valor é igual ao 0,025 desejado. Agora localizamos o número 18 na coluna
dos graus de liberdade. O valor na interseção da linha rotulada como 18 e a coluna rotulada
t:975 é o t que buscamos. Esse valor de t, que é nosso coeficiente de confiabilidade, é
2,1009. Agora construímos nosso intervalo de confiança de 95% da seguinte maneira:
250:8 2:1009 30 ð Þ :0305

250:8 63:1
187:7; 313:9
&
Esse intervalo pode ser interpretado tanto do ponto de vista probabilístico quanto do ponto de vista prático.
Temos 95% de confiança de que a média real da população, m, está entre 187,7 e 313,9 porque, em
amostragem repetida, 95% dos intervalos construídos da mesma maneira incluirão m.
Decidindo entre z e t Quando construímos um intervalo de confiança para a média de uma população,
devemos decidir se usaremos um valor de z ou um valor de t como fator de confiabilidade. Para fazer uma
escolha apropriada, devemos considerar o tamanho da amostra, se a população amostrada é normalmente
distribuída e se a variância da população é conhecida. A Figura 6.3.3 fornece um fluxograma que pode ser
usado para decidir rapidamente se o fator de confiabilidade deve ser z ou t.
Análise de computador Se você deseja que o MINITAB construa um intervalo de confiança para uma média
populacional quando a estatística t é o fator de confiabilidade apropriado, o comando é TINTERVAL. No
Windows, escolha 1-Sample t nas Estatísticas básicas
cardápio.
EXERCÍCIOS 175
População
Sim normalmente Não
distribuída?
Tamanho da Tamanho da
Sim amostra Não Sim amostra Não
ampla? ampla?
Variância Variância Variância Variância

Sim populacional Não Sim populacional Não Sim populacional Não Sim populacional Não
normalmente
distribuída
População
conhecida? conhecida? conhecida? conhecida?
z t z t z z * *
ou O teorema do limite central se aplica
FIGURA 6.3.3 Fluxograma para uso na decisão entre z e t ao fazer inferências sobre médias
populacionais. (Use um procedimento não paramétrico. Consulte o Capítulo 13.)
EXERCÍCIOS
6.3.1. Use a distribuição t para encontrar o fator de confiabilidade para um intervalo de confiança com base no seguinte
coeficientes de confiança e tamanhos de amostra:
abcd
Coeficiente de confiança 0,95 0,99 0,90 0,95
Tamanho da amostra 15 24 8 30
6.3.2. Em um estudo sobre os efeitos da doença de Alzheimer precoce na memória não declarativa, Reber et al. (A-2)
usou o Teste de Fluência de Categoria para estabelecer persistência de linha de base e memória semântica
e habilidades de linguagem. Os oito indivíduos da amostra tiveram pontuações no Teste de Fluência de
Categoria de 11, 10, 6, 3, 11, 10, 9, 11. Suponha que os oito indivíduos constituam uma amostra aleatória
simples de uma população normalmente distribuída de indivíduos semelhantes com doença de Alzheimer
inicial . (a) Qual é a estimativa pontual da média da população? (b) Qual é o desvio padrão da amostra? (c)
Qual é o erro padrão estimado da média amostral? (d) Construa um intervalo de confiança de 95 por cento
para a pontuação média da população no teste de fluência da categoria. (e) Qual é a precisão da estimativa?
(f) Enuncie a interpretação probabilística do intervalo de confiança que você construiu. (g) Declare a
interpretação prática do intervalo de confiança que você construiu.
6.3.3. Pedroletti et ai. (A-3) relataram a taxa máxima de difusão de óxido nítrico em uma amostra de 15
escolares asmáticos e 15 controles como erro padrão médio da média. Para crianças asmáticas, eles
relataram 3:5 0:4 nL=s (nanolitros por segundo) e para indivíduos de controle relataram 0:7:1 nL=s.
Para cada grupo, determine o seguinte: (a) Qual foi o
desvio padrão da amostra? (b) Qual é o intervalo de confiança
de 95% para a taxa média máxima de difusão de óxido nítrico da população? (c) Quais suposições são necessárias para a
validade do intervalo de confiança que você construiu? (d) Quais são as interpretações práticas e probabilísticas do intervalo que
você construiu? (e) Qual interpretação seria mais apropriada para usar ao discutir intervalos de confiança com alguém que não
teve um curso de estatística? Exponha as razões de sua escolha. (f) Se você fosse construir um intervalo de confiança de 90%
para a média da população a partir das informações fornecidas aqui, o intervalo seria mais largo ou mais estreito do que o intervalo
de confiança de 95%? Explique sua resposta sem realmente construir o intervalo. (g) Se você fosse construir um intervalo de
confiança de 99% para a média da população a partir das informações fornecidas aqui, o intervalo seria mais largo ou mais
estreito do que o intervalo de confiança de 95%? Explique sua resposta sem realmente construir o intervalo.
6.3.4. A preocupação de um estudo de Beynnon et al. (A-4) eram nove indivíduos com lesões crônicas do ligamento cruzado anterior (LCA).
Uma das variáveis de interesse foi a frouxidão do anteroposterior, onde valores maiores indicam mais instabilidade do joelho. Os
pesquisadores descobriram que entre os indivíduos com joelhos deficientes no LCA, o valor médio de frouxidão foi de 17,4 mm
com um desvio padrão de 4,3 mm.
(a) Qual é o erro padrão estimado da média? (b) Construa o intervalo de
confiança de 99% para a média da população da qual se pode presumir que os nove sujeitos sejam uma amostra aleatória. (c)
Qual é a precisão da estimativa? (d) Quais suposições são necessárias para a validade do intervalo de confiança que você
construiu?
6.3.5. Uma amostra de 16 meninas de dez anos de idade tinha um peso médio de 71,5 e um desvio padrão de 12 libras,
respectivamente. Assumindo normalidade, encontre os intervalos de confiança de 90, 95 e 99 por cento para m.
6.3.6. Os sujeitos de um estudo de Dugoff et al. (A-5) foram 10 internos de obstetrícia e ginecologia no Centro de Ciências da Saúde da
Universidade do Colorado. Os pesquisadores queriam avaliar a competência na realização de exames clínicos de mama. Uma
das medições iniciais foi o número de tais exames realizados. Os dados a seguir fornecem o número de exames de mama
realizados para esta amostra de 10 internos.
Número do estagiário Nº de exames de mama realizados
1 30
2 40
3 8
4 20
Fonte: Lorraine Dugoff, Mauritha R.
5 26
Everett, Louis Vontver e Gwyn E.
6 35 Barley, “Avaliação das Habilidades de Exame
7 35 Pélvico e de Mama de Estagiários em
8 20 Obstetrics and Gynecology and Internal
9 25 Medicine,” American Journal of Obstetrics and
10 20 Gynecology, 189 (2003), 655–658.
6.4 INTERVALO DE CONFIANÇA PARA A DIFERENÇA ENTRE DUAS MÉDIAS DA POPULAÇÃO 177
Construa um intervalo de confiança de 95 por cento para a média da população da qual se pode
presumir que os sujeitos do estudo foram retirados.
6.4 INTERVALO DE CONFIANÇA PARA A DIFERENÇA

ENTRE DUAS MÉDIAS DE POPULAÇÃO
Às vezes surgem casos em que estamos interessados em estimar a diferença entre duas
médias populacionais. De cada uma das populações é extraída uma amostra aleatória
independente e, a partir dos dados de cada uma , são calculadas as médias amostrais x1 e
x2, respectivamente. Aprendemos no capítulo anterior que o estimador x1 x2 produz uma
estimativa imparcial de m1 m2, a diferença entre as médias da população. A variância do
estimador é s2 1=n1 þ s2 2=n2 . Também sabemos do Capítulo 5 que, dependendo das
condições, a distribuição amostral de x1 x2 pode ser, pelo menos, aproximadamente distribuída
normalmente, de modo que, em muitos casos, fazemos uso da teoria relevante para
distribuições normais para calcular um intervalo de confiança para m1 m2. Quando as
variâncias populacionais são
Þ um intervalo deconhecidas, o 100 1ðpara m1 m2 é dado por
confiança percentual
s21 s2 þ 2
ðz1a=2
Þ x1 x2 (6.4.1)
n2 n1
s
Um exame de um intervalo de confiança para a diferença entre as médias populacionais fornece informações
úteis para decidir se é provável ou não que as duas médias populacionais sejam iguais. Quando o intervalo
construído não inclui zero, dizemos que o intervalo fornece evidências de que as duas médias populacionais
não são iguais. Quando o intervalo inclui zero, dizemos que as médias populacionais podem ser iguais.
Vamos ilustrar um caso em que a amostragem é das distribuições normais.
EXEMPLO 6.4.1
Uma equipe de pesquisa está interessada na diferença entre os níveis séricos de ácido úrico em
pacientes com e sem síndrome de Down. Em um grande hospital para o tratamento de deficientes
mentais, uma amostra de 12 indivíduos com síndrome de Down rendeu uma média de x1 ¼ 4:5
mg=100 ml. Em um hospital geral, uma amostra de 15 indivíduos normais da mesma idade e sexo
apresentou um valor médio de x2 ¼ 3:4. Se for razoável assumir que as duas populações de valores
são normalmente distribuídas com variâncias iguais a 1 e 1,5, encontre o intervalo de confiança de
95 por cento para m1 m2.
Solução: Para uma estimativa pontual de m1 m2, usamos x1 x2 ¼ 4:5 3:4 ¼ 1:1. O coeficiente
de confiabilidade correspondente a 0,95 é encontrado na Tabela D do Apêndice
como 1,96. O erro padrão é
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
s21 s2 þ 2 1 1:5
sx1x2 ¼
¼
þ ¼ :4282
15 12
r
n2 n1
s
O intervalo de confiança de 95%, então, é
1:1 1:96ð Þ :4282

1:1:84
ð:26; 1:94Þ
Dizemos que temos 95% de confiança de que a verdadeira diferença, m1 m2,

está em algum lugar entre 0,26 e 1,94 porque, na amostragem repetida, 95% dos
intervalos construídos dessa maneira incluiriam a diferença entre as médias
verdadeiras.
Como o intervalo não inclui zero, concluímos que as duas médias populacionais
não são iguais. &
Amostragem de populações não normais A construção de um intervalo de confiança para a

diferença entre duas médias populacionais quando a amostragem é de populações não normais
ocorre da mesma maneira que no Exemplo 6.4.1 se os tamanhos de amostra n1 e n2 forem grandes.
Novamente, isso é resultado do teorema do limite central. Se as variâncias populacionais forem
desconhecidas, usamos as variâncias amostrais para estimá-las.
EXEMPLO 6.4.2
Apesar do conhecimento comum dos efeitos adversos de fazê-lo, muitas mulheres continuam a
fumar durante a gravidez. Mayhew et ai. (A-6) examinou a eficácia de um programa de cessação
do tabagismo para mulheres grávidas. O número médio de cigarros fumados diariamente no final
do programa pelas 328 mulheres que completaram o programa foi de 4,3 com desvio padrão de
5,22. Entre 64 mulheres que não completaram o programa, a média de cigarros fumados por dia ao
final do programa foi de 13 com desvio padrão de 8,97. Desejamos construir um intervalo de
confiança de 99% para a diferença entre as médias das populações das quais se pode presumir
que as amostras foram selecionadas.
Solução: Não há informações sobre a forma de distribuição dos cigarros fumados por dia. Como
nossos tamanhos de amostra são grandes, no entanto, o teorema do limite central
nos garante que a distribuição amostral da diferença entre as médias amostrais será
aproximadamente distribuída normalmente, mesmo que a distribuição da variável
nas populações não seja normalmente distribuída.
Podemos usar esse fato como justificativa para usar a estatística z como fator de
confiabilidade na construção de nosso intervalo de confiança. Além disso, como os
desvios padrão da população não são fornecidos, usaremos os desvios padrão da
amostra para estimá-los. A estimativa pontual para a diferença entre as médias
populacionais é a diferença entre as médias amostrais, 4:3 13:0 ¼
8:7. Na Tabela D do Apêndice, descobrimos que o fator de confiabilidade é 2,58.
O erro padrão estimado é
5:222 8:972 ¼
sx1x2 ¼ 1:1577 þ
s 328 64
Pela Equação 6.4.1, nosso intervalo de confiança de 99% para a diferença entre as médias
populacionais é 8:7 2:58 1ð Þ :1577 ð11:7; 5:7Þ
Estamos 99% confiantes de que o número médio de cigarros fumados por dia para mulheres
que completam o programa é entre 5,7 e 11,7 menor do que a média para mulheres que não
concluem o programa. &
A distribuição t e a diferença entre médias Quando as variâncias populacionais são desconhecidas e desejamos
estimar a diferença entre duas médias populacionais com um intervalo de confiança, podemos usar a distribuição
t como fonte do fator de confiabilidade se certas suposições forem atendidas. Devemos saber, ou estar dispostos
a supor, que as duas populações amostradas são normalmente distribuídas. No que diz respeito às variâncias
populacionais, distinguimos duas situações: (1) a situação em que as variâncias populacionais são iguais e (2)
a situação em que não são iguais. Vamos considerar cada situação separadamente.
Variâncias populacionais iguais Se a suposição de variâncias populacionais iguais for justificada, as duas
variâncias amostrais que calculamos a partir de nossas duas amostras independentes podem ser consideradas
como estimativas da mesma quantidade, a variância comum. Parece lógico, então, que de alguma forma
devemos capitalizar isso em nossa análise. Fazemos exatamente isso e obtemos uma estimativa combinada da
variância comum. Essa estimativa agrupada é obtida calculando a média ponderada das duas variâncias de
amostra. Cada variância da amostra é ponderada por seus graus de liberdade. Se os tamanhos das amostras
forem iguais, essa média ponderada é a média aritmética das duas variâncias da amostra. Se os dois tamanhos
de amostra forem desiguais, a média ponderada aproveita as informações adicionais fornecidas pela amostra
maior. A estimativa combinada é dada pela fórmula
¼
n1þ1n2
n1 s22n21 1 s2 ð Þ þ ð Þ2
2
sp
(6.4.2)
O erro padrão da estimativa, então, é dado por

s2 s2
p p
sx1x2 ¼ º (6.4.3)
n2n1
s
e o 100 1ð Þ um intervalo de confiança percentual para m1 m2 é dado por

s2 s2
p
ðtðÞÞx11a=2
x2 pþ _ (6.4.4)
n2n1
s
O número de graus de liberdade usados na determinação do valor de t a ser usado na construção do intervalo
é n1 þ n2 2, o denominador da Equação 6.4.2. Interpretamos esse intervalo da maneira usual.
Métodos que podem ser usados para chegar a uma decisão sobre a igualdade da população
as variações são discutidas nas Seções 6.10 e 7.8.
EXEMPLO 6.4.3
O objetivo do estudo de Granholm et al. (A-7) foi determinar a eficácia de um programa integrado de
tratamento ambulatorial de diagnóstico duplo para indivíduos com doenças mentais. Os autores
estavam abordando o problema do abuso de substâncias entre pessoas com transtornos mentais
graves. Uma revisão retrospectiva de prontuários foi realizada em 50 encaminhamentos consecutivos
de pacientes para o programa de abuso de substâncias/doenças mentais no VA San Diego
Healthcare System. Uma das variáveis de resultado examinadas foi o número de dias de internação
por transtorno psiquiátrico durante o ano seguinte ao término do programa. Entre 18 indivíduos com
esquizofrenia, o número médio de dias de tratamento foi de 4,7 com um desvio padrão de 9,3. Para
10 indivíduos com transtorno bipolar, o número médio de dias de tratamento de transtorno psiquiátrico
foi de 8,8 com um desvio padrão de 11,5. Desejamos construir um intervalo de confiança de 95%
para a diferença entre as médias das populações representadas por essas duas amostras.
Solução: Primeiro, usamos a Equação 6.4.2 para calcular a estimativa combinada da variância
comum da população.
2
10
Þ118ð 1Þ9:32
11:5þ18
ð ðþ Þ
10 2
2 ¼ ¼ 102:33
sp
Quando entramos na Tabela E do Apêndice com 18 þ 10 2 ¼ 26 graus de liberdade

e um nível de confiança desejado de 0,95, descobrimos que o fator de confiabilidade
é 2,0555. Pela Expressão 6.4.4, calculamos o intervalo de confiança de 95 por cento
para a diferença entre as médias populacionais da seguinte forma:
102:33 102:33
ð2:0555
Þ 4:7 8:8 þ
r 18 10
4:1 8:20
ð12.3, 4.1Þ
Temos 95% de confiança de que a diferença entre as médias populacionais está

entre 12:3 e 4,10. Podemos dizer isso porque sabemos que, se repetíssemos o
estudo muitas e muitas vezes e calculássemos os intervalos de confiança da mesma
maneira, cerca de 95% dos intervalos incluiriam a diferença entre as médias
populacionais.
Como o intervalo inclui zero, concluímos que as médias populacionais podem
ser iguais. &
Variâncias populacionais não iguais Quando não é possível concluir que as variâncias de duas
populações de interesse são iguais, mesmo que as duas populações possam ser consideradas
normalmente distribuídas, não é apropriado usar a distribuição t como acabamos de esboçar na
construção de intervalos de confiança .
Como regra prática em problemas aplicados, pode-se desejar assumir a desigualdade de
variâncias se a razão da maior para a menor variância exceder 2; no entanto, um teste mais formal é
descrito na Seção 6.10.
Uma solução para o problema de variâncias desiguais foi proposta por Behrens (3) e posteriormente
verificada e generalizada por Fisher (4,5). Soluções também foram propostas por Neyman (6), Scheffe (7,8) e
Welch (9,10). O problema é discutido em detalhes por Cochran (11).
O problema gira em torno do fato de que a quantidade
x1 x2
ð º ð Þ m1 m2
s2
p p
s2 þ
n2 n1
s
não segue uma distribuição com n1 þ n2 2 graus de liberdade quando as variâncias populacionais não são
iguais. Conseqüentemente, a distribuição t não pode ser usada da maneira usual para obter o fator de
confiabilidade do intervalo de confiança da diferença entre as médias de duas populações com variâncias
desiguais. A solução proposta por Cochran consiste em calcular o fator de confiabilidade, t
0
pela seguinte fórmula: 1a=2,
w1t1 þ w2t2
0 ¼
(6.4.5)
t 1a=2
w1 þ w2
onde w1 ¼ s2 1=n1; w2 ¼ s2 2=n2; t1 ¼ t1a=2 para n1 1 graus de liberdade, e t2 ¼ t1a=2 para n2 1 graus de
liberdade. Um intervalo de confiança aproximado de 100 1ð Þ a por cento para m1 m2 é dado por
0 1 s2
2
ðt Þ
ðÞx11a=2
x2 s2 þ (6.4.6)
n2 n1
s
Ajustes no coeficiente de confiabilidade também podem ser feitos reduzindo o número de graus de liberdade em
vez de modificar t da maneira que acabamos de demonstrar. Muitos programas de computador calculam um
coeficiente de confiabilidade ajustado dessa maneira.
EXEMPLO 6.4.4
Vamos reexaminar os dados apresentados no Exemplo 6.4.3 do estudo de Granholm et al.

(A-7). Lembre-se de que entre os 18 indivíduos com esquizofrenia, o número médio de dias de tratamento foi de
4,7 com um desvio padrão de 9,3. No grupo de tratamento de transtorno bipolar de 10 indivíduos, o número
médio de dias de tratamento de transtorno psiquiátrico foi de 8,8 com um desvio padrão de 11,5. Assumimos
que as duas populações de número de dias de transtorno psiquiátrico são aproximadamente normalmente
distribuídas. Agora vamos supor, no entanto, que as duas variâncias populacionais não são iguais. Desejamos
construir um intervalo de confiança de 95% para a diferença entre as médias das duas populações representadas
pelas amostras.
0
Solução: Usaremos t conforme encontrado na Equação 6.4.5 para o fator de confiabilidade. A
referência ao Apêndice Tabela E mostra que com 17 graus de liberdade e 1 :05=2 ¼ :975; t1 ¼
2:1098. Da mesma forma, com 9 graus de liberdade e
População
Sim normalmente Não
distribuída?
Tamanhos Tamanhos
Sim de amostra Não Sim de amostra Não
grandes? grandes?
População População População População

Sim variações Não Sim variações Não Sim variações Não Sim variações Não
conhecidas? conhecidas? conhecidas? conhecidas?
Sim =? Não Sim = ? Não Sim = ? Não Sim = ? Não Sim = ? Não Sim = ? Não Sim = ? não sim = ? Não
z z t t' z zt t' z z z t' * ** *
ou ou
O teorema do limite central se aplica
z z
FIGURA 6.4.1 Fluxograma para uso ao decidir se o fator de confiabilidade deve ser z, t ou t0 ao fazer
inferências sobre a diferença entre duas médias populacionais. (Use um procedimento não paramétrico.
Consulte o Capítulo 13.)
1 :05=2 ¼ :975; t2 ¼ 2:2622. Nós agora calculamos
9:32=18 ð 11:52
2:2622=10
¼ 2:2216
ð Þþ 2:1098
9:32=18
Þ þ 11:52
0t ¼ =10
Pela Expressão 6.4.6, construímos agora o intervalo de confiança de 95% para a

diferença entre as duas médias populacionais.
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
9:32 11:52
ð2:2216
Þ 4:7 8:8 þ
10 r
18 ð Þ 4:7 8:8
:246175
2:2216 4ð Þ
13:5; 5:3
Como o intervalo inclui zero, concluímos que as duas médias populacionais podem
ser iguais.
Um exemplo desse tipo de cálculo usando o programa R, que usa a
aproximação de Welch para o problema de variâncias desiguais, é fornecido na
Figura 6.4.2. Observe que há uma pequena diferença nos pontos finais do intervalo.
&
Ao construir um intervalo de confiança para a diferença entre duas médias populacionais,

pode-se usar a Figura 6.4.1 para decidir rapidamente se o fator de confiabilidade deve ser z, t ou t
0
.
EXERCÍCIOS 183
Código R:
> tsum.test(média.x ¼ 4,7, sx ¼ 9,3, nx ¼ 18, média.y ¼ 8,8, sy ¼ 11,5, ny ¼ 10, alternativa ¼ “dois lados”, mu ¼ 0,
var.igual ¼ FALSO , nível conf. ¼ 0,95)
R Saída:
Teste t de duas amostras modificado de Welch
dados: x e y resumidos
t ¼ 0,9656, df ¼ 15,635, valor p ¼ 0,349
hipótese alternativa: a verdadeira diferença nas médias não é igual a 0
Intervalo de confiança de 95%:

13,118585 4,918585
estimativas de amostra:
média de x média de y 4,7
8,8
FIGURA 6.4.2 Cálculo de exemplo do Programa R para o intervalo de confiança entre duas médias
assumindo variâncias desiguais usando os dados do Exemplo 6.4.4.
EXERCÍCIOS
Para cada um dos exercícios a seguir, construa intervalos de confiança de 90, 95 e 99 por cento para a diferença entre as
médias populacionais. Quando apropriado, indique as suposições que tornam seu método válido. Declare as interpretações
práticas e probabilísticas de cada intervalo que você construir.
Considere as variáveis em consideração em cada exercício e indique o uso que você acha que os pesquisadores podem fazer
de seus resultados.
6.4.1. Iannelo et al. (A-8) realizou um estudo que examinou as concentrações de ácidos graxos livres em 18 indivíduos magros e 11
indivíduos obesos. Os magros tiveram nível médio de 299 mEq/L com erro padrão de média de 30, enquanto os obesos tiveram
média de 744 mEq/L com erro padrão de média de 62.
6.4.2. Chan et ai. (A-9) desenvolveu um questionário para avaliar o conhecimento sobre o câncer de próstata. Houve um total de 36
perguntas para as quais os entrevistados poderiam responder “concordo”, “discordo” ou “não sei”. As pontuações podem variar
de 0 a 36. A pontuação média para os participantes caucasianos do estudo foi de 20,6 com um desvio padrão de 5,8, enquanto
a pontuação média para homens afro-americanos foi de 17,4 com um desvio padrão de 5,8. O número de participantes
caucasianos do estudo foi de 185 e o número de afro-americanos foi de 86.
6.4.3. Os objetivos do estudo de van Vollenhoven et al. (A-10) examinaram a eficácia do etanercepte sozinho e do etanercepte em
combinação com o metotrexato no tratamento da artrite reumatoide. Os pesquisadores realizaram um estudo retrospectivo
usando dados do banco de dados STURE, que coleta dados de eficácia e segurança para todos os pacientes que iniciam
tratamentos biológicos nos principais hospitais de Estocolmo, na Suécia. Os pesquisadores identificaram 40 indivíduos que
receberam apenas etanercepte e 57 indivíduos que receberam etanercepte com metotrexato. Usando uma escala analógica
visual de 100 mm (quanto maior o valor, maior a dor), os pesquisadores descobriram que, após 3 meses de tratamento, o
escore médio de dor foi de 36,4 com um erro padrão da média de 5,5 para indivíduos que tomaram apenas etanercepte. Na
amostra que recebeu etanercept mais metotrexato, o escore médio foi de 30,5 com erro padrão da média de 4,6.
6.4.4. O objetivo do estudo de Nozawa et al. (A-11) foi determinar a eficácia da fixação com fio segmentar em atletas com espondilólise.
Entre 1993 e 2000, 20 atletas (6 mulheres e 14 homens)
com espondilólise lombar foram tratados cirurgicamente com a técnica. A tabela a seguir fornece a pontuação de avaliação da
Associação Ortopédica Japonesa (JOA) para síndrome de dor lombar para homens e mulheres antes da cirurgia. A pontuação
mais baixa indica menos dor.
Gênero pontuações JOA
Fêmea 14, 13, 24, 21, 20, 21 21,

Macho 26, 24, 24, 22, 23, 18, 24, 13, 22, 25, 23, 21, 25
Fonte: Satoshi Nozawa, Katsuji Shimizu, Kei Miyamoto e Mizuo

Tanaka, “Repair of Pars Interarticularis Defect by Segmental Wire
Fixation in Young Athletes with Spondylolysis,” American Journal of
Sports Medicine, 31 (2003), 359–364.
6.4.5. Krantz et ai. (A-12) investigou os efeitos relacionados à dose de metadona em indivíduos com torsade de pointes, uma taquicardia
ventricular polimórfica. No estudo de 17 indivíduos, nove estavam sendo tratados com metadona para dependência de opiáceos
e oito para dor crônica. A dose diária média de metadona no grupo de dependência de opiáceos foi de 541 mg/dia com desvio
padrão de 156, enquanto o grupo de dor crônica recebeu dose média de 269 mg/dia com desvio padrão de 316.
6.4.6. Medições de diâmetro transversal nos corações de machos e fêmeas adultos deram o seguinte
resultados:
Grupo Tamanho da amostra x (cm) s (cm)
machos 12 13.21 1.05

fêmeas 9 11h00 1.01
Assuma populações normalmente distribuídas com variâncias iguais.
6.4.7. Vinte e quatro animais experimentais com deficiência de vitamina D foram divididos igualmente em dois grupos.
O grupo 1 recebeu tratamento que consistia em uma dieta que fornecia vitamina D. O segundo grupo não foi tratado. No final do
período experimental, as determinações de cálcio sérico foram feitas com os seguintes resultados:
Grupo tratado: x ¼ 11:1 mg=100 ml;s ¼ 1:5

Grupo não tratado: x ¼ 7:8 mg=100 ml;s ¼ 2:0
Assuma populações normalmente distribuídas com variâncias iguais.
6.4.8. Dois grupos de crianças receberam testes de acuidade visual. O grupo 1 foi composto por 11 crianças atendidas por médicos
particulares. A pontuação média desse grupo foi de 26 com desvio padrão de 5. O grupo 2 foi composto por 14 crianças
atendidas pela secretaria de saúde e teve pontuação média de 21 com desvio padrão de 6. Suponha populações normalmente
distribuídas com variâncias iguais.
6.4.9. O tempo médio de internação de uma amostra de 20 pacientes egressos de um hospital geral foi de 7 dias com desvio padrão de 2
dias. Uma amostra de 24 pacientes egressos de um hospital de doenças crônicas teve tempo médio de internação de 36 dias
com desvio padrão de 10 dias. Assuma populações normalmente distribuídas com variâncias desiguais.
6.4.10. Em um estudo dos fatores considerados responsáveis pelos efeitos adversos do fumo na reprodução humana, as determinações do
nível de cádmio (nanogramas por grama) foram feitas no tecido da placenta de um
6.5 INTERVALO DE CONFIANÇA PARA UMA PROPORÇÃO DA POPULAÇÃO 185
amostra de 14 mães fumantes e amostra aleatória independente de 18 mães não fumantes. Os resultados
foram os seguintes:
Não fumantes: 10,0, 8,4, 12,8, 25,0, 11,8, 9,8, 12,5, 15,4, 23,5, 9,4,
25,1, 19,5, 25,5, 9,8, 7,5, 11,8, 12,2, 15,0
Fumantes: 30,0, 30,1, 15,0, 24,1, 30,5, 17,8, 16,8, 14,8, 13,4,
28,5, 17,5, 14,4, 12,5, 20,4
Parece provável que o nível médio de cádmio seja maior entre os fumantes do que entre os não fumantes? Por
que você chega a essa conclusão?
6.5 INTERVALO DE CONFIANÇA PARA UMA PROPORÇÃO

DA POPULAÇÃO
Muitas questões de interesse para o profissional de saúde estão relacionadas às proporções populacionais.
Que proporção de pacientes que recebem um determinado tipo de tratamento se recupera? Que proporção de
alguma população tem uma determinada doença? Que proporção de uma população é imune a uma
determinada doença?
Para estimar uma proporção populacional, procedemos da mesma maneira que para estimar uma
média populacional. Uma amostra é extraída da população de interesse e a proporção da amostra, ^p, é
calculada. Essa proporção amostral é usada como o estimador pontual da proporção populacional. Um
intervalo de confiança é obtido pela fórmula geral
estimador ð Þ coeficiente de confiabilidade ð

erro padrão do estimador º
No capítulo anterior vimos que quando np e nð Þ 1 p são maiores que

podemos
5, considerar a distribuição
amostral de ^p bastante próxima da distribuição normal.
Quando essa condição é atendida, nosso coeficiente de confiabilidade é algum valor de z do padrão ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
distribuição normal. O erro padrão, como vimos, é igual a s^p ¼ p pð 1 p = nº .

Como p, o parâmetro que estamos tentando estimar, é desconhecido, devemos usar ^p como estimativa. 1 ^p
confiança percentual para p é dado

=nppor º ,
Assim, estimamos s^p por ^pð e nosso 100 1ð Þ um intervalo de
^pð Þ ^p =np1 ^p z1a=2 (6.5.1)
Damos a esse intervalo interpretações probabilísticas e práticas.
EXEMPLO 6.5.1
O Pew Internet and American Life Project (A-13) relatou em 2003 que 18% dos usuários da Internet o usaram
para pesquisar informações sobre tratamentos ou medicamentos experimentais. A amostra consistiu de 1220
internautas adultos, e as informações foram coletadas por meio de entrevistas telefônicas. Desejamos construir
um intervalo de confiança de 95% para a proporção de usuários da Internet na população amostrada que
buscaram informações sobre tratamentos ou medicamentos experimentais.
Solução: Vamos assumir que os 1220 indivíduos foram amostrados de forma aleatória. A melhor estimativa
pontual da proporção da população é ^p ¼ :18.
O tamanho da amostra e nossa estimativa de p são de magnitude suficiente para justificar o
uso da distribuição normal padrão na construção de um intervalo de confiança. O coeficiente
de confiabilidade correspondente a um nível de confiança de 0,95 é 1,96, e nossa estimativa
do erro padrão s^p é p ^pð
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼
1 ^ p =ºn p ð Þ :18 ð Þ :82 =1220 ¼ :0110. A confiança de 95 por cento
intervalo para p, com base nesses dados, é
:18 1:96ð Þ :0110

:18 :022
:158; :202
Estamos 95 por cento confiantes de que a proporção populacional p está entre 0,158 e 0,202
porque, em amostragem repetida, cerca de 95 por cento dos intervalos construídos da
maneira do presente intervalo único incluiriam o verdadeiro p. Com base nesses resultados,
esperaríamos, com 95% de confiança, encontrar algo entre 15,8% e 20,2% dos usuários
adultos da Internet que o usaram para obter informações sobre medicamentos ou tratamentos
experimentais. &
EXERCÍCIOS
Para cada um dos exercícios a seguir, indique as interpretações práticas e probabilísticas do intervalo que você
construiu. Identifique cada componente do intervalo: estimativa pontual, coeficiente de confiabilidade e erro
padrão. Explique por que os coeficientes de confiabilidade não são os mesmos para todos os exercícios.
6.5.1. Luna et ai. (A-14) estudaram pacientes ventilados mecanicamente na unidade de terapia intensiva de seis hospitais
de Buenos Aires, Argentina. Os pesquisadores descobriram que, de 472 pacientes ventilados mecanicamente,
63 apresentavam evidências clínicas de pneumonia associada ao ventilador (PAV). Construa um intervalo de
confiança de 95% para a proporção de todos os pacientes ventilados mecanicamente nesses hospitais que
podem desenvolver PAV.
6.5.2. Ondas Q no eletrocardiograma, segundo Schinkel et al. (A-15), muitas vezes são considerados reflexos de
miocárdio com cicatrizes irreversíveis. Esses pesquisadores afirmam, no entanto, que existem algumas
indicações de que tecido viável residual pode estar presente em regiões de infarto com onda Q. Seu estudo de
150 pacientes com infarto eletrocardiográfico crônico da onda Q encontrou 202 regiões disfuncionais da onda Q.
Com ecocardiografia de estresse com dobutamina (DSE), eles observaram que 118 dessas 202 regiões eram
viáveis com informações do teste DSE. Construa um intervalo de confiança de 90% para a proporção de regiões
viáveis que se pode esperar encontrar em uma população de regiões disfuncionais de onda Q.
6.5.3. Em um estudo de von zur Muhlen et al. (A-16), foram estudados 136 indivíduos com síncope ou quase-síncope.
A síncope é a perda temporária de consciência devido a um súbito declínio no fluxo sanguíneo para o cérebro.
Desses indivíduos, 75 também relataram ter doença cardiovascular. Construa um intervalo de confiança de 99
por cento para a proporção populacional de indivíduos com síncope ou quase síncope que também têm doença
cardiovascular.
6.5.4. Em uma amostra aleatória simples de 125 homens desempregados que abandonaram o ensino médio com idade
entre 16 e 21 anos, inclusive, 88 afirmaram ser consumidores regulares de bebidas alcoólicas. Construa um
intervalo de confiança de 95% para a proporção da população.
6.6 INTERVALO DE CONFIANÇA PARA A DIFERENÇA ENTRE DUAS PROPORÇÕES POPULACIONAIS 187
6.6 INTERVALO DE CONFIANÇA PARA A DIFERENÇA

ENTRE DUAS PROPORÇÕES DE POPULAÇÃO
A magnitude da diferença entre duas proporções populacionais é frequentemente de interesse.

Podemos querer comparar, por exemplo, homens e mulheres, dois grupos de idade, dois grupos
socioeconômicos ou dois grupos de diagnóstico com relação à proporção que possui alguma
característica de interesse. Um estimador pontual imparcial da diferença entre duas proporções
populacionais é fornecido pela diferença entre as proporções amostrais, ^p1 ^p2. Comoquando
vimos,
n1
e n2 são grandes e as proporções populacionais não são muito próximas de 0 ou 1, aplica-se o
teorema do limite central e a teoria da distribuição normal pode ser empregada para obter
intervalos de confiança. O erro padrão da estimativa geralmente deve ser estimado por
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
^p1ð Þ ^p1 1 ^p2ð Þ ^p2 1

s^^p1^p2 ¼ º
s n1 n2
Þ um por cento
porque, via de regra, as proporções populacionais são desconhecidas. Um intervalo
de confiança de 100 1ð para p1 p2 é dado por
^p1ð Þ ^p1 1 ^p2ðþÞ ^p2 1

(6.6.1)
ð ^p1 ^p2Þ z1a=2 s n1 n2
Podemos interpretar esse intervalo do ponto de vista probabilístico e prático.
EXEMPLO 6.6.1
Connor et ai. (A-17) investigou diferenças de gênero na agressão proativa e reativa em uma
amostra de 323 crianças e adolescentes (68 mulheres e 255 homens). Os sujeitos eram de
encaminhamentos consecutivos não solicitados para um centro de tratamento residencial e
uma clínica de psicofarmacologia pediátrica que atende a um hospital terciário e escola de
medicina. Na amostra, 31 das mulheres e 53 dos homens relataram abuso sexual. Desejamos
construir um intervalo de confiança de 99% para a diferença entre as proporções de abuso
sexual nas duas populações amostradas.
Solução: As proporções amostrais para mulheres e homens são, respectivamente,

^pF ¼ 31=68 ¼ :4559 e ^pM ¼ 53=255 ¼ :2078. A diferença entre as
proporções da amostra é ^pF ^pM ¼ :4559 :2078 ¼ :2481. O erro padrão
estimado da diferença entre as proporções da amostra é
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
ð Þ :4559 ð Þ :5441 ð Þ :2078 ð Þ :7922

s^^pF^pM ¼ þ 255
r 68
¼ :0655
O fator de confiabilidade da Tabela D do Apêndice é 2,58, de modo que nosso intervalo

de confiança, pela Expressão 6.6.1, é
:2481 2:58ð Þ :0655

:0791; :4171
Estamos 99% confiantes de que, para as populações amostradas, a proporção de casos

de abuso sexual relatado entre mulheres excede a proporção de casos de abuso sexual
relatado entre homens em algo entre 0,0791 e 0,4171.
Como o intervalo não inclui o zero, concluímos que os dois

proporções populacionais não são iguais. &
EXERCÍCIOS
Para cada um dos exercícios a seguir, indique as interpretações práticas e probabilísticas do intervalo que você
construiu. Identifique cada componente do intervalo: estimativa pontual, coeficiente de confiabilidade e erro padrão.
Explique por que os coeficientes de confiabilidade não são os mesmos para todos os exercícios.
6.6.1. Horwitz e outros. (A-18) estudou 637 pessoas que foram identificadas por registros judiciais de 1967 a 1971 como tendo
sofrido abuso ou negligência. Para um grupo de controle, eles localizaram 510 indivíduos que, quando crianças,
frequentaram a mesma escola primária e viviam em um raio de cinco quarteirões daqueles do grupo abusado/
negligenciado. No grupo abusado/negligenciado e no grupo controle, 114 e 57 indivíduos, respectivamente,
desenvolveram transtornos de personalidade antissocial ao longo de suas vidas. Construa um intervalo de confiança
de 95% para a diferença entre as proporções de indivíduos que desenvolvem transtornos de personalidade antissocial
que se pode esperar encontrar nas populações de indivíduos das quais se presume que os indivíduos deste estudo
tenham sido retirados.
6.6.2. O objetivo de um estudo randomizado controlado por Adab et al. (A-19) foi determinar se fornecer às mulheres
informações adicionais sobre os prós e contras do rastreamento do câncer do colo do útero aumentaria a disposição
de fazer o rastreamento. Um grupo de tratamento de 138 mulheres recebeu um folheto sobre triagem que continha
mais informações (risco individual médio de câncer cervical, probabilidade de resultado positivo, possibilidade de
resultados falsos positivos/negativos, etc.) do que o folheto padrão desenvolvido pelo British National Health Serviço
que 136 mulheres em um grupo de controle receberam. No grupo de tratamento, 109 mulheres indicaram que
queriam fazer o teste de rastreamento para câncer cervical, enquanto no grupo controle, 120 indicaram que queriam
o teste de rastreamento. Construa um intervalo de confiança de 95% para a diferença nas proporções das duas
populações representadas por essas amostras.
6.6.3. Spertus et ai. (A-20) realizaram um estudo randomizado simples cego para indivíduos com doença arterial coronariana
estável. Eles randomizaram os indivíduos em dois grupos de tratamento. O primeiro grupo teve os medicamentos
atuais para angina otimizados, e o segundo grupo foi reduzido gradualmente aos medicamentos existentes e, em
seguida, iniciou diltiazem de ação prolongada a 180 mg/dia. Os pesquisadores realizaram vários testes para
determinar se havia diferenças significativas nos dois grupos de tratamento no início do estudo. Uma das
características de interesse foi a diferença nas porcentagens de indivíduos que relataram história de insuficiência
cardíaca congestiva. No grupo em que os medicamentos atuais foram otimizados, 16 dos 49 indivíduos relataram
histórico de insuficiência cardíaca congestiva. Nos indivíduos tratados com diltiazem, 12 dos 51 indivíduos relataram
uma história de insuficiência cardíaca congestiva. Declare as suposições que você acha necessárias e construa um
intervalo de confiança de 95% para a diferença entre as proporções daqueles que relatam insuficiência cardíaca
congestiva nas duas populações das quais presumimos que esses grupos de tratamento foram selecionados.
6.6.4. Estudar a diferença na adesão à terapia medicamentosa entre indivíduos com depressão que receberam cuidados
habituais e aqueles que receberam cuidados em um modelo de cuidado colaborativo foi o objetivo do estudo
conduzido por Finley et al. (A-21). O modelo de cuidado colaborativo enfatizou o papel do farmacêutico clínico no
gerenciamento da terapia medicamentosa e no acompanhamento do tratamento. Dos 50 sujeitos que receberam
cuidados habituais, 24 aderiram ao esquema medicamentoso prescrito, enquanto 50 dos 75 sujeitos no modelo de cuidado colaborativo
6.7 DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA ESTIMAR MEIOS 189
aderiram ao esquema medicamentoso. Construa um intervalo de confiança de 90% para a diferença nas
proporções de adesão para as populações de indivíduos representadas por essas duas amostras.
6.7 DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA ESTIMAR

MEIOS
A questão do tamanho da amostra a ser coletada surge no início do planejamento de qualquer pesquisa ou experimento.
Esta é uma questão importante que não deve ser tratada levianamente. Tirar uma amostra maior do que o necessário
para alcançar os resultados desejados é um desperdício de recursos, enquanto amostras muito pequenas geralmente
levam a resultados sem utilidade prática. Vamos considerar, então, como alguém pode determinar o tamanho da
amostra que é necessário em uma dada situação. Nesta seção, apresentamos um método para determinar o tamanho
amostral necessário para estimar uma média populacional e, na seção seguinte, aplicamos esse método ao caso de
determinação do tamanho amostral quando o parâmetro a ser estimado é uma proporção populacional. Por extensões
diretas desses métodos, os tamanhos de amostra necessários para situações mais complicadas podem ser determinados.
Objetivos Os objetivos na estimativa de intervalo são obter intervalos estreitos com alta confiabilidade. Se observarmos
os componentes de um intervalo de confiança, veremos que a largura do intervalo é determinada pela magnitude da
quantidade
ð Þ coeficiente de confiabilidade ð
erro padrão do estimador º
uma vez que a largura total do intervalo é o dobro desse valor. Aprendemos que essa quantidade é geralmente
chamada de precisão da estimativa ou margem de erro. Para um determinado erro padrão, aumentar a confiabilidade
significa um coeficiente de confiabilidade maior. Mas um coeficiente de confiabilidade maior para um erro padrão fixo
resulta em um intervalo mais amplo.
Por outro lado, se fixarmos o coeficiente de confiabilidade, a única forma de reduzir a largura do intervalo é
reduzir o erro padrão. Como o erro padrão é igual a s= np ; e como s é uma constante, a única maneira de obter um
ffiffiffi
pequeno
desvioerro
padrão
padrão
da população,
é obter umado
amostra
grau degrande.
confiabilidade
Quão grande
desejado
é uma
e da
amostra?
largura do
Isso
intervalo
dependedesejado.
do tamanho de s, do
Suponhamos que queremos um intervalo que estenda d unidades em ambos os lados do estimador.
Nós podemos escrever
d ¼ ð Þ coeficiente de confiabilidade ð Þ erro padrão do estimador (6.7.1)
Se a amostragem for com reposição, de uma população infinita ou de uma população suficientemente grande
para garantir que ignoremos a correção da população finita, a Equação 6.7.1 torna-se
s
d ¼ znp ffiffiffi
(6.7.2)
que, quando resolvido para n, dá
z2s2
n¼ (6.7.3)
d2
Quando a amostragem é sem reposição de uma pequena população finita, a correção da população
finita é necessária e a Equação 6.7.1 torna-se
s Nn
d¼ ffiffiffi
(6.7.4)
znp N1r
que, quando resolvido para n, dá
Nz2s2
n¼ (6.7.5)
d2 ð Þþ N 1 z2s2
Se a correção da população finita puder ser ignorada, a Equação 6.7.5 se reduz à Equação
6.7.3.
Estimando s2 As fórmulas para o tamanho da amostra requerem conhecimento de s2 , mas, como foi
apontado, a variância da população é, via de regra, desconhecida. Como resultado, s2 deve ser
estimado. As fontes de estimativas mais usadas para s2 são as seguintes:
1. Uma amostra piloto ou preliminar pode ser extraída da população e a variância calculada dessa
amostra pode ser usada como uma estimativa de s2. As observações usadas na amostra piloto
podem ser contadas como parte da amostra final, de modo que n (o tamanho da amostra
computada) n1 (o tamanho da amostra piloto) ¼ n2 (o número de observações necessárias
para satisfazer o requisito de tamanho total da amostra).
2. Estimativas de s2 podem estar disponíveis a partir de estudos anteriores ou similares.
3. Se for considerado que a população da qual a amostra será extraída é aproximadamente

normalmente distribuída, pode-se usar o fato de que o intervalo é aproximadamente igual a
seis desvios padrão e calcular s R=6. Este método requer algum conhecimento do menor e
maior valor da variável na população.
EXEMPLO 6.7.1
Um nutricionista do departamento de saúde, desejando conduzir uma pesquisa entre uma população
de adolescentes para determinar sua ingestão média diária de proteínas (medida em gramas), está
buscando o conselho de um bioestatístico em relação ao tamanho da amostra que deve ser tomada.
Qual procedimento o bioestatístico segue ao prestar assistência ao nutricionista? Antes que o
estatístico possa ajudar o nutricionista, este último deve fornecer três itens de informação: (1) a largura
desejada do intervalo de confiança, (2) o nível de confiança desejado e (3) a magnitude da variação
da população .
Solução: Suponhamos que o nutricionista queira um intervalo de cerca de 10 gramas de largura; ou

seja, a estimativa deve estar dentro de cerca de 5 gramas da média da população em
qualquer direção. Em outras palavras, deseja-se uma margem de erro de 5 gramas.
Suponhamos também que um coeficiente de confiança de 0,95 seja decidido e que,
por experiência anterior, o nutricionista sinta que o desvio padrão da população é
provavelmente de cerca de 20 gramas. O estatístico agora tem
6.8 DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA ESTIMAR AS PROPORÇÕES 191
as informações necessárias para calcular o tamanho da amostra: z ¼ 1:96; s ¼ 20 e d ¼ 5. Vamos

assumir que a população de interesse é grande para que o estatístico possa ignorar a correção da
população finita e usar a Equação 6.7.3. Ao fazer substituições apropriadas, o valor de n é encontrado
para ser
2 2
ðÞ 1:96 ð Þ 20
n¼
2
ð5Þ
¼ 61:47
O nutricionista é aconselhado a coletar uma amostra de tamanho 62. Ao calcular um tamanho de

amostra pela Equação 6.7.3 ou Equação 6.7.5, arredondamos para o próximo maior número inteiro se os
cálculos resultarem em um número que não seja um número inteiro. &
EXERCÍCIOS
6.7.1. A administradora de um hospital deseja estimar o peso médio dos bebês nascidos em seu hospital. Qual deve ser o
tamanho da amostra de registros de nascimento se ela deseja um intervalo de confiança de 99% com 1 libra de
largura? Suponha que uma estimativa razoável de s seja 1 libra. Que tamanho de amostra é necessário se o
coeficiente de confiança for reduzido para 0,95?
6.7.2. O diretor da seção de controle da raiva de um departamento de saúde de uma cidade deseja obter uma amostra dos
registros do departamento de mordidas de cães relatadas durante o ano passado para estimar a idade média das
pessoas mordidas. Ele quer um intervalo de confiança de 95%, ficará satisfeito em deixar d = 2:5 e, a partir de
estudos anteriores, estima que o desvio padrão da população seja de cerca de 15 anos. Qual deve ser o tamanho
da amostra?
6.7.3. Um médico gostaria de saber o valor médio da glicemia em jejum (miligramas por 100 ml) de pacientes atendidos em
uma clínica de diabetes nos últimos 10 anos. Determine o número de registros que o médico deve examinar para
obter um intervalo de confiança de 90% para m se a largura desejada do intervalo for de 6 unidades e uma amostra
piloto produzir uma variação de 60.
6.7.4. Para pacientes com esclerose múltipla, desejamos estimar a idade média em que a doença foi diagnosticada pela
primeira vez. Queremos um intervalo de confiança de 95% com 10 anos de largura. Se a variância da população
for 90, qual deve ser o tamanho de nossa amostra?
6.8 DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA

ESTIMATIVA DE PROPORÇÕES
O método de determinação do tamanho da amostra quando uma proporção populacional deve ser estimada é essencialmente
o mesmo descrito para estimar uma média populacional. Fazemos uso do fato de que a metade do intervalo desejado, d,
pode ser igual ao produto do coeficiente de confiabilidade e do erro padrão.
Assumindo que a amostragem aleatória e as condições que garantem a normalidade aproximada da distribuição de
^p levam à seguinte fórmula para n quando a amostragem é com
substituição, quando a amostragem é de uma população infinita, ou quando a população amostrada é

grande o suficiente para tornar desnecessário o uso da correção da população finita,
z2pq
n¼ (6.8.1)
d2
onde q ¼ 1 p:
Se a correção da população finita não puder ser desconsiderada, a fórmula apropriada para n é
Nz2pq
n¼ (6.8.2)
d2 ð Þþ N 1 z2pq
Quando N é grande em comparação com n (isto é, n=N :05 a população finita

a correção pode ser ignorada e a Equação 6.8.2 se reduz à Equação 6.8.1.
Estimando p Como vemos, ambas as fórmulas requerem conhecimento de p, a proporção na população

que possui a característica de interesse. Como este é o parâmetro que estamos tentando estimar, ele
obviamente será desconhecido. Uma solução para esse problema é pegar uma amostra piloto e calcular
uma estimativa a ser usada no lugar de p na fórmula para n.
Às vezes, um investigador terá alguma noção de um limite superior para p que pode ser usado na fórmula.
Por exemplo, se for desejado estimar a proporção de alguma população que tem uma certa deficiência,
podemos sentir que a verdadeira proporção não pode ser maior do que, digamos, 0,30. Em seguida,
substituímos p por 0,30 na fórmula de n. Se for impossível chegar a uma estimativa melhor, pode-se definir
p igual a 0,5 e resolver para n.
Como p ¼ :5 na fórmula resulta no valor máximo de n, esse procedimento fornecerá uma amostra grande
o suficiente para a confiabilidade desejada e a largura do intervalo. Pode, no entanto, ser maior do que o
necessário e resultar em uma amostra mais cara do que se uma estimativa melhor de p estivesse disponível.
Este procedimento deve ser usado apenas se não for possível chegar a uma estimativa melhor de p.
EXEMPLO 6.8.1
Uma pesquisa está sendo planejada para determinar que proporção de famílias em uma determinada área
são medicamente indigentes. Acredita-se que a proporção não pode ser maior que 0,35. Um intervalo de
confiança de 95% é desejado com d ¼ :05. Que tamanho de amostra de famílias deve ser selecionada?
Solução: Se a correção de população finita puder ser ignorada, temos
2
ðÞ 1:96 ð Þ :35 ð Þ
n¼ :65 ¼ 349:59
2
ð Þ :05
O tamanho amostral necessário, então, é 350. &

6.9 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA DE UMA POPULAÇÃO NORMALMENTE DISTRIBUÍDA 193
EXERCÍCIOS
6.8.1. Um epidemiologista deseja saber que proporção de adultos que vivem em uma grande área metropolitana tem o
subtipo do vírus da hepatite B. Determine o tamanho da amostra que seria necessário para estimar a verdadeira
proporção dentro de 0,03 com 95 por cento de confiança. Em uma área metropolitana semelhante, a proporção
de adultos com a característica é de 0,20. Se os dados de outra área metropolitana não estivessem disponíveis
e não fosse possível obter uma amostra piloto, que tamanho de amostra seria necessário?
6.8.2. Planeja-se uma pesquisa para determinar que proporção de alunos do ensino médio em um sistema escolar
metropolitano fuma maconha regularmente. Se nenhuma estimativa de p estiver disponível a partir de estudos
anteriores, uma amostra piloto não pode ser extraída, um coeficiente de confiança de 0,95 é desejado e d ¼ :04
deve ser usado, determine o tamanho de amostra apropriado. Que tamanho de amostra seria necessário se
99% de confiança fosse desejado?
6.8.3. Um administrador hospitalar deseja saber qual a proporção de pacientes que receberam alta está insatisfeita com
os cuidados recebidos durante a internação. Qual deve ser o tamanho da amostra se considerarmos d ¼ :05, o
coeficiente de confiança for 0,95 e nenhuma outra informação estiver disponível? Qual deve ser o tamanho da
amostra se p for aproximado por 0,25?
6.8.4. Uma agência de planejamento de saúde deseja saber, para uma determinada região geográfica, qual a proporção
de pacientes internados em hospitais para tratamento de traumas que morrem no hospital. Um intervalo de
confiança de 95 por cento é desejado, a largura do intervalo deve ser 0,06 e a proporção da população, a partir
de outras evidências, é estimada em 0,20. Qual é o tamanho da amostra necessária?
6.9 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA DE

UMA POPULAÇÃO NORMALMENTE DISTRIBUÍDA
Estimativa pontual da variância da população Nas seções anteriores, foi sugerido que,
quando a variância da população é desconhecida, a variância da amostra pode ser
usada como um estimador. Você deve ter se perguntado sobre a qualidade desse estimador.
Discutimos apenas um critério de qualidade - imparcialidade - então vamos ver se a
variância da amostra é um estimador imparcial da variância da população. Para ser
imparcial, o valor médio da variância da amostra em todas as amostras possíveis deve
ser igual à variância da população. Ou seja, a expressão E s2 ð Þ¼ s2 deve ser mantida.
Para ver se essa condição é válida para uma situação particular, vamos nos referir ao
exemplo de construção de uma distribuição amostral dado na Seção 5.3. Na Tabela 5.3.1
temos todas as amostras possíveis de tamanho 2 da população que consiste nos valores 6, 8, 10, 1
Recorde-se que duas medidas de dispersão para esta população foram calculadas da
seguinte forma:
2 2
PðÞx s2
m ¼
S2 ¼ PðÞx ¼
m8 e
¼ 10
N N1
2
xi x
Se calcularmos a variância amostral s2 ¼ Pð Þ amostras =ðpara
Þ n 1cada um dos possíveis
mostradas na Tabela 5.3.1, obtemos as variâncias amostrais mostradas na Tabela 6.9.1.
TABELA 6.9.1 Variações calculadas a partir das amostras

mostradas na Tabela 5.3.1
Segundo Sorteio
6 8 10 12 14
6 0 2 8 18 32
8 2 0 2 8 18
Primeiro Sorteio 10 82028
12 18 8 2 0 2
14 32 18 8 2 0
Amostragem com reposição Se a amostragem for com reposição, o valor esperado de s é obtido
2
tomando a média de todas as variâncias amostrais na Tabela 6.9.1. Quando fazemos isso, temos
ps2 0 þ 2 þþ 2 þ 0 200
E s2 ¼ ¼8
eu
¼ ¼
Nn 25 25
2 ¼
e vemos, por exemplo, que quando a amostragem é com reposição E s2 ð Þ¼ s2, onde sn 1 e
2 2
xi x º
P =ððÞ s2 ¼ Pð Þ xm =N.
Amostragem sem reposição Se considerarmos o caso em que a amostragem é sem reposição, o

2
valor esperado de s é obtido tomando a média de todasdiagonal
as variâncias acima
principal. Isso(ou
é, abaixo) da
ps2 2 þ 8 þþ 2 100
E s2 ¼ ¼ 10
eu
¼ ¼
NCn 10 10
2
que, vemos, não é igual a s2, mas é igual a S2 ¼ Pð Þ xm =ðÞ N 1 .
Esses resultados são exemplos de princípios gerais, pois pode-se mostrar que, em geral,
E s2 ð Þ¼ s2 quando a amostragem é com reposição

E s2 ð Þ¼ S2 quando a amostragem é sem reposição
Quando N é grande, N 1 e N serão aproximadamente iguais e, consequentemente,

s2 e S2 serão aproximadamente iguais.
2
Esses resultados justificam nosso uso de s2 ¼xi xPð Þ =ðao
Þ ncalcular
1 o é um estimador
2
variância da amostra. De passagem, notemos que embora s imparcial de
s2; s não é um estimador imparcial de s. O viés, no entanto, diminui rapidamente conforme n
aumenta.
Estimativa de intervalo de uma variação populacional Com uma estimativa pontual disponível, é
lógico indagar sobre a construção de um intervalo de confiança para uma variação populacional. O
sucesso na construção de um intervalo de confiança para s2 dependerá de nossa capacidade de
encontrar uma distribuição amostral apropriada.
6.9 INTERVALO DE CONFIANÇA PARA A VARIÂNCIA DE UMA POPULAÇÃO NORMALMENTE DISTRIBUÍDA 195
df = 1
0,4
0,3 df = 2
0,2 df = 4
df = 10
0,1
0,0
0 2 4 6 8 10 12 14
FIGURA 6.9.1 Distribuições Qui-quadrado.
(Fonte: Gerald van Belle, Lloyd D. Fisher, Patrick J. Heagerty e Thomas Lumley, Biostatistics: A
Methodology for the Health Sciences, 2nd Ed., # 2004 John Wiley & Sons, Inc. Este material é reproduzido
com permissão de John Wiley & Sons, Inc.)
Os intervalos de confiança da distribuição qui-quadrada para s2 geralmente são baseados em Þ n

distribuição normalmente amostral
1 s2=s2.
de população
Se amostras
ð distribuída,
de tamanho
essanquantidade
forem extraídas
terá uma
de uma
distribuição conhecida como distribuição qui-quadrada x2 ð Þ com n 1 graus de liberdade. Como
falaremos mais sobre esta distribuição no capítulo 12 n 1 s2=s2 , apenas dizemos aqui que é a
distribuição
quantidade ð Þ e que é útil para encontrar intervalos de confiança para s2 quando
que que aé de
a população
a suposição
normalmente distribuído é verdadeiro.
A Figura 6.9.1 mostra distribuições qui-quadrada para vários valores de graus de liberdade.
Os percentis da distribuição do qui-quadrado são dados na Tabela F do Apêndice. Os títulos das
colunas fornecem os valores de x2 à esquerda dos quais se encontra uma proporção da área total
sob a curva igual ao subscrito de x2. Os rótulos de linha são os graus de liberdade. Þ um intervalo
obtemos 100 1ð Þ um intervalo
de confiança
de confiança
percentual
percentual
para s2para Þ n 1,100
Paraðobter s2=s2
1ð,.primeiro
Para fazer isso, selecionamos os
valores de x2 da Tabela F do Apêndice de forma que a=2 esteja à esquerda do valor menor e a=2
esteja à direita do valor maior. Em outras palavras, os dois valores de x2 são selecionados de
forma que a seja dividido igualmente entre as duas pontas da distribuição. Podemos designar
esses dois valores de x2 como x2 e x2 s2=s2,
1ð Þ a=2
então,
, respectivamente.
é dado pelo intervalo
O 100 de
1ð confiança
Þ a por cento
paran ð1
a=
2Þ
ð Þ n 1 s2 <
x2a=2 < x2 s2 1ð Þ a=2
Agora manipulamos essa expressão de forma que obtemos uma expressão com s2
sozinho como termo médio. Primeiro, vamos dividir cada termo por ð n 1 s2 para obter Þ
x2 1 x21ð Þ
< <
a=2
n 1 ðs2Þ s2 a=2
s2 ð Þ 1n
Se tomarmos o recíproco desta expressão, temos
a=2
Þ n 1ð
1 s2
Þ a=2
n 1 s2 ð ð Þ > s2 > x2 x2
Observe que a direção das desigualdades mudou quando tomamos os recíprocos. Se

invertermos a ordem dos termos, teremos
1ð
ÞnÞ 1a=2
s2 a=2
n 1 s2 ð ð Þ < s2 < x2 x2
(6.9.1)
para s2 que é 100 1ð cada

Þ um
termo
intervalo
na Expressão
de confiança
6.9.1, temos o . Se tirarmos a raiz quadrada de Þ
percentual
seguinte intervalo 100 1ð para s, o desvio padrão da população: uma porcentagem de confiança
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
ð Þ n 1 s2 ðs2
Þn1
<s< (6.9.2)
x2
1ð Þ a=2 s a=2 sx2
EXEMPLO 6.9.1
Em um estudo sobre a eficácia de uma dieta sem glúten em parentes de primeiro grau de
pacientes com diabetes tipo I, Hummel et al. (A-22) colocou sete indivíduos em uma dieta
sem glúten por 12 meses. Antes da dieta, eles fizeram medições iniciais de vários anticorpos
e autoanticorpos, um dos quais era o autoanticorpo de insulina relacionado ao diabetes (IAA).
Os níveis de IAA foram medidos por ensaio de radioligação. Os sete indivíduos tinham unidades
IAA de
9:7; 12:3; 11:2; 5:1; 24:8; 14:8; 17:7
Desejamos estimar a partir dos dados desta amostra a variância das unidades IAA na
população da qual a amostra foi extraída e construir um intervalo de confiança de 95 por
cento para esta estimativa.
Solução: A amostra produziu um valor de s2 ¼ 39:763. Os graus de liberdade são n 1 ¼ 6: Os

valores apropriados de x2 da Tabela F do Apêndice são
EXERCÍCIOS 197
x21ð Þ ¼ 14:449 e x2 ¼ 1:237. Nosso intervalo de confiança de 95% para a=2

a=2 s2 é
6 39 ð Þ :763 6 39 ð Þ :763 < s2 <

14:449 1:237
16:512 < s2 < 192:868
O intervalo de confiança de 95 por cento para s é
4:063 <s < 13:888
Temos 95% de confiança de que os parâmetros que estão sendo estimados estão
dentro dos limites especificados, porque sabemos que no longo prazo, em amostragem
repetida, 95% dos intervalos construídos conforme ilustrado incluiriam os respectivos
parâmetros. &
Algumas precauções Embora esse método de construção de intervalos de confiança para s2 seja
amplamente utilizado, ele tem suas desvantagens. Primeiro, a suposição da normalidade da população
da qual a amostra é extraída é crucial, e os resultados podem ser enganosos se a suposição for
ignorada.
Outra dificuldade com esses intervalos decorre do fato de o estimador não estar no centro do
intervalo de confiança, como é o caso do intervalo de confiança para m. Isso ocorre porque a
distribuição qui-quadrado, ao contrário da normal, não é simétrica. A implicação prática disso é que o
método para a construção de intervalos de confiança para s2 que acabamos de descrever não produz,
os intervalos de confiança mais curtos possíveis.
Tate e Klett (12) fornecem tabelas que podem ser usadas para superar essa dificuldade.
EXERCÍCIOS
6.9.1. Um estudo de Aizenberg et al. (A-23) examinou a eficácia do sildenafil, um potente inibidor da fosfodiesterase,
no tratamento de homens idosos com disfunção erétil induzida por tratamento antidepressivo para transtorno
depressivo maior. As idades dos 10 inscritos no estudo eram
74; 81; 70; 70; 74; 77; 76; 70; 71; 72
Suponha que os sujeitos nesta amostra constituam uma amostra aleatória simples extraída de uma população
de sujeitos semelhantes. Construa um intervalo de confiança de 95% para a variância das idades dos
indivíduos na população.
6.9.2. Borden et ai. (A-24) realizou experimentos em joelhos de cadáveres para testar a eficácia de várias técnicas de
reparo meniscal. As amostras foram carregadas em um dispositivo servo-hidráulico e carregadas com tensão
até a falha. O teste biomecânico foi realizado usando uma taxa de carga lenta para simular as tensões que o
menisco medial pode ser submetido durante os primeiros exercícios de reabilitação e atividades da vida
diária. Uma das medidas é a quantidade de deslocamento que ocorre. Dos 12 espécimes que receberam a
sutura vertical em colchão e o método FasT-FIX, os valores de deslocamento
medidos em milímetros são 16,9, 20,2, 20,1, 15,7, 13,9, 14,9, 18,0, 18,5, 9,2, 18,8, 22,8, 17,5.
Construa um intervalo de confiança de 90 por cento para a variância do deslocamento em milímetros para uma população de
indivíduos recebendo essas técnicas de reparo.
6.9.3. Determinações forçadas da capacidade vital foram feitas em 20 homens adultos saudáveis. A variância da amostra foi de 1.000.000.
Construa intervalos de confiança de 90% para s2 e s.
6.9.4. Em um estudo dos tempos de trânsito miocárdico, os tempos de trânsito de aparência foram obtidos em uma amostra de 30 pacientes
com doença arterial coronariana. A variância amostral encontrada foi de 1,03. Construa intervalos de confiança de 99% para s2
e s.
6.9.5. Uma amostra de 25 homens fisicamente e mentalmente saudáveis participou de um experimento de sono no qual a porcentagem do
tempo total de sono de cada participante gasto em um determinado estágio do sono foi registrada. A variância calculada a partir
dos dados da amostra foi de 2,25. Construa intervalos de confiança de 95 por cento para s2
e s.
6.9.6. As determinações de hemoglobina foram feitas em 16 animais expostos a uma substância química nociva. As seguintes observações
foram registradas: 15,6, 14,8, 14,4, 16,6, 13,8, 14,0, 17,3, 17,4, 18,6, 16,2, 14,7, 15,7, 16,4, 13,9, 14,8, 17,5. Construa intervalos
de confiança de 95% para s2 e s.
6.9.7. Vinte amostras de ar coletadas no mesmo local durante um período de 6 meses mostraram as seguintes quantidades de
material particulado em suspensão (microgramas por metro cúbico de ar):
68 22 36 32
42 24 28 38
30 44 28 27
28 43 45 50
79 74 57 21
Considere essas medições como uma amostra aleatória de uma população de medições normalmente distribuídas e construa
um intervalo de confiança de 95% para a variância da população.
6.10 INTERVALO DE CONFIANÇA PARA A RAZÃO

DAS VARIÂNCIAS DE DUAS POPULAÇÕES NORMALMENTE
DISTRIBUÍDAS
Frequentemente é interessante comparar duas variâncias, e uma maneira de fazer isso é formar sua
razão, s2 1=s2 Se
2. duas variâncias forem iguais, sua razão será igual a 1. Normalmente não
conheceremos as variâncias das populações de interesse e, conseqüentemente, quaisquer comparações
que fizermos serão baseadas nas variâncias da amostra. Em outras palavras, podemos desejar estimar
a razão de duas variâncias populacionais. Aprendemos na Seção 6.4 que o uso válido da distribuição t
para construir um intervalo de confiança para a diferença entre duas médias populacionais exige que
as variâncias populacionais sejam iguais. O uso da razão de duas variâncias populacionais para
determinar a igualdade de variâncias foi formalizado em um teste estatístico. A distribuição desse teste
fornece valores de teste para determinar se a razão excede o valor 1 em uma extensão suficientemente
grande para que possamos concluir que as variâncias não são iguais. O teste é conhecido como Teste
F-máx por Hartley (13) ou Teste de Razão de Variância por Zar (14). Muitos programas de computador
fornecem algum teste formalizado da igualdade de variâncias, de modo que a suposição de igualdade
de variâncias associada a muitos dos testes nos capítulos seguintes pode ser
6.10 INTERVALO DE CONFIANÇA PARA A RAZÃO DAS VARIÂNCIAS DE DUAS POPULAÇÕES NORMALMENTE DISTRIBUÍDAS 199
(10; ÿ)
1,0
(10; 50)
0,8 (10; 10)

(10; 4)
0,6
f(x)
0,4
0,2
0,0
0 0,5 1,0 1,5 2.0 2.5 3.0 3.5 4.0
F
FIGURA 6.10.1 A distribuição F para vários graus de liberdade.

(Da Documenta Geigy, Scientific Tables, Sétima Edição, 1970. Cortesia de Ciba-Geigy Limited, Basel,
Suíça.)
examinado. Se o intervalo de confiança para a razão de duas variâncias populacionais incluir 1, concluímos que as duas
variâncias populacionais podem, de fato, ser iguais. Novamente, uma vez que esta é uma forma de inferência, devemos
confiar em alguma distribuição de amostragem e, desta vez, a distribuição de s2 1=s2 1 = s2 2=s2 2 é utilizada desde que
certas suposições
de tamanho
sejam
n1
designar
e
atendidas.
n2 , respectivamente,
a maior
As suposições
das duasextraídas
variâncias
são de que
deamostrais.
duas
s2 e populações
s2 são calculados
normalmente
a partirdistribuídas.
de amostrasUsamos
independentes
s2 para
1 2
1
A distribuição F Se as suposições forem atendidas, s2 1=s2 1 = s2 2=s2 2 segue uma distribuição conhecida como distribuição
F. Adiamos uma discussão mais completa dessa distribuição até o capítulo 8, mas observe que essa distribuição depende
de valores de dois graus de liberdade, um correspondendo ao valor de n1 1 usado no cálculo de s2 e o outro correspondendo
ao valor de n2 1 usado no cálculo de s2 como os graus de liberdade do numerador e os graus de liberdade do denominador.
1
2. Estes são geralmente referidos
A Figura 6.10.1 mostra algumas distribuições F para várias combinações de graus de liberdade de numerador e denominador.
O Apêndice Tabela G contém, para combinações especificadas de graus de liberdade e valores de a; Valores de F à direita
dos quais está a = 2 da área sob a curva de F.
Um intervalo de confiança para s2 1=s2 intervalo para s2 2 Para encontrar o 100 1ð Þ uma porcentagem de confiança
1=s2 2, começamos com a expressão
s2 1=s2 1
Fa=2 < < F1ð Þ a=2
s2 2=s2 2
onde Fa=2 e F1ð Þ a=2 são os valores da tabela F à esquerda e à direita dos quais, respectivamente, encontra-se a=2 da área
sob a curva. O termo médio desta expressão pode ser reescrito de modo que toda a expressão seja s2
s21 2
Fa=2 < < F1ð Þ a=2
s22 s21
Se dividirmos por s2 1=s2 2, temos
Fa=2
s22 F1ð Þ a=2
< <
s2 1=s2 2 s2 1 s2 1=s2 2
Tomando os recíprocos dos três termos dá
s2 1=s2 2
s2 s2 1=s2 2
> 1>
Fa=2 s2 2 F1ð Þ a=2
e se invertermos a ordem, temos o seguinte 100 1ð para s2 1=s2 Þ um intervalo de confiança percentual
2:
s2 1=s2 2
s21 s2 1=s2 2
< < (6.10.1)
F1ð Þ a=2 s22 Fa=2
EXEMPLO 6.10.1
Allen e Gross (A-25) examinam a força dos flexores dos dedos dos pés em indivíduos com fascite
plantar (dor de esporão de calcanhar ou dor geral no calcanhar), uma condição comum em pacientes
com problemas músculo-esqueléticos. A inflamação da fáscia plantar costuma ser dispendiosa de tratar
e frustrante tanto para o paciente quanto para o clínico. Uma das medições de linha de base foi o índice
de massa corporal (IMC). Para as 16 mulheres do estudo, o desvio padrão do IMC foi de 8,1 e para
quatro homens do estudo, o desvio padrão foi de 5,9. Desejamos construir um intervalo de confiança
de 95% para a razão das variâncias das duas populações das quais presumimos que essas amostras
foram extraídas.
Solução: Temos as seguintes informações:
n1 ¼ 16 n2 ¼ 4 s2 ¼
2
ð1Þ liberdade
8:1 ¼ graus
do¼de
numerador65:61 s2 ¼ ð Þ 5:9 2 ¼ 34:81
2
df 1 ¼ n1 1 ¼ 15 ¼ graus de liberdade do denominador ¼ n2
df 2 1 ¼ 3
a ¼ :05
F:025 ¼ :24096 F:975 ¼ 14:25
Agora estamos prontos para obter nosso intervalo de confiança de 95% para s2
1=s2 2 substituindo os valores apropriados na Expressão 6.10.1:
65:61=34:81 s21
< < s2
14:25 2 65:61=34:81:24096
s21
:1323 < < 7:8221
s22
6.10 INTERVALO DE CONFIANÇA PARA A RAZÃO DAS VARIÂNCIAS DE DUAS POPULAÇÕES NORMALMENTE DISTRIBUÍDAS 201
Damos a esse intervalo as interpretações probabilísticas e práticas apropriadas.
Como o intervalo 0,1323 a 7,8221 inclui 1, podemos concluir que as duas variâncias
populacionais podem ser iguais. &
Encontrando F e F a=2 Neste

explicar comoponto devemos
os valores fazer
F:975 uma incômoda,
¼ 14:25 e F:025 ¼mas 1ð Þ
:24096 a=2 inevitável
foram obtidos. Odigressão e
valor de F:975
na interseção da coluna encabeçada por df 1 ¼ 15 e a linha rotulada df 2 ¼ 3 é 14,25. Se tivéssemos uma
tabela mais extensa da distribuição F, encontrar F:025 não seria problema; simplesmenteF:025
encontraríamos
como
encontramos F:975.
3. Incluir
Pegaríamos
todos os percentis
o valor napossíveis
interseção
deda
F coluna
resultaria
comemcabeçalho
uma tabela
15muito
e a linha
longa.
comFelizmente,
cabeçalho
porém, existe uma relação que nos permite calcular os valores percentuais mais baixos de nossa tabela
limitada. A relação é a seguinte:
1
¼
Fa;df 1;df 2 (6.10.2)
F1a;df 2;df 1
Procedemos da seguinte forma.

Troque os graus de liberdade do numerador e do denominador e localize o valor apropriado de F. Para
o problema em questão, localizamos 4,15, que está na interseção da coluna com o cabeçalho 3 e a linha
rotulada com 15. Agora tomamos o recíproco desse valor, 1=4:15 ¼ :24096. Em resumo, o limite de confiança
inferior (LCL) e o limite de confiança superior (UCL) s2 1=s2 2
são como segue:
s21 1
LCL ¼
s22
FðÞ 1a=2 ;df 1;df 2
s21
UCL ¼
F1ð Þ a=2 ;df 2;df 1
s22
Procedimentos alternativos para fazer inferências sobre a igualdade de duas variâncias quando as
populações amostradas não são normalmente distribuídas podem ser encontrados no livro de Daniel (15).
Algumas precauções Semelhante à discussão na seção anterior de construção de intervalos de confiança

, aésuposição
para s2 , as amostras são desenhadas de obter
crucial para normalidade das
intervalos populações
corretos das
para a quais
razão de variâncias
discutidas nesta seção. Felizmente, a maioria dos programas estatísticos de computador fornece alternativas
para o F-ratio, como o teste de Levene, quando não se pode presumir que as distribuições subjacentes sejam
normalmente distribuídas. Computacionalmente, o teste de Levene usa uma medida de distância de uma
mediana de amostra em vez de uma média de amostra, removendo assim a suposição de normalidade.
EXERCÍCIOS
6.10.1. O objetivo do estudo de Moneim et al. (A-26) foi examinar amputações de polegar em rodeios. Os pesquisadores revisaram
16 casos de amputações de polegar. Destas, 11 foram amputações completas, enquanto cinco foram incompletas. O
tempo de isquemia é o período de tempo em que oxigênio insuficiente é fornecido ao polegar amputado. Os tempos
de isquemia (horas) para 11 indivíduos com amputações completas foram
4:67; 10:5; 2:0; 3:18; 4:00; 3:5; 3:33; 5:32; 2:0; 4:25; 6:0
Para cinco vítimas de amputação incompleta do polegar, os tempos de isquemia foram
3:0; 10:25; 1:5; 5:22; 5:0
Trate os dois conjuntos de dados relatados como dados de amostra das duas populações conforme descrito.
Construa um intervalo de confiança de 95% para a razão das duas variações populacionais desconhecidas.
6.10.2. O objetivo do estudo de Horesh et al. (A-27) foi explorar a hipótese de que algumas formas de comportamento suicida
entre adolescentes estão relacionadas à raiva e à impulsividade. A amostra foi composta por 65 adolescentes
internados em uma unidade psiquiátrica juvenil universitária. Os pesquisadores usaram a Escala de Controle de
Impulsividade (ICS, A-28), onde números mais altos indicam graus mais altos de impulsividade e as pontuações podem
variar de 0 a 45. os indivíduos tiveram um desvio padrão de 6,0.
Suponha que esses dois grupos constituam amostras aleatórias simples independentes de duas populações de
indivíduos semelhantes. Assuma também que as pontuações do ICS nessas duas populações são normalmente distribuídas.
Encontre o intervalo de confiança de 99 por cento para a razão das duas variações populacionais de pontuações no
ICS.
6.10.3. Os valores do índice de AVC foram analisados estatisticamente para duas amostras de pacientes sofrendo de infarto do
miocárdio. As variâncias amostrais foram 12 e 10. Havia 21 pacientes em cada amostra. Construa o intervalo de
confiança de 95% para a razão das duas variações populacionais.
6.10.4. Trinta e dois asfásicos adultos que procuram terapia da fala foram divididos igualmente em dois grupos. O grupo 1
recebeu o tratamento 1 e o grupo 2 recebeu o tratamento 2. A análise estatística dos escores de eficácia do tratamento
produziu as seguintes variações: s2 ¼ 8;s2 ¼ 15. Construa o intervalo
1 de confiança
2 de 90 por cento para s2 2=s2 1.
6.10.5. As variâncias da amostra foram calculadas para os volumes correntes (mililitros) de dois grupos de pacientes com
comunicação interatrial. Os resultados e tamanhos de amostra foram os seguintes:
n1 ¼ 31; s21 ¼ 35; 000

n2 ¼ 41; s22 ¼ 20; 000
Construa o intervalo de confiança de 95% para a razão das duas variações populacionais.
6.10.6. As respostas de glicose à glicose oral foram registradas para 11 pacientes com doença de Huntington (grupo 1) e 13
indivíduos de controle (grupo 2). A análise estatística dos resultados produziu as seguintes variâncias de amostra: s2
¼ 105;s2 ¼ 148. Construa o intervalo de confiança de 95 por cento para a razão das duas variâncias populacionais.
1 2
6.10.7. Medições da secreção gástrica de ácido clorídrico (miliequivalentes por hora) em 16 indivíduos normais e 10 indivíduos com
úlcera duodenal produziram os seguintes resultados:
Sujeitos normais: 6,3, 2,0, 2,3, 0,5, 1,9, 3,2, 4,1, 4,0, 6,2, 6,1, 3,5, 1,3, 1,7, 4,5, 6,3, 6,2 13,7, 20,6, 15,9,
Temas de úlcera: 28,4, 29,4, 18,4, 21,1, 63,0
Construa um intervalo de confiança de 95% para a razão das duas variações populacionais. Quais pressupostos devem ser
atendidos para que esse procedimento seja válido?
6.11 RESUMO
Este capítulo trata de uma das principais áreas da inferência estatística — a estimativa.
Estimativa de ponto e estimativa de intervalo são abordadas. Os conceitos e métodos envolvidos na
construção de intervalos de confiança são ilustrados para os seguintes parâmetros: médias, diferença
entre duas médias, proporções, diferença entre duas proporções, variâncias e razão de duas variâncias.
Além disso, aprendemos neste capítulo como determinar o tamanho da amostra necessário para estimar
uma média populacional e uma proporção populacional em níveis especificados de precisão.
Aprendemos, também, neste capítulo, que estimativas de intervalo de parâmetros populacionais

são mais desejáveis do que estimativas pontuais porque declarações de confiança podem ser anexadas a
estimativas de intervalo.
Fórmula
6.2.1 Expressão de uma estimativa estimador ð Þ coeficiente

ð Þ erro padrão
de confiabilidade
do estimador
de intervalo
6.2.2 Estimativa de intervalo para x zð Þ 1a=2 sx

m quando s é conhecido
6.3.1 t-transformação xmt ¼

ffiffiffi
s=np
6.3.2 s
Estimativa de intervalo para ¼
x tð Þ 1a=2
ffiffiffi
m quando s é desconhecido np
6.4.1 Estimativa de intervalo para a s22

s21
diferença entre duas médias ð
x1 x2 º zðÞ 1a=2 þ
n1
n2 s
populacionais quando s1 e s2
são conhecidos
6.4.2 Estimativa de variância agrupada n121 s2 n2 11s2 ð Þ þ ð Þ n1 þ2

n2
2 ¼
sp
6.4.3 Erro padrão de estimativa s2 s2

p p
sð Þ x1x2
¼
þ
n2 n1
s
(Contínuo )
6.4.4 Estimativa de intervalo para

s2 s2
p p
a diferença entre dois ðx1 x2 º tðÞ 1a=2 þ
população significa quando n2 n1
s
s1 é desconhecido
6.4.5 Correção de Cochran para 0 w1t1 þ w2t2

t ¼
ð Þ 1a=2
coeficiente de confiabilidade w1 þ w2
quando as variâncias não são
iguais
6.4.6 Estimativa de intervalo usando

0 1 s22
Correção de Cochran para t ðx1 x2 º t s2 þ
ð Þ 1a=2
n2 n1
s
6.5.1 Estimativa de intervalo para um 1 ^pðÞ

^p zð Þ 1a=2 ^p =np
proporção da população
6.6.1 Estimativa de intervalo para o

ð ^p1 1 ^p1 ð ^p2 1 ^p2 Þ
diferença entre dois ð ^p1 ^ p2Þ zðÞ 1a=2 Þþ
n1 n2
proporções populacionais s
6.7.1–6.7.3 Determinação do tamanho da d ¼ ð coeficiente de confiabilidade Þ ð erro padrão Þ

amostra ao amostrar com s
d¼z ffiffiffi
reposição
np
;
z2s2
n¼
d2
6.7.4–6.7.5 Determinação do tamanho da s Nn

d¼ ffiffiffi
amostra ao amostrar sem znp N1r

reposição
;
Nz2s2
n¼
d2 ðz2s2
Þþ N 1
6.8.1 Determinação do tamanho da z2pq

n¼
amostra para proporções ao d2
amostrar com reposição
6.8.2 Determinação do tamanho da Nz2s2

n¼
amostra para proporções ao d2 ð Þþ N 1 z2s2
amostrar sem reposição
6.9.1 Estimativa de intervalo para s2 a=2

Þ nð1Þs2a=2
n 1 s2 ð ð Þ < s2 < x2 x2 1ð Þ
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
6.9.2 Estimativa de intervalo para s

ðx2
Þ n 1 s2 ðs2
Þn1
<s<
x2
1ð Þ a=2 s Þ a=2 sð
6.10.1 Estimativa de intervalo para o s2 1=s2 2

s21 s2 1=s2 2
< < s2
razão de duas variâncias
F1ð Þ a=2 2 Fa=2
6.10.2 Relação entre razões F 1

¼
Fa;df 1;df 2
F1a;df 2;df 1
Símbolo a ¼ taxa de erro tipo 1 x2

Chave ¼ distribuição qui-quadrada d ¼
componente de erro da estimativa de intervalo df ¼
graus de liberdade
F ¼ F-distribuição
m ¼ média da população n ¼
tamanho da amostra p ¼
proporção da população q ¼ ð Þ 1 p
^p ¼ proporção
população
s2estimada
¼s variância
¼ desvio
da da
amostra
padrão
da população sx ¼ erro padrão s ¼ desvio
padrão da amostra sp ¼ padrão agrupado
desvio t ¼ transformação t de Student
0t ¼ Correção de Cochran para t

x ¼ média da amostra z
¼ distribuição normal padrão
1. O que é inferência estatística?
2. Por que a estimativa é um tipo importante de inferência?
3. O que é uma estimativa pontual?
4. Explique o significado de imparcialidade.
(a) Coeficiente de confiabilidade (b) Coeficiente de confiança (e) (c) Precisão (f)
(d) Erro padrão Estimador Margem de erro
6. Forneça a fórmula geral para um intervalo de confiança.
7. Enuncie as interpretações probabilísticas e práticas de um intervalo de confiança.
8. Para que serve o teorema do limite central na estimativa?
9. Descreva a distribuição t.
10. Quais são as suposições subjacentes ao uso da distribuição t na estimativa de uma única população
significar?
11. Qual é a correção de população finita? Quando pode ser ignorado?
12. Quais são as suposições subjacentes ao uso da distribuição t para estimar a diferença entre
duas médias populacionais?
13. As análises de gases sanguíneos arteriais realizadas em uma amostra de 15 homens adultos fisicamente ativos produziram o
seguintes valores de PaO2 em repouso :
75; 80; 80; 74; 84; 78; 89; 72; 83; 76; 75; 87; 78; 79; 88
Calcule o intervalo de confiança de 95% para a média da população.
14. Qual a proporção de pacientes com asma que são alérgicos à poeira doméstica? Em uma amostra de 140, 35% tiveram reações
cutâneas positivas. Construa o intervalo de confiança de 95% para a proporção da população.
15. Uma pesquisa de higiene industrial foi realizada em uma grande área metropolitana. Das 70 fábricas de um determinado tipo
visitadas, 21 receberam uma classificação “ruim” com relação à ausência de riscos à segurança.
Construa um intervalo de confiança de 95% para a proporção da população que merece uma classificação “ruim”.
16. Consulte o problema anterior. Qual seria o tamanho da amostra necessária para estimar a proporção da população com precisão de
0,05 com 95% de confiança (0,30 é a melhor estimativa disponível de p): (a) Se a correção da população finita puder ser ignorada?
(b) Se a correção da população finita não for ignorada e N ¼ 1500?
17. Em uma pesquisa odontológica conduzida por uma equipe municipal de saúde bucal, 500 adultos foram questionados sobre o motivo
de sua última visita a um dentista. Dos 220 que não concluíram o ensino médio, 44 disseram que foram por motivos preventivos.
Dos 280 restantes, com ensino médio ou superior, 150 afirmaram ter ido por prevenção. Construa um intervalo de confiança de
95% para a diferença entre as duas proporções populacionais.
18. Uma equipe de pesquisa de câncer de mama coletou os seguintes dados sobre o tamanho do tumor:
Tipo de tumor n x s
UMA 21 3,85 cm 1,95 cm

B 16 2,80 cm 1,70 cm
Construa um intervalo de confiança de 95% para a diferença entre as médias populacionais.
19. Certo medicamento mostrou-se eficaz no tratamento de doenças pulmonares em 180 dos 200 casos tratados. Construa o intervalo
de confiança de 90% para a proporção da população.
20. Setenta pacientes com úlceras de estase na perna foram aleatoriamente divididos em dois grupos iguais. Cada grupo recebeu um
tratamento diferente para o edema. No final do experimento, a eficácia do tratamento foi medida em termos de redução no volume
da perna conforme determinado pelo deslocamento da água. As médias e desvios padrão para os dois grupos foram os seguintes:
Grupo (tratamento) x s
UMA 95 cc 25
B 125 cc 30
Construa um intervalo de confiança de 95% para a diferença nas médias populacionais.
21. Qual é o nível médio de bilirrubina sérica de pacientes internados em um hospital para tratamento de hepatite?
Uma amostra de 10 pacientes produziu os seguintes resultados:
20:5; 14:8; 21:3; 12:7; 15:2; 26:6; 23:4; 22:9; 15:7; 19:2
Construa um intervalo de confiança de 95% para a média da população.
22. As determinações dos níveis de pH da saliva foram feitas em duas amostras aleatórias independentes de escolares da
sétima série. As crianças da amostra A estavam livres de cárie, enquanto as crianças da amostra B tinham uma alta
incidência de cárie. Os resultados foram os seguintes:
A: 7.14, 7.11, 7.61, 7.98, 7.21, 7.16, 7.89 B: 7,36, 7,04, 7,19, 7,41, 7,10, 7,15, 7,36, 7,57, 7,64,
7.24, 7.86, 7.47, 7.82, 7.37, 7.66, 7.62, 7.65 7,00, 7,25, 7,19
Construa um intervalo de confiança de 90% para a diferença entre as médias populacionais. Assuma que as variâncias
populacionais são iguais.
23. A droga A foi prescrita para uma amostra aleatória de 12 pacientes com queixa de insônia. Uma amostra aleatória
independente de 16 pacientes com a mesma queixa recebeu a droga B. O número de horas de sono durante a segunda
noite após o início do tratamento foi o seguinte:
A: 3,5, 5,7, 3,4, 6,9, 17,8, 3,8, 3,0, 6,4, 6,8, 3,6, 6,9, 5,7 B: 4,5, 11,7,
10,8, 4,5, 6,3, 3,8, 6,2, 6,6, 7,1, 6,4, 4,5, 5,1 ,
3.2, 4.7, 4.5, 3.0
Construa um intervalo de confiança de 95% para a diferença entre as médias populacionais. Assuma que as variâncias
populacionais são iguais.
24. O objetivo do estudo de Crane et al. (A-29) foi examinar a eficácia, segurança e satisfação materna de (a) misoprostol oral e
(b) ocitocina intravenosa para indução do parto em mulheres com ruptura prematura de membranas a termo. Os
pesquisadores designaram mulheres aleatoriamente para os dois tratamentos. Para as 52 mulheres que receberam
misoprostol oral, o tempo médio em minutos para o trabalho de parto ativo foi de 358 minutos com um desvio padrão de
308 minutos. Para as 53 mulheres em uso de ocitocina, o tempo médio foi de 483 minutos com desvio padrão de 144
minutos. Construa um intervalo de confiança de 99% para a diferença no tempo médio para o trabalho de parto ativo para
esses dois medicamentos diferentes.
Que suposições devem ser feitas sobre os dados relatados? Descreva a população sobre a qual uma inferência pode ser
feita.
25. Durante um período de 2 anos, 34 mulheres européias com diabetes gestacional anterior foram recrutadas retrospectivamente
dos bancos de dados pré-natais de West London para um estudo conduzido por Kousta et al. (A-30). Uma das medidas
para essas mulheres foi a concentração de ácidos graxos não esterificados em jejum (NEFA) medida em mmol = L. Na
amostra de 34 mulheres, o nível médio de NEFA foi de 435 com desvio padrão amostral de 215,0. Construa um intervalo
de confiança de 95% para o nível médio de NEFA em jejum para uma população de mulheres com diabetes gestacional.
Declare todas as suposições necessárias sobre os dados e assuntos relatados.
26. Scheid et al. (A-31) questionou 387 mulheres que receberam triagem gratuita de densidade mineral óssea. As perguntas
enfocavam o histórico de tabagismo. Indivíduos submetidos à terapia de reposição hormonal (TRH) e indivíduos não
submetidos à TRH foram questionados se já haviam sido fumantes regulares. No grupo HRT, 29,3 por cento de 220
mulheres afirmaram que em algum momento de sua vida eram fumantes regulares. No grupo sem TRH, 17,3% das 106
mulheres responderam positivamente ao fato de terem sido fumantes regulares em algum momento de suas vidas.
(Sessenta e uma mulheres optaram por não responder à pergunta.) Construa um intervalo de confiança de 95% para a
diferença nas porcentagens de fumantes para as duas populações de mulheres representadas pelos sujeitos do estudo.
Quais suposições sobre os dados são necessárias?
27. O objetivo de um estudo de Elliott et al. (A-32) foi avaliar a prevalência de deficiência de vitamina D em mulheres que vivem
em asilos. A amostra consistiu de 39 mulheres em uma unidade de enfermagem especializada com 120 leitos. Mulheres
com mais de 65 anos de idade residentes de longa duração foram convidadas a participar se não tivessem diagnóstico
de câncer terminal ou doença metastática. Na amostra, 23 mulheres tinham níveis de 25-hidroxivitamina D de 20 ng/ml
ou menos. Construa um intervalo de confiança de 95% para a porcentagem de mulheres com deficiência de vitamina D
na população presumivelmente representada por esta amostra.
28. Em um estudo sobre o papel das gorduras dietéticas na etiologia da doença isquêmica do coração, os participantes foram 60
homens entre 40 e 60 anos de idade que tiveram um infarto do miocárdio recentemente e 50 homens aparentemente saudáveis
da mesma faixa etária e classe social . Uma variável de interesse no estudo foi a proporção de ácido linoléico (LA) nos ácidos
graxos triglicerídeos plasmáticos dos indivíduos. Os dados dessa variável foram os seguintes:
Indivíduos com Infarto do Miocárdio
Sujeito Los Angeles

Sujeito Los Angeles
Sujeito Los Angeles
Sujeito Los Angeles
1 18,0 2 17.6 3 9.6 4 5.5

5 16.8 6 12.9 7 14,0 8 8,0
9 8.9 10 15,0 11 9.3 12 5.8
13 8.3 14 4.8 15 6.9 16 18.3
17 24,0 18 16,8 19 12,1 20 12,9
21 16,9 22 15,1 23 6,1 24 16,6
25 8,7 26 15,6 27 12,3 28 14,9
29 16,9 30 5,7 31 14,3 32 14,1
33 14,1 34 15,1 35 10,6 36 13,6
37 16,4 38 10,7 39 18,1 40 14,3
41 6,9 42 6,5 43 17,7 44 13,4
45 15,6 46 10,9 47 13,0 48 10.6
49 7.9 50 2,8 51 15.2 52 22.3
53 9.7 54 15.2 55 10.1 56 11.5
57 15.4 58 17.8 59 12.6 60 7.2
Sujeitos Saudáveis
Sujeito Los Angeles

Sujeito Los Angeles
Sujeito Los Angeles
Sujeito Los Angeles
1 17.1 2 22.9 3 10.4 4 30.9

5 32,7 6 9.1 7 20.1 8 19.2
9 18.9 10 20.3 11 35,6 12 17.2
13 5.8 14 15.2 15 22.2 16 21.2
17 19.3 18 25.6 19 42.4 20 5.9
21 29.6 22 18.2 23 21.7 24 29,7
25 12.4 26 15.4 27 21.7 28 19.3
29 16.4 30 23.1 31 19,0 32 12.9
33 18.5 34 27.6 35 25,0 36 20,0
37 51,7 38 20,5 39 25.9 40 24.6
41 22.4 42 27.1 43 11.1 44 32,7
45 13.2 46 22.1 47 13.5 48 5.3
49 29,0 50 20.2
Construa o intervalo de confiança de 95% para a diferença entre as médias populacionais. O que esses dados sugerem sobre
os níveis de ácido linoléico nas duas populações amostradas?
29. O objetivo de um estudo de Tahmassebi e Curzon (A-33) foi comparar a taxa média de fluxo salivar entre indivíduos com paralisia
cerebral e entre indivíduos em um grupo de controle. Cada grupo tinha 10 sujeitos. A tabela a seguir fornece a taxa de fluxo
média em ml/minuto, bem como o erro padrão.
Grupo Tamanho da amostra Média ml/minuto Erro padrão
Paralisia cerebral 10 0,220 0,0582

Ao controle 10 0,334 0,1641
Fonte: JF Tahmassebi e MEJ Curzon, “A causa da baba em crianças com paralisia

cerebral — hipersalivação ou defeito de deglutição?” Jornal Internacional de
Odontopediatria, 13 (2003), 106–111.
Construa o intervalo de confiança de 90% para a diferença na taxa média de fluxo salivar para as duas populações de
indivíduos representadas pelos dados da amostra. Indique as suposições necessárias para que este seja um intervalo
de confiança válido.
30. Culligan et al. (A-34) comparou os resultados a longo prazo de dois tratamentos: (a) um procedimento de Burch
modificado e (b) um procedimento de tipoia para incontinência de estresse com uma uretra de baixa pressão. Trinta e
seis mulheres participaram do estudo, sendo 19 no grupo de tratamento com Burch e 17 no grupo de tratamento com
tipoia. Uma das medidas de resultado três meses após a cirurgia foi a pressão máxima de fechamento uretral (cm
H2O). No grupo Burch, a média e o desvio padrão foram de 16,4 e 8,2 cm, respectivamente. No grupo da tipoia, a
média e o desvio padrão foram 39,8 e 23,0, respectivamente.
Construa o intervalo de confiança de 99% para a diferença na pressão máxima média de fechamento uretral para as
duas populações representadas por esses indivíduos. Declare todas as suposições necessárias.
31. Em geral, intervalos de confiança estreitos são preferíveis aos amplos. Podemos estreitar um intervalo usando um
pequeno coeficiente de confiança. Para um determinado conjunto de outras condições, o que acontece com o nível
de confiança quando usamos um coeficiente de confiança pequeno? O que aconteceria com a largura do intervalo e
o nível de confiança se usássemos um coeficiente de confiança igual a zero?
32. Em geral, um alto nível de confiança é preferível a um baixo nível de confiança. Para um determinado conjunto de outras
condições, suponha que definimos nosso nível de confiança em 100%. Qual seria o efeito de tal escolha na largura do
intervalo?
33. Os sujeitos de um estudo de Borland et al. (A-35) eram crianças com dor aguda. Trinta e duas crianças que se
apresentaram em uma sala de emergência foram incluídas no estudo. Cada criança usou a escala visual analógica
para classificar a dor em uma escala de 0 a 100 mm. O escore médio de dor foi de 61,3 mm com um intervalo de
confiança de 95% de 53,2 mm–69,4 mm. Qual seria o fator de confiabilidade apropriado para o intervalo, z ou t?
Justifique sua escolha. Qual é a precisão da estimativa? A margem de erro?
34. O delirium aumenta o tempo de internação? Essa foi a questão de pesquisa investigada por McCusker et al.
(A-36). Os pesquisadores amostraram 204 pacientes com delirium prevalente e 118 sem delirium. A conclusão do
estudo foi que os pacientes com delirium prevalente não tiveram um tempo médio de permanência maior em
comparação com aqueles sem delirium. Qual era a população-alvo? A população amostrada?
35. Avaliar a auto-restrição ao dirigir em relação ao desempenho da visão foi o objetivo de um estudo de West et al. (A-37).
Os pesquisadores estudaram 629 motoristas atuais com 55 anos ou mais por 2 anos. As variáveis de interesse foram
comportamento ao dirigir, saúde, função física e função visual. Os sujeitos faziam parte de um estudo de visão maior
no Smith-Kettlewell Eye Research Institute. A conclusão do estudo foi que os idosos com alterações precoces na
função de visão espacial e percepção de profundidade parecem reconhecer suas limitações e restringir sua direção.
Qual era a população-alvo? A população amostrada?
36. Em um estudo piloto conduzido por Ayouba et al. (A-38), os pesquisadores estudaram 123 crianças nascidas de mães
infectadas pelo HIV-1 em Yaounde, Camarões. Mulheres grávidas aconselhadas e consentidas receberam uma dose
única de nevirapina no início do trabalho de parto. Os bebês receberam um xarope contendo nevirapina nas primeiras
72 horas de vida. Os pesquisadores descobriram que 87% das crianças foram consideradas não infectadas entre 6 e
8 semanas de idade. Qual é a população-alvo? Qual é a população amostrada?
37. Consulte o Exercício 2.3.11. Construa um intervalo de confiança de 95% para a razão S/R da média populacional.
Você deve usar t ou z como o coeficiente de confiabilidade? Porque? Descreva a população sobre quais
inferências com base neste estudo podem ser feitas.
38. Consulte o Exercício 2.3.12. Construa um intervalo de confiança de 90% para a altura média da população.
Você deve usar t ou z como o coeficiente de confiabilidade? Porque? Descreva a população sobre quais
inferências com base neste estudo podem ser feitas.
Exercícios para uso com grandes conjuntos de dados disponíveis no seguinte site: www.wiley.com/
college/daniel
1. Consulte os dados de registro de nascimento da Carolina do Norte NCBIRTH800 com 800 observações
(consulte o Exercício 1 de dados grandes no Capítulo 2). Calcule intervalos de confiança de 95 por cento
para o seguinte: (a) a porcentagem de crianças do sexo masculino (b) a idade média de uma mãe dando
à luz (c) o peso médio ganho durante a gravidez (d) a porcentagem de mães que admitiram fumar durante
a gravidez ( e) a diferença no peso médio ganho entre mães fumantes e não fumantes (f) a diferença no
peso médio ao nascer em gramas entre mães casadas e não casadas (g) a diferença na porcentagem de
bebês com baixo peso ao nascer entre casadas e não casadas
mães
2. Consulte os níveis séricos de colesterol para 1000 indivíduos (COLEST). Selecione uma amostra aleatória
simples de tamanho 15 dessa população e construa um intervalo de confiança de 95% para a média da
população. Compare seus resultados com os de seus colegas. Quais suposições são necessárias para
que seu procedimento de estimativa seja válido?
3. Consulte os níveis séricos de colesterol para 1000 indivíduos (COLEST). Selecione uma amostra aleatória
simples de tamanho 50 da população e construa um intervalo de confiança de 95 por cento para a
proporção de indivíduos na população com leituras superiores a 225. Compare seus resultados com os de
seus colegas.
4. Refere-se aos pesos de 1.200 bebês nascidos em um hospital comunitário (BABY WGTS). Desenhe uma
amostra aleatória simples de tamanho 20 dessa população e construa um intervalo de confiança de 95%
para a média da população. Compare seus resultados com os de seus colegas. Quais suposições são
necessárias para que seu procedimento de estimativa seja válido?
5. Refere-se aos pesos de 1.200 bebês nascidos em um hospital comunitário (BABY WGTS). Desenhe uma
amostra aleatória simples de tamanho 35 da população e construa um intervalo de confiança de 95% para
a média da população. Compare este intervalo com o construído no Exercício 4.
6. Consulte a altura de 1.000 meninos de 12 anos (BOY HGTS). Selecione uma amostra aleatória simples de
tamanho 15 dessa população e construa um intervalo de confiança de 99% para a média da população.
Quais suposições são necessárias para que esse procedimento seja válido?
7. Consulte a altura de 1.000 meninos de 12 anos (BOY HGTS). Selecione uma amostra aleatória simples de
tamanho 35 da população e construa um intervalo de confiança de 99% para a média da população.
Compare este intervalo com o construído no Exercício 5.
REFERÊNCIAS
1. JOHN A. RICE, Mathematical Statistics and Data Analysis, 2ª ed., Duxbury, Belmont, CA, 1988.
2. WS GOSSET (“Student”), “The Probable Error of a Mean,” Biometrika, 6 (1908), 1–25.
REFERÊNCIAS 211
3. WV BEHRENS, “Ein Beitrag zu Fehlerberechnung bei wenige Beobachtungen,” Landwirtsschaftliche 68 (1929), 807–837.
€
Jahrbücher ,
4. RA FISHER, “A comparação de amostras com variações possivelmente desiguais,” Annals of Eugenics, 9 (1939),
174–180.
5. RA FISHER, “A Abordagem Assintótica para a Integral de Behrens com Tabelas Adicionais para o Teste d de Significância,”
Annals of Eugenics, 11 (1941), 141–172.
6. J. NEYMAN, "Argumento Fiducial e a Teoria dos Intervalos de Confiança", Biometrika, 32 (1941), 128–150.
7. H. SCHEFFE, “On Solutions of the Behrens-Fisher Problem Based on the t-Distribution,” Annals of Mathematical
Estatísticas, 14 (1943), 35–44.
8. H. SCHEFFE, "Uma nota sobre o problema de Behrens-Fisher", Annals of Mathematical Statistics, 15 (1944), 430–432.
9. BL WELCH, “O significado da diferença entre duas médias quando as variações da população são
Desigual,” Biometrika, 29 (1937), 350–361.
10. BL WELCH, “A generalização do 'problema do aluno quando várias variações populacionais diferentes são
Envolvido,” Biometrika, 34 (1947), 28–35.
11. WILLIAM G. COCHRAN, “Níveis de significância aproximados do teste de Behrens-Fisher,” Biometria, 20 (1964),
191–195.
12. RF TATE e GW KLETT, "Intervalos de confiança ideais para a variância de uma distribuição normal", Journal of
a American Statistical Association, 54 (1959), 674-682.
13. HO HARTLEY, “The Maximum F-Ratio as a Short Cut Test for Heterogeneity of Variances,” Biometrika,
37 (1950), 308–312.
14. JH ZAR, Biostatistical Analysis, 4ª ed., Prentice-Hall, Upper Saddle River, NJ, 1999.
15. WAYNE W. DANIEL, Applied Nonparametric Statistics, 2ª ed., PWS-KENT, Boston, 1989.
A-1. NICOLA MAFFULLI, CHERLY TALLON, JASON WONG, KIM PENG e ROBERT BLEAKNEY, “Early Weightbearing and Ankle
Mobilization after Open Repair of Acute Midsubstance Tears of the Achilles Tendon,” American Journal of Sports Medicine, 31
(2003), 692–700.
A-2. PAUL J. REBER, LUCY A. MARTINEZ e SANDRA WEINTRAUB, "Aprendizagem de gramática artificial na doença de Alzheimer",
Neurociência cognitiva, afetiva e comportamental, 3 (2003), 145–153.
A-3. CHRISTOPHE PEDROLETTI, MARIEANN H€oGMAN, PEKKA MERILAINEN, LENNART S. NORDVALL, GUNILLA HEDLIN, e
€
KJELL ALVING, "Nitric Oxide Airway Difusing Capacity and Mucosal Concentration in Asthmatic School children," Pediatric
Research, 54 (2003), 496–501.
A-4. BRUCE D. BEYNNON, BRADEN C. FLEMING, DAVID L. CHURCHILL e DANIEL BROWN, “The Effect of Anterior Cruciate Ligament
Deficiency and Functional Bracing on Translation of the Tibia Relative to the Femur during Nonweightbearing and Weightbearing,”
American Journal of Sports Medicine , 31 (2003), 99–105.
A-5. LORRAINE DUGOFF, MAURITHA R. EVERETT, LOUIS VONTVER e GWYN E. BARLEY, “Evaluation of Pelvic and Breast
Examination Skills of Interns in Obstetrics and Gynecology and Internal Medicine,” American Journal of Obstetrics and Gynecology,
189 (2003), 655– 658.
A-6. DIONNE MAYHEW , KAREN M. PERRIN e WENDY STRUCHEN, “An Analysis of a Healthy Start Smoking Cessation Program,”
American Journal of Health Studies, 17 (2002), 186–190.
A-7. ERIC GRANHOLM, ROBERT ANTHENELLI, RITA MONTEIRO, JOHN SEVCIK e MARILYN STOLER, “Brief Integrated Outpatient
Dual-Diagnosis Treatment Reduces Psychiatric Hospitalizations,” American Journal on Addictions, 12 (2003), 306–313.
A-8. SILVIA IANNELO, ANTONINA CAVALERI, PAOLINA MILAZZO, SANTI CANTARELLA e FRANCESCO BELFIORE, “Baixo nível de
triglicerídeos séricos em jejum como marcador precoce de distúrbios autoimunes”, Medscape General Medicine, 5 (3) (2003).
A-9. EVELYN CY CHAN, SALLY W. VERNON, FREDERICK T. O'DONNELL, CHUL AHN, ANTHONY GRESINGER e DONNIE W.
AGA, “Consentimento informado para rastreamento de câncer com antígeno específico da próstata: quão bem os homens estão
recebendo a mensagem?” American Journal of Public Health, 93 (2003), 779–785.
A-10. RONALD F. VAN VOLLENHOVEN, SOFIA ERNESTAM, ANDERS HARJU, JOHAN BRATT e LARS KLARESKOG, “Etanercept
Versus Etanercept Plus Methotrexate: A Registry-Based Study Suggesting that the Combination Is Clinical More Effacious,”
Arthritis Research and Therapy, 5 (2003) , R347–R351.
A-11. SATOSHI NOZAWA, KATSUJI SHIMIZU, KEI MIYAMOTO e MIZUO TANAKA, “Repair of Pars Interarticularis Defect by Segmental
Wire Fixation in Young Athletes with Spondylolysis,” American Journal of Sports Medicine, 31 (2003), 359–364.
A-12. MORI J. KRANTZ, ILANA B. KUTINSKY, ALASTAIR D. ROBERTSON e PHILIP S. MEHLER, "Efeitos relacionados à dose da
metadona no prolongamento do intervalo QT em uma série de pacientes com Torsade de Pointes", Farmacoterapia, 23 (2003),
802 –805.
A-13. SUSANNAH FOX e DEBORAH FELLOWS, “Pesquisas de saúde e e-mail se tornaram mais comuns, mas há espaço para
melhorias nas pesquisas e no acesso geral à Internet”, Pew Internet and American Life Project, www.pewinternet.org/PPF/r/
95/report_display .asp.
A-14. CARLOS M. LUNA, DANIEL BLANZACO, MICHAEL S. NIDERMAN, WALTER MATARUCCO, NATALIO C. BAREDES, PABLO
DESMERY, FERNANDO PALIZAS, GUILLERMO MENGA, FERNANDO RIOS e CARLOS APEZTEGUIA, “Resolution of
Ventilator-Associated Pneumonia: Prospective Evaluation of Clinical Pulmonary Infection Score as an Early Clinical Predictor of
Outcome,” Critical Care Medicine, 31 (3) (2003), 676–682.
A-15. AREND FL SCHINKEL, JEROEN J. BAX, ERIC BOERSMA, ABDOU ELHENDY, ELENI C. VOURVOURI , JOS RTC ROELANDT
e DON POLDERMANS, “Assessment of Residual Myocardial Viability in Regions with Chronic Electrocardio graphic Q-Wave
Infarction,” American Heart Journal, 144 (2002), 865–869.
A-16. FRIEDERIKE VON ZUR MUHLEN, WEILUM QUAN, DAVID J. D'AGATE e TODD J. COHEN, “A Study of Carotid Sinus Massage
and Head-Up Tilt Table Testing in Patients with Syncope and Near-Syncope,” Journal of Invasive Cardiology, 14 (2002), 477–
482.
A-17. DANIEL F. CONNOR, RONALD J. STEINGARD, JENNIFER J. ANDERSON e RICHARD H. MELLONI, Jr., “Gender Differences
em Reactive and Proactive Aggression,” Psiquiatria Infantil e Desenvolvimento Humano, 33 (2003), 279–294.
A-18. ALLAN V. HORWITZ, CATHY SPATZ WIDOM, JULIE MCLAUGHLIN e HELENE RASKIN WHITE, “The Impact of Childhood Abuse
and Neglect on Adult Mental Health: A Prospective Study,” Journal of Health and Social Behavior, 42 (2001), 184–201 .
A-19. P. ADAB, T. MARSHALL, A. ROUSE, B. RANDHAWA, H. SANGHA e N. BHANGOO, “Estudo controlado randomizado do efeito
da informação baseada em evidências sobre a disposição das mulheres para participar do rastreamento do câncer cervical,”
Jornal de Epidemiologia e Saúde Comunitária, 57 (2003), 589–593.
A-20. JOHN A. SPERTUS, TIM KEWHURST, CYNTHIA M. DOUGHERTY e PAUL NICHOL, “Testing the Effectiveness of Converting
Patients to Long-Acting Antianginal Medications: The Quality of Life in Angina Research,”
American Heart Journal, 141 (2001), 550–558.
A-21. PATRICK R. FINLEY, HEIDI R. RENS, JOAN T. PONT, SUSAN L. GESS, CLIFTON LOUIE, SCOTTA. BULL, JANELLE Y. LEE e
LISA A. BERO, “Impacto de um Modelo de Cuidado Colaborativo na Depressão em um Ambiente de Atenção Primária: Um
Estudo Randomizado e Controlado,” Farmacoterapia, 23 (9) (2003), 1175–1185.
A-22. MICHAEL HUMMEL, EZIO BONIFACIO, HEIKE E. NASERKE e ANETTE G. ZIEGLER, “A eliminação do glúten dietético não reduz
os títulos de autoanticorpos associados ao diabetes tipo 1 em indivíduos de alto risco”, Diabetes Care, 25 (2002), 1111– 1116.
A-23. DOV AIZENBERG, ABRAHAM WEIZMAN e YORAM BARAK , "Sildenafil para Disfunção Erétil Induzida por Inibidor Seletivo de
Recaptação de Serotonina em Pacientes Deprimidos Idosos", Journal of Sex and Marital Therapy, 29 (2003), 297–303.
A-24. PETER BORDEN, JOHN NYLAND, DAVID NM CABORN e DAVID PIENKOWSKI, “Biomechanical Comparison of the FasT-Fix
Meniscal Repair Suture System with Vertical Mattress Sutures and Meniscus Arrows,” American Journal of Sports Medicine, 31
(2003), 374–378.
A-25. RACHEL H. ALLEN e MICHAEL T. GROSS, “Força dos flexores dos dedos e extensão passiva da amplitude de movimento da
primeira articulação metatarsofalângica em indivíduos com fascite plantar”, Journal of Orthopaedic and Sports Physical
Therapy, 33 (2003), 468–477.
A-26. MOHEB S. MONEIM, KEIKHOSROW FIROOZBAKHSH, DOMINIC GROSS, STEVEN D. YOUNG e GEORGE OMER, “Thumb
Amputations from Team Roping,” American Journal of Sports Medicine, 31 (2003), 728–735.
A-27. NETTA HORESH, ISRAEL ORBACH, DORON GOTHELF, MEIR EFRATI e ALAN APTER, “Comparação do comportamento suicida
de pacientes adolescentes internados com transtorno de personalidade limítrofe e depressão maior”, Journal of Nervous and
Mental Disease, 191 (2003), 582–588.
A-28. R. PLUTCHIK e H. VAN PRAAG, “A medição da suicidalidade, agressividade e impulsividade,” Clínica
Neuropharmacology, 9 (supl) (1989), 380–382.
A-29. JOAN MG CRANE, TINA DELANEY e DONNA HUTCHENS, “Oral Misoprostol para ruptura prematura de membranas no termo”,
REFERÊNCIAS 213
A-30. ELENI KOUSTA, NATASHA J. LAWRENCE, IAN F. GODSLAND, ANNA PENNY, VICTOR ANYAOKU, BARBARA A. MILLAUER,
ESTER CELA, DESMOND G. JOHNSTON, STEPHEN ROBINSON e MARK I. MCCARTHY, “Insulin Resistance and Beta Cell
Dysfunction in Normoglycaemic Mulheres Europeias com História de Diabetes Gestacional,” Endocrinologia Clínica, 59 (2003),
289–297.
A-31. DEWEY C. SCHEID, MARIO T. COLEMAN e ROBERT M. HAMM, “Do Perceptions of Risk and Quality of Life
Affect Use of Hormone Replace Therapy by Postmenopausal Women?” Journal of the American Board of
Family Practice, 16 (2003), 270–277.
A-32. MARY E. ELLIOTT, NEIL C. BINKLEY, MOLLY CARNES, DAVID R. ZIMMERMAN, KIM PETERSEN, KATHY KNAPP, JESSICA J.
BEHLKE, NANCY AHMANN e MARY A. KIESER, “Riscos de fratura para mulheres em cuidados prolongados: alta prevalência
de osteoporose calcânea e hipovitaminose D”, Farmacoterapia, 23 (2003), 702–710.
A-33. JF TAHMASSEBI e MEJ CURZON, “A causa da baba em crianças com paralisia cerebral — hipersalivação ou
defeito de deglutição?” Jornal Internacional de Odontopediatria, 13 (2003), 106–111.
A-34. PATRICK J. CULLIGAN, ROGER P. GOLDBERG e PETER K. SAND, “A Randomized Controlled Trial Comparing
a Modified Burch Procedure and a Suburethral Sling: Long-Term Follow-Up,” International Urogynecology
Journal, 14 (2003), 229– 233.
A-35. MEREDITH L. BORLAND, IAN JACOBS e GARY GEELHOE, “Intranasal Fentanyl Reduz a Dor Aguda em Crianças no
Departamento de Emergência: Um Estudo de Segurança e Eficácia,” Emergency Medicine, 14 (2002), 275–280.
A-36. JANE MCCUSKER, MARTIN G. COLE, NANDINI DENDUKURI e ERIC BELZILE, “Does Delirium
Ficar?" Jornal da Sociedade Americana de Geriatria, 51 (2003), 1539–1546.
A-37. CATHERINE G. WEST, GINNY GILDENGORIN , GUNILLA HAEGERSTROM PORTNOY, LORI A. LOTT, MARILYN E. SCHNECK
e JOHN A. BRABYN, “Vision and Driving Self-Restriction in Older Adults,” Journal of the American Geriatrics Society, 51 (2003 ),
1348-1355.
A-38. AHIDJO AYOUBA, GILBERT TENE , PATRICK CUNIN, YACOUBA FOUPOUAPOUOGNIGNI, ELISABETH MENU, ANFUMBOM
KFUTWAH, JOCELYN THONNON, GABRIELLA SCARLATTI, MARCEL MONNY-LOBE, NICOLE ETEKI , CHARLES
KOUANFACK, MICHELE TARDY, ROBERT LEKE, MAURICE NKAM , ANNE E. BARRE-SINOUSSI,
ERIC NERRIENET,
PAUL
S
“Baixa
MV MARTIN
taxa de e
transmissão de HIV-1 de mãe para filho após intervenção com nevirapina em um programa piloto de saúde pública em Yaounde,
Camarões,” Journal of Acquired Immune Deficiency Syndrome, 34 ( 2003), 274–280.
CAPÍTULO 7
TESTANDO HIPÓTESES
Este capítulo aborda o teste de hipóteses, a segunda de duas áreas gerais de

inferência estatística. O teste de hipóteses é um tópico com o qual você, como
aluno, provavelmente tem alguma familiaridade. A estimativa de intervalo, discutida
no capítulo anterior, e o teste de hipótese são baseados em conceitos semelhantes.
Na verdade, os intervalos de confiança podem ser usados para chegar às mesmas
conclusões que são alcançadas por meio do uso de testes de hipóteses. Este
capítulo fornece um formato, seguido ao longo deste livro, para conduzir um teste de hipótese.
TÓPICOS
7.1 INTRODUÇÃO
7.2 TESTE DE HIPÓTESE: UMA ÚNICA MÉDIA DE POPULAÇÃO
7.3 TESTE DE HIPÓTESES: A DIFERENÇA ENTRE DUAS POPULAÇÕES

MEIOS
7.4 COMPARAÇÕES DE PARES
7.5 TESTE DE HIPÓTESE: UMA ÚNICA PROPORÇÃO DE POPULAÇÃO
7.6 TESTE DE HIPÓTESE: A DIFERENÇA ENTRE DUAS POPULAÇÕES

PROPORÇÕES
7.7 TESTE DE HIPÓTESE: VARIÂNCIA DE UMA ÚNICA POPULAÇÃO
7.8 TESTE DE HIPÓTESE: A RAZÃO DE DUAS VARIÂNCIAS DE POPULAÇÃO
7.9 O ERRO TIPO II E O PODER DE UM TESTE
7.10 DETERMINANDO O TAMANHO DA AMOSTRA PARA CONTROLAR ERROS TIPO II
7.11 RESUMO
Depois de estudar este capítulo, o aluno irá 1. entender como
enunciar corretamente uma hipótese nula e alternativa e realizar uma

teste de hipótese estruturado.
2. entender os conceitos de erro tipo I, erro tipo II e o poder de um teste. 3. ser capaz de calcular e interpretar estatísticas de teste
z, t, F e qui-quadrado para fazer

inferências estatísticas.
4. entender como calcular e interpretar os valores de p.
214
7.1 INTRODUÇÃO
Um tipo de inferência estatística, a estimativa, é discutido no capítulo anterior. O outro tipo, teste de
hipótese, é o assunto deste capítulo. Como acontece com a estimativa, o propósito do teste de hipótese é
ajudar o clínico, pesquisador ou administrador a chegar a uma conclusão sobre uma população examinando
uma amostra dessa população. A estimativa e o teste de hipóteses não são tão diferentes quanto parecem
pelo fato de que a maioria dos livros didáticos dedica um capítulo separado para cada um. Como
explicaremos mais tarde, pode-se usar intervalos de confiança para chegar às mesmas conclusões que
são alcançadas usando os procedimentos de teste de hipóteses discutidos neste capítulo.
Conceitos Básicos Nesta seção são apresentados alguns dos conceitos básicos essenciais para a
compreensão do teste de hipóteses. Os detalhes específicos de determinados testes serão fornecidos nas
seções seguintes.
DEFINIÇÃO
Uma hipótese pode ser definida simplesmente como uma declaração sobre uma ou
mais populações.
A hipótese está frequentemente preocupada com os parâmetros das populações sobre as quais a
afirmação é feita. Um administrador hospitalar pode supor que o tempo médio de permanência dos
pacientes internados no hospital é de 5 dias; uma enfermeira de saúde pública pode levantar a hipótese de
que um determinado programa educacional resultará em uma melhor comunicação entre enfermeira e
paciente; um médico pode supor que um determinado medicamento será eficaz em 90 por cento dos casos
para os quais é usado. Por meio de testes de hipóteses, determina-se se tais afirmações são ou não
compatíveis com os dados disponíveis.
Tipos de hipóteses Os pesquisadores se preocupam com dois tipos de hipóteses — hipóteses de pesquisa
e hipóteses estatísticas.
DEFINIÇÃO A
hipótese de pesquisa é a conjectura ou suposição que motiva a pesquisa.
Pode ser o resultado de anos de observação por parte do pesquisador. Uma enfermeira de saúde
pública, por exemplo, pode ter notado que certos clientes responderam mais prontamente a um determinado
tipo de programa de educação em saúde. Um médico pode se lembrar de vários casos em que certas
combinações de medidas terapêuticas foram mais eficazes do que qualquer uma delas isoladamente.
Projetos de pesquisa geralmente resultam do desejo de tais profissionais de saúde de determinar se suas
teorias ou suspeitas podem ou não ser apoiadas quando submetidas aos rigores da investigação científica.
216 CAPÍTULO 7 TESTE DE HIPÓTESES
As hipóteses de pesquisa levam diretamente a hipóteses estatísticas.
DEFINIÇÃO
Hipóteses estatísticas são hipóteses formuladas de forma que possam ser avaliadas
por técnicas estatísticas apropriadas.
Neste livro, as hipóteses nas quais vamos nos concentrar são as hipóteses estatísticas.
Assumiremos que as hipóteses de pesquisa para os exemplos e exercícios já foram consideradas.
Etapas do teste de hipóteses Por conveniência, o teste de hipóteses será apresentado como um
procedimento de dez etapas. Não há nada de mágico ou sagrado nesse formato específico. Simplesmente
divide o processo em uma sequência lógica de ações e decisões.
1. Dados. A natureza dos dados que formam a base dos procedimentos de teste deve ser entendida,
pois isso determina o teste específico a ser empregado. Se os dados consistem em contagens ou
medições, por exemplo, deve ser determinado.
2. Suposições. Como aprendemos no capítulo sobre estimativa, diferentes suposições levam a
modificações nos intervalos de confiança. O mesmo é verdade no teste de hipóteses: um
procedimento geral é modificado dependendo das suposições. Na verdade, as mesmas suposições
que são importantes na estimativa são importantes no teste de hipóteses. Vimos que isso inclui
suposições sobre a normalidade da distribuição da população, igualdade de variâncias e
independência das amostras.
3. Hipóteses. Existem duas hipóteses estatísticas envolvidas no teste de hipóteses, e elas devem ser
declaradas explicitamente. A hipótese nula é a hipótese a ser testada. É designado pelo símbolo
H0. A hipótese nula às vezes é referida como uma hipótese de nenhuma diferença, uma vez que
é uma declaração de concordância com (ou nenhuma diferença de) condições presumidas como
verdadeiras na população de interesse. Em geral, a hipótese nula é montada com o propósito
expresso de ser desacreditada. Consequentemente, o complemento da conclusão que o
pesquisador busca chegar torna-se a afirmação da hipótese nula. No processo de teste, a hipótese
nula é rejeitada ou não é rejeitada. Se a hipótese nula não for rejeitada, diremos que os dados nos
quais o teste se baseia não fornecem evidências suficientes para causar rejeição. Se o
procedimento de teste levar à rejeição, diremos que os dados em questão não são compatíveis
com a hipótese nula, mas dão suporte a alguma outra hipótese. A hipótese alternativa é uma
declaração do que acreditaremos ser verdade se nossos dados de amostra nos fizerem rejeitar a
hipótese nula. Normalmente, a hipótese alternativa e a hipótese de pesquisa são as mesmas e, de
fato, os dois termos são usados de forma intercambiável.
Designaremos a hipótese alternativa pelo símbolo HA.
Regras para estabelecer hipóteses estatísticas Quando as hipóteses são do tipo considerado neste
capítulo, uma indicação de igualdade ðou ¼; ; ou Þ deve aparecer na hipótese nula. Suponha,
exemplo,
por que
queremos responder à
pergunta: Podemos concluir que uma certa média populacional não é 50? A hipótese nula é
H0: m ¼ 50
e a alternativa é
HA: m 6¼ 50
Suponha que queremos saber se podemos concluir que a média da população é maior que 50. Nossas
hipóteses são
H0: m 50 HA: m > 50
Se quisermos saber se podemos concluir que a média da população é menor que 50, as hipóteses são
H0: m 50 HA: m < 50
Em resumo, podemos estabelecer as seguintes regras práticas para decidir qual afirmação vai na
hipótese nula e qual afirmação vai na hipótese alternativa:
(a) O que você espera ou espera ser capaz de concluir como resultado do teste geralmente deve ser
colocado na hipótese alternativa.
(b) A hipótese nula deve conter uma declaração de igualdade, seja ¼; ; (c) A hipótese nula é a ou .
hipótese que é testada. (d) As hipóteses nula e alternativa são complementares. Ou seja, os
dois juntos esgotam todas as possibilidades quanto ao valor que o parâmetro hipotético pode
presumir.
Uma precaução Deve ser apontado que nem o teste de hipóteses nem a inferência estatística, em geral,
levam à prova de uma hipótese; apenas indica se a hipótese é suportada ou não pelos dados disponíveis.
Quando deixamos de rejeitar uma hipótese nula, portanto, não dizemos que ela é verdadeira, mas que pode
ser verdadeira. Quando falamos em aceitar uma hipótese nula, temos essa limitação em mente e não
queremos transmitir a ideia de que aceitar implica prova.
4. Estatística de teste. A estatística de teste é alguma estatística que pode ser calculada a partir dos dados
da amostra. Como regra, existem muitos valores possíveis que a estatística de teste pode assumir, o
valor específico observado dependendo da amostra específica coletada. Como veremos, a estatística
de teste serve como um tomador de decisão, pois a decisão de rejeitar ou não a hipótese nula depende
da magnitude da estatística de teste.
Um exemplo de uma estatística de teste é a quantidade
x m0 z
¼ ffiffiffi
(7.1.1)
nps=
onde m0 é um valor hipotético de uma média populacional. Esta estatística de teste está relacionada
com a estatística
xmz ¼
ffiffiffi
(7.1.2)
s=np
com os quais já estamos familiarizados.
Fórmula geral para estatística de teste A seguir está uma fórmula geral para uma estatística de teste que será
aplicável em muitos dos testes de hipótese discutidos neste livro:
estatística relevante estatística de teste de parâmetro

hipotético ¼ erro padrão da estatística relevante
ffiffiffi
Na Equação 7.1.1, x é a estatística relevante, m0 é o parâmetro hipotético e s= np é o erro padrão de x, a

estatística relevante.
5. Distribuição da estatística de teste. Foi apontado que a chave para a inferência estatística é a distribuição
amostral. Somos lembrados disso novamente quando se torna necessário especificar a distribuição de
probabilidade da estatística de teste. A distribuição da estatística de teste
x m0 z
¼ nps= ffiffiffi
por exemplo, segue a distribuição normal padrão se a hipótese nula for verdadeira e as suposições
forem atendidas.
6. Regra de decisão. Todos os valores possíveis que a estatística de teste pode assumir são pontos no eixo
horizontal do gráfico da distribuição da estatística de teste e são divididos em dois grupos; um grupo
constitui o que é conhecido como região de rejeição e o outro grupo constitui a região de não rejeição.
Os valores da estatística de teste que formam a região de rejeição são aqueles valores menos prováveis
de ocorrer se a hipótese nula for verdadeira, enquanto os valores que compõem a região de aceitação
são mais prováveis de ocorrer se a hipótese nula for verdadeira. A regra de decisão nos diz para rejeitar
a hipótese nula se o valor da estatística de teste que calculamos de nossa amostra for um dos valores
na região de rejeição e não rejeitar a hipótese nula se o valor calculado da estatística de teste for um
dos os valores na região de não rejeição.
Nível de significância A decisão sobre quais valores vão para a região de rejeição e quais vão para a região de
não rejeição é feita com base no nível de significância desejado, designado por a. O termo nível de significância
reflete o fato de que os testes de hipótese às vezes são chamados de testes de significância, e um valor
calculado da estatística de teste que cai na região de rejeição é considerado significativo. O nível de significância,
a, especifica a área sob a curva da distribuição da estatística de teste que está acima dos valores na
eixo horizontal constituindo a região de rejeição.

DEFINIÇÃO
O nível de significância a é uma probabilidade e, de fato, é a probabilidade de

rejeitar uma hipótese nula verdadeira.
Uma vez que rejeitar uma hipótese nula verdadeira constituiria um erro, parece apenas
razoável que devamos tornar pequena a probabilidade de rejeitar uma hipótese nula verdadeira e,
de fato, é isso que é feito. Selecionamos um pequeno valor de a para tornar pequena a probabilidade
de rejeitar uma hipótese nula verdadeira. Os valores de a encontrados com mais frequência são
0,01, 0,05 e 0,10.
Tipos de Erros O erro cometido quando uma hipótese nula verdadeira é rejeitada é chamado de
erro tipo I. O erro tipo II é o erro cometido quando uma hipótese nula falsa não é rejeitada. A
probabilidade de cometer um erro tipo II é designada por b.
Sempre que rejeitamos uma hipótese nula existe sempre o risco concomitante de cometer
um erro tipo I, rejeitando uma verdadeira hipótese nula. Sempre que falhamos em rejeitar uma
hipótese nula, o risco de falhar em rejeitar uma falsa hipótese nula está sempre presente. Fazemos
um pequeno, mas geralmente não exercemos controle sobre b, embora saibamos que na maioria
das situações práticas ele é maior que a.
Nunca sabemos se cometemos um desses erros quando rejeitamos ou deixamos de rejeitar
uma hipótese nula, pois o verdadeiro estado de coisas é desconhecido. Se o procedimento de teste
levar à rejeição da hipótese nula, podemos nos confortar com o fato de que cometemos um erro
pequeno e, portanto, a probabilidade de cometer um erro do tipo I era pequena. Se falharmos em
rejeitar a hipótese nula, não sabemos o risco concorrente de cometer um erro tipo II, uma vez que
b é geralmente desconhecido, mas, como foi apontado, sabemos que, na maioria das situações
práticas, é maior do que uma.
A Figura 7.1.1 mostra, para várias condições de um teste de hipótese, as possíveis ações
que um investigador pode realizar e as condições sob as quais cada um dos dois tipos de erro será
cometido. A tabela mostrada nesta figura é um exemplo do que geralmente é chamado de matriz
de confusão.
7. Cálculo da estatística de teste. A partir dos dados contidos na amostra, calculamos um valor
da estatística de teste e comparamos com as regiões de rejeição e não rejeição que já foram
especificadas.
8. Decisão estatística. A decisão estatística consiste em rejeitar ou não rejeitar a hipótese nula.
Ele é rejeitado se o valor calculado da estatística de teste cair no
Condição da Hipótese Nula
Verdadeiro Falso
Falha ação correta erro tipo II

Possível ao rejeitar H0
Ação
Rejeitar H0 erro tipo I ação correta
FIGURA 7.1.1 Condições sob as quais erros tipo I e tipo II podem ser cometidos.
região de rejeição e não é rejeitada se o valor calculado da estatística de teste cair na região de não
rejeição.
9. Conclusão. Se H0 for rejeitada, concluímos que HA é verdadeira. Se H0 não for rejeitada,
concluir que H0 pode ser verdadeira.
10. valores p. O valor p é um número que nos diz quão incomuns são os resultados de nossa amostra,
dado que a hipótese nula é verdadeira. Um valor de p indicando que os resultados da amostra
provavelmente não ocorreram, se a hipótese nula for verdadeira, fornece justificativa para duvidar
da verdade da hipótese nula.
DEFINIÇÃO
Um valor p é a probabilidade de que o valor calculado de uma estatística de teste seja

pelo menos tão extremo quanto um valor especificado da estatística de teste quando a
hipótese nula for verdadeira. Assim, o valor de p é o menor valor de a para o qual podemos
rejeitar uma hipótese nula.
Ressaltamos que quando a hipótese nula não é rejeitada não se deve dizer que a hipótese nula é
aceita. Devemos dizer que a hipótese nula “não é rejeitada”. Evitamos usar a palavra “aceitar” neste caso
porque podemos ter cometido um erro do tipo II.
Como, frequentemente, a probabilidade de cometer um erro tipo II pode ser bastante alta, não queremos
nos comprometer a aceitar a hipótese nula.
A Figura 7.1.2 é um fluxograma das etapas que seguimos quando realizamos uma hipótese
teste.
Finalidade do teste de hipótese A finalidade do teste de hipótese é auxiliar administradores e médicos na

tomada de decisões. A decisão administrativa ou clínica geralmente depende da decisão estatística. Se a
hipótese nula for rejeitada, a decisão administrativa ou clínica geralmente reflete isso, na medida em que a
decisão é compatível com a hipótese alternativa. O inverso é geralmente verdadeiro se a hipótese nula não
for rejeitada. A decisão administrativa ou clínica, no entanto, pode assumir outras formas, como a decisão
de coletar mais dados.
Também enfatizamos que os procedimentos de teste de hipóteses destacados no restante deste

capítulo geralmente examinam o caso de dados normalmente distribuídos ou casos em que os
procedimentos são apropriados porque o teorema do limite central se aplica. Na prática, não é incomum
que as amostras sejam pequenas em relação ao tamanho da população ou tenham amostras altamente
distorcidas e, portanto, a suposição de normalidade é violada. Os métodos para lidar com essa situação,
que são métodos livres de distribuição ou não paramétricos, são examinados em detalhes no Capítulo 13.
A maioria dos pacotes de computador inclui um procedimento analítico (por exemplo, o teste de Shapiro-
Wilk ou Anderson-Darling) para testar a normalidade. É importante que tais testes sejam realizados antes
da análise dos dados. Além disso, ao testar duas amostras, há uma suposição implícita de que as variações
são iguais. Testes para essa suposição são fornecidos na Seção 7.8. Finalmente, deve-se notar que os
testes de hipóteses, assim como os intervalos de confiança, são relativamente
avaliar
dados
Revisar
suposições
hipóteses de estado
Selecione
as
estatísticas de teste
Determinar a
distribuição das
estatísticas
de teste
regra
de decisão
estadual
Calcular
estatísticas de teste
Não Tomar
decisão Rejeitar H0
rejeitar H0 estatística
Concluir H0 Concluir HA é
pode ser verdadeiro verdadeiro
FIGURA 7.1.2 Etapas do procedimento de teste de hipótese.
sensível ao tamanho das amostras que estão sendo testadas, e deve-se tomar cuidado ao interpretar os resultados
que envolvem tamanhos de amostra muito pequenos.
Devemos enfatizar neste ponto, no entanto, que o resultado do teste estatístico é apenas uma evidência que
influencia a decisão administrativa ou clínica. A decisão estatística não deve ser interpretada como definitiva, mas
deve ser considerada junto com todas as outras informações relevantes disponíveis para o experimentador.
Com esses comentários gerais como pano de fundo, agora discutimos hipóteses específicas
testes.
7.2 TESTE DE HIPÓTESE: UMA ÚNICA MÉDIA

DE POPULAÇÃO
Nesta seção, consideramos o teste de uma hipótese sobre a média de uma população sob três condições
diferentes: (1) quando a amostragem é de uma população normalmente distribuída de valores com
variância conhecida; (2) quando a amostragem é de uma população normalmente distribuída com
variância desconhecida e (3) quando a amostragem é de uma população que não é normalmente
distribuída. Embora a teoria para as condições 1 e 2 dependa de populações normalmente distribuídas, é
prática comum fazer uso da teoria quando as populações relevantes são apenas aproximadamente
distribuídas normalmente. Isso é satisfatório, desde que o afastamento da normalidade não seja drástico.
Quando a amostragem é de uma população normalmente distribuída e a variância da população é
conhecida, a estatística de teste para testar H0: m ¼ m0 é
xmz ¼
ffiffiffi
(7.2.1)
s=np
que, quando H0 é verdadeiro, é distribuído como a normal padrão. Os exemplos 7.2.1 e 7.2.2 ilustram o
teste de hipótese nessas condições.
Amostragem de Populações Normalmente Distribuídas: Variâncias Populacionais Conhecidas Como

fizemos no Capítulo 6, enfatizamos novamente que são raras as situações em que a variável de interesse
é normalmente distribuída com uma variância conhecida. O exemplo a seguir, entretanto, servirá para
ilustrar o procedimento.
EXEMPLO 7.2.1
Os pesquisadores estão interessados na idade média de uma determinada população. Digamos que eles
estão fazendo a seguinte pergunta: podemos concluir que a média de idade dessa população é diferente
de 30 anos?
Solução: Com base em nosso conhecimento sobre testes de hipóteses, respondemos que eles podem
concluir que a idade média é diferente de 30 anos se rejeitarem a hipótese nula de que a
média é igual a 30. Vamos usar o procedimento de teste de hipóteses de dez etapas dado
na seção anterior para ajudar os pesquisadores a chegar a uma conclusão.
1. Dados. Os dados disponíveis para os pesquisadores são as idades de uma amostra

aleatória simples de 10 indivíduos retirados da população de interesse.
A partir desta amostra, uma média de x ¼ 27 foi calculada.
2. Suposições. Assume-se que a amostra vem de uma população cujas idades são
aproximadamente normalmente distribuídas. Suponhamos também que a população
tenha uma variância conhecida de s2 ¼ 20.
3. Hipóteses. A hipótese a ser testada, ou hipótese nula, é que a idade média da
população é igual a 30 anos. A hipótese alternativa é
7.2 TESTE DE HIPÓTESE: UMA ÚNICA POPULAÇÃO MÉDIA 223
que a idade média da população não é igual a 30. Observe que estamos
identificando com a hipótese alternativa a conclusão que os pesquisadores
desejam chegar, de modo que, se os dados permitirem a rejeição da hipótese
nula, a conclusão dos pesquisadores terá mais peso , uma vez que a
probabilidade de rejeição de uma hipótese nula verdadeira será pequena.
Garantiremos isso atribuindo um valor pequeno a a, a probabilidade de
cometer um erro do tipo I. Podemos apresentar as hipóteses relevantes de
forma compacta da seguinte forma:
H0: m ¼ 30
HA: m 6¼ 30
4. Estatística de teste. Como estamos testando uma hipótese sobre a média da

população, como assumimos que a população é normalmente distribuída e
como a variância da população é conhecida, nossa estatística de teste é dada
pela Equação 7.2.1.
5. Distribuição da estatística de teste. Com base em nosso conhecimento das
distribuições amostrais e da distribuição normal, sabemos que a estatística
de teste é normalmente distribuída com média 0 e variância 1, se H0 for
verdadeira. Existem muitos valores possíveis da estatística de teste que a
situação atual pode gerar; um para cada amostra possível de tamanho 10 que
pode ser extraída da população. Como extraímos apenas uma amostra, temos
apenas um desses valores possíveis para basear uma decisão.
6. Regra de decisão. A regra de decisão nos diz para rejeitar H0 se o valor

calculado da estatística de teste cair na região de rejeição e não rejeitar H0
se cair na região de não rejeição. Devemos agora especificar as regiões de
rejeição e não rejeição. Podemos começar nos perguntando que magnitude
de valores da estatística de teste causará a rejeição de H0. Se a hipótese
nula for falsa, pode ser porque a média da população é menor que 30 ou
porque a média da população é maior que 30. Portanto, valores suficientemente
pequenos ou suficientemente grandes da estatística de teste causarão a
rejeição do nulo hipótese. Queremos que esses valores extremos constituam
a região de rejeição. Quão extremo deve ser um valor possível da estatística
de teste para se qualificar para a região de rejeição? A resposta depende do
nível de significância que escolhermos, ou seja, do tamanho da probabilidade
de cometer um erro tipo I. Digamos que queremos que a probabilidade de
rejeitar uma hipótese nula verdadeira seja de ¼ :05. Como nossa região de
rejeição deve consistir em duas partes, valores suficientemente pequenos e
valores suficientemente grandes da estatística de teste, parte de a terá que
ser associada aos valores grandes e parte aos valores pequenos. Parece
razoável que devamos dividir a igualmente e deixar a=2 ¼ :025 estar
associado a valores pequenos e a=2 ¼ :025 estar associado a valores grandes.
Valor crítico da estatística de teste
Que valor da estatística de teste é tão grande que, quando a hipótese nula é verdadeira, a probabilidade de obter
um valor tão grande ou maior é de 0,025? Em outras palavras, qual é o valor de z à direita do qual está 0,025 da
área sob a distribuição normal padrão? O valor de z à direita do qual está 0,025 da área é o mesmo valor que tem
0,975 da área entre ele e 1. Procuramos no corpo do Apêndice Tabela D até encontrar 0,975 ou seu valor mais
próximo e lemos o entradas marginais correspondentes para obter nosso valor z. No presente exemplo, o valor de
z é 1,96. Raciocínio semelhante nos levará a encontrar 1:96 como o valor da estatística de teste tão pequeno que,
quando a hipótese nula for verdadeira, a probabilidade de obter um valor tão pequeno ou menor é de 0,025. Nossa
região de rejeição, então, consiste em todos os valores da estatística de teste iguais ou maiores que 1,96 e menores
ou iguais a 1:96. A região de não rejeição consiste em todos os valores intermediários. Podemos enunciar a regra
de decisão para este teste da seguinte forma: rejeitar H0 se o valor calculado da estatística de teste for 1:96 ou
1:96. Caso contrário, não rejeite H0. As regiões de rejeição e não rejeição são mostradas na Figura 7.2.1. Os
valores da estatística de teste que separam as regiões de rejeição e não rejeição são chamados de valores críticos
da estatística de teste, e a região de rejeição às vezes é chamada de região crítica.
A regra de decisão nos diz para calcular um valor da estatística de teste a partir dos dados de nossa
amostra e rejeitar H0 se obtivermos um valor igual ou maior que 1,96 ou igual ou menor que 1:96 e falhar em
rejeitar H0 se obtivermos qualquer outro valor. O valor de a e, portanto, a regra de decisão devem ser decididos
antes de coletar os dados.
Isso evita que sejamos acusados de permitir que os resultados da amostra influenciem nossa escolha de a. Essa
condição de objetividade é altamente desejável e deve ser preservada em todos os testes.
7. Cálculo da estatística de teste. De nossa amostra, calculamos
27 30 3
z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ ¼ 2:12
1:4142
20=10 p
8. Decisão estatística. Seguindo a regra de decisão, podemos rejeitar a hipótese nula, pois 2:12
está na região de rejeição. Nós
s=1
0,95
a/2= 0,025 a/2 = 0,025
_ 69.1 0 69.1 z
região de rejeição região de não região de rejeição

rejeição
FIGURA 7.2.1 Regiões de rejeição e não rejeição para o Exemplo 7.2.1.

pode dizer que o valor calculado da estatística de teste é significativo no

nível 0,05.
9. Conclusão. Concluímos que m não é igual a 30 e deixamos que nossas
ações administrativas ou clínicas estejam de acordo com essa conclusão.
10. valores p. Em vez de dizer que um valor observado da estatística de teste

é significativo ou não significativo, a maioria dos escritores na literatura de
pesquisa prefere relatar a probabilidade exata de obter um valor tão
extremo ou mais extremo do que o observado se a hipótese nula for
verdadeira. No presente caso, esses escritores dariam o valor calculado
da estatística de teste junto com a declaração p ¼ :0340. A declaração p
¼ :0340 significa que a probabilidade de obter um valor tão extremo quanto
2,12 em qualquer direção, quando a hipótese nula for verdadeira, é 0,0340.
O valor 0,0340 é obtido da Tabela D do Apêndice e é a probabilidade de
observar az 2:12 ou az 2:12 quando a hipótese nula équandoverdadeira.
H0 éIsto é,
verdadeiro, a probabilidade de obter um valor de z tão grande ou maior que
2,12 é 0,0170, e a probabilidade de observar um valor de z tão pequeno
ou menor que 2:12 é 0,0170. A probabilidade de um ou outro desses
eventos ocorrer, quando H0 é verdadeiro, é igual à soma das duas
probabilidades individuais e, portanto, no presente exemplo, dizemos que
p ¼ :0170 þ :0170 ¼ :0340.
Lembre-se de que o valor de p para um teste também pode ser definido

como o menor valor de a para o qual a hipótese nula pode ser rejeitada. Como,
no Exemplo 7.2.1, nosso valor de p é 0,0340, sabemos que poderíamos ter
escolhido um valor de a tão pequeno quanto 0,0340 e ainda rejeitar a hipótese
nula. Se tivéssemos escolhido um a menor que 0,0340, não poderíamos rejeitar
a hipótese nula. Uma regra geral que vale a pena lembrar, então, é esta: se o
valor de p for menor ou igual a a, rejeitamos a hipótese nula; se o valor de p
for maior que a, não rejeitamos a hipótese nula.
O relato de valores de p como parte dos resultados de uma investigação

é mais informativo para o leitor do que declarações como “a hipótese nula é
rejeitada no nível de significância 0,05” ou “os resultados não foram
significativos no nível 0,05. ” Relatar o valor p associado a um teste permite
que o leitor saiba quão comum ou quão raro é o valor computado da estatística
do teste dado que H0 é verdadeiro. &
Testando H0 por meio de um intervalo de confiança Anteriormente, afirmamos que é possível

usar intervalos de confiança para testar hipóteses. No Exemplo 7.2.1 usamos um
procedimento de teste de hipóteses para testar H0: m ¼ 30 contra a alternativa, HA: m 6¼ 30.
Conseguimos rejeitar H0 porque o valor calculado da estatística de teste caiu na região de
rejeição.
Vejamos como poderíamos ter chegado a essa mesma conclusão usando um 100 1ð Þa
intervalo de confiança percentual. O intervalo de confiança de 95% para m é
27 1:96 20=10 p
27 1:96 1ð Þ :414
2:7714
27
ð24:2286; 29:7714Þ
Como esse intervalo não inclui 30, dizemos que 30 não é candidato à média que estamos estimando
e, portanto, m não é igual a 30 e H0 é rejeitada. Esta é a mesma conclusão alcançada por meio do
procedimento de teste de hipótese.
Se o parâmetro hipotético, 30, estivesse dentro do intervalo de confiança de 95%, teríamos dito
que H0 não é rejeitada no nível de significância de 0,05. Em geral, ao testar uma hipótese nula por
meio de um intervalo de confiança bilateral, rejeitamos H0 no nível de significância a se o parâmetro
hipotético não estiver contido no intervalo de confiança de 100 1ð Þ a por cento. Se o parâmetro
hipotético estiver contido no intervalo, H0 não pode ser rejeitada no nível de significância a.
Testes de hipóteses unilaterais O teste de hipóteses ilustrado no Exemplo 7.2.1 é um exemplo de teste
bilateral, assim chamado porque a região de rejeição é dividida entre os dois lados ou caudas da
distribuição da estatística de teste. Um teste de hipótese pode ser unilateral, caso em que toda a região
de rejeição está em uma ou outra cauda da distribuição. O uso de um teste unilateral ou bilateral
depende da natureza da pergunta feita pelo pesquisador.
Se valores grandes e pequenos causarem a rejeição da hipótese nula, um teste bilateral é

indicado. Quando apenas valores suficientemente “pequenos” ou apenas valores suficientemente
“grandes” causarão a rejeição da hipótese nula, um teste unilateral é indicado.
EXEMPLO 7.2.2
Consulte o Exemplo 7.2.1. Suponha que, em vez de perguntar se eles poderiam concluir que m 6¼
30, os pesquisadores tivessem perguntado: Podemos concluir que m < 30? A esta pergunta
responderíamos que eles podem concluir assim se puderem rejeitar a hipótese nula de que m 30.
Solução: Vamos seguir o procedimento de dez etapas para chegar a uma decisão com base em uma
teste unilateral.
1. Dados. Veja o exemplo anterior.

2. Suposições. Veja o exemplo anterior.
3. Hipóteses.
H0: m 30
HA: m < 30
A desigualdade na hipótese nula implica que a hipótese nula consiste em um

número infinito de hipóteses. O teste será feito apenas
no ponto de igualdade, pois pode-se mostrar que se H0 for rejeitada quando o teste for feito
no ponto de igualdade, ela seria rejeitada se o teste fosse feito para qualquer outro valor de
m indicado na hipótese nula.
4. Estatística de teste.
x m0 z
¼ s= np ffiffiffi
5. Distribuição da estatística de teste. Veja o exemplo anterior.
6. Regra de decisão. Vamos usar novamente um ¼ :05. Para determinar onde colocar a região
de rejeição, vamos nos perguntar que magnitude de valores causaria a rejeição da hipótese
nula. Se olharmos para as hipóteses, veremos que valores suficientemente pequenos
causariam rejeição e que valores grandes tenderiam a reforçar a hipótese nula. Queremos
que nossa região de rejeição esteja onde estão os valores pequenos - na cauda inferior da
distribuição. Desta vez, como temos um teste unilateral, todos irão para a cauda única da
distribuição. Consultando a Tabela D do Apêndice, descobrimos que o valor de z à esquerda
do qual fica 0,05 da área sob a curva normal padrão é 1:645 após a interpolação. Nossas
regiões de rejeição e não rejeição agora estão especificadas e são mostradas na Figura
7.2.2.
Nossa regra de decisão nos diz para rejeitar H0 se o valor calculado da estatística
de teste for menor ou igual a 1:645.
7. Cálculo da estatística de teste. A partir de nossos dados, calculamos
27 30
z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ 2:12
20=10 p
8. Decisão estatística. Podemos rejeitar a hipótese nula, pois

2:12 < 1:645.
9. Conclusão. Concluímos que a média da população é menor que 30 e agimos de acordo.
10. valor p. O valor de p para este teste é 0,0170, já que Pðz 2:12Þ, quando H0 é verdadeiro, é
0,0170 conforme fornecido pela Tabela D do Apêndice quando determinamos o
s=1
0,95
0,05
_1.645 0 z
região de rejeição região de não rejeição

magnitude da área à esquerda de 2:12 sob a curva normal padrão. Pode-se testar
uma hipótese nula unilateral por meio de um intervalo de confiança unilateral. No
entanto, não abordaremos a construção e a interpretação desse tipo de intervalo de
confiança neste livro.
Se a pergunta do pesquisador fosse: “Podemos concluir que a média é maior que 30?”,
seguir o procedimento de dez etapas acima levaria a um teste unilateral com toda a região
de rejeição na cauda superior da distribuição de a estatística de teste e um valor crítico
de þ1:645. &
Amostragem de uma população normalmente distribuída: variância populacional desconhecida Como já

observamos, a variância populacional geralmente é desconhecida em situações reais que envolvem
inferência estatística sobre a média populacional. Quando a amostragem é de uma população
aproximadamente normal com uma variância desconhecida, a estatística de teste para testar H0: m ¼ m0
é
x m0 t
¼ ffiffiffi
(7.2.2)
s=np
que, quando H0 é verdadeiro, é distribuído como t de Student com n 1 graus de liberdade. O exemplo a
seguir ilustra o procedimento de teste de hipótese quando a população é considerada normalmente
distribuída e sua variância é desconhecida. Esta é a situação usual encontrada na prática.
EXEMPLO 7.2.3
Nakamura et ai. (A-1) estudou indivíduos com rupturas do ligamento colateral medial (LCM) e do ligamento
cruzado anterior (LCA). Entre fevereiro de 1995 e dezembro de 1997, 17 pacientes consecutivos com
lesões agudas combinadas do LCA e LCM grau III foram tratados pelo mesmo médico no centro de
pesquisa. Uma das variáveis de interesse foi o tempo em dias entre a ocorrência da lesão e a primeira
ressonância magnética (RM). Os dados são apresentados na Tabela 7.2.1. Queremos saber se podemos
concluir que o número médio de dias entre a lesão e a ressonância magnética inicial não é de 15 dias em
uma população presumivelmente representada por esses dados de amostra.
TABELA 7.2.1 Número de dias até a ressonância magnética para indivíduos com rupturas de MCL e ACL
Sujeito Dias Sujeito Dias Sujeito Dias Sujeito Dias
1 14 6 0 11 28 16 14
2 9 7 10 12 24 17 9
3 18 8 413 24
4 26 9 814 2
5 12 10 21 15 3
Fonte: Norimasa Nakamura, Shuji Horibe, Yukyoshi Toritsuka, Tomoki Mitsuoka, Hideki Yoshikawa e Konsei Shino,
“Acute Grade III Medial Collateral Ligament Injury of the Knee Associated with Anterior Cruciate Ligament Tear,”
American Journal of Sports Medicine, 31 (2003) , 261–267.
Solução: Poderemos concluir que a média de dias da população não é 15 se pudermos rejeitar a hipótese
nula de que a média da população é igual a 15.
1. Dados. Os dados consistem no número de dias até a ressonância magnética em 17 indivíduos,

conforme descrito anteriormente.
2. Suposições. Os 17 sujeitos constituem uma amostra aleatória simples de uma

população de sujeitos semelhantes. Assumimos que o número de dias até a
ressonância magnética nesta população é aproximadamente normalmente distribuído.
3. Hipóteses.
H0: m ¼ 15
HA: m 6¼ 15
4. Estatística de teste. Como a variância da população é desconhecida, nosso teste

estatística é dada pela Equação 7.2.2.
5. Distribuição da estatística de teste. Nossa estatística de teste é distribuída como t de
Student com n 1 ¼ 17 1 ¼ 16 graus de liberdade se H0 for verdadeira.
6. Regra de decisão. Deixe um ¼ :05. Como temos um teste bilateral, colocamos a=2
¼ :025 em cada cauda da distribuição de nossa estatística de teste. Os valores de
t à direita e à esquerda dos quais se situa 0,025 da área são 2,1199 e 2:1199.
Esses valores são obtidos na Tabela E do Apêndice.
as regiões de rejeição e não rejeição são mostradas na Figura 7.2.3.
A regra de decisão nos diz para calcular um valor da estatística de teste e
rejeitar H0 se o t calculado for maior ou igual a 2,1199 ou menor ou igual a 2:1199.
7. Cálculo da estatística de teste. A partir de nossos dados amostrais, calculamos uma

média amostral de 13,2941 e um desvio padrão amostral de 8,88654.
Substituir essas estatísticas na Equação 7.2.2 dá
13:2941 15 1:7059
t¼ ffiffiffiffiff
¼ ¼:791
8:88654= 17 p 2:1553
0,95
0,025 0,025
–2.1199 0 2.1199 t
região de rejeição região de não região de rejeição

rejeição

p /2 > .10 p /2 > .10
.10 .10
–1,337 –,791 0 ,791 1,337 t

p > .20
FIGURA 7.2.4 Determinação do valor de p para o Exemplo 7.2.3.
8. Decisão estatística. Não rejeite H0, pois 0,791 cai na região de não rejeição.
9. Conclusão. Nossa conclusão, com base nesses dados, é que a média da população
de onde veio a amostra pode ser 15.
10. valor p. O valor p exato para este teste não pode ser obtido na Tabela E do Apêndice,
pois fornece valores t apenas para percentis selecionados.
No entanto, o valor de p pode ser declarado como um intervalo. Descobrimos que
:791 é menor que 1:337, cujo valor de t à esquerda fica 0,10 da área sob t com 16
graus de liberdade. Conseqüentemente, quando H0 é verdadeiro, a probabilidade
de obter um valor de t tão pequeno ou menor que :791 é maior que 0,10. Isso é P
tð Þ :791 > :10. Como o teste foi bilateral, valor
devemos
computado
permitirda
a possibilidade
estatística de de
teste
um
tão grande na direção oposta à observada. A Tabela E do Apêndice revela que P tð
Þ :791 > :10 também. O valor de p, então, é p > :20. Na verdade, o Excel calcula o
valor de p como 0,4403. A Figura 7.2.4 mostra o valor de p para este exemplo.
Se no exemplo anterior as hipóteses foram
H0: m 15
HA: m < 15
o procedimento de teste teria levado a um teste unilateral com toda a região de rejeição
na cauda inferior da distribuição, e se as hipóteses tivessem sido
H0: m 15
HA: m > 15
teríamos um teste unilateral com toda a região de rejeição na cauda superior da

distribuição. &
Amostragem de uma população que não é normalmente distribuída

Se, como é frequentemente o caso, a amostra na qual baseamos nosso teste de hipótese sobre uma
média populacional vier de uma população que não é normalmente distribuída, podemos, se nossa
amostra for grande (maior ou igual a 30), tirar vantagem do teorema do limite central e use z ¼ x m0 ð Þ=
ffiffiffi
s= np ð Þ como a estatística de teste. Se o desvio padrão da população não for

conhecido, a prática usual é usar o desvio padrão da amostra como uma estimativa. A estatística de teste para
testar H0: m ¼ m0, então, é
x m0 z ¼
ffiffiffi
(7.2.3)
s=np
que, quando H0 é verdadeiro, é distribuído aproximadamente como a distribuição normal padrão se n for grande.
A justificativa para usar s para substituir s é que a amostra grande, necessária para a aplicação do teorema do
limite central, produzirá um desvio padrão de amostra que se aproxima bastante de s.
EXEMPLO 7.2.4
O objetivo do estudo de Klingler et al. (A-2) foi determinar como o reconhecimento e a percepção dos sintomas
influenciam a apresentação clínica em função da raça. Eles caracterizaram os sintomas e o comportamento de
busca de cuidados em pacientes afro-americanos com dor no peito atendidos no departamento de emergência.
Um dos sinais vitais apresentados foi a pressão arterial sistólica. Entre 157 homens afro-americanos, a pressão
arterial sistólica média foi de 146 mm Hg com um desvio padrão de 27. Queremos saber se, com base nesses
dados, podemos concluir que a pressão arterial sistólica média para uma população de africanos Homens
americanos é maior que 140.
Solução: Diremos que os dados fornecem evidências suficientes para concluir que a média da população é maior
que 140 se pudermos rejeitar a hipótese nula de que a média é menor ou igual a 140. O seguinte
teste pode ser realizado:
1. Dados. Os dados consistem em pontuações de pressão arterial sistólica para 157

Homens americanos com x ¼ 146 e s ¼ 27.
2. Suposições. Os dados constituem uma amostra aleatória simples de uma população de

homens afro-americanos que se apresentam a um departamento de emergência com
sintomas semelhantes aos da amostra. Não estamos dispostos a assumir que os valores
da pressão arterial sistólica são normalmente distribuídos em tal população.
3. Hipóteses.
H0: m 140
HA: m > 140
4. Estatística de teste. A estatística de teste é dada pela Equação 7.2.3, pois s é

desconhecido.
5. Distribuição da estatística de teste. Por causa do teorema do limite central, a estatística de

teste é, na pior das hipóteses, aproximadamente normalmente distribuída com m ¼ 0 se
H0 for verdadeiro.
6. Regra de decisão. Deixe um ¼ :05. O valor crítico da estatística de teste é 1,645. As regiões
de rejeição e não rejeição são mostradas na Figura 7.2.5.
Rejeitar H0 se calculado z 1:645.
0,05
0 1.645 z
região de não rejeição região de rejeição
7. Cálculo da estatística de teste.
146 140 6
z¼ fffiffiffiffiffiff
¼ ¼ 2:78
27= 157 p 2:1548
8. Decisão estatística. Rejeitar H0 desde 2:78 > 1:645.

9. Conclusão. Conclua que a pressão arterial sistólica média para o
população amostrada é maior que 140.
10. valor p. O valor de p para este teste é 1:9973 ¼:0027, pois conforme mostrado na
Tabela D do Apêndice, a área (0,0027) à direita de 2,78 é menor que 0,05, a área à
direita de 1,645. &
Procedimentos para outras condições Se a variância da população fosse conhecida, o procedimento teria
sido idêntico ao anterior, exceto que o valor conhecido de s, em vez do valor amostral s, teria sido usado
no denominador da estatística de teste computada.
Dependendo do que os investigadores desejassem concluir, um teste bilateral ou um teste

unilateral, com a região de rejeição na cauda inferior da distribuição, poderia ter sido feito usando os
dados acima.
Ao testar uma hipótese sobre a média de uma única população, podemos usar a Figura 6.3.3 para
decidir rapidamente se a estatística de teste é z ou t.
Análise de computador Para ilustrar o uso de computadores no teste de hipóteses, consideramos o

seguinte exemplo.
EXEMPLO 7.2.5
A seguir estão as circunferências da cabeça (centímetros) no nascimento de 15 bebês:
33.38 32,15 33,99 34.10 33,97

34,34 33,95 33,85 34,23 32,73
33,46 34,13 34,45 34,19 34,05
Queremos testar H0: m ¼ 34:5 contra HA: m 6¼ 34:5.

EXERCÍCIOS 233
Stat Estatísticas básicas 1-amostra t MTB > TESTE 34.5 C1
Digite C1 em Amostras em colunas. Digite 34,5

na caixa Média de teste . Clique em OK.
Saída:
Uma amostra T: C1
TESTE DE UM 34.5 VS NÃO 34,5

VARIÁVEL N MEAN STDEV SE MEAN CI de 95% T P
C1 15 33,7980 0,6303 0,1627 (33,4490, 34,1470) 4,31 0,001
FIGURA 7.2.6 Procedimento e saída do MINITAB para o Exemplo 7.2.5.
Solução: Assumimos que as suposições para uso da estatística t são atendidas. entramos no
dados na Coluna 1 e proceda conforme mostrado na Figura 7.2.6.
Para indicar que um teste é unilateral no Windows, clique no botão Opções e
escolha “menor que” ou “maior que” conforme apropriado na caixa Alternativa. Se z
for a estatística de teste apropriada, escolhemos 1-Sample z no menu Basic
Statistics. O restante dos comandos são os mesmos do teste t.
Aprendemos com a impressão que o valor calculado da estatística de teste é

4:31 e o valor p para o teste é 0,0007. Os usuários do SAS® podem usar a saída
do PROC MEANS ou PROC UNIVARIATE para realizar testes de hipóteses.
Quando tanto a estatística z quanto a estatística t são estatísticas de teste
inadequadas para uso com os dados disponíveis, pode-se desejar usar uma técnica
não paramétrica para testar uma hipótese sobre uma única medida populacional de
tendência central. Um desses procedimentos, o teste do sinal, é discutido no
Capítulo 13. &
EXERCÍCIOS
Para cada um dos exercícios a seguir, execute o procedimento de teste de hipótese de dez etapas para o
nível de significância fornecido. Para cada exercício, conforme apropriado, explique por que você escolheu
um teste unilateral ou um teste bilateral. Discuta como você acha que os pesquisadores e/ou clínicos podem
usar os resultados de seu teste de hipótese. Que decisões e/ou ações clínicas e/ou de pesquisa você acha
que seriam apropriadas à luz dos resultados do seu teste?
7.2.1 Escobar et al. (A-3) realizaram um estudo para validar uma versão traduzida do questionário WOMAC (Western
Ontario and McMaster Universities Osteoarthritis Index) usado com pacientes falantes de espanhol com
osteoartrite de quadril ou joelho. Para as 76 mulheres classificadas com dor intensa no quadril, o
A pontuação média de função do WOMAC (em uma escala de 0 a 100 com um número maior indicando menos
função) foi de 70,7 com um desvio padrão de 14,6. Queremos saber se podemos concluir que a pontuação média
da função para uma população de mulheres semelhantes com dor intensa no quadril é inferior a 75.
Deixe um ¼ :01.
7.2.2 Um estudo de Thienprasiddhi et al. (A-4) examinou uma amostra de 16 indivíduos com glaucoma de ângulo aberto e
defeitos de hemicampo unilateral. As idades (anos) dos participantes foram:
62 62 68 48 51 60 51 57
57 41 62 50 53 34 62 61
Fonte: Phamornsak Thienprasiddhi, Vivienne C. Greenstein,
Candice S. Chen, Jeffrey M. Liebmann, Robert Ritch e
Donald C. Hood, “Multifocal Visual Evoked Potential
Responses in Glaucoma Patients with Unilateral Hemifield
Defects,” American Journal of Ophthalmology, 136 (2003),
34-40.
Podemos concluir que a idade média da população da qual se pode presumir que a amostra foi extraída é inferior a
60 anos? Deixe um ¼ :05.
7.2.3 O objetivo do estudo de Luglie et al. (A-5) foi investigar o estado bucal de um grupo de pacientes diagnosticados com
talassemia maior (MT). Uma das medidas de resultado foi o índice de dentes cariados, perdidos e obturados
(CPOD). Em uma amostra de 18 pacientes, o valor médio do índice CPOD foi de 10,3 com desvio padrão de 7,3.
Isso é evidência suficiente para nos permitir concluir que o CPO-D médio
índice é maior que 9,0 em uma população de indivíduos semelhantes? Deixe um ¼ :10.
7.2.4 Estudou-se uma amostra de 25 prontuários de pacientes atendidos em hospital de doenças crônicas em regime
ambulatorial. A média de atendimentos ambulatoriais por paciente foi de 4,8 e o desvio padrão da amostra foi de 2.
Pode-se concluir a partir desses dados que a média populacional é superior a quatro atendimentos por paciente?
Deixe a probabilidade de cometer um erro tipo I ser 0,05. Que pressupostos são necessários?
7.2.5 Em uma amostra de 49 adolescentes que serviram como sujeitos em um estudo imunológico, uma variável de interesse
foi o diâmetro da reação do teste cutâneo a um antígeno. A média e o desvio padrão da amostra foram 21 e 11 mm
de eritema, respectivamente. Pode-se concluir a partir desses dados que a média da população é inferior a 30?
Deixe um ¼ :05.
7.2.6 Nove animais de laboratório foram infectados com uma determinada bactéria e depois imunossuprimidos. O número
médio de organismos posteriormente recuperados de espécimes de tecido foi de 6,5 (dados codificados) com um
desvio padrão de 0,6. Pode-se concluir a partir desses dados que a média da população é maior que 6?
Deixe um ¼ :05. Que pressupostos são necessários?
7.2.7 Uma amostra de 25 estudantes de enfermagem do primeiro ano teve uma pontuação média de 77 em um teste
projetado para medir a atitude em relação ao paciente terminal. O desvio padrão da amostra foi 10. Esses dados
fornecem evidências suficientes para indicar, no nível de significância de 0,05, que a média da população é inferior
a 80? Que pressupostos são necessários?
7.2.8 Queremos saber se podemos concluir que a ingestão calórica diária média na população rural adulta de um país em
desenvolvimento é inferior a 2.000. Uma amostra de 500 tinha uma média de 1985 e um desvio padrão de 210.
Seja ¼ :05.
7.2.9 Uma pesquisa em 100 hospitais de porte similar revelou uma média diária de censo no serviço de pediatria de 27 com
desvio padrão de 6,5. Esses dados fornecem evidências suficientes para indicar que a média da população é maior
que 25? Deixe um ¼ :05.
EXERCÍCIOS 235
7.2.10 Após um programa de treinamento de supervisão hospitalar de uma semana, 16 administradores hospitalares
assistentes obtiveram uma pontuação média de 74 em um teste administrado como parte da avaliação do
programa de treinamento. O desvio padrão amostral foi 12. Pode-se concluir a partir desses dados que a média
populacional é maior que 70? Deixe um ¼ :05. Que pressupostos são necessários?
7.2.11 Uma amostra aleatória de 16 relatórios de emergência foi selecionada dos arquivos de um serviço de ambulância.
O tempo médio (calculado a partir dos dados da amostra) necessário para as ambulâncias chegarem aos seus
destinos foi de 13 minutos. Suponha que a população de tempos seja normalmente distribuída com uma
variação de 9. Podemos concluir no nível de significância de 0,05 que a média da população é maior que 10
minutos?
7.2.12 Os dados a seguir são os consumos de oxigênio (mililitros) durante a incubação de uma amostra aleatória de
15 suspensões de células:
14,0, 14,1, 14,5, 13,2, 11,2, 14,0, 14,1, 12,2,

11,1, 13,7, 13,2, 16,0, 12,8, 14,4, 12,9
Esses dados fornecem evidências suficientes no nível de significância de 0,05 de que a média da população
não é 12 ml? Que pressupostos são necessários?
7.2.13 Podemos concluir que o valor médio máximo de ventilação voluntária para universitários aparentemente saudáveis
idosos não é de 110 litros por minuto? Uma amostra de 20 produziu os seguintes valores:
132, 33, 91, 108, 67, 169, 54, 203, 190, 133, 96,
30, 187, 21, 63, 166, 84, 110, 157, 138
7.2.14 A seguir estão as pressões arteriais sistólicas (mm Hg) de 12 pacientes em terapia medicamentosa para
hipertensão:
183, 152, 178, 157, 194, 163, 144, 114, 178, 152, 118, 158
Podemos concluir com base nesses dados que a média da população é menor que 165? Deixe um ¼ :05.
Que pressupostos são necessários?
7.2.15 Podemos concluir que a idade média de óbito dos pacientes com doença falciforme homozigótica é inferior a 30
anos? Uma amostra de 50 pacientes rendeu as seguintes idades em anos:
15,5 2,0 45,1 1.7 .8 1,1 18,2 9,7 28,1 18,2

27,6 45,0 1,0 66,4 2,0 67,4 2,5 61,7 16,2 31,7
6,9 13,5 1,9 31,2 9,0 2,6 29,7 13,5 2,6 14,4
20,7 30,9 36,6 1,1 23,6 .9 7,6 23,5 6,3 40,2
23.7 4,8 33,2 27,1 36,7 3,2 38,0 3,5 21,8 2.4
7.2.16 A seguir, os valores de pressão intraocular (mm Hg) registrados para uma amostra de 21 idosos
assuntos:
14,5 12,9 14,0 16,1 12,0 17,5 14,1 12,9 17,9 12,0
16,4 24,2 12,2 14,4 17,0 10,0 18,5 20,8 16,2 14,9
19.6
Podemos concluir a partir desses dados que a média da população da qual a amostra foi extraída é maior que
14? Deixe um ¼ :05. Que pressupostos são necessários?
7.2.17 Suponha que se saiba que as pontuações de QI de uma certa população de adultos são aproximadamente
distribuídas normalmente com um desvio padrão de 15. Uma amostra aleatória simples de 25 adultos retirada
dessa população tinha uma pontuação média de QI de 105. Com base desses dados podemos concluir que a
pontuação média de QI para a população não é 100? Deixe a probabilidade de cometer um erro tipo I ser 0,05.
7.2.18 Uma equipe de pesquisa está disposta a assumir que a pressão arterial sistólica em uma determinada população
de homens é aproximadamente distribuída normalmente com um desvio padrão de 16. Uma amostra aleatória
simples de 64 homens da população teve uma leitura média de pressão arterial sistólica de 133 • No nível de
significância de 0,05, esses dados fornecem evidências suficientes para concluirmos que a média da população
é maior que 130?
7.2.19 Uma amostra aleatória simples de 16 adultos retirada de uma certa população de adultos rendeu um peso médio
de 63 kg. Assuma que os pesos da população são aproximadamente normalmente distribuídos com uma
variância de 49. Os dados da amostra fornecem evidências suficientes para concluirmos que o peso médio da
população é inferior a 70 kg? Deixe a probabilidade de cometer um erro tipo I ser 0,01.
7.3 TESTE DE HIPÓTESE: A DIFERENÇA ENTRE

DUAS MÉDIAS DE POPULAÇÃO
O teste de hipótese envolvendo a diferença entre duas médias populacionais é

empregado com mais frequência para determinar se é ou não razoável concluir que as
duas médias populacionais são desiguais. Nesses casos, uma ou outra das seguintes
hipóteses pode ser formulada:
1. H0: m1 m2 ¼ 0; HA: m1 m2 6¼ 0 2. H0: m1

m2 0; HA: m1 m2 < 0 3. H0: m1 m2 0; HA: m1
m2 > 0
É possível, porém, testar a hipótese de que a diferença é igual a, maior
menor ou igual a, ou menor ou igual a algum valor diferente de zero.
Como foi feito na seção anterior, o teste de hipótese envolvendo a diferença entre duas
médias populacionais será discutido em três contextos diferentes: (1) quando a amostragem
for de populações normalmente distribuídas com variações populacionais conhecidas, (2)
quando a amostragem for de populações normalmente distribuídas com variações populacionais
desconhecidas e (3) quando a amostragem é de populações que não são normalmente distribuídas.
Amostragem de Populações Normalmente Distribuídas: População

Variâncias conhecidas Quando cada uma das duas amostras aleatórias simples independentes foi retirada de
uma população normalmente distribuída com uma variância conhecida, a estatística de teste para testar a
hipótese nula de médias populacionais iguais é
ðx1 x2 º ð Þ0 m1 m2
(7.3.1)
s22
s21 þ
n2 n1
s
7.3 TESTE DE HIPÓTESES: A DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS 237
onde o subscrito 0 indica que a diferença é um parâmetro hipotético. Quando H0 é verdadeiro, a estatística de
teste da Equação 7.3.1 é distribuída como a normal padrão.
EXEMPLO 7.3.1
Os pesquisadores desejam saber se os dados coletados fornecem evidências suficientes para indicar uma
diferença nos níveis médios de ácido úrico sérico entre indivíduos normais e indivíduos com síndrome de Down.
Os dados consistem em leituras de ácido úrico sérico em 12 indivíduos com síndrome de Down e 15 indivíduos
normais. As médias são x1 ¼ 4:5 mg/100 ml e x2 ¼ 3:4 mg/100 ml.
Solução: Diremos que os dados da amostra fornecem evidências de que as médias populacionais não são
iguais se pudermos rejeitar a hipótese nula de que as médias populacionais são iguais. Vamos
chegar a uma conclusão por meio do procedimento de teste de hipótese de dez etapas.
1. Dados. Veja a declaração do problema.
2. Suposições. Os dados constituem duas amostras aleatórias simples independentes, cada

uma retirada de uma população normalmente distribuída com uma variância igual a 1
para a população com síndrome de Down e 1,5 para a população normal.
3. Hipóteses.
H0: m1 m2 ¼ 0
HA: m1 m2 6¼ 0
Uma forma alternativa de formular as hipóteses é a seguinte:
H0: m1 ¼ m2
HA: m1 6¼ m2
4. Estatística de teste. A estatística de teste é dada pela Equação 7.3.1.
5. Distribuição da estatística de teste. Quando a hipótese nula é verdadeira, o teste

estatística segue a distribuição normal padrão.
6. Regra de decisão. Deixe um ¼ :05. Os valores críticos de z são 1:96. Rejeitar H0 a menos
que 1:96 < zcomputado < 1:96. As regiões de rejeição e não rejeição são mostradas na
Figura 7.3.1.
ð Þ 4:5 3:4 0 1:1

z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ ¼
2:57:4282
1=12 þ 1:5=15 p
8. Decisão estatística. Rejeite H0, desde 2:57 > 1:96.

9. Conclusão. Conclua que, com base nesses dados, há uma indicação de que as duas
médias populacionais não são iguais.
10. valor p. Para este teste, p ¼ :0102.

s=1
_1,96 0 1,96 z
região de rejeição região de não rejeição região de rejeição

FIGURA 7.3.1 Regiões de rejeição e não rejeição para o Exemplo 7.3.1 &
Um intervalo de confiança de 95 por cento para m1 m2 No capítulo anterior, o intervalo de confiança de 95 por
cento para m1 m2, calculado a partir dos mesmos dados, foi de 0,26 a 1,94. Como esse intervalo não inclui 0,
dizemos que 0 não é candidato à diferença entre as médias populacionais e concluímos que a diferença não
é zero. Assim chegamos à mesma conclusão por meio de um intervalo de confiança.
Amostragem de populações normalmente distribuídas: variações populacionais desconhecidas Como

aprendemos, quando as variações populacionais são desconhecidas, existem duas possibilidades. As duas
variâncias populacionais podem ser iguais ou desiguais. Consideramos primeiro o caso em que se sabe, ou é
razoável assumir, que são iguais. Um teste da hipótese de que duas variâncias populacionais são iguais é
descrito na Seção 7.8.
Variâncias da população iguais Quando as variâncias da população são desconhecidas, mas assumidas como
iguais, lembramos do Capítulo 6 que é apropriado agrupar as variâncias da amostra por meio da seguinte
fórmula:
ð n1 1
n1s2þ1n2 12 s2 Þ þ ð Þ2
¼
2
sp
Quando cada uma das duas amostras aleatórias simples independentes foi retirada de uma
população normalmente distribuída e as duas populações têm variâncias iguais, mas desconhecidas,
a estatística de teste para testar H0: m1 ¼ m2 é dada por
ðx1 x2 º ð m1 m2 Þ0
t¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
(7.3.2)
s2 s2
p
pþ _
n2 n1
s
que, quando H0 é verdadeiro, é distribuído como t de Student com n1 þ n2 2 graus de liberdade.

7.3 TESTE DE HIPÓTESES: A DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS 239
EXEMPLO 7.3.2
O objetivo do estudo de Tam et al. (A-6) foi investigar as manobras da cadeira de rodas em indivíduos com lesão medular
(LM) de nível inferior e controles saudáveis (C). Os sujeitos usaram uma cadeira de rodas modificada para incorporar
uma superfície de assento rígida para facilitar as medições experimentais especificadas. A medição da pressão da
interface foi registrada usando um tapete sensível à pressão de alta resolução com uma resolução espacial de quatro
sensores por centímetro quadrado colado no suporte do assento rígido. Durante as condições sentadas estáticas, as
pressões médias foram registradas sob as tuberosidades isquiáticas (a parte inferior dos ossos pélvicos). Os dados das
medidas da tuberosidade isquiática esquerda (em mm Hg) para os grupos SCI e controle são apresentados na Tabela
7.3.1. Queremos saber se podemos concluir, com base nesses dados, que, em geral, indivíduos saudáveis apresentam
pressão menor do que indivíduos com LM.
Solução:
2. Suposições. Os dados constituem duas amostras aleatórias simples independentes de medições

de pressão, uma amostra de uma população de indivíduos de controle e a outra amostra de
uma população com lesão medular de nível inferior. Assumiremos que as medidas de pressão
em ambas as populações são aproximadamente distribuídas normalmente. As variações
populacionais são desconhecidas, mas supõe-se que sejam iguais.
3. Hipóteses. H0: mC mSCI; HA: mC < mSCI.
5. Distribuição da estatística de teste. Quando a hipótese nula é verdadeira, a estatística de teste

segue a distribuição t de Student com n1 þ n2 2 graus de liberdade.
6. Regra de decisão. Deixe um ¼ :05. O valor crítico de t é 1:7341. Rejeitar H0 a menos que
tcalculado > 1:7341.
7. Cálculo da estatística de teste. A partir dos dados de amostra, calculamos
xC ¼ 126:1; sC ¼ 21:8; xSCI ¼ 133:1; sSCI ¼ 32:2
Em seguida, reunimos as variâncias da amostra para obter
2 2
9 21 ð Þ þ 9 32 ð Þ :2
2 ¼ ¼ 756:04
sp :8 9 þ 9
TABELA 7.3.1 Pressões (mm Hg) sob a pelve durante condições estáticas para o exemplo 7.3.2
Ao controle 131 115 124 131 122 117 88 114 150 169
SCI 60 150 130 180 163 130 121 119 130 148
Fonte: Eric W. Tam, Arthur F. Mak, Wai Nga Lam, John H. Evans e York Y. Chow, “Pelvic Movement and Interface Pressure
Distribution Durante Manual Wheelchair Propulsion,” Archives of Physical Medicine and Rehabilitation, 84 (2003 ), 1466-1472.
Nós agora calculamos
ð 126:1 133:1 º
0 ¼ :569
756:04 756:04
þ
r 10 10
8. Decisão estatística. Não rejeitamos H0, pois 1:7341 < :569; que
ou seja, :569 cai na região de não rejeição.
9. Conclusão. Com base nesses dados, não podemos concluir que a pressão média da
população é menor para indivíduos saudáveis do que para indivíduos com LM.
10. valor p. Para este teste, p > :10 usando a Tabela E, ou 0,5764 usando um computador
desde 1:330 < :569. &
Variâncias populacionais desiguais Quando duas amostras aleatórias simples independentes foram
retiradas de populações normalmente distribuídas com variâncias desconhecidas e desiguais, a estatística
de teste para testar H0: m1 ¼ m2 é
0 ðx1 x2 º ð m1 m2 Þ0
t ¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
(7.3.3)
1 s22
s2 þ
n2 n1
s
0
O valor crítico de t para um nível de significância e um teste bilateral é aproximadamente
0 w1t1 þ w2t2
t ¼
(7.3.4)
1ð Þ a=2
w1 þ w2
onde w1 ¼ s2 1=n1; w2 ¼ s2 2=n2; t1 ¼ t1ð Þ a=2 para n1 1 graus de liberdade, e t2 ¼ t1ð Þ a=2 para n2
0
1 graus de liberdade. O valor crítico de t encontrado calculando t para um teste unilateral é

0
1a pela Equação 7.3.4, usando t1 ¼ t1a para n1 1 graus de liberdade

e t2 ¼ t1a para n2 1 graus de liberdade.
0
Para um teste bilateral, rejeite H0 se o valor calculado de t é maior ou igual ao valor
crítico dado pela Equação 7.3.4 ou menor ou igual ao negativo desse valor.
Para um teste unilateral com a região de rejeição na cauda direita da distribuição amostral, é igual
0 0
rejeitar H0 se a região de ou maior que o t crítico . Para um teste unilateral com
0
rejeição de cauda esquerda t calculada, rejeitar H0 se o valor computadoé igual ou menor que o
0
de t negativo do t crítico calculado pela adaptação indicada da Equação 7.3.4.
EXEMPLO 7.3.3
Dernellis e Panaretou (A-7) examinaram sujeitos com hipertensão e controles saudáveis. Uma das variáveis
de interesse foi o índice de rigidez aórtica. As medidas dessa variável foram calculadas a partir do diâmetro
aórtico avaliado pelo ecocardiograma modo M e da pressão arterial medida por esfigmomanômetro.
Geralmente, os médicos desejam
7.3 TESTE DE HIPÓTESE: A DIFERENÇA ENTRE DUAS MÉDIAS DE POPULAÇÃO 241
reduzir a rigidez aórtica. Nos 15 hipertensos (grupo 1), a média do índice de rigidez aórtica foi de
19,16 com desvio padrão de 5,29. Nos 30 indivíduos controle (grupo 2), o índice médio de rigidez
aórtica foi de 9,53 com desvio padrão de 2,69. Desejamos determinar se as duas populações
representadas por essas amostras diferem em relação ao índice médio de rigidez aórtica.
Solução:
1. Dados. Os tamanhos de amostra, médias e desvios padrão de amostra são:
n1 ¼ 15; x1 ¼ 19:16; s1 ¼ 5:29 n2 ¼

30; x2 ¼ 9:53; s2 ¼ 2:69
2. Suposições. Os dados constituem duas amostras aleatórias independentes, uma

de uma população de hipertensos e outra de uma população controle.
Assumimos que os valores de rigidez aórtica são aproximadamente normalmente
distribuídos em ambas as populações. As variâncias populacionais são
desconhecidas e desiguais.
3. Hipóteses.
H0: m1 m2 ¼ 0
HA: m1 m2 6¼ 0

5. Distribuição da estatística de teste. A estatística dada pela Equação 7.3.3 não
segue a distribuição t de Student. Obtemos, portanto, seus valores críticos pela
Equação 7.3.4.
0
6. Regra de decisão. Deixe um ¼ :05. Antes de calcular t calculamos w1 ¼ =30
2 2
ðÞ 5:29 =15 ¼ 1:8656 e w2 ¼ ð Þ 2:69
queEt1 ¼ 2:1448
:2412. Na
descobrimos
¼ e Tabela Apêndice
t2 ¼ 2:0452. Pela Equação 7.3.4 calculamos
1:8656 2ð Þþ :1448 :2412 2ð Þ :0452

t0 ¼ ¼ 2:133
1:8656 þ :2412
Nossa regra de decisão, então, é rejeitar H0 se o t calculado for 2:133

ou 2:133.
7. Cálculo da estatística de teste. Pela Equação 7.3.3 calculamos
ð Þ 19:16 9:53 0 9:63

0t ¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ ¼ 6:63
2 2 1:4515
ðÞ 5:29 ðÞ 2:69
º
s 15 30
8. Decisão estatística. Como 6:63 > 2:133, rejeitamos H0.

9. Conclusão. Com base nesses resultados, concluímos que os dois
médias populacionais são diferentes.
10. valor p. Para este teste p < :05; o programa R calcula este valor para ser
< .00001.
&
Amostragem de populações que não são normalmente distribuídas Quando a amostragem é de populações
que não são normalmente distribuídas, os resultados do teorema do limite central podem ser empregados se
os tamanhos das amostras forem grandes (digamos, 30). Isso permitirá o uso da teoria normal, pois a
distribuição da diferença entre as médias das amostras será aproximadamente normal. Quando cada uma de
duas grandes amostras aleatórias simples independentes foi retirada de uma população que não é normalmente
distribuída, a estatística de teste para testar H0: m1 ¼ m2 é
x1 x2
ð º ð m1 m2 Þ0
(7.3.5)
s22
s21 þ
n2 n1
s
que, quando H0 é verdadeiro, segue a distribuição normal padrão. Se as variações populacionais forem
conhecidas, elas serão usadas; mas se forem desconhecidos, como é o caso usual, as variâncias amostrais,
que são necessariamente baseadas em grandes amostras, são usadas como estimativas.
As variâncias da amostra não são agrupadas, pois a igualdade das variâncias da população não é uma
suposição necessária quando a estatística z é usada.
EXEMPLO 7.3.4
O objetivo do estudo de Sairam et al. (A-8) foi identificar o papel de vários estados de doença e fatores de
risco adicionais no desenvolvimento de trombose. Um dos focos do estudo foi determinar se havia níveis
diferentes do anticorpo anticardiolipina IgG em indivíduos com e sem trombose. A Tabela 7.3.2 resume as
descobertas dos pesquisadores:
TABELA 7.3.2 Níveis de IgG para Indivíduos com e Sem Trombose para o Exemplo 7.3.4
Nível médio de IgG

Grupo (ml/unidade) Tamanho da amostra Desvio padrão
Trombose 59.01 53 44,89

Sem trombose 46,61 54 34,85
Fonte: S. Sairam, BA Baethge e T. McNearney, “Analysis of Risk Factors and Comorbid Diseases
in the Development of Thrombosis in Patients with Anticardiolipin Antibodies,”
Reumatologia Clínica, 22 (2003), 24–29.
7.3 TESTE DE HIPÓTESE: A DIFERENÇA ENTRE DUAS MÉDIAS DE POPULAÇÃO 243
Queremos saber se podemos concluir, com base nesses resultados, que, em geral, as pessoas com
trombose têm, em média, níveis de IgG mais elevados do que as pessoas sem trombose.
Solução:
1. Dados. Veja declaração de exemplo.

2. Suposições. As estatísticas foram calculadas a partir de duas amostras
independentes que se comportam como amostras aleatórias simples de uma
população de pessoas com trombose e uma população de pessoas que não
têm trombose. Como as variâncias populacionais são desconhecidas, usaremos
as variâncias amostrais no cálculo da estatística de teste.
3. Hipóteses.
H0: mT mNT 0
HA: mT mNT > 0
ou alternativamente,
H0: mT mNT
HA: mT > mNT
4. Estatística de teste. Como temos amostras grandes, o teorema do limite central

nos permite usar a Equação 7.3.5 como estatística de teste.
5. Distribuição da estatística de teste. Quando a hipótese nula é verdadeira, a
estatística de teste é distribuída aproximadamente como a normal padrão.
6. Regra de decisão. Deixe um ¼ :01. Este é um teste unilateral com um valor crítico
de z igual a 2,33. Rejeitar H0 se zcomputou 2:33.

59:01 46:61
z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ 1:59
44:892 34:852
þ
r 53 54
8. Decisão estatística. Falha ao rejeitar H0, pois z ¼ 1:59 está na região de não
rejeição.
9. Conclusão. Esses dados indicam que, em média, pessoas com trombose e
pessoas sem trombose podem não ter níveis de IgG diferentes.
10. valor p. Para este teste, p ¼ :0559. Ao testar uma hipótese sobre a diferença
entre as médias de duas populações, podemos usar a Figura 6.4.1 para decidir
rapidamente se a estatística de teste deve ser z ou t. &
Podemos usar o MINITAB para realizar testes t de duas amostras. Para ilustrar, vamos nos
referir aos dados da Tabela 7.3.1. Colocamos os dados para indivíduos de controle e medula espinhal
Stat Estatísticas básicas 2 amostras t > MTB TwoSample 95.0 C2C1 SUBC> Alternativa
1,
Escolha Amostras em diferentes colunas. Digite SUBC> Agrupado.
C1 em Primeiro e C2 em Segundo. Clique na caixa

Opções e selecione “menor que” na caixa Alternativas .
Marque Assumir variâncias iguais. Clique em OK.
Saída:
Teste T de duas amostras e SCIC, CI:
Duas amostras SCIvs C para T

N Significar StDev MeanSE
C 10 126.1 21.8 6.9
SCI 10 133.1 32.2 10
Diferença C mu SCImu
Estimativa para diferença: 7,0
Limite superior de 95% para diferença: 14,3 T-Test de diferença (vs

0 <): T-Valor 0,57 P-Valor 0,288
DF 18
Ambos usam o Pooled StDev 27.5
FIGURA 7.3.2 Procedimento do MINITAB e saída para teste t de duas amostras, Exemplo 7.3.2
(dados na Tabela 7.3.1).
sujeitos com lesões na Coluna 1 e Coluna 2, respectivamente, e proceda conforme mostrado na Figura
7.3.2.
O pacote estatístico SAS® executa o teste t para igualdade de médias populacionais sob ambas
as suposições relativas às variâncias populacionais: que são iguais e que não são iguais. Observe que
SAS® designa o valor p como Pr > jtj. A saída padrão é um valor p para um teste bilateral. O pesquisador
que utiliza o SAS® deve dividir essa quantidade pela metade quando o teste de hipótese for unilateral. O
pacote SAS® também testa a igualdade das variâncias populacionais conforme descrito na Seção 7.8. A
Figura 7.3.3 mostra a saída SAS® para o Exemplo 7.3.2.
Alternativas para z e t Às vezes, nem a estatística z nem a estatística t são estatísticas de teste apropriadas
para uso com os dados disponíveis. Quando for esse o caso, pode-se desejar usar uma técnica não
paramétrica para testar uma hipótese sobre a diferença entre duas medidas populacionais de tendência
central. A estatística de teste de Mann-Whitney e o teste da mediana, discutidos no Capítulo 13, são
alternativas frequentemente usadas para as estatísticas z e t.
EXERCÍCIOS 245
O Sistema SAS
O procedimento de TESTE
Estatisticas CL inferior CL superior

CL inferior CL superior Padrão Padrão Padrão Padrão
grupo variável N Média Média Média Desenvolvedor Desenvolvedor Desenvolvedor Errar

-------------------------------------------------- -------------------------
pressão C pressão 10 110,49 126,1 141,71 15,008 21,82 39,834 6.9
SCI pressão Dif (1–2) 10 110,08 133,1 156,12 22,133 32,178 58,745 10,176
32,83 7 18,83 20,773 27,491 40,655 12,294
Testes T
-------------------------------------------------- -------------------------
Variável Método variações DF valor |t|> Pr
pressão agrupados Igual 18 0,57 0,5761
pressão Satterthwaite Desigual 15.8 0,57 0,5771
Igualdade de Variâncias
-------------------------------------------------- -------------------------
Variável Método DFNum ValorF DFDen F>Pr
pressão F dobrado 9 9 2.17 0,2626
FIGURA 7.3.3 Saída SAS® para o Exemplo 7.3.2 (dados na Tabela 7.3.1).
EXERCÍCIOS
Em cada um dos exercícios a seguir, conclua o procedimento de teste de hipóteses em dez etapas. Declare as
suposições que são necessárias para que seu procedimento seja válido. Para cada exercício, conforme
apropriado, explique por que você escolheu um teste unilateral ou um teste bilateral. Discuta como você acha
que pesquisadores ou médicos podem usar os resultados de seu teste de hipótese. Que decisões ou ações
clínicas ou de pesquisa você acha que seriam apropriadas à luz dos resultados do seu teste?
7.3.1 Indivíduos em um estudo de Dabonneville et al. (A-9) incluiu uma amostra de 40 homens que afirmaram praticar
uma variedade de atividades esportivas (multiesporte). O índice médio de massa corporal (IMC) para esses
homens foi de 22,41 com desvio padrão de 1,27. Uma amostra de 24 jogadores de rúgbi do sexo masculino
apresentou média de IMC de 27,75 com desvio padrão de 2,64. Existem evidências suficientes para afirmar que,
em geral, os jogadores de rugby têm um IMC maior do que os poliesportivos? Deixe um ¼ :01.
7.3.2 O objetivo de um estudo de Ingle e Eastell (A-10) foi examinar a densidade mineral óssea (DMO) e as propriedades
ultrassonográficas de mulheres com fraturas de tornozelo. Os pesquisadores recrutaram 31 mulheres na pós-
menopausa com fraturas no tornozelo e 31 mulheres na pós-menopausa saudáveis para servir como controle.
Uma das medições da linha de base foi o índice de rigidez do Aquiles lunar. O significativo
o índice de rigidez para o grupo de fratura de tornozelo foi de 76,9 com desvio padrão de 12,6. No grupo controle,
a média foi de 90,9 com desvio padrão de 12,5. Esses dados fornecem evidências suficientes para permitir que
você conclua que, em geral, o índice médio de rigidez é maior em
mulheres pós-menopáusicas saudáveis do que em mulheres pós-menopáusicas com fraturas de tornozelo? Deixe um ¼ :05.
7.3.3 Hoekema et al. (A-11) estudou a morfologia craniofacial de 26 pacientes do sexo masculino com síndrome da apneia obstrutiva
do sono (SAOS) e 37 indivíduos saudáveis do sexo masculino (não-SAOS). Uma das variáveis de interesse foi o comprimento
do ponto mais superoanterior do corpo do osso hioide até a horizontal de Frankfort (medido em milímetros).
Comprimento (mm) Não-SAOS Comprimento (mm) SAOS
96,80 97,00 101,00 88,95 105,95 114,90 113,70

100,70 97,70 88,25 101.05 114,90 114,35 116,30
94,55 97,00 92,60 92,60 110,35 112,25 108,75
99,65 94,55 98,25 97,00 123.10 106,15 113,30
109,15 106,45 90,85 91,95 119,30 102,60 106,00
102,75 94,55 95,25 88,95 110,00 102,40 101,75
97,70 94,05 88,80 95,75 98,95 105,05
92,10 89,45 101,40 114,20 112,65
91,90 89,85 90,55 108,95 128,95
89,50 98,20 109,80 105,05 117,70
Fonte: Dados fornecidos por cortesia de A. Hoekema, DDS
Esses dados fornecem evidências suficientes para nos permitir concluir que as duas populações amostradas diferem em
relação ao comprimento do osso hioide até a horizontal de Frankfort? Deixe um ¼ :01.
7.3.4 Podemos concluir que pacientes com hipertensão primária (HP), em média, apresentam níveis de colesterol total mais elevados
do que pacientes normotensos (NT)? Essa foi uma das indagações de interesse de Rossi et al. (A-12). Na tabela a seguir
estão as medições de colesterol total (mg/dl) para 133 pacientes com HP e 41 pacientes com NT. Podemos concluir que os
pacientes com HP têm, em média, níveis de colesterol total mais elevados do que os pacientes com TN? Deixe um ¼ :05.
Colesterol Total (mg/dl)
Pacientes hipertensos primários Pacientes Normotensos
207 221 212 220 190 286 189

172 223 260 214 245 226 196
191 181 210 215 171 187 142
221 217 265 206 261 204 179
203 208 206 247 182 203 212
241 202 198 221 162 206 163
208 218 210 199 182 196 196
199 216 211 196 225 168 189
185 168 274 239 203 229 142
235 168 223 199 195 184 168
214 214 175 244 178 186 121
134 203 203 214 240 281
226 280 168 236 222 203
(Contínuo)
EXERCÍCIOS 247
Colesterol Total (mg/dl)
Pacientes hipertensos primários Pacientes Normotensos
222 203 178 249 117 177 135

213 225 217 212 252 179 161
272 227 200 259 203 194
185 239 226 189 245 206
181 265 207 235 218 219
238 228 232 239 152 173
141 226 182 239 231 189
203 236 215 210 237 194
222 195 239 203 196
221 284 210 188 212
180 183 207 237 168
276 266 224 231 188
226 258 251 222 232
224 214 212 174 242
206 260 201 219 200
Fonte: Dados fornecidos por cortesia de Gian Paolo Rossi, MD, FACC, FAHA
7.3.5 GarcSão e Cabrita (A-13) pretendiam avaliar a capacidade do farmacêutico comunitário para influenciar positivamente os
resultados da terapêutica medicamentosa anti-hipertensora através de um programa de cuidados farmacêuticos em
Portugal. Oitenta e dois indivíduos com hipertensão essencial foram aleatoriamente designados para uma intervenção ou
um grupo de controle. O grupo de intervenção recebeu acompanhamento mensal por um farmacêutico pesquisador para
monitorar a pressão arterial, avaliar a adesão ao tratamento, prevenir, detectar e resolver problemas relacionados a
medicamentos e incentivar medidas não farmacológicas para controle da pressão arterial. As mudanças após 6 meses
na pressão arterial diastólica (pré pós, mm Hg) são dadas na tabela a seguir para pacientes em cada um dos dois grupos.
Grupo de Intervenção Grupo de controle
20 4 12 16 0 4 12 0
2 24 6 10 12 2 2 8
36 6 24 16 18 2 0 10
26 2 42 10 0 8 0 14
2 8 20 6 8 10 4 8
20 8 14 6 10 0 12 0
2 16 2 286 42
14 14 10 8 14 10 28 8
30 8 2 16 4 2 18 16
18 20 18 12 2 2 12 12
6 6
Fonte: Dados fornecidos por cortesia de José GarcSão, MS, Pharm.D.
Com base nesses dados, o que o pesquisador deve concluir? Deixe um ¼ :05.
7.3.6 Um teste destinado a medir as atitudes das mães em relação às experiências de trabalho de parto e parto foi aplicado a dois
grupos de novas mães. A amostra 1 (participantes) frequentou aulas de pré-natal realizadas no
Departamento de Saúde. A amostra 2 (não frequentadores) não compareceu às aulas. Os tamanhos das amostras e as
médias e desvios padrão das pontuações dos testes foram os seguintes:
Amostra n x s
1 15 4,75 1,0
2 22 3,00 1,5
Esses dados fornecem evidências suficientes para indicar que os participantes, em média, pontuam mais alto do que os
não participantes? Deixe um ¼ :05.
7.3.7 As determinações do nível de cortisol foram feitas em duas amostras de mulheres no parto. As participantes do Grupo 1
foram submetidas a cesariana de emergência após trabalho de parto induzido. Indivíduos do Grupo 2 entregues por
cesariana ou por via vaginal após trabalho de parto espontâneo. Os tamanhos das amostras, os níveis médios de cortisol
e os desvios padrão foram os seguintes:
Amostra n x s
1 10 435 65
2 12 645 80
Esses dados fornecem evidências suficientes para indicar uma diferença nos níveis médios de cortisol nas populações
representadas? Deixe um ¼ :05.
7.3.8 Os níveis de protoporfirina foram medidos em duas amostras de indivíduos. A amostra 1 consistia em 50 alcoólatras adultos
do sexo masculino com sideroblastos em anel na medula óssea. A amostra 2 consistiu de 40 homens adultos não
alcoólatras aparentemente saudáveis. Os níveis médios de protoporfirina e desvios padrão para as duas amostras foram
os seguintes:
Amostra x s
340 250
12 45 25
Pode-se concluir com base nesses dados que os níveis de protoporfirina são mais altos na população alcoólica
representada do que na população não alcoólica? Deixe um ¼ :01.
7.3.9 Um pesquisador estava interessado em saber se bebês prematuros com acidose metabólica tardia e bebês prematuros sem
a condição diferem em relação aos níveis de um determinado produto químico na urina.
Os níveis médios, desvios padrão e tamanhos de amostra para as duas amostras estudadas foram os seguintes:
Amostra n x s
com condição 35 8,5 5.5

Sem condição 40 4,8 3.6
O que o pesquisador deve concluir com base nesses resultados? Deixe um ¼ :05.
7.4 COMPARAÇÕES DE PARES 249
7.3.10 Os pesquisadores desejavam saber se podiam concluir que duas populações de bebês diferem com relação à idade
média em que andavam sozinhos. Os seguintes dados (idade em meses) foram coletados:
Amostra da população A: 9,5, 10,5, 9,0, 9,75, 10,0, 13,0,

10,0, 13,5, 10,0, 9,5, 10,0, 9,75
Amostra da população B: 12,5, 9,5, 13,5, 13,75, 12,0, 13,75,
12,5, 9,5, 12,0, 12,0, 123,0, 11,0
O que os pesquisadores devem concluir? Deixe um ¼ :05.
7.3.11 A privação sensorial tem efeito na frequência de onda alfa de uma pessoa? Vinte indivíduos voluntários foram
divididos aleatoriamente em dois grupos. Os indivíduos do grupo A foram submetidos a um período de 10 dias de
privação sensorial, enquanto os indivíduos do grupo B serviram como controles. No final do período experimental,
o componente de frequência de onda alfa dos eletroencefalogramas dos indivíduos foi medido. Os resultados
foram os seguintes:
Grupo A: 10,2, 9,5, 10,1, 10,0, 9,8, 10,9, 11,4, 10,8, 9,7, 10,4 Grupo B:
11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9
Deixe um ¼ :05.
7.3.12 Podemos concluir que, em média, linfócitos e células tumorais diferem em tamanho? A seguir estão os diâmetros
celulares ð Þ mm de 40 linfócitos e 50 células tumorais obtidas de biópsias de tecido de pacientes com melanoma:
Linfócitos
9,0 9.4 4.7 4.8 8.9 4.9 8.4 5.9

6.3 5.7 5,0 3.5 7.8 10.4 8,0 8,0
8.6 7,0 6.8 7.1 5.7 7.6 6.2 7.1
7.4 8,7 4.9 7,4 6.4 7.1 6.3 8.8
8.8 5,2 7.1 5,3 4.7 8.4 6.4 8.3
Células Tumorais
12.6 14.6 16.2 23.9 23.3 17.1 20,0 21,0 19.1 19.4
16.7 15.9 15.8 16,0 17.9 13.4 19.1 16.6 18.9 18.7
20,0 17.8 13.9 22.1 13.9 18.3 22.8 13,0 17.9 15.2
17.7 15.1 16.9 16.4 22.8 19.4 19.6 18.4 18.2 20.7
16.3 17.7 18.1 24.3 11.2 19.5 18.6 16.4 16.1 21.5
Deixe um ¼ :05.
7.4 COMPARAÇÕES DE PARES
Em nossa discussão anterior envolvendo a diferença entre duas médias populacionais,

assumiu-se que as amostras eram independentes. Um método freqüentemente empregado
para avaliar a eficácia de um tratamento ou procedimento experimental é aquele que faz uso de
observações resultantes de amostras não independentes. Um teste de hipótese baseado neste tipo de
dados é conhecido como teste de comparações pareadas.
Razões para o pareamento Freqüentemente, não existem diferenças verdadeiras entre duas populações
com relação à variável de interesse, mas a presença de fontes estranhas de variação pode causar a rejeição
da hipótese nula de nenhuma diferença.
Por outro lado, diferenças verdadeiras também podem ser mascaradas pela presença de fatores estranhos.
Suponha, por exemplo, que desejamos comparar dois protetores solares. Existem pelo menos duas
maneiras pelas quais o experimento pode ser realizado. Um método seria selecionar uma amostra aleatória
simples de indivíduos para receber protetor solar A e uma amostra aleatória simples independente de
indivíduos para receber protetor solar B. Mandamos os indivíduos para a luz do sol por um período de tempo
especificado, após o qual mediremos a quantidade de dano dos raios do sol. Suponha que empreguemos
esse método, mas, inadvertidamente, a maioria dos indivíduos que recebem protetor solar A têm tez mais
escura que são naturalmente menos sensíveis à luz solar.
Digamos que, após a conclusão do experimento, descobrimos que os indivíduos que receberam protetor
solar A sofreram menos danos causados pelo sol. Não saberíamos se eles sofreram menos danos causados
pelo sol porque o protetor solar A era mais protetor que o protetor solar B ou porque os sujeitos eram
naturalmente menos sensíveis ao sol.
Uma maneira melhor de planejar o experimento seria selecionar apenas uma amostra aleatória
simples de indivíduos e permitir que cada membro da amostra recebesse ambos os protetores solares.
Poderíamos, por exemplo, atribuir aleatoriamente os protetores solares à esquerda ou à direita das costas
de cada sujeito, com cada sujeito recebendo ambos os protetores solares. Depois de um período específico
de exposição ao sol, medimos a quantidade de danos causados pelo sol em cada metade das costas. Se a
metade das costas que recebeu o filtro solar A tendesse a ser menos danificada, poderíamos atribuir com
mais segurança o resultado ao filtro solar, pois em cada instância os dois filtros solares foram aplicados em
peles igualmente pigmentadas.
O objetivo nos testes de comparações pareadas é eliminar um número máximo de fontes de variação
estranha tornando os pares semelhantes em relação ao maior número possível de variáveis.
Observações relacionadas ou pareadas podem ser obtidas de várias maneiras. Os mesmos

indivíduos podem ser medidos antes e depois de receber algum tratamento. Os companheiros de ninhada
do mesmo sexo podem ser designados aleatoriamente para receber um tratamento ou um placebo. Pares
de gêmeos ou irmãos podem ser designados aleatoriamente para dois tratamentos de tal forma que os
membros de um único par recebam tratamentos diferentes. Ao comparar dois métodos de análise, o material
a ser analisado pode ser dividido igualmente, de modo que metade seja analisada por um método e a outra
metade seja analisada pelo outro. Ou os pares podem ser formados combinando indivíduos em alguma
característica, por exemplo, destreza digital, que está intimamente relacionada à medição de interesse,
digamos, pontuações pós-tratamento em algum teste que requeira manipulação digital.
Em vez de realizar a análise com observações individuais, usamos di, a diferença entre pares de
observações, como variável de interesse.
Quando as n diferenças amostrais calculadas a partir dos n pares de medições constituem uma
amostra aleatória simples de uma população de diferenças normalmente distribuída, a estatística de teste
para testar hipóteses sobre a diferença média da população md é
d md0
t¼ (7.4.1)
SD
onde d é a diferença média amostral, md0 é a diferença média hipotética da população, sd ¼ sd= n é o número de
ffiffiffi
diferenças amostrais e sd é np , distribuída

o desvio padrão das
como
diferenças
t de Student
amostrais.
com n 1Quando
graus de
H0liberdade.
é verdadeiro, a estatística de teste é
Embora inicialmente tenhamos duas amostras - digamos, níveis anteriores e posteriores - não precisamos nos
preocupar com igualdade de variâncias, como ocorre com amostras independentes, pois nossa variável é a diferença
entre as leituras no mesmo indivíduo ou em indivíduos pareados, e, portanto, apenas uma variável está envolvida. A
aritmética envolvida na realização de um teste de comparações pareadas, portanto, é a mesma para realizar um teste
envolvendo uma única amostra conforme descrito na Seção 7.2.
O exemplo a seguir ilustra os procedimentos envolvidos em comparações pareadas

teste.
EXEMPLO 7.4.1
John M. Morton et ai. (A-14) examinou a função da vesícula biliar antes e depois da fundoplicatura – uma cirurgia usada
para impedir que o conteúdo do estômago volte para o esôfago (refluxo) – em pacientes com doença do refluxo
gastroesofágico. Os autores mediram a funcionalidade da vesícula biliar calculando a fração de ejeção da vesícula biliar
(GBEF) antes e depois da fundoplicatura. O objetivo da fundoplicatura é aumentar o GBEF, que é medido em
porcentagem. Os dados são apresentados na Tabela 7.4.1. Queremos saber se esses dados fornecem evidências
suficientes para nos permitir concluir que a fundoplicatura aumenta o funcionamento do GBEF.
Solução: Diremos que há evidências suficientes para concluirmos que a fundoplicatura é eficaz se pudermos rejeitar a
hipótese nula de que a variação média populacional md é diferente de zero na direção apropriada.
Podemos chegar a uma conclusão por meio do procedimento de teste de hipótese de dez etapas.
1. Dados. Os dados consistem no GBEF para 12 indivíduos, antes e depois da fundoplicatura.

Faremos a análise estatística das diferenças no GBEF pré e pós-operatório. Podemos obter as
diferenças de duas maneiras: subtraindo os percentuais pré-operatórios dos percentuais pós-
operatórios ou subtraindo os percentuais pós-operatórios dos percentuais pré-operatórios. Deixe-
nos
TABELA 7.4.1 Função da vesícula biliar em pacientes com apresentações de doença do refluxo
gastroesofágico antes e depois do tratamento
Pré-operatório (%) 22 63,3 96 9,2 3.1 50 33 69 64 18,8 0 34

Pós-operatório (%) 63,5 91,5 59 37,8 10,1 19.6 41 87,8 86 55 88 40
Fonte: John M. Morton, Steven P. Bowers, Tananchai A. Lucktong, Samer Mattar, W. Alan Bradshaw, Kevin E.
Behrns, Mark J. Koruda, Charles A. Herbst, William McCartney, Raghuveer K. Halkar, C. Daniel Smith e Timothy M. Farrell,
"Função da vesícula biliar antes e depois da fundoplicação", Journal of Gastrointestinal Surgery, 6 (2002), 806–811.
obtenha as diferenças subtraindo os percentuais pré-operatórios dos percentuais pós-

operatórios. As diferenças di ¼ pós-operatório pré-operatório são:
41,5, 28,2, 37:0, 28,6, 7,0, 30:4, 8,0, 18,8, 22,0, 36,2, 88,0, 6,0
2. Suposições. As diferenças observadas constituem uma amostra aleatória simples de uma

população normalmente distribuída de diferenças que poderiam ser geradas nas
mesmas circunstâncias.
3. Hipóteses. A forma como enunciamos nossas hipóteses nula e alternativa deve ser
consistente com a forma como subtraímos as medidas para obter as diferenças. No
presente exemplo, queremos saber se podemos concluir que a fundoplicatura é útil para
aumentar o percentual de GBEF. Se for eficaz para melhorar o GBEF, esperaríamos
que os percentuais pós-operatórios tendessem a ser maiores do que os percentuais pré-
operatórios. Se, portanto, subtraíssemos os percentuais pré-operatórios dos percentuais
pós-operatórios ðpostop pré-operatório, esperaríamos que as diferenças tendessem a
ser positivas. Além disso, esperaríamos que a média de uma população de tais
diferenças fosse positiva. Então, nessas condições, perguntar se podemos concluir que
a fundoplicatura é eficaz é o mesmo que perguntar se podemos concluir que a diferença
média populacional é positiva (maior que zero).
As hipóteses nula e alternativa são as seguintes:
H0: md 0
HA: md > 0
Se tivéssemos obtido as diferenças subtraindo os percentuais pós-operatórios dos

pesos pré-operatórios ðpré-operatório pós-operatório, nossas hipóteses teriam sido
H0: md 0
HA: md < 0
Se a questão fosse tal que um teste bilateral fosse indicado, as hipóteses teriam sido
H0: md ¼ 0
HA: md 6¼ 0
independentemente da forma como subtraímos para obter as diferenças.
4. Estatística de teste. A estatística de teste apropriada é dada pela Equação 7.4.1.
5. Distribuição da estatística de teste. Se a hipótese nula for verdadeira, a estatística de

teste é distribuída como t de Student com n 1 graus de liberdade.
6. Regra de decisão. Deixe um ¼ :05. O valor crítico de t é 1,7959. Rejeitar H0 se t calculado

for maior ou igual ao valor crítico. As regiões de rejeição e não rejeição são mostradas
na Figura 7.4.1.
a = 0,05
0 1,7959 t
FIGURA 7.4.1 Regiões de rejeição e não rejeição para o

Exemplo 7.4.1.
7. Cálculo da estatística de teste. Das n ¼ 12 diferenças di, calculamos as seguintes

medidas descritivas:
Pdi ð Þþ 41:5 ð Þþ 28:2 ð Þþþ 37:0 ð Þ 6:0 12 216:9

d¼ ¼ ¼ ¼ 18:075
n 12
2 2 2
PðÞ di dn 1 n Pd2 Pð Þ di 12 15669 ð Þ :49 ð Þ 216:9 ð Þ 12
¼ 1068:0930
eu
s2d ¼ ¼ ¼
n nð Þ1 ð Þ 11
18:075 0 18:075
¼ ¼ 1:9159
9:4344
1068:0930=12p
8. Decisão estatística. Rejeite H0, pois 1,9159 está na região de rejeição.
Teste T pareado e IC: C2, C1
T emparelhado para C2 - C1
N Média StDev SE Média

C2 12 56.6083 27.8001 8.0252
C1 12 38.5333 30.0587 8.6772
Diferença 12 18.0750 32.6817 9.4344
Limite inferior de 95% para a diferença média: 1,1319

Teste t de diferença média 0 (vs 0): Valor T 1,92 Valor-P
0,041
FIGURA 7.4.2 Procedimento do MINITAB e saída para teste de comparações pareadas, Exemplo 7.4.1
(dados na Tabela 7.4.1).
9. Conclusão. Podemos concluir que o procedimento de fundoplicatura aumenta

avalia o funcionamento do GBEF.
10. valor p. Para este teste, :025 < p < :05, pois 1:7959 < 1:9159 < 2:2010.
O MINITAB fornece o valor p exato como 0,041 (Figura 7.4.2). &
Um intervalo de confiança para md Um intervalo de confiança de 95 por cento para md pode ser obtido
da seguinte forma:
d t1ð Þ a=2 sd
18:075 2:2010 1068:0930=12p

18:075 20:765
ð2:690; 38:840Þ
O uso de z Se, na análise de dados pareados, a variância populacional das diferenças for conhecida, a
estatística de teste apropriada é
d md
z¼ ffiffiffi
(7.4.2)
sd = np
É improvável que sd seja conhecido na prática.

Se a suposição de di's normalmente distribuídos não puder ser feita, o teorema do limite central
pode ser empregado se n for grande. Nesses casos, a estatística de teste é a Equação 7.4.2, com sd
usado para estimar sd quando, como geralmente é o caso, este último é desconhecido.
Desvantagens O uso do teste de comparações pareadas tem seus problemas.

Se sujeitos diferentes forem usados e atribuídos aleatoriamente a dois tratamentos, tempo e gastos
consideráveis podem ser envolvidos em nossa tentativa de combinar indivíduos em uma ou mais variáveis
relevantes. Outro preço que pagamos por usar comparações pareadas é a perda de graus de liberdade.
Se não usarmos observações pareadas, teremos 2n 2 graus de liberdade disponíveis em comparação
com n 1 quando usarmos o procedimento de comparações pareadas.
Em geral, ao decidir se deve ou não usar o procedimento de comparações pareadas, deve-se
guiar pela economia envolvida, bem como pela consideração dos ganhos a serem obtidos em termos de
controle de variação externa.
Alternativas Se nem z nem t for uma estatística de teste apropriada para uso com os dados disponíveis,
pode-se considerar o uso de alguma técnica não paramétrica para testar uma hipótese sobre uma
diferença mediana. O teste do sinal, discutido no Capítulo 13, é um candidato para uso nesses casos.
EXERCÍCIOS
Nos exercícios a seguir, execute o procedimento de teste de hipótese de dez etapas no nível de significância
especificado. Para cada exercício, conforme apropriado, explique por que você escolheu um teste unilateral ou
um teste bilateral. Discuta como você acha que pesquisadores ou médicos podem usar os resultados de seu
teste de hipótese. Que decisões ou ações clínicas ou de pesquisa você acha que seriam apropriadas à luz dos
resultados do seu teste?
EXERCÍCIOS 255
7.4.1 Ellen Davis Jones (A-15) estudou os efeitos da terapia de reminiscência para mulheres idosas com depressão. Ela estudou 15
mulheres de 60 anos ou mais residindo por 3 meses ou mais em uma instituição de cuidados de longa duração. Para este
estudo, a depressão foi medida pela Escala de Depressão Geriátrica (GDS). Pontuações mais altas indicam sintomas de
depressão mais graves. Os participantes receberam terapia de reminiscência para cuidados de longo prazo, que usa
fotografias de família, álbuns de recortes e recordações pessoais para estimular a memória e a conversa entre os membros
do grupo. Os escores de depressão pré-tratamento e pós-tratamento são dados na tabela a seguir. Podemos concluir, com
base nesses dados, que os sujeitos que participam da terapia de reminiscência experimentam, em média, um declínio nos
escores de depressão da GDS? Deixe um ¼ :01.
Pré–GDS: 12 10 16 2 12 18 11 16 16 10 14 21 9 19 20 Pós–GDS: 11 10 11 3 8 14 16 10 12 22 9 16 18 Fonte: Dados

fornecidos por cortesia de Ellen Davis Jones, ND, RN, FNP-C.
9 13
7.4.2 Beney et al. (A-16) avaliaram o efeito do acompanhamento telefônico na dimensão do bem-estar físico da qualidade de vida
relacionada à saúde em pacientes com câncer. Uma das principais variáveis de resultado foi medida pela subescala de bem-
estar físico da Escala de Avaliação Funcional da Terapia do Câncer-Geral (FACT-G). Uma pontuação mais alta indica maior
bem-estar físico. A tabela a seguir mostra a pontuação FACT-G inicial e a pontuação de acompanhamento para avaliar o
bem-estar físico durante os 7 dias após a alta do hospital para casa para 66 pacientes que receberam um telefonema 48–
72 horas após a alta que deu aos pacientes a oportunidade de discutir medicamentos, problemas e conselhos.
Existem evidências suficientes para indicar que a qualidade do bem-estar físico diminui significativamente na primeira
semana de alta entre os pacientes que recebem um telefonema? Deixe um ¼ :05.
Linha de base Acompanhamento Linha de base Acompanhamento
Sujeito FACT-G Assunto FACT-G FACT-G FACT-G
1 16 19 34 25 14
2 26 19 35 21 17
3 13 9 36 14 22
4 20 23 37 23 22
5 22 25 38 19 16
6 21 20 39 19 15
7 20 10 40 18 23
8 15 20 41 20 21
9 25 22 42 18 11
10 20 18 43 22 22
11 11 6 44 7 17
12 22 21 45 23 9
13 18 17 46 19 16
14 21 13 47 17 16
15 25 25 48 22 20
16 17 21 49 19 23
17 26 22 50 5 17
18 18 22 51 22 17
19 7 9 52 12 6
20 25 24 53 19 19
21 22 15 54 17 20
22 15 9 55 7 6
(Contínuo )
Linha de base Acompanhamento Linha de base Acompanhamento
Sujeito FACT-G Assunto FACT-G FACT-G FACT-G
23 19 56 27 10
24 23 7 57 22 16
25 19 20 58 16 14
26 21 19 24 59 26 24
27 24 23 60 17 19
28 21 15 61 23 22
29 28 27 62 23 23
30 18 26 63 13 3
31 25 26 64 24 22
32 25 26 65 17 21
33 28 28 66 22 21
Fonte: Dados fornecidos por cortesia de Johnny Beney, Ph.D. e E. Beth Devine,
Pharm.D., MBA et al.
7.4.3 O objetivo de uma investigação de Morley et al. (A-17) foi avaliar a eficácia analgésica de uma dose diária de metadona oral em
pacientes com síndromes de dor neuropática crônica. Os pesquisadores usaram uma escala visual analógica (0 a 100 mm,
número maior indica maior dor) para avaliar a intensidade máxima da dor ao longo do dia. Cada sujeito tomou 20 mg de metadona
ou um placebo por dia durante 5 dias. Os indivíduos não sabiam qual tratamento estavam tomando. A tabela a seguir apresenta
as pontuações médias da intensidade máxima da dor para os 5 dias com metadona e os 5 dias com placebo. Esses dados
fornecem evidências suficientes, no nível de significância de 0,05, para indicar que, em geral, a intensidade máxima da dor é
menor nos dias em que a metadona é tomada?
Sujeito Metadona Placebo
1 29,8 57.2
2 73,0 69,8
3 98,6 98,2
4 58,8 62,4
5 60,6 67,2
6 57,2 70,6
7 57,2 67,8
8 89,2 95,6 Fonte: John S. Morley, John Bridson, Tim P. Nash, John B.
9 97,0 98,4 Miles, Sarah White e Matthew K. Makin, “Low-Dose
10 49,8 63,2 Metadone Has an Analgesic Effect in Neuropathic Pain:
A Double-Blind Randomized Controlled Crossover Trial,”
11 37,0 63,6
Medicina paliativa, 17 (2003), 576–587.
7.4.4 Woo e McKenna (A-18) investigaram o efeito da terapia ultravioleta B (UVB) de banda larga e creme de calcipotriol tópico usados
juntos em áreas de psoríase. Uma das variáveis de resultado é o Índice de Área e Gravidade da Psoríase (PASI). A tabela a
seguir fornece as pontuações PASI para 20 indivíduos medidos na linha de base e após oito tratamentos. Esses dados fornecem
evidências suficientes, no nível de significância de 0,01, para indicar que a terapia combinada reduz os escores PASI?
7.5 TESTE DE HIPÓTESE: UMA ÚNICA PROPORÇÃO DE POPULAÇÃO 257
depois das 8
Linha de base do assunto Tratamentos
1 5.9 5.2
2 7.6 12.2
3 12,8 4.6
4 16,5 4,0
5 6,1 0,4
6 14,4 3,8
7 6,6 1,2
8 5,4 3,1
9 9,6 3,5
10 11,6 4,9
11 11.1 11,1
12 15.6 8.4
13 6.9 5.8
14 15.2 5,0
15 21,0 6.4
16 5.9 0,0
17 10,0 2.7
18 12.2 5.1
19 20.2 4.8
20 6.2 4.2
Fonte: Dados fornecidos por cortesia de WK Woo, MD
7.4.5 Um dos objetivos da investigação de Porcellini et al. (A-19) foi investigar o efeito na contagem de células T CD4 da
administração de interleucina intermitente (IL-2) além da terapia antirretroviral altamente ativa (HAART). A tabela a
seguir mostra a contagem de células T CD4 no início e novamente após 12 meses de terapia HAART com IL-2. Os
dados mostram, no nível 0,05, uma mudança significativa na contagem de células T CD4?
Sujeito 1 2 3 4567
Contagem de células T CD4 na entrada ð 106 =LÞ 173 58 103 181 105 301 169
Contagem de células T CD4 no final do 257 108 315 362 141 549 369
acompanhamento ð 106 =LÞ
Fonte: Simona Procellini, Giuliana Vallanti, Silvia Nozza, Guido Poli, Adraino Lazzarin, Guiseppe Tabussi e
Antonio Grassia, “Improved Thymopoietic Potential in Aviremic HIV-Infected Individuals with HAART by Intermittent
IL-2 Administration,” AIDS, 17 (2003) , 1621–1630.
7.5 TESTE DE HIPÓTESE: UMA ÚNICA PROPORÇÃO DE

POPULAÇÃO
O teste de hipóteses sobre proporções populacionais é realizado da mesma maneira que para
médias quando as condições necessárias para usar a curva normal são atendidas. Podem ser
feitos testes unilaterais ou bilaterais, dependendo da pergunta que está sendo feita. Quando uma amostra
suficientemente grande para aplicação do teorema do limite central conforme discutido na Seção 5.5
está disponível para análise, a estatística de teste é
^p p0
z¼ fffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
(7.5.1)
p0q0
nº
que, quando H0 é verdadeiro, é distribuído aproximadamente como a normal padrão.
EXEMPLO 7.5.1
Wagenknecht et ai. (A-20) coletou dados de uma amostra de 301 mulheres hispânicas que vivem em
San Antonio, Texas. Uma variável de interesse foi a porcentagem de indivíduos com glicemia de jejum
alterada (IFG). IFG refere-se a um estágio metabólico intermediário entre a homeostase normal da
glicose e o diabetes. No estudo, 24 mulheres foram classificadas na etapa IFG. O artigo cita estimativas
populacionais para IFG entre mulheres hispânicas no Texas como 6,3 por cento.
Existem evidências suficientes para indicar que a população de mulheres hispânicas em San Antonio
tem uma prevalência de IFG superior a 6,3%?
Solução:
1. Dados. Os dados são obtidos a partir das respostas de 301 indivíduos dos quais 24
possuíam a característica de interesse; isto é, ^p ¼ 24=301 ¼ :080.
2. Suposições. Os sujeitos do estudo podem ser tratados como uma amostra aleatória
simples de uma população de sujeitos semelhantes, e a distribuição amostral de
^p é aproximadamente distribuída normalmente de acordo com o teorema do limite
central.
3. Hipóteses.
H0: p :063
HA: p > :063
Conduzimos o teste no ponto de igualdade. A conclusão a que chegaremos será a

mesma que chegaríamos se realizássemos o teste usando qualquer outro valor
hipotético de p maior que 0,063. Se H0 for verdadeiro, p ¼ :063 ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
=301 e o erro padrão s^p ¼ pð Þ :063 ð Þ :937 . Observe que usamos o

valor hipotético de p no cálculo de s^p. Fazemos isso porque todo o teste é baseado
na suposição de que a hipótese nula é verdadeira. Usar a proporção de amostra,
^p, no cálculo de s^p não seria consistente com esse conceito.

5. Distribuição da estatística de teste. Se a hipótese nula for verdadeira, a estatística
de teste é aproximadamente distribuída normalmente com média zero.
6. Regra de decisão. Deixe um ¼ :05. O valor crítico de z é 1,645. Rejeitar H0 se o z
calculado for 1:645.
7.5 TESTE DE HIPÓTESE: UMA ÚNICA PROPORÇÃO DE POPULAÇÃO 259
:080 :063
z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff ¼ 1:21
ð Þ :063 ð Þ :937
301 r
8. Decisão estatística. Não rejeite H0 desde 1:21 < 1:645.

9. Conclusão. Não podemos concluir que na população amostrada a proporção
de IFG seja superior a 6,3 por cento. 10. valor p. p ¼ :1131.
&
Testes envolvendo uma única proporção podem ser realizados usando uma variedade de
programas de computador. As saídas do MINITAB e NCSS, usando os dados do Exemplo 7.5.1,
são mostradas na Figura 7.5.1. Deve-se notar que os resultados irão variar ligeiramente, devido
a erros de arredondamento, se os cálculos forem feitos à mão. Também deve ser observado que
alguns programas, como o NCSS, usam uma correção de continuidade no cálculo do valor z e,
portanto, os valores estatísticos de teste e os valores p correspondentes diferem ligeiramente da
saída do MINITAB.
Saída do MINITAB
Teste e IC para uma proporção
Teste de p 0,063 vs p 0,063
95% inferior
Amostra x N Amostra p 24 Limite Valor Z Valor P
1 301 0,079734 0,054053 1.19 0,116
Usando a aproximação normal.
Saída NCSS
Aproximação normal usando (P0)
Alternativo Valor Z Problema Decisão

sehtopyH si veL le )%5(
P P0 1.0763 0,281780 Aceitar H0
P P0 1.0763 0,859110 Aceitar H0
P P0 1.0763 0,140890 Aceitar H0
FIGURA 7.5.1 MINITAB e saída NCSS parcial para os dados do Exemplo 7.5.1.
EXERCÍCIOS
Para cada um dos exercícios a seguir, execute o procedimento de teste de hipótese de dez etapas no nível de significância
designado. Para cada exercício, conforme apropriado, explique por que você escolheu um teste unilateral ou um teste
bilateral. Discuta como você acha que pesquisadores ou médicos podem usar os resultados de seu teste de hipótese. Que
decisões ou ações clínicas ou de pesquisa você acha que seriam apropriadas à luz dos resultados do seu teste?
7.5.1 Jacquemyn et al. (A-21) realizou uma pesquisa entre ginecologistas-obstetras na região de Flandres e obteve 295 respostas.
Das que responderam, 90 indicaram que haviam realizado pelo menos uma cesariana sob demanda a cada ano. Este
estudo fornece evidências suficientes para concluirmos que menos de 35% dos ginecologistas-obstetras na região de
Flandres realizam pelo menos uma cesariana sob demanda a cada ano? Deixe um ¼ :05.
7.5.2 Em um artigo na revista Health and Place, Hui e Bell (A-22) descobriram que entre 2.428 meninos de 7 a 12 anos, 461 estavam
acima do peso ou obesos. Com base neste estudo, podemos concluir que mais de 15% dos meninos de 7 a 12 anos na
população amostrada são obesos ou têm sobrepeso? Deixe um ¼ :05.
7.5.3 Becker et al. (A-23) conduziu um estudo usando uma amostra de 50 mulheres de etnia fijiana. As mulheres preencheram um
questionário de autorrelato sobre dieta e atitudes em relação à forma e mudança do corpo.
Os pesquisadores descobriram que cinco dos entrevistados relataram pelo menos episódios semanais de compulsão
alimentar durante os 6 meses anteriores. Isso é evidência suficiente para concluir que menos de 20% da população de
mulheres fijianas se envolve em pelo menos episódios semanais de compulsão alimentar?
Deixe um ¼ :05.
7.5.4 O questionário a seguir foi preenchido por uma amostra aleatória simples de 250 ginecologistas. o
número de verificação de cada resposta é mostrado na caixa apropriada.
1. Quando você pode escolher, qual procedimento você prefere para obter amostras de endométrio?
(a) Dilatação e curetagem 175 (b) Vobra
aspiração 75
2. Você viu uma ou mais mulheres grávidas durante o ano passado que você sabia que tinham níveis elevados de chumbo
no sangue?
(a) Sim 25 (b)

Não 225
3. Você rotineiramente informa suas pacientes grávidas que fumam sobre os perigos suspeitos de fumar para o feto? (a)
Sim 238 (b) Não 12
Podemos concluir a partir desses dados que na população amostrada mais de 60% preferem dilatação e curetagem para
obter amostras de endométrio? Deixe um ¼ :01.
7.5.5 Consulte o Exercício 7.5.4. Podemos concluir a partir desses dados que, na população amostrada, menos de 15% viram
(durante o ano passado) uma ou mais mulheres grávidas com níveis elevados de chumbo no sangue? Deixe um ¼ :05.
7.5.6 Consulte o Exercício 7.5.4. Podemos concluir a partir desses dados que mais de 90 por cento informam suas pacientes grávidas
que fumam sobre os perigos suspeitos de fumar para o feto? Deixe um ¼ :05.
7.6 TESTE DE HIPÓTESES: A DIFERENÇA ENTRE DUAS PROPORÇÕES DE POPULAÇÃO 261
7.6 TESTE DE HIPÓTESE: A DIFERENÇA ENTRE

DUAS PROPORÇÕES DE POPULAÇÃO
O teste mais freqüentemente empregado em relação à diferença entre duas proporções populacionais
é que sua diferença é zero. É possível, no entanto, testar se a diferença é igual a algum outro valor.
Podem ser feitos testes unilaterais e bilaterais.
Quando a hipótese nula a ser testada é p1 p2 ¼ 0, estamos hipotetizando que as duas proporções
populacionais são iguais. Usamos isso como justificativa para combinar os resultados das duas amostras
para obter uma estimativa combinada da proporção comum hipotética. Se este procedimento for adotado,
computa-se
x1 þ x2
p ¼ n1 þ n2 ; eq¼1p
onde x1 e x2 são os números da primeira e segunda amostras, respectivamente, possuindo a

característica de interesse. Essa estimativa combinada de p ¼ p1 ¼ p2 é usada no cálculo de
s^^p1^p2 , o erro padrão estimado do estimador, como segue:
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
pð Þ pð Þ 1 p 1 p þ
s^^p1^p2 ¼ (7.6.1)
s n1 n2
A estatística de teste se torna
ð ^p1 ^p2ðs^^p1^p2
Þ p1 p2 Þ0
z¼ (7.6.2)
que é distribuído aproximadamente como normal padrão se a hipótese nula for verdadeira.
EXEMPLO 7.6.1
A síndrome de Noonan é uma condição genética que pode afetar o coração, o crescimento, a coagulação
do sangue e o desenvolvimento mental e físico. Noonan et ai. (A-24) examinou a estatura de homens e
mulheres com síndrome de Noonan. O estudo continha 29 adultos do sexo masculino e 44 do sexo feminino.
Um dos valores de corte utilizados para avaliar a estatura foi o terceiro percentil da estatura adulta.
Onze dos homens caíram abaixo do terceiro percentil da altura adulta masculina, enquanto 24 das
mulheres caíram abaixo do terceiro percentil da altura adulta feminina. Este estudo fornece evidências
suficientes para concluirmos que, entre os indivíduos com síndrome de Noonan, as mulheres são
mais propensas do que os homens a cair abaixo do respectivo terceiro percentil da altura adulta?
Deixe um ¼ :05.
Solução:
1. Dados. Os dados consistem em informações sobre o status de altura de homens

e mulheres com síndrome de Noonan, conforme descrito na declaração do
exemplo.
2. Suposições. Assumimos que os pacientes no estudo constituem amostras
aleatórias simples independentes de populações de homens e mulheres com
síndrome de Noonan.
3. Hipóteses.
H0: pF pM ou pF pM 0
HA: pF > pM ou pF pM > 0
onde pF é a proporção de mulheres abaixo do terceiro percentil da altura adulta

feminina e pM é a proporção de homens abaixo do terceiro percentil da altura
adulta masculina.
5. Distribuição da estatística de teste. Se a hipótese nula for verdadeira, a estatística
de teste é distribuída aproximadamente como a normal padrão.
6. Regra de decisão. Deixe um ¼ :05. O valor crítico de z é 1,645. Rejeitar H0 se z
calculado for maior que 1,645.
7. Cálculo da estatística de teste. A partir dos dados de amostra, calculamos
^pF ¼ 24=44 ¼ :545; ^pM ¼ 11=29 ¼ :379, e p ¼ ð Þvalor 24 þcalculado
11
29=ð
estatística
:479.
Þ¼daO44 þ
de teste, então, é
ð :545 :379 Þ
¼ 1:39
ð:479Þð:521Þ ð:479Þð:521Þ
þ
r 44 29
8. Decisão estatística. Falha ao rejeitar H0 desde 1:39 < 1:645.

9. Conclusão. Na população geral de adultos com síndrome de Noonan, pode não
haver diferença na proporção de homens e mulheres com altura abaixo do
terceiro percentil da altura adulta. 10. valor p. Para este teste p ¼ :0823.
&
Testes envolvendo duas proporções, usando os dados do Exemplo 7.6.1, podem ser executados
com uma variedade de programas de computador. As saídas do MINITAB e NCSS são mostradas na
Figura 7.6.1. Novamente, deve-se notar que, devido a erros de arredondamento, os resultados irão
variar ligeiramente se os cálculos forem feitos à mão.
EXERCÍCIOS 263
Saída do MINITAB
Teste e CI para Duas Proporções
Amostra X N Amostra p
1 24 44 0,545455
2 11 29 0,379310
Diferença p (1) p (2)
Estimativa para diferença: 0,166144
Limite inferior de 95% para diferença: 0,0267550
Teste para diferença 0 (vs > 0): Z 1,39 P-Valor 0,082
Saída NCSS
Teste Teste Teste Problema Concluir H1

Nome Estatisticas Estatística Nível às 5%
noitubirtsiD eulaV ?ecnacfiingiS
Teste Z Normal 1.390 0,0822 Não
FIGURA 7.6.1 MINITAB e saída NCSS parcial para os dados do Exemplo 7.6.1.
EXERCÍCIOS
Em cada um dos exercícios a seguir, use o procedimento de teste de hipóteses em dez etapas. Para cada
exercício, conforme apropriado, explique por que você escolheu um teste unilateral ou um teste bilateral.
Discuta como você acha que pesquisadores ou médicos podem usar os resultados de seu teste de hipótese.
Que decisões ou ações clínicas ou de pesquisa você acha que seriam apropriadas à luz dos resultados do
seu teste?
7.6.1 Ho et al. (A-25) usou entrevistas telefônicas com entrevistados selecionados aleatoriamente em Hong Kong
para obter informações sobre as percepções dos indivíduos sobre a saúde e o histórico de tabagismo. Entre
1.222 fumantes atuais do sexo masculino, 72 relataram que tinham saúde “ruim” ou “muito ruim”, enquanto
30 entre 282 ex-fumantes relataram que tinham saúde “ruim” ou “muito ruim”. Isso é evidência suficiente
para permitir concluir que entre os homens de Hong Kong há uma diferença entre fumantes atuais e ex-
fumantes com relação à proporção que se percebe como tendo saúde “ruim” e “muito ruim”? Deixe um ¼
:01.
7.6.2 Landolt et al. (A-26) examinou as taxas de transtorno de estresse pós-traumático (TEPT) em mães e pais.
Os pais foram entrevistados 5 a 6 semanas após um acidente ou um novo diagnóstico de câncer ou diabetes
mellitus tipo I para seu filho. Vinte e oito dos 175 pais entrevistados e 43 das 180 mães entrevistadas
entrevistados preencheram os critérios para TEPT atual. Há evidências suficientes para concluirmos que
os pais são menos propensos a desenvolver TEPT do que as mães quando uma criança é traumatizada por um acidente,
diagnóstico de câncer ou diagnóstico de diabetes? Deixe um ¼ :05.
7.6.3 Em artigo da Kidney International, Avram et al. (A-27) relataram um estudo envolvendo 529 pacientes em hemodiálise e 326
pacientes em diálise peritoneal. Eles descobriram que no início do estudo 249 indivíduos no grupo de tratamento de hemodiálise
eram diabéticos, enquanto no início do estudo 134 dos indivíduos no grupo de diálise peritoneal eram diabéticos. Existe uma
diferença significativa na prevalência de diabetes no início do estudo entre os dois grupos deste estudo? Deixe um ¼ :05. O
que sua descoberta sobre a significância da amostra implica sobre as populações de sujeitos?
7.6.4 Em um estudo de obesidade, os seguintes resultados foram obtidos de amostras de homens e mulheres entre
as idades de 20 e 75 anos:
n Número Excesso de peso
machos 150 21
Fêmeas 200 48
Podemos concluir destes dados que nas populações amostradas existe uma diferença nas proporções de pessoas com excesso
de peso? Deixe um ¼ :05.
7.7 TESTE DE HIPÓTESE: VARIÂNCIA DE UMA ÚNICA POPULAÇÃO
Na Seção 6.9 examinamos como é possível construir um intervalo de confiança para a variância de uma
população normalmente distribuída. Os princípios gerais apresentados nessa seção podem ser
empregados para testar uma hipótese sobre uma variação populacional. Quando os dados disponíveis
para análise consistem em uma amostra aleatória simples extraída de uma população normalmente
distribuída, a estatística de teste para testar hipóteses sobre a variância da população é
x2 ¼ ð 2 =s2 Þ n 1 s (7.7.1)
que, quando H0 é verdadeiro, é distribuído como x2 com n 1 graus de liberdade.
EXEMPLO 7.7.1
O objetivo do estudo de Wilkins et al. (A-28) foi medir a eficácia do hormônio de crescimento humano
recombinante (rhGH) em crianças com queimaduras na superfície corporal total > 40 por cento. Neste
estudo, 16 indivíduos receberam injeções diárias de rhGH em casa. No início, os pesquisadores queriam
saber os níveis atuais de fator de crescimento semelhante à insulina (IGF-I) antes da administração de
rhGH. A variância amostral dos níveis de IGF-I (em ng/ml) foi de 670,81. Queremos saber se podemos
concluir a partir desses dados que a variância da população não é 600.
7.7 TESTE DE HIPÓTESE: VARIÂNCIA DE UMA ÚNICA POPULAÇÃO 265
Solução:
1. Dados. Veja a declaração no exemplo.

2. Suposições. A amostra do estudo constitui uma amostra aleatória simples de
uma população de crianças semelhantes. Os níveis de IGF-I são normalmente
distribuídos.
3. Hipóteses.
H0: s2 ¼ 600
HA: s2 6¼ 600

5. Distribuição da estatística de teste. Quando a hipótese nula é verdadeira, a
estatística de teste é distribuída como x2 com n 1 graus de liberdade.
6. Regra de decisão. Deixe um ¼ :05. Os valores críticos de x2 são 6,262 e 27,488.
Rejeitar H0 a menos que o valor calculado da estatística de teste esteja entre
6,262 e 27,488. As regiões de rejeição e não rejeição são mostradas na Figura
7.7.1.
15ð670:81Þ
x2 ¼ ¼ 16:77 600
8. Decisão estatística. Não rejeite H0 desde 6:262 < 16:77 < 27:488.
9. Conclusão. Com base nesses dados, não podemos concluir que o
variação da população não é 600.
10. valor p. A determinação do valor p para esse teste é complicada pelo fato de
termos um teste bilateral e uma distribuição amostral assimétrica. Quando
temos um teste bilateral e uma distribuição amostral simétrica, como a normal
padrão ou t, podemos, como vimos, dobrar o valor de p unilateral. Os problemas
surgem quando tentamos
0,025
0,025
6.2620 27.488 x2
15
região de rejeição região de não rejeição região de rejeição

faça isso com uma distribuição de amostragem assimétrica, como a distribuição qui-
quadrada. Nesta situação, o valor de p unilateral é relatado junto com a direção do
desvio observado da hipótese nula. De fato, esse procedimento pode ser seguido
no caso de distribuições amostrais simétricas. O precedente, no entanto, parece
favorecer a duplicação do valor de p unilateral quando o teste é bilateral e envolve
uma distribuição de amostragem simétrica.
Para o presente exemplo, então, podemos reportar o valor p da seguinte forma:

p > :05 (teste bilateral). Uma variância populacional superior a 600 é sugerida pelos
dados da amostra, mas essa hipótese não é fortemente apoiada pelo teste.
Se o problema for apresentado em termos de desvio padrão da população, pode-

se elevar ao quadrado o desvio padrão da amostra e realizar o teste conforme
indicado acima. &
Testes unilaterais Embora este seja um exemplo de teste bilateral, os testes unilaterais também podem
ser feitos pela modificação lógica do procedimento fornecido aqui.
Para HA: s2 > s20; rejeitar H0 se calculado x2 x2 1a
Para HA: s2 < s20; rejeitar H0 se calculado x2 x2 uma
Testes envolvendo uma única variância populacional podem ser realizados usando o software
MINITAB. A maioria dos outros programas estatísticos de computador carece de procedimentos para
realizar esses testes diretamente. A saída do MINITAB, usando os dados do Exemplo 7.7.1, é mostrada
na Figura 7.7.2.
Teste e IC para uma variação
Estatisticas
N StDev Variância
16 25,9 671
Intervalos de confiança de 95%
IC para IC para
Método StDev variância
Padrão (19.1, 40.1) (366, 1607)
testes
Método Qui-quadrado padrão 16,77 DF Valor P

15 0,666
FIGURA 7.7.2 Saída do MINITAB para os dados do Exemplo 7.7.1.

7.8 TESTE DE HIPÓTESE: A RAZÃO DE DUAS VARIÂNCIAS DE POPULAÇÃO 267
EXERCÍCIOS
Em cada um dos exercícios a seguir, execute o procedimento de teste de dez etapas. Para cada exercício,
conforme apropriado, explique por que você escolheu um teste unilateral ou um teste bilateral. Discuta como
você acha que pesquisadores ou médicos podem usar os resultados de seu teste de hipótese. Que decisões ou
ações clínicas ou de pesquisa você acha que seriam apropriadas à luz dos resultados do seu teste?
7.7.1 Lembre-se do Exemplo 7.2.3, onde Nakamura et al. (A-1) estudou indivíduos com lesão aguda do ligamento
colateral medial (LCM) com ruptura do ligamento cruzado anterior (LCA). As idades dos 17 participantes eram:
31; 26; 21; 15; 26; 16; 19; 21; 28; 27; 22; 20; 25; 31; 20; 25; 15
Use esses dados para determinar se há evidências suficientes para concluirmos que, em uma população de
indivíduos semelhantes, a variação das idades dos indivíduos não é de 20 anos. Deixe um ¼ :01.
7.7.2 Robinson e outros. (A-29) estudaram nove indivíduos submetidos ao procedimento de baffle para transposição
das grandes artérias (TGA). Na linha de base, os valores da resistência vascular sistêmica (RVS) (medida em
WU m2) em repouso produziram um desvio padrão de 28. Podemos concluir a partir desses dados que a
variação da RVP de uma população de indivíduos semelhantes com TGA não é 700? Deixe um ¼ :10.
7.7.3 Os valores da capacidade vital foram registrados para uma amostra de 10 pacientes com obstrução crônica grave
das vias aéreas. A variância das 10 observações foi de 0,75. Teste a hipótese nula de que a variância da
população é 1,00. Deixe um ¼ :05.
7.7.4 Os valores de hemoglobina (g por cento) foram registrados para uma amostra de 20 crianças que fizeram parte de
um estudo de leucemia aguda. A variância das observações foi 5. Esses dados fornecem evidências suficientes
para indicar que a variância da população é maior que 4? Deixe um ¼ :05.
7.7.5 Uma amostra de 25 administradores de grandes hospitais participou de um estudo para investigar a natureza e
extensão da frustração e tensão emocional associada ao trabalho. Cada participante recebeu um teste destinado
a medir a extensão da tensão emocional que ele ou ela experimentou como resultado dos deveres e
responsabilidades associados ao trabalho. A variância das pontuações foi de 30. Pode-se concluir a partir
desses dados que a variância da população é maior que 25? Deixe um ¼ :05.
7.7.6 Em um estudo no qual os sujeitos eram 15 pacientes que sofriam de doença pulmonar sarcóide, foram feitas
determinações de gases no sangue. A variância dos valores de Pao2 (mm Hg) foi de 450. Teste a hipótese nula
de que a variância da população é maior que 250. Seja a ¼ :05.
7.7.7 A análise do líquido amniótico de uma amostra aleatória simples de 15 mulheres grávidas produziu o
seguintes medições de proteína total (gramas por 100 ml) presentes:
:69; 1:04; :39; :37; :64; :73; :69; 1:04;

:83; 1:00; :19; :61; :42; :20; :79
Esses dados fornecem evidências suficientes para indicar que a variância da população é maior que 0,05?
7.8 TESTE DE HIPÓTESE: A RAZÃO DE DUAS VARIÂNCIAS DE

POPULAÇÃO
Como vimos, o uso da distribuição t na construção de intervalos de confiança e no teste

de hipóteses para a diferença entre duas médias populacionais assume que as variâncias
populacionais são iguais. Como regra, as únicas dicas disponíveis sobre as magnitudes de
as respectivas variâncias são as variâncias calculadas a partir de amostras retiradas das populações.
Gostaríamos de saber se a diferença que, sem dúvida, existirá entre as variâncias amostrais é indicativa
de uma diferença real nas variâncias populacionais, ou se a diferença é de tal magnitude que poderia ter
ocorrido apenas por acaso quando o as variações populacionais são iguais.
Dois métodos de análise química podem dar os mesmos resultados em média. Pode ser, no
entanto, que os resultados produzidos por um método sejam mais variáveis do que os resultados do outro.
Gostaríamos de algum método para determinar se isso é provável que seja verdade.
Teste de Razão de Variância As decisões relativas à comparabilidade de duas variâncias populacionais

geralmente são baseadas no teste de razão de variância, que é um teste da hipótese nula de que duas
variâncias populacionais são iguais. Quando testamos a hipótese de que duas variâncias populacionais
são iguais, estamos, na verdade, testando a hipótese de que sua razão é igual a 1.
Aprendemos no capítulo anterior que, quando certas suposições são atendidas, a quantidade s2
1=s2 1 = s2 2=s2 2 liberdade
é distribuída
no
verdadeira,
denominador.
como F come as
n1Se
duas
1 estamos
graus
variâncias
dehipotetizando
liberdade
se anulam
no numerador
que
na s2
expressão
¼ s2
e que
n2acima
1agraus
hipótese
deixando
de é
s2 1=s2 2, será designado VR para assumimos 2,
1
que segue a mesma distribuição F. A razão s2 1=s2 2

razão de variância.
Para um teste bilateral, seguimos a convenção de colocar a maior variância amostral no numerador
e obter o valor crítico de F para a=2 e os graus de liberdade apropriados. No entanto, para um teste
unilateral, qual das duas variâncias da amostra deve ser colocada no numerador é predeterminada pela
declaração da hipótese nula. Por exemplo, para a hipótese nula de que s2 1=s2 2, a estatística de teste
apropriada é V:R: ¼ s2 1=s2 2. O valor crítico
de F é obtido para a (não a=2) e os graus de liberdade apropriados. Da mesma forma, se a hipótese nula
é que s2 s2 a estatística de teste apropriada 1é V:R: 2,¼ s2 2=s2 1.
Em todos os casos, a regra de decisão é rejeitar a hipótese nula se o VR calculado for igual ou maior que
o valor crítico de F.
EXEMPLO 7.8.1
Borden et ai. (A-30) comparou técnicas de reparo meniscal usando espécimes de joelho de cadáveres.
Uma das variáveis de interesse foi a carga na falha (em newtons) para joelhos fixados com a técnica
FasT-FIX (grupo 1) e o método de sutura vertical (grupo 2). Cada técnica foi aplicada em seis espécimes.
O desvio padrão para o método FasT-FIX foi de 30,62 e o desvio padrão para o método de sutura vertical
foi de 11,37. Podemos concluir que, em geral, a variação da carga na falha é maior para a técnica FasT-
FIX do que para o método de sutura vertical?
Solução:
1. Dados. Veja a declaração do exemplo.

2. Suposições. Cada amostra constitui uma amostra aleatória simples de uma população
de sujeitos semelhantes. As amostras são independentes. Assumimos que as
cargas na falha em ambas as populações são aproximadamente distribuídas
normalmente.
7.8 TESTE DE HIPÓTESE: A RAZÃO DE DUAS VARIÂNCIAS DE POPULAÇÃO 269
0,05
0 5.05 F(5, 5)
FIGURA 7.8.1 Regiões de rejeição e não rejeição,

Exemplo 7.8.1.
3. Hipóteses.
H0: s2 1 s22
HA: s2 >1 s2 2
s21
V:R: ¼ (7.8.1)
s2 2
5. Distribuição da estatística de teste. Quando a hipótese nula é verdadeira, a estatística de

teste é distribuída como F com n1 1 numerador e n2 1 denominador graus de liberdade.
6. Regra de decisão. Deixe um ¼ :05. O valor crítico de F, da Tabela G do Apêndice, é 5,05.

Observe que, se a Tabela G não contiver uma entrada para os graus de liberdade do
numerador fornecidos, usamos a coluna com valor mais próximo dos graus de liberdade do
numerador fornecidos. Rejeitar H0 se V:R: 5:05.
As regiões de rejeição e não rejeição são mostradas na Figura 7.8.1.
2
ðÞ 30:62
V:R: ¼ ð ¼ 7:25
2
Þ 11:37
8. Decisão estatística. Rejeitamos H0, pois 7:25 > 5:05; ou seja, a razão calculada cai na região
de rejeição.
9. Conclusão. A variabilidade da carga de falha é maior ao usar o método FasT FIX do que o
método de sutura vertical.
10. valor p. Como o VR calculado de 7,25 é maior que 5,05, o valor p para esse teste é menor
que 0,05. O Excel calcula esse valor de p como 0,0243.
&
Vários programas de computador podem ser usados para testar a igualdade de duas variâncias. As saídas
desses programas serão diferentes dependendo do teste usado. Vimos na Figura 7.3.3,
por exemplo, que o sistema SAS usa um procedimento de teste F dobrado. O MINITAB usa dois testes
diferentes. O primeiro é um teste F sob a suposição de normalidade, e o outro é um teste de Levene
modificado (1) que é usado quando a normalidade não pode ser assumida. O SPSS usa um teste de
Levene não modificado (2). Independentemente das opções, esses testes são geralmente considerados
superiores ao teste de razão de variância apresentado no Exemplo 7.8.1. A discussão da matemática por
trás desses testes está além do escopo deste livro, mas um exemplo é dado para ilustrar esses
procedimentos, uma vez que os resultados desses testes geralmente são fornecidos automaticamente
como saídas quando um programa de computador é usado para realizar um teste t.
EXEMPLO 7.8.2
Usando os dados do Exemplo 7.3.2, estamos interessados em testar se a suposição de igualdade de

variâncias pode ser assumida antes de realizar um teste t. Para facilitar a discussão, os dados são
reproduzidos abaixo (Tabela 7.8.1):
TABELA 7.8.1 Pressões (mm Hg) sob a pelve durante condições estáticas para o exemplo 7.3.2
Ao controle 131 115 124 131 122 117 88 114 150 169
SCI 60 150 130 180 163 130 121 119 130 148
Saídas parciais para MINITAB, SAS e SPSS são mostradas na Figura 7.8.2. Independentemente do teste
ou programa usado, falhamos em rejeitar a hipótese nula de variâncias iguais porque todos os valores de
H0: s2 1¼ s2 2 p > 0:05. Podemos agora prosseguir com um teste t sob a hipótese de variâncias iguais.
&
Saída do MINITAB Saída SPSS
Teste F Teste de Levene para
Estatística de teste 0,46 Valor P 0,263 Igualdade de Variâncias
F Assinar
Teste de Levene
.664 0,482
Estatística de teste 0,49 Valor P 0,495
Saída SAS
Igualdade de Variâncias
Variável Método Num DF Den DF Valor F Pr F

pressão F dobrado 9 9 2.17 0,2626
FIGURA 7.8.2 Saídas parciais do MINITAB, SPSS e SAS para testar a igualdade de duas
variâncias populacionais.
EXERCÍCIOS 271
EXERCÍCIOS
Nos exercícios a seguir, execute o teste de dez passos. Para cada exercício, conforme apropriado, explique por que você
escolheu um teste unilateral ou um teste bilateral. Discuta como você acha que pesquisadores ou médicos podem usar os
resultados de seu teste de hipótese. Que decisões ou ações clínicas ou de pesquisa você acha que seriam apropriadas à luz
dos resultados do seu teste?
7.8.1 Dora et al. (A-31) investigou as dimensões do canal vertebral em 30 indivíduos sintomáticos com hérnia de disco selecionados
para discectomia e 45 indivíduos assintomáticos. Os pesquisadores queriam saber se as dimensões do canal vertebral são
um fator de risco significativo para o desenvolvimento da ciática. Para isso, eles mediram a dimensão do canal vertebral entre
as vértebras L3 e L4 e obtiveram uma média de 17,8 mm no grupo de discectomia com desvio padrão de 3,1. No grupo
controle, a média foi de 18,5 mm com desvio padrão de 2,8 mm. Há evidências suficientes para indicar que em
populações relevantes a variação para indivíduos sintomáticos com hérnia de disco é maior do que a variação para indivíduos
de controle? Deixe um ¼ :05.
7.8.2 Nagy et al. (A-32) estudaram 50 pacientes estáveis admitidos por ferimento por arma de fogo que atravessou o mediastino.
Destes, oito foram considerados com lesão mediastinal e 42 não. O desvio padrão das idades dos oito indivíduos com lesão
mediastinal foi de 4,7 anos, e o desvio padrão das idades dos 42 sem lesão foi de 11,6 anos. Podemos concluir a partir
desses dados que a variação da idade é maior para uma população de indivíduos semelhantes sem lesão em comparação
com uma população com lesão do mediastino? Deixe um ¼ :05.
7.8.3 Um teste destinado a medir o nível de ansiedade foi administrado a uma amostra de pacientes do sexo masculino e a uma amostra de
pacientes do sexo feminino imediatamente antes de serem submetidos ao mesmo procedimento cirúrgico. Os tamanhos de amostra
e as variâncias calculadas a partir das pontuações foram as seguintes:
Homens: n ¼ 16; s2 ¼ 150

Fêmeas: n ¼ 21; s2 ¼ 275
Esses dados fornecem evidências suficientes para indicar que nas populações representadas as pontuações feitas por
mulheres são mais variáveis do que aquelas feitas por homens? Deixe um ¼ :05.
7.8.4 Em um experimento para avaliar os efeitos da exposição à fumaça de cigarro em ratos, 11 animais foram expostos e 11 animais
de controle não foram expostos à fumaça de cigarros sem filtro. Ao final do experimento, foram medidas a frequência do
batimento ciliar (batidas/min a 20C) em cada animal. A variância para o grupo exposto foi de 3400 e 1200 para o grupo não
exposto. Esses dados indicam que nas populações representadas as variâncias são diferentes?
Deixe um ¼ :05.
7.8.5 Dois medicamentos para alívio da dor foram comparados quanto à eficácia com base no tempo decorrido entre a administração
do medicamento e a cessação da dor. Treze pacientes receberam o medicamento 1 e 13 receberam o medicamento 2. As
variâncias da amostra foram s2 ¼ 64 e s2 ¼ 16. Teste a1hipótese
Deixe umnula
¼ de
:05.
2 que as duas variâncias populacionais são iguais.
7.8.6 As determinações do volume globular foram feitas em dois grupos de crianças com cianose congênita
doença cardíaca. Os tamanhos e variâncias da amostra foram os seguintes:
Grupo n s2
1 10 40
2 16 84
Esses dados fornecem evidências suficientes para indicar que a variância da população 2 é maior do que a variância
da população 1? Deixe um ¼ :05.
7.8.7 Amostras aleatórias simples independentes de duas linhagens de camundongos usadas em um experimento produziram o
seguintes medições dos níveis de glicose plasmática após uma experiência traumática:
Cepa A: 54; 99; 105; 46; 70; 87; 55; 58; 139; 91
Cepa B: 93; 91; 93; 150; 80; 104; 128; 83; 88; 95; 94; 97
Esses dados fornecem evidências suficientes para indicar que a variância é maior na população de camundongos da
cepa A do que na população de camundongos da cepa B? Deixe um ¼ :05. Que pressupostos são necessários?
7.9 O ERRO TIPO II E O PODER

DE UM TESTE
Em nossa discussão sobre o teste de hipóteses, nosso foco tem sido a, a probabilidade de cometer um
erro do tipo I (rejeitar uma hipótese nula verdadeira). Demos pouca atenção a b, a probabilidade de
cometer um erro tipo II (não rejeitar uma hipótese nula falsa).
Há uma razão para essa diferença de ênfase. Para um determinado teste, a é um número único atribuído
pelo investigador antes de realizar o teste. É uma medida do risco aceitável de rejeitar uma hipótese nula
verdadeira. Por outro lado, b pode assumir um dos muitos valores. Suponha que desejamos testar a
hipótese nula de que algum parâmetro da população é igual a algum valor especificado. Se H0 for falsa e
não conseguirmos rejeitá-la, cometemos um erro tipo II. Se o valor hipotético do parâmetro não for o valor
verdadeiro, o valor de b (a probabilidade de cometer um erro tipo II) depende de vários fatores: (1) o valor
verdadeiro do parâmetro de interesse, (2) o valor hipotético do parâmetro, (3) o valor de a, e (4) o tamanho
da amostra, n. Para a e n fixos, podemos, antes de realizar um teste de hipótese, calcular muitos valores
de b postulando muitos valores para o parâmetro de interesse dado que o valor hipotético é falso.
Para um determinado teste de hipótese, é interessante saber o quão bem o teste controla os erros
do tipo II. Se H0 for de fato falsa, gostaríamos de saber a probabilidade de rejeitá-la. O poder de um teste,
designado 1 b, fornece essa informação desejada. A quantidade 1 b é a probabilidade de rejeitarmos uma
hipótese nula falsa; pode ser calculado para qualquer valor alternativo do parâmetro sobre o qual estamos
testando uma hipótese. Portanto, 1 b é a probabilidade de tomarmos a ação correta quando H0 for falsa
porque o valor verdadeiro do parâmetro é igual àquele para o qual calculamos 1 b. Para um determinado
teste, podemos especificar qualquer número de valores possíveis do parâmetro de interesse e para cada
um calcular o valor de 1 b. O resultado é chamado de função de potência. O gráfico de uma função de
poder, chamado de curva de poder, é um dispositivo útil para avaliar rapidamente a natureza do poder de
um determinado teste. O exemplo a seguir ilustra os procedimentos que usamos para analisar o poder de
um teste.
EXEMPLO 7.9.1
Suponha que temos uma variável cujos valores produzem um desvio padrão populacional de 3,6.
Da população, selecionamos uma amostra aleatória simples de tamanho n ¼ 100. Selecionamos um valor
de ¼ :05 para as seguintes hipóteses:
H0: m ¼ 17:5; HA: m 6¼ 17:5

7.9 O ERRO TIPO II E O PODER DE UM TESTE 273
Solução: Quando estudamos o poder de um teste, localizamos as regiões de rejeição e não rejeição
na escala x em vez da escala z. Encontramos os valores críticos de x para um teste
bilateral usando as seguintes fórmulas:
s
xU ¼ m0 þ ffiffiffi
(7.9.1)
znp
e
s
xL ¼ m0 znp ffiffiffi
(7.9.2)
onde xU e xL são os valores críticos superior e inferior, respectivamente, de x; þz e

z são os valores críticos de z; e m0 é o valor hipotético de m.
Para o nosso exemplo, temos
ð3:6Þ xU ¼ 17:50 þ 1:96 ¼ 17:50 þ 1:96ð:36Þ

ð10Þ
¼ 17:50 þ :7056 ¼ 18:21
xL ¼ 17:50 1:96ð:36Þ ¼ 17:50 :7056 ¼ 16:79
Suponha que H0 seja falsa, ou seja, que m não seja igual a 17,5. Nesse caso,
m é igual a algum valor diferente de 17,5. Não sabemos o valor real de m. Mas se
H0 for falso, m é um dos muitos valores maiores ou menores que 17,5. Suponha que
a verdadeira média da população seja m1 ¼ 16:5. Então a distribuição amostral de
x1 também é aproximadamente normal, com mx ¼ m ¼ 16:5. Chamamos essa
distribuição amostral de fð Þ x1 , e chamamos a distribuição amostralnulasob
de afðhipótese
Þ x0 .
b, a probabilidade do erro tipo II de não rejeitar uma falsa hipótese nula, é a área
sob a curva de fð Þ x1 que se sobrepõe à região de não rejeição especificada
em H0. Para determinar o valor de b, encontramos a área sob fð Þ x1 , acima do
eixo x, e entre x ¼ 16:79 e x ¼ 18:21.
O valor de b é igual a Pð Þ 16:79

¼x16:5.
18:21Isto
quando
éo m
igual a
16:79 16:5 18:21 16:5 :29 1:71

P z ¼P z
:36 :36 :36 :36
¼ PðÞ :81 z 4:75

1:7910 ¼:2090
Assim, a probabilidade de tomar uma ação apropriada (ou seja, rejeitar

H0) quando a hipótese nula afirma que m ¼ 17:5, mas na verdade m ¼ 16:5, é
FIGURA 7.9.1 Tamanho de b para valores selecionados para H1 para o Exemplo 7.9.1.
1:2090 ¼:7910. Como observamos, m pode ser um de um grande número de valores

possíveis quando H0 é falso. A Figura 7.9.1 mostra um gráfico de várias dessas
possibilidades. A Tabela 7.9.1 mostra os valores correspondentes de b e 1 b (que são
aproximados), juntamente com os valores de b para algumas alternativas adicionais.
Observe que na Figura 7.9.1 e na Tabela 7.9.1 os valores de m sob a hipótese

alternativa que estão mais próximos do valor de m especificado por H0 têm valores b
maiores associados. Por exemplo, quando m ¼ 18 sob a hipótese alternativa, b ¼ :7190;
e quando m ¼ 19:0 sob HA, b ¼ :0143. O poder do teste para essas duas alternativas,
então, é 1 :7190 ¼ :2810 e 1 :0143 ¼ :9857, respectivamente. Mostramos o poder do
teste graficamente
7.9 O ERRO TIPO II E O PODER DE UM TESTE 275
TABELA 7.9.1 Valores de b e 1 b para valores alternativos

selecionados de m1, Exemplo 7.9.1
Valores Possíveis de m Abaixo

HA Quando H0 é Falso b 1b
16,0 0,0143 0,9857

16.5 0,2090 0,7910
17,0 0,7190 0,2810
18,0 0,7190 0,2810
18.5 0,2090 0,7910
19,0 0,0143 0,9857
1- b
1,00
0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0
16,0 17,0 18,0 19,0 Valores alternativos
de m
FIGURA 7.9.2 Curva de potência para o Exemplo 7.9.1.
em uma curva de potência, como na Figura 7.9.2. Observe que quanto maior a curva, maior
a potência. &
Embora apenas um valor de a esteja associado a um determinado teste de hipótese, existem muitos valores
de b, um para cada valor possível de m se m0 não for o valor verdadeiro de m conforme a hipótese.
A menos que os valores alternativos de m sejam muito maiores ou menores que m0, b é relativamente
grande em comparação com a. Normalmente, usamos procedimentos de teste de hipóteses com mais
frequência nos casos em que, quando H0 é falso, o valor verdadeiro do parâmetro é bastante próximo do
valor hipotético. Na maioria dos casos, b, a probabilidade calculada de não rejeitar uma hipótese nula falsa,
é maior do que a, a probabilidade de rejeitar uma hipótese nula verdadeira.
Esses fatos são compatíveis com nossa afirmação de que uma decisão baseada em hipótese nula rejeitada
é mais conclusiva do que uma decisão baseada em hipótese nula não rejeitada. A probabilidade de estar
errado no último caso é geralmente maior do que a probabilidade de estar errado no primeiro caso.
A Figura 7.9.2 mostra a aparência em forma de V de uma curva de potência para um teste bilateral.
Em geral, um teste bilateral que discrimina bem entre o valor do parâmetro em H0 e os valores em H1
resulta em uma curva de potência em forma de V estreita. Uma ampla curva em forma de V
indica que o teste discrimina mal em um intervalo relativamente amplo de valores alternativos do parâmetro.
Curvas de potência para testes unilaterais A forma de uma curva de potência para um teste unilateral com a
região de rejeição na cauda superior é um S alongado. Se a região de rejeição de um teste unilateral estiver
localizada na cauda inferior da distribuição , a curva de potência assume a forma de um S alongado reverso.
O exemplo a seguir mostra a natureza da curva de potência para um teste unilateral.
EXEMPLO 7.9.2
O tempo médio que os funcionários do laboratório agora levam para realizar uma determinada tarefa em uma
máquina é de 65 segundos, com um desvio padrão de 15 segundos. Os tempos são aproximadamente normais
distribuído. Os fabricantes de uma nova máquina afirmam que sua máquina reduzirá o
tempo médio necessário para realizar a tarefa. O supervisor de controle de qualidade elabora um teste para
determinar se deve ou não acreditar na afirmação dos fabricantes da nova máquina.
Ela escolhe um nível de significância de ¼ 0:01 e seleciona aleatoriamente 20 funcionários para realizar a
tarefa na nova máquina. As hipóteses são
H0: m 65; HA: m < 65
O supervisor de controle de qualidade também deseja construir uma curva de potência para o teste.
Solução: O supervisor de controle de qualidade calcula, por exemplo, o seguinte valor de 1 b para a alternativa
m ¼ 55. O valor crítico de 1 b para o teste é
15
65 2:33 ffiffiffiffiff
¼ 57
20 p
Encontramos b da seguinte forma:
57 55 b
¼ Pð x > 57 jm ¼ 55 ¼ P z > º20 p 15= ffiffiffiffiff
¼ P zðÞ > :60
¼ 1:7257 ¼:2743
Consequentemente, 1 b ¼ 1:2743 ¼:7257. A Figura 7.9.3 mostra o cálculo de b. Cálculos

semelhantes para outros valores alternativos de m
a = 0,01 b = 0,2743
–
x
55 57 65
FIGURA 7.9.3 b calculado para m ¼ 55.

7.10 DETERMINANDO O TAMANHO DA AMOSTRA PARA CONTROLAR ERROS DO TIPO II 277
1- b
1,00
0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
51 53 55 59 57 61 63 65
Valores alternativos de m
FIGURA 7.9.4 Curva de potência para o Exemplo 7.9.2.
também produzem valores de 1 b. Quando plotados contra os valores de m, eles fornecem

a curva de potência mostrada na Figura 7.9.4. &
Curvas de características operacionais Outra forma de avaliar um teste é observar sua curva característica
de operação (OC). Para construir uma curva OC, plotamos os valores de b, em vez de 1 b, ao longo do
eixo vertical. Assim, uma curva OC é o complemento da curva de potência correspondente.
EXERCÍCIOS
Construa e represente graficamente a função potência para cada uma das seguintes situações.
7.9.1 H0: m 516; HA: m > 516; n ¼ 16; s ¼ 32; a ¼ 0:05:
7.9.2 H0: m ¼ 3; HA: m 6¼ 3; n ¼ 100; s ¼ 1; a ¼ 0:05:
7.9.3 H0: m 4:25; HA: m > 4:25; n ¼ 81; s ¼ 1:8; a ¼ 0:01:
7.10 DETERMINANDO O TAMANHO DA AMOSTRA

PARA CONTROLAR ERROS TIPO II
Você aprendeu no Capítulo 6 como encontrar os tamanhos de amostra necessários para construir
intervalos de confiança para médias populacionais e proporções para níveis de confiança especificados.
Você aprendeu no Capítulo 7 que os intervalos de confiança podem ser usados para testar hipóteses. O
método de determinação do tamanho da amostra apresentado no Capítulo 6 leva em consideração a
probabilidade de um erro tipo I, mas não um erro tipo II, pois o nível de confiança é determinado pelo
coeficiente de confiança, 1 a.
Em muitos procedimentos de inferência estatística, o investigador deseja considerar o erro tipo II,
bem como o erro tipo I, ao determinar o tamanho da amostra. Para ilustrar o procedimento, nos referimos
novamente ao Exemplo 7.9.2.
EXEMPLO 7.10.1
No Exemplo 7.9.2, as hipóteses são
H0: m 65; HA: m < 65
O desvio padrão da população é 15, e a probabilidade de um erro tipo I é fixada em 0,01.

Suponha que queremos que a probabilidade de não rejeitar H0ð Þ b seja de 0,05 se H0 for falsa porque a
média verdadeira é 55 em vez dos 65 hipotéticos. Qual o tamanho da amostra que precisamos para
realizar, simultaneamente, os níveis desejados de a e b?
Solução: Para a ¼ :01 en ¼ 20; b é igual a 0,2743. O valor crítico é 57. Nas novas condições, o valor
crítico é desconhecido. Vamos chamar esse novo valor crítico de C. Seja m0 a média
hipotética e m1 a média sob a hipótese alternativa. Podemos transformar cada uma das
distribuições de amostragem relevantes de x, aquela com uma média de m0 e aquela com
uma média de m1 em uma distribuição z.
Portanto, podemos converter C para um valor z na escala horizontal de cada uma das
duas distribuições normais padrão. Quando transformamos a distribuição amostral de x
que tem uma média de m0 para a distribuição normal padrão, chamamos o z que resulta
de z0. Quando transformamos a distribuição amostral x que tem uma média de m1 para a
distribuição normal padrão, chamamos o z que resulta de z1.
A Figura 7.10.1 representa a situação descrita até agora.
Podemos expressar o valor crítico C como uma função de z0 e m0 e também como
uma função de z1 e m1. Isso dá as seguintes equações:
s
C ¼ m0 z0 np ffiffiffi
(7.10.1)
s
C ¼ m1 þ z1 ffiffiffi
(7.10.2)
np
uma
b
–
x
m1 C m0
z
0 z1
z
z0 0
FIGURA 7.10.1 Representação gráfica das relações na determinação do

tamanho da amostra para controlar os erros tipo I e tipo II.
EXERCÍCIOS 279
Definimos os lados direitos dessas equações iguais entre si e resolvemos para n, para obter
2
ðz1
Þ sz0ðþ
n¼ (7.10.3)
m0 m1 º
Para encontrar n para nosso exemplo ilustrativo, substituímos as quantidades

apropriadas na Equação 7.10.3. Temos m0 ¼ 65, m1 ¼ 55 e s ¼ 15. Da Tabela D do
Apêndice, o valor de z que tem 0,01 da área à sua esquerda é 2:33. O valor de z que tem
0,05 da área à sua direita é 1,645. Ambos z0 e z1 são tomados como positivos. Determinamos
se C está acima ou abaixo de m0 ou m1 quando substituímos nas Equações 7.10.1 e 7.10.2.
Assim, calculamos
2
ððÞÞ2:33
15 ðþÞ1:645
65 55
n¼ ¼ 35:55
Precisaríamos de uma amostra de tamanho 36 para atingir os níveis desejados de a e b

quando escolhemos m1 ¼ 55 como o valor alternativo de m.
Agora calculamos C, o valor crítico para o teste, e estabelecemos uma regra de
decisão apropriada. Para encontrar C, podemos substituir valores numéricos conhecidos na
Equação 7.10.1 ou na Equação 7.10.2. Para fins ilustrativos, resolvemos ambas as equações
para C. Primeiro temos
15
C ¼ 65 2:33 ffiffiffiffiff
¼ 59:175
36p
Da Equação 7.10.2, temos
15
C ¼ 55 1:645 ffiffiffiffiff
¼ 59:1125
36p
A diferença entre os dois resultados se deve ao erro de arredondamento.

A regra de decisão, quando usamos o primeiro valor de C, é a seguinte:
Selecione uma amostra de tamanho 36 e calcule x, se x 59:175, rejeite H0. Se x >

59:175, não rejeite H0.
Limitamos nossa discussão sobre o erro tipo II e o poder de um teste ao caso

envolvendo uma média populacional. Os conceitos se estendem a casos envolvendo outros
parâmetros. &
EXERCÍCIOS
7.10.1 Dado H0: m ¼ 516; HA: m > 516; n ¼ 16; s ¼ 32; a ¼ :05: Seja b ¼ :10 e m1 ¼ 520, e
encontre n e C. Enuncie a regra de decisão apropriada.
7.10.2 Dado H0: m 4:500; HA: m > 4:500; n ¼ 16; s¼ :020; a ¼ :01: Seja b ¼ :05 em1 ¼ 4:52,
e encontre n e C. Enuncie a regra de decisão apropriada.
7.10.3 Dado H0: m 4:25; HA: m > 4:25; n ¼ 81; s ¼ 1:8; a ¼ :01: Seja b ¼ :03 e m1 ¼ 5:00,
e encontre n e C. Enuncie a regra de decisão apropriada.
7.11 RESUMO
Neste capítulo, os conceitos gerais de teste de hipóteses são discutidos. Sugere-se um procedimento geral para
a realização de um teste de hipótese que consiste nas dez etapas a seguir.
1. Descrição dos dados.
2. Declaração das premissas necessárias.
3. Declaração das hipóteses nula e alternativa.
4. Especificação da estatística de teste.
5. Especificação da distribuição da estatística de teste.

6. Declaração da regra de decisão.
7. Cálculo da estatística de teste a partir de dados de amostra.
8. A decisão estatística com base nos resultados da amostra.

9. Conclusão.
10. Determinação do valor p.
Vários testes de hipóteses específicos são descritos em detalhes e ilustrados com exemplos apropriados.
Estes incluem testes sobre médias populacionais, a diferença entre duas médias populacionais, comparações
pareadas, proporções populacionais, a diferença entre duas proporções populacionais, uma variância
populacional e a razão de duas variâncias populacionais. Além disso, discutimos o poder de um teste e a
determinação do tamanho da amostra para controlar os erros do tipo I e do tipo II.
Nome do Número da Fórmula Fórmula
7.1.1, 7.1.2, 7.2.1 transformação z x m0

z¼ ffiffiffi
(usando m ou m0) s=np
7.2.2 t-transformação x m0 t ¼
ffiffiffi
nps=
7.2.3 Estatística de teste ao x m0 z

¼ ffiffiffi
amostrar de uma s=np

população que não é
normalmente distribuída
7.3.1 Estatística de teste quando ðx1 x2 º ð m1 m2 Þ0

amostragem de populações
s2 s22
normalmente distribuídas: 1þ
variações populacionais n2 n1
s
conhecidas
7.3.2 Estatística de teste ð m1 m2

t ¼ ð Þ x1 x2 ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
Þ0
, Onde
ao amostrar de populações
s2
p p
normalmente distribuídas: s2 þ
variâncias populacionais n2n1
s
desconhecidas e iguais
ð n1 Þ 1 þs2n2þ 2ð1 Þ
s2n2
1 n1 2
s2 ¼
p
7.3.3, 7.3.4 Estatística de teste quando ðx1 x2 º ð m1 m2 Þ0

t0 ¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
, Onde
amostragem de populações
s21 s2
normalmente distribuídas: 2þ
variâncias populacionais n2n1

s
desconhecidas e desiguais
w1t1 þ w2t2
t0 ¼
1ð Þ a=2
w1 þ w2
7.3.5 Amostragem de ð Þ x1 x2 ð m1 m2 Þ0
populações que não são

s21 s22
normalmente distribuídas º
n2 n1
s
7.4.1 Estatística de teste para d md0

t¼
diferenças pareadas quando o
SD
variação da população é
desconhecida
7.4.2 Estatística de teste para d md

z¼ ffiffiffi
diferenças pareadas quando o

sd = np
a variância da população é
conhecida
7.5.1 Estatística de teste para uma ^p p0

z¼ fffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
única proporção da população p0q0

nº
7.6.1, 7.6.2 Estatística de teste para o ð ^p1 ð Þ p1 p2 Þ0 ^p2

s^^p1^p2
z¼ , Onde
diferença entre dois
proporções populacionais
x1 þ x2
p ¼ n1 þ n2 ,e
pðÞ 1 p pðÞ 1 p
s^^p1^p2 ¼ º
r n1 n2
7.7.1 Estatística de teste para uma ðÞx2

n1¼s2
s2
única variância populacional
7.8.1 razão de variância s21

V:R: ¼
s2 2
(Contínuo)
s
7.9.1, 7.9.2 Valores críticos superiores e
xU ¼ m0 þ znp ffiffiffi
inferiores para x
s
xL ¼ m0 z ffiffiffi
np
Valor crítico para s s

7.10.1, 7.10.2
C ¼ m0 z0 np ffiffiffi
¼ m1 þ z1 np ffiffiffi
determinar o tamanho da
amostra para controlar os
erros do tipo II
7.10.3 2
Tamanho da amostra para ðz1
Þ sz0ðþ
n¼
controlar erros do tipo II
m0 m1 º
Tecla de símbolo uma taxa de erro tipo 1 de ¼

C ¼ valor crítico x2 ¼
distribuição qui-quadrada d ¼
diferença média m ¼ média da
população m0 ¼ média hipotética n
¼ tamanho da amostra p ¼ proporção
da população p ¼ proporção média
q ¼ ð Þ 1 p ^p ¼ proporção estimada
da amostra s2 ¼ variância da população
s ¼ desvio
sx ¼padrão
erro
erro
padrão
da
padrão
população
s¼dadesvio
diferença
sd ¼
padrão da amostra sd ¼ desvio padrão da
diferença sp ¼ desvio padrão agrupado t ¼
transformação t de Student
0
t ¼ correção de Cochran para t
x ¼ média da amostra xL
¼ limite inferior do valor crítico para x xU ¼ limite
superior do valor crítico para xz ¼ transformação
normal padrão
1. Qual é o propósito do teste de hipóteses?
2. O que é uma hipótese?
3. Liste e explique cada etapa do procedimento de teste de hipótese de dez etapas.

4. Defina:
(a) Erro tipo I (b) Erro tipo II (c) A potência de um teste

(d) Função de potência (e) Curva de potência (f) Curva
característica operacional
5. Explique a diferença entre as curvas de potência para testes unilaterais e testes bilaterais.
6. Explique como se decide qual afirmação entra na hipótese nula e qual afirmação entra
a hipótese alternativa.
7. Quais são as suposições subjacentes ao uso da estatística t no teste de hipóteses sobre uma única média? A diferença entre
dois meios?
8. Quando a estatística z pode ser usada para testar hipóteses sobre

(a) média de uma única população?
(b) a diferença entre duas médias populacionais? (c) uma única
proporção da população? (d) a diferença entre duas proporções
populacionais?
9. Ao testar uma hipótese sobre a diferença entre duas médias populacionais, qual é a justificativa
por trás do agrupamento das variâncias da amostra?
10. Explique a lógica por trás do uso do teste de comparações pareadas.
11. Dê um exemplo de sua área de interesse onde um teste de comparações pareadas seria apropriado.
Use dados reais ou realistas e realize um teste de hipótese apropriado.
12. Dê um exemplo de sua área de interesse onde seria apropriado testar uma hipótese sobre a diferença entre duas médias
populacionais. Use dados reais ou realistas e execute o procedimento de teste de hipótese de dez etapas.
13. Faça o Exercício 12 para uma única média populacional.
14. Faça o Exercício 12 para uma única proporção da população.
15. Faça o Exercício 12 para a diferença entre duas proporções populacionais.
16. Faça o Exercício 12 para uma variância populacional.
17. Faça o Exercício 12 para a razão de duas variâncias populacionais.
18. Ochsenk€uhn et al. (A-33) estudou o nascimento como resultado de fertilização in vitro (FIV) e o nascimento por concepção
espontânea. Na amostra, houve 163 nascimentos únicos resultantes de fertilização in vitro com peso médio de nascimento
de 3.071 g e desvio padrão amostral de 761 g. Entre os 321 nascimentos únicos resultantes de concepção espontânea, o
peso médio ao nascer foi de 3.172 g com desvio padrão de 702 g. Determine se esses dados fornecem evidências
suficientes para concluirmos que o peso médio ao nascer em gramas de nascimentos únicos resultantes de fertilização in
vitro é menor, em geral, do que o peso médio ao nascer de nascimentos únicos resultantes de concepção espontânea.
Deixe um ¼ :10.
19. William Tindall (A-34) realizou um estudo retrospectivo dos registros de pacientes recebendo tratamento para hipercolesterolemia.
A tabela a seguir fornece medições de colesterol total para pacientes antes e 6 semanas após o uso de estatinas. Existe
evidência suficiente no nível de significância a ¼ :01 para concluirmos que a droga resultaria em redução do colesterol total
em uma população de pacientes com hipercolesterolemia semelhante?
Identidade. Não. Antes Depois Identidade. Não. Antes Depois Identidade. Não. Antes Depois
1 195 125 37 221 191 73 205 151

2 208 164 38 245 164 74 298 163
3 254 152 39 250 162 75 305 171
4 226 144 40 266 180 76 262 129
5 290 212 41 240 161 77 320 191
6 239 171 42 218 168 78 271 167
7 216 164 43 278 200 79 195 158
8 286 200 44 185 139 80 345 192
9 243 190 45 280 207 81 223 117
10 217 130 46 278 200 82 220 114
11 245 170 47 223 134 83 279 181
12 257 182 48 205 133 84 252 167
13 199 153 49 285 161 85 246 158
14 277 204 50 314 203 86 304 190
15 249 174 51 235 152 87 292 177
16 197 160 52 248 198 88 276 148
17 279 205 53 291 193 89 250 169
18 226 159 54 231 158 90 236 185
19 262 170 55 208 148 91 256 172
20 231 180 56 263 203 92 269 188
21 234 161 57 205 156 93 235 172
22 170 139 58 230 161 94 184 151
23 242 159 59 250 150 95 253 156
24 186 114 60 209 181 96 352 219
25 223 134 61 269 186 97 266 186
26 220 166 62 261 164 98 321 206
27 277 170 63 255 164 99 233 173
28 235 136 64 275 195 100 224 109
29 216 134 65 239 169 101 274 109
30 197 138 66 298 177 102 222 136
31 253 181 67 265 217 103 194 131
32 209 147 68 220 191 104 293 228
33 245 164 69 196 129 105 262 211
34 217 159 70 177 142 106 306 192
35 187 139 71 211 138 107 239 174
36 265 171 72 244 166
Fonte: Dados fornecidos por cortesia de William Tindall, Ph.D. e o Centro de Consultoria da
Wright State University.
20. O objetivo do estudo de van Vollenhoven et al. (A-35) foi examinar a eficácia de Etanercept sozinho e Etanercept em combinação
com metotrexato no tratamento da artrite reumatóide. Eles realizaram um estudo retrospectivo usando dados do banco de
dados STURE, que coleta dados de eficácia e segurança para todos os pacientes que iniciam tratamentos biológicos nos
principais hospitais de Estocolmo, na Suécia. Os pesquisadores identificaram 40 indivíduos que receberam apenas Etanercept
e 57 que receberam Etanercept com metotrexato. Uma das medidas de resultado foi o número de articulações inchadas. A
tabela a seguir fornece o número médio de articulações inchadas nos dois grupos, bem como o erro padrão da média. Há
evidências suficientes no
um nível de significância de ¼ :05 para concluirmos que há uma diferença nas contagens médias de articulações
inchadas nas populações relevantes?
Tratamento Erro Padrão Médio da Média
Etanercepte 5.56 0,84

Etanercept mais metotrexato 4,40 0,57
21. Miyazaki et al. (A-36) examinou as taxas livres de recorrência de remoção com varicectomia e remoção com
escleroterapia para o tratamento de veias varicosas primárias. O grupo de varicectomia consistia em 122 membros
para os quais o procedimento foi realizado, e o grupo de escleroterapia consistia em 98 membros para os quais o
procedimento foi realizado. Após 3 anos, 115 membros do grupo de varicectomia e 87 membros do grupo de
escleroterapia estavam livres de recorrência. Isso é evidência suficiente para concluirmos que não há diferença,
em geral, na taxa livre de recorrência entre os dois procedimentos para tratamento de varizes? Deixe um ¼ :05.
22. Lembre-se do estudo relatado no Exercício 7.8.1, no qual Dora et al. (A-37) investigou as dimensões do canal
vertebral em 30 indivíduos sintomáticos com hérnia de disco selecionados para discectomia e 45 indivíduos
assintomáticos (grupo controle). Uma das áreas de interesse foi determinar se existe uma diferença entre os dois
grupos na área da seção transversal do canal vertebral (cm2 ) entre as vértebras L5/S1. Os dados na tabela a
seguir são simulados para serem consistentes com os resultados relatados no artigo. Esses dados simulados
fornecem evidências para concluirmos que existe uma diferença na área transversal do canal espinhal entre uma
população de indivíduos com hérnia de disco e uma população de indivíduos sem hérnia de disco? Deixe um ¼
:05.
Grupo de Hérnia de Disco Grupo de controle
2.62 2,57 1,98 3,21 3,59 1,60 1,80 3,91 3.72 4.30 2.87 3.87 2.73 5.28 1.33 2.36 3.67 1.64
2,56 1,53 2,39 2,67 3,53 2,26 2,82 2,05 3.54 3.63 4.26 3.08 3.32 4.00 2.76 3.58 3.11
1,19 3,01 2,39 3,61 2,09 3,79 2,45 2,55 3.94 4.39 3.73 2.22 2.73 5.02 3.62 3.02 3.15 3.57
2,10 2,28 2,33 2,81 3,70 2.61 2.37 5.42 3.35 2.62 3.72 4.37 5.28 4.97 2.58
2.25 3.12 3.43 3.95 2.98 4.11 3.08 2.22
Fonte: Dados simulados.
23. Iannelo et al. (A-38) investigou as diferenças entre os níveis de triglicerídeos em indivíduos obesos saudáveis
(controle) e indivíduos obesos com hepatite B ou C crônica ativa. Os níveis de triglicerídeos de 208 controles
obesos tiveram um valor médio de 1,81 com um erro padrão da média de 0,07 mmol/L. os 19 obesos
indivíduos com hepatite tiveram uma média de 0,71 com um erro padrão da média de 0,05. Isso é evidência
suficiente para concluirmos que, em geral, existe uma diferença nos níveis médios de triglicerídeos entre indivíduos
obesos saudáveis e indivíduos obesos com hepatite B ou C? Deixe um ¼ :01.
24. Alunos do jardim de infância foram os participantes de um estudo conduzido por Susan Bazyk et al. (A-39). Os
pesquisadores estudaram as habilidades motoras finas de 37 crianças que receberam terapia ocupacional. Eles
usaram um índice de habilidades motoras finas que media o uso das mãos, a coordenação olho-mão e a destreza manual.
antes e após 7 meses de terapia ocupacional. Valores mais altos indicam habilidades motoras finas mais fortes.
As pontuações aparecem na tabela a seguir.
Assunto Pré Post Assunto Pré Post
1 91 94 20 76 112
2 61 94 85 21 79 91 97
3 103 88 112 22 100 109112
4 94 91 112 23 70 70 58 76
5 112 24 97 97 112112
6 25
7 109 112 79 26
8 97 27
9 109 100 28 97 112
10 115 106 29 112 106
11 46 46 30 85 112
12 45 41 31 112 112
13 106 112 32 103 106
14 112 112 33 100 100
15 91 94 34 88 88
16 115 112 35 109 112
17 59 94 36 85 112
18 85 109 37 88 97
19 112 112
Fonte: Dados fornecidos por cortesia de Susan Bazyk, MHS
Pode-se concluir com base nesses dados que após 7 meses, as habilidades motoras finas em uma população de
sujeitos semelhantes seriam mais fortes? Deixe um ¼ :05. Determine o valor p.
25. Uma pesquisa com 90 mulheres que deram à luz recentemente nas listas de um departamento de bem-estar do
condado revelou que 27 tinham um histórico de infecção intraparto ou pós-parto. Teste a hipótese nula de que a
proporção da população com história de infecção intraparto ou pós-parto é menor ou igual a 0,25. Deixe um ¼ :05.
Determine o valor p.
26. Em uma amostra de 150 admissões hospitalares de emergência com um determinado diagnóstico, 128 listaram o
vômito como sintoma inicial. Esses dados fornecem evidências suficientes para indicar, no nível de significância de
0,01, que a proporção da população é inferior a 0,92? Determine o valor p.
27. Uma equipe de pesquisa mediu o volume corrente em 15 animais experimentais. A média e o desvio padrão foram de
45 e 5 cc, respectivamente. Esses dados fornecem evidências suficientes para indicar que a média da população é
maior que 40 cc? Deixe um ¼ :05.
28. Uma amostra de oito pacientes internados em um hospital com diagnóstico de cirrose biliar apresentou um nível médio
de IgM de 160,55 unidades por mililitro. O desvio padrão da amostra foi de 50. Esses dados fornecem evidências
suficientes para indicar que a média da população é maior que 150? Deixe um ¼ :05. Determine o valor p.
29. Alguns pesquisadores observaram maior resistência das vias aéreas em fumantes do que em não fumantes. Suponha
que um estudo, conduzido para comparar a porcentagem de retenção traqueobrônquica de partículas em gêmeos
monozigóticos discordantes fumantes, produziu os seguintes resultados:
Retenção Percentual Retenção Percentual
Twin Fumador Twin Não Fumador Twin Fumador Twin Não Fumador
60,6 47,5 57.2 54.3

12,0 13.3 62,7 13,9
56,0 33,0 28,7 8,9
75.2 55.2 66,0 46.1
12.5 21.9 25.2 29,8
29,7 27.9 40.1 36.2
Esses dados suportam a hipótese de que a depuração traqueobrônquica é mais lenta em fumantes? Deixe um ¼ :05.
Determine o valor de p para este teste.
30. Os níveis circulantes de estrona foram medidos em uma amostra de 25 mulheres na pós-menopausa após tratamento com
estrogênio. A média amostral e o desvio padrão foram 73 e 16, respectivamente. No nível de significância de 0,05, pode-
se concluir com base nesses dados que a média da população é maior que 70?
31. As determinações da resistência vascular sistêmica foram feitas em uma amostra de 16 pacientes com insuficiência cardíaca
congestiva crônica enquanto recebiam um tratamento específico. A média amostral e o desvio padrão foram 1600 e 700,
respectivamente. No nível de significância de 0,05, esses dados fornecem evidências suficientes para indicar que a
média da população é inferior a 2.000?
32. O comprimento médio ao nascer de 14 bebês do sexo masculino foi de 53 cm com um desvio padrão de 9 cm. Pode-se
concluir com base nesses dados que a média da população não é 50 cm? Deixe a probabilidade de cometer um erro tipo
I ser 0,10.
Para cada um dos estudos descritos nos Exercícios 33 a 38, responda ao máximo possível das seguintes questões:
(a) Qual é a variável de interesse? (b) O parâmetro de interesse é uma média, a diferença entre duas médias (amostras
independentes), uma diferença média (dados pareados), uma proporção ou a diferença entre duas proporções (amostras
independentes)? (c) Qual é a população amostrada? (d) Qual é a população-alvo? (e) Quais são as hipóteses nula e
alternativa? (f) A alternativa é unilateral (cauda esquerda), unilateral (cauda direita) ou bilateral? (g) Quais erros do tipo I
e tipo II são possíveis? (h) Você acha que a hipótese nula foi rejeitada? Explique por que ou por que não.
33. Durante um período de um ano, Hong et al. (A-40) estudou todos os pacientes que se apresentaram ao serviço cirúrgico
com possível apendicite. Cento e oitenta e dois pacientes com possível apendicite foram randomizados para avaliação
clínica (CA) isolada ou avaliação clínica e TC abdominal/pélvica. Um caso verdadeiro positivo resultou em uma
laparotomia que revelou uma lesão que requeria operação.
Um caso verdadeiro negativo não exigiu uma operação na avaliação de acompanhamento de uma semana. No final do
estudo, eles não encontraram nenhuma diferença significativa no tempo de internação hospitalar para os dois tratamentos.
grupos.
34. Lembre-se do estudo relatado no Exercício 7.8.2, no qual Nagy et al. (A-32) estudaram 50 pacientes estáveis internados por
ferimento por arma de fogo que atravessou o mediastino. Eles descobriram que oito dos indivíduos tiveram uma lesão
mediastinal, enquanto 42 não tiveram tal lesão. Eles realizaram um teste t de Student para determinar se havia diferença
na idade média (anos) entre os dois grupos. O valor de p relatado foi de 0,59.
35. Dykstra et al. (A-41) estudou 15 pacientes do sexo feminino com frequência urinária com ou sem incontinência. As mulheres
foram tratadas com toxina botulínica tipo B (BTX-B). Um teste t do
A diferença pré/pós na frequência indicou que esses 15 pacientes apresentaram uma média de 5,27 episódios de frequência a
menos por dia após o tratamento com BTX-B. O valor de p para o teste foi inferior a 0,001.
36. Lembre-se do estudo relatado no Exercício 6.10.2, no qual Horesh et al. (A-42) investigou o comportamento suicida entre
adolescentes. Além da impulsividade, os pesquisadores estudaram a desesperança entre os 33 indivíduos do grupo suicida e os
32 indivíduos do grupo não suicida. As médias para os dois grupos na Escala de Desesperança de Beck foram 11,6 e 5,2,
respectivamente, e o valor t para o teste foi 5,13.
37. Mauksch et al. (A-43) pesquisou 500 pacientes consecutivos (idades de 18 a 64 anos) em uma clínica de atendimento primário que
atende apenas pacientes sem plano de saúde e de baixa renda. Eles usaram perguntas de autorrelato sobre por que os pacientes
estavam vindo à clínica e outras ferramentas para classificar os indivíduos como portadores ou não de doenças mentais graves.
Em comparação com pacientes sem doença mental grave atual, os pacientes com doença mental grave atual relataram
significativamente ð p < :001 mais preocupações, doenças crônicas, estressores,
º formas de maus-tratos e sintomas físicos.
38. Um estudo de Hosking et al. (A-44) foi projetado para comparar os efeitos do alendronato e do risedronato na densidade mineral
óssea (BMD). Uma das medidas de resultado foi o aumento percentual na DMO em 12 meses. O alendronato produziu uma
alteração percentual significativamente maior (4,8%) na DMO do que o risedronato (2,8%) com um valor de p <:001.
39. Para cada uma das seguintes situações, identifique os erros tipo I e tipo II e as ações corretas. (a) H0: Um novo tratamento não é
mais eficaz que o tradicional.
(1) Adote o novo tratamento quando o novo for mais eficaz.

(2) Continue com o tratamento tradicional quando o novo for mais eficaz.
(3) Continue com o tratamento tradicional quando o novo não for mais eficaz.
(4) Adotar o novo tratamento quando o novo não for mais eficaz.
(b) H0: Um novo procedimento fisioterapêutico é satisfatório.
(1) Empregar um novo procedimento quando for insatisfatório.

(2) Não empregue um novo procedimento quando for insatisfatório.
(3) Não empregue um novo procedimento quando for satisfatório.
(4) Empregar um novo procedimento quando for satisfatório. (c) H0:
A produção de um medicamento é de qualidade satisfatória.
(1) Rejeitar uma execução de qualidade satisfatória.

(2) Aceite uma execução de qualidade satisfatória.
(3) Rejeitar uma execução de qualidade insatisfatória.
(4) Aceite uma corrida de qualidade insatisfatória.
Para cada um dos estudos descritos nos Exercícios 40 a 55, faça o seguinte: (a) Realize uma análise
estatística dos dados (incluindo teste de hipótese e construção do intervalo de confiança) que você acha que forneceriam
informações úteis para os pesquisadores. (b) Declare todas as suposições necessárias para validar sua análise. (c) Encontre os
valores de p para todas as estatísticas de teste computadas. (d) Descreva a(s) população(ões) sobre a(s) qual(is) você acha que
as inferências baseadas em sua análise seriam aplicáveis.
40. Um estudo de Bell (A-45) investigou a hipótese de que a alteração do sistema endócrino da vitamina D em negros resulta da redução
da 25-hidroxivitamina D sérica e que a alteração é revertida pelo tratamento oral com 25-hidroxivitamina D3. Os oito indivíduos
(três homens e cinco mulheres) foram estudados sem tratamento (controle) e após receberem 25-hidroxivitamina D3 por 7 dias
(25-OHD3). A seguir estão as determinações de cálcio urinário (mg/d) para os oito indivíduos nas duas condições.
Controle de assunto 25-OHD3
UMA 66 98
B 115 142
C 54 78
D 88 101
E 82 134
F 115 158
G 176 219
H 46 60
do Dr. Norman H. Bell.
41. Montner et al. (A-46) conduziu estudos para testar os efeitos da hiperhidratação aumentada com glicerol (GEH) na
resistência no desempenho do ciclismo. Os 11 indivíduos, com idades entre 22 e 40 anos, pedalaram regularmente pelo
menos 75 milhas por semana. A seguir estão os volumes de produção de urina pré-exercício (ml) após a ingestão de
glicerol e água:
Experimental, ml Controle, ml
Sujeito # (Glicerol) (Placebo)
1 1410 2375
2 610 1610
3 1170 1608
4 1140 1490
5 515 1475
6 580 1445
7 430 885
8 1140 1187
9 720 1445
10 275 890
11 Fonte: Dados fornecidos por
875 1785
cortesia do Dr. Paul Montner.
42. D'Alessandro et al. (A-47) desejava saber se a hiperresponsividade (HR) preexistente das vias aéreas predispõe os
indivíduos a um resultado mais grave após a exposição ao cloro. Os sujeitos foram voluntários saudáveis com idades
entre 18 e 50 anos, classificados como com e sem FC.
A seguir estão as medições de FEV1 e resistência específica das vias aéreas (Sraw) feitas nos indivíduos antes e
depois da exposição ao gás de cloro adequadamente diluído:
Sujeitos Hiper-Reativos
Pré-exposição Pós-exposição
Assunto FEV1 Sraw FEV1 Sraw
1 3.0 5,80 1.8 21.4

2 4.1 9.56 3.7 12.5
3 3.4 7,84 3.0 14.3
4 3.3 6,41 3.0 10.9
5 3.3 9.12 3.0 17.1
assuntos normais
Pré-exposição Pós-exposição
Indivíduo FEV1 Sraw VEF1 Sraw
1 4.3 5.52 4.2 8,70

2 3,9 6.43 3.7 6,94
3 3,6 5.67 3.3 10,00
4 3.6 3,77 3.5 4.54
5 5.1 5.53 4.9 7.37
cortesia do Dr. Paul Blanc.
43. Observando a escassez de informações sobre o efeito do estrogênio na composição de ácidos graxos da membrana plaquetária,
Ranganath et al. (A-48) conduziu um estudo para examinar a possibilidade de que mudanças possam estar presentes em
mulheres pós-menopáusicas e que elas possam ser reversíveis com o tratamento com estrogênio. As 31 mulheres recrutadas
para o estudo não menstruavam há pelo menos 3 meses ou apresentavam sintomas da menopausa. Nenhuma mulher estava
em qualquer forma de terapia de reposição hormonal (TRH) no momento em que foi recrutada. A seguir estão os valores de
ácido linoleico da membrana plaquetária antes e depois de um período de TRH:
Sujeito Antes de Depois de Sujeito Antes de Depois de Sujeito Antes de Depois de
1 6.06 5.34 12 7,65 5,55 23 5.04 4,74

2 6.68 6.11 13 4.57 4.25 24 7,89 7.48
3 5,22 5,79 14 5,97 5,66 25 7,98 6,24
4 5,79 5,97 15 6,07 5,66 26 6,35 5,66
5 6,26 5,93 16 6,32 5,97 27 4,85 4,26
6 6,41 6,73 17 6,12 6,52 28 6,94 5,15
7 4,23 4,39 18 6,05 5,70 29 6,54 5,30
8 4,61 4,20 19 6,31 3,58 30 4,83 5,58
9 6,79 5,97 20 4,44 4,52 31 4,71 4,10
10 6,16 6,00 21 5,51 4,93
11 6.41 5.35 22 8.48 8,80
Fonte: Dados fornecidos por cortesia do Dr. L. Ranganath.
44. O objetivo de um estudo de Goran et al. (A-49) foi examinar a precisão de algumas técnicas de composição corporal amplamente
usadas para crianças por meio do uso da técnica de absorciometria de raios-X de dupla energia (DXA). Os sujeitos eram
crianças com idades compreendidas entre os 4 e os 10 anos. A seguir estão as medidas de massa gorda feitas nas crianças
por três técnicas - DXA, dobra cutânea (ST) e resistência bioelétrica (BR):
Sexo
DXA ST BR (1 ¼ Masculino; 0 ¼ Feminino)
3.6483 4.5525 4.2636 1

2.9174 2.8234 6.0888 0
7.5302 3.8888 5.1175 0
6.2417 5.4915 8.0412 0
10.5891 10.4554 14.1576 0
9.5756 11.1779 12.4004 0
(Contínuo )
Sexo
2,4424 3,5168 3,7389 1

3,5639 5,8266 4,3359 1
1,2270 2,2467 2,7144 1
2.2632 2,4499 2,4912 1
2.4607 3,1578 1,2400 1
4.0867 5.5272 6.8943 0
4.1850 4.0018 3.0936 1
2.7739 5.1745 1
4.4748 3.6897 4.2761 0
4.2329 4.6807 5.2242 0
2.9496 4.4187 4.9795 0
2.9027 3.8341 4.9630 0
5.4831 4.8781 5.4468 0
3.6152 4.1334 4.1018 1
5.3343 3.6211 4.3097 0
3.2341 2.0924 2.5711 1
5.4779 5.3890 5.8418 0
4.6087 4.1792 3.9818 0
2.8191 2.1216 1.5406 1
4.1659 4,5373 5,1724 1
3.7384 2,5182 4,6520 1
4,8984 4,8076 6,5432 1
3,9136 3,0082 3,2363 1
12,1196 13,9266 16,3243 1
15,4519 15,9078 18,0300 0
20,0434 19,5560 21,7365 0
9,5300 8,5864 4,7322 1
2,7244 2,8653 2,7251 1

3.8981 5.1352 5.2420 0
4.9271 8.0535 6.0338 0
3.5753 4.6209 5.6038 1
6.7783 6.5755 6.6942 1
3.2663 4.0034 3.2876 0
1,5457 2.4742 3.6931 0
2.1423 2.1845 2.4433 1
4.1894 3.0594 3.0203 1
1.9863 2.5045 3.2229 1
3.3916 3.1226 3.3839 1
2.3143 2.7677 3.7693 1
1.9062 3.1355 12.4938 1
3.7744 4.0693 5.9229 1
2.3502 2.7872 4.3192 0
4.6797 4.4804 6.2469 0
4,7260 5,4851 7.2809 0
4,2749 4,4954 6.6952 0
2,6462 3,2102 3.8791 0
(Contínuo )
Sexo
2,7043 3,0178 5,6841 0

4,6148 4,0118 5,1399 0
3,0896 3,2852 4,4280 0
5,0533 5.6011 4.3556 0
6.8461 7.4328 8.6565 1
11.0554 13.0693 11.7701 1
4.4630 4.0056 7.0398 0
2.4846 3.5805 3.6149 0
7.4703 5.5016 9.5402 0
8.5020 6.3584 9.6492 0
6.6542 6.8948 9.3396 1
4.3528 4.1296 6.9323 0
3.6312 3,8990 4.2405 1
4.5863 5.1113 4.0359 1
2.2948 2.6349 3,8080 1
3.6204 3.7307 4.1255 1
2.3042 3.5027 3.4347 1
4.3425 3.7523 4.3001 1
4.0726 3.0877 5.2256 0
1,7928 2.8417 3,8734 1
4,1428 3,6814 2,9502 1
5,5146 5,2222 6,0072 0
3,2124 2,7632 3,4809 1
5,1687 5,0174 3,7219 1
3,9615 4,5117 2,7698 1
3,6698 4,9751 1,8274 1

4,3493 7,3525 4,8862 0
2,9417 3,6390 3,4951 1
5,0380 4,9351 5,6038 0
7.9095 9.5907 8.5024 0
1,7822 3.0487 3.0028 1
3.4623 3.3281 2.8628 1
11.4204 14.9164 10.7378 1
1.2216 2.2942 2.6263 1
2.9375 3.3124 3.3728 1
4.6931 5.4706 5.1432 0
8.1227 7.7552 7.7401 0
10.0142 8.9838 11.2360 0
2.5598 2.8520 4.5943 0
3,7669 3,7342 4.7384 0
4.2059 2.6356 4.0405 0
6.7340 6.6878 8.1053 0
3.5071 3.4947 4.4126 1
2.2483 2,8100 3,6705 0
Dados ausentes.
7.1891 5,4414 6,6332 0
Fonte: Dados fornecidos por cortesia do
6.4390 3,9532 5,1693 0 Dr. Michael I. Goran.
45. Hartard et al. (A-50) conduziu um estudo para determinar se um determinado regime de treinamento pode neutralizar a perda
de densidade óssea em mulheres com osteopenia pós-menopausa. A seguir estão as medidas de força para cinco grupos
musculares tomadas em 15 indivíduos antes (B) e após (A) 6 meses de treinamento:
Leg press Flexor do quadril Extensor de quadril
Sujeito (B) (UMA) (B) (UMA) (B) (UMA)
1 100 180 8 15 10 20
2 l55 195 10 20 12 25
3 115 150 8 13 12 19
4 130 170 10 14 12 20
5 120 150 7 12 12 15
6 60 140 5 12 8 16
7 60 100 4 6 6 9
8 140 215 12 18 14 24
9 110 150 10 13 12 19
10 95 120 6 8 8 14
11 110 130 10 12 10 14
12 150 220 10 13 15 29
13 120 140 9 20 14 25
14 100 150 9 10 15 29
15 110 130 6 9 8 12
Abdutor de Braço Adutor de Braço
Sujeito (B) (UMA) (B) (UMA)
1 10 12 12 19
2 7 20 10 20
3 8 14 8 14
4 8 15 6 16
5 8 13 9 13
6 5 13 6 13
7 4848
8 12 15 14 19
9 10 14 814
10 6 9 6 10
11 8 11 8 12
12 8 14 13 15
13 8 19 11 18
14 4 7 10 22
15 4 8 8 12
Fonte: Dados fornecidos por cortesia do Dr. Manfred Hartard.
46. Vitacca et al. (A-51) realizaram um estudo para determinar se a posição supina ou sentada piora os fluxos expiratórios
forçados estáticos e as medidas da mecânica pulmonar. Os indivíduos tinham idade
pessoas vivendo em uma casa de repouso que estavam clinicamente estáveis e sem evidência clínica de
doenças cardiorrespiratórias. Entre os dados coletados estavam os seguintes valores percentuais de VEF1
para indivíduos nas posturas sentada e supina:
Sentado Supino Sentado Supino
64 56 103 94
44 37 109 92
44 39 99 99
40 43 169 165
32 32 73 66
70 61 95 94
82 58 99 99
74 48 73 58
91 63
Fonte: Dados fornecidos por cortesia do Dr. M. Vitacca.
47. O objetivo de uma investigação de Young et al. (A-52) foi examinar a eficácia e segurança de um sling
suburetral específico. Os sujeitos eram mulheres com incontinência de esforço que também preenchiam
outros critérios. Entre os dados coletados estavam os seguintes valores de capacidade cistométrica
pré e pós-operatória (ml):
Pré Pós Pré Pós Pré Pós Pré Pós
350 321 340 320 595 557 475 344 700 483 310 336 315
221 427 277
356 336 361 333 363 291 405 514
362 447 339 280 305 310 312 402
361 214 527 492 200 220 385 282
304 285 245 330 270 315 274 317
675 480 313 310 300 230 340 323
367 330 241 230 792 575 524 383
387 325 313 298 275 140 301 279
535 325 323 349 307 192 411 383
328 250 438 345 312 217 250 285
557 410 497 300 375 462 600 618
569 603 302 335 440 414 393 355
260 178 471 630 300 250 232 252
320 362 540 400 379 335 332 331
405 235 275 278 682 339 451 400 351
310 557 381
Fonte: Dados fornecidos por cortesia do Dr. Stephen B. Young.
48. Diamond et al. (A-53) desejava saber se a triagem cognitiva deveria ser usada para ajudar a selecionar
candidatos apropriados para reabilitação abrangente de pacientes internados. Eles estudaram uma
amostra de pacientes de reabilitação geriátrica usando estratégias de medição padronizadas. Entre os
dados coletados estavam as seguintes pontuações de admissão e alta feitas pelos sujeitos no Mini
Exame do Estado Mental (MEEM):
Dispensa de Admissão Dispensa de Admissão
9 10 24 26
11 11 24 30
14 19 24 28
15 15 25 26
16 17 25 22
16 15 26 26
16 17 26 28
16 17 26 26
17 14 27 28
17 18 27 28
17 21 27 27
18 21 27 27
18 21 27 27
19 21 28 28
19 25 28 29
19 21 28 29
19 22 28 29
19 19 29 28
20 22 29 28
21 23 29 30
22 22 29 30
22 19 29 30
22 26 29 30
23 21 29 30
24 21 30 30
24 20
Fonte: Dados fornecidos por cortesia do Dr. Stephen N. Macciocchi.
49. Em um estudo para explorar a possibilidade de alteração hormonal na asma, Weinstein et al. (A-54) coletou dados de
22 mulheres pós-menopáusicas com asma e 22 mulheres pós-menopáusicas da mesma idade sem asma. A seguir
estão os valores de sulfato de dehidroepiandrosterona (DHEAS) coletados pelos investigadores:
Sem Asma Com Asma Sem Asma Com Asma
20.59 87,50 15,90 166.02

37,81 111,52 49,77 129.01
76,95 143,75 25.86 31.02
77,54 25.16 55,27 47,66
19,30 68,16 33,83 171,88
35,00 136,13 56,45 241,88
146,09 89,26 19,91 235,16
166,02 96,88 24,92 25,16
96,58 144,34 76,37 78,71
24,57 97,46 6,64 111,52
53,52 82,81 115,04 54,69
Fonte: Dados fornecidos por cortesia do Dr. Robert E. Weinstein.

50. A motivação para um estudo de Gruber et al. (A-55) foi o desejo de encontrar um marcador sérico potencialmente útil na artrite
reumatóide (AR) que reflita os mecanismos patogênicos subjacentes. Eles mediram, entre outras variáveis, os níveis
circulantes de gelatinase B no soro e líquido sinovial (SF) de pacientes com AR e de controles. Os resultados foram os
seguintes:
Sérum Fluido sinovial Sérum Fluido sinovial
Controle RA Controle RA Controle RA Controle RA
26,8 23.4 71,8 3.0 36,7

19.1 30,5 29.4 4.0 57.2
249,6 10.3 185,0 3.9 71.3
53,6 8,0 114,0 6.9 25.2
66.1 7.3 69,6 9.6 46,7
52,6 10.1 52.3 22.1 30.9
14.5 17.3 113.1 13.4 27,5
22.7 24.4 104,7 13.3 17.2
43,5 19.7 60,7 10.3
25.4 8.4 116,8 7.5
29,8 20.4 84,9 31.6
27.6 16.3 215.4 30,0
106.1 16.5 33.6 42,0
76,5 22.2 158,3 20.3
Fonte: Dados fornecidos por cortesia do Dr. Darius Sorbi.
51. Benini et al. (A-56) conduziram um estudo para avaliar a gravidade da acidificação esofágica na acalásia após a dilatação bem-
sucedida das cárdias e para determinar quais fatores estão associados à acidificação patológica do esôfago em tais
pacientes. Vinte e dois indivíduos, dos quais sete eram do sexo masculino; na faixa etária de 28 a 78 anos. Com base em
critérios estabelecidos, eles foram classificados como refluxos ou não refluxos. A seguir estão os valores de depuração do
ácido (min/refluxo) para os 22 indivíduos:
Refluxores Não-refluxos
8.9 2.3
30,0 0,2
23,0 0,9
6,2 8,3
11,5 0,0
0,9
0,4
2,0
0,7
3,6
0,5
1.4
0,2
0,7
17.9
2.1
0,0
cortesia do Dr. Luigi Benini.
52. O objetivo de um estudo de Baker et al. (A-57) foi determinar se a deformação médica altera os efeitos in vitro do plasma de pacientes
com pré-eclâmpsia na função da célula endotelial para produzir um paradigma semelhante ao estado da doença in vivo. Os
sujeitos foram 24 gestantes nulíparas antes do parto, das quais 12 tiveram pré-eclâmpsia e 12 eram gestantes normais. Entre os
dados coletados estavam as seguintes idades gestacionais (semanas) no momento do parto:
Pré-eclâmpsia grávida normal
38 40
32 41
42 38
30 40
38 40
35 39
32 39
38 41
39 41
29 40
29 40
32 40
cortesia do Dr. James M. Roberts.
53. Zisselman et al. (A-58) realizaram um estudo para avaliar o uso de benzodiazepínicos e o tratamento da depressão antes da
internação em uma unidade de psiquiatria geriátrica em uma amostra de pacientes idosos.
Entre os dados coletados estavam os seguintes escores de transtorno de comportamento em 27 pacientes tratados com
benzodiazepínicos (W) e 28 que não eram (WO).
C OS
0,00 1,00 0,00 0,00

0,00 1,00 0,00 10.00
0,00 0,00 0,00 0,00
.00 ,00 .00 18,00
.00 10,00 .00 ,00
.00 2,00 .00 2,00
.00 .00 5,00
.00 .00
.00 4,00
0,00 1,00
4,00 2,00
3,00 0,00
2,00 6,00
0,00 0,00
10.00 0,00
2,00 1,00
0,00 2,00
9h00 1,00
0,00 22h00
1,00 0,00
16h00 0,00
cortesia do Dr. Yochi Shmuely.
54. O objetivo de um estudo de Reinecke et al. (A-59) foi investigar a atividade funcional e a expressão da troca
sarcolema Naþ=Ca2þ no coração humano com problemas. Os pesquisadores obtiveram amostras do ventrículo
esquerdo de corações humanos falidos de 11 pacientes do sexo masculino (idade média de 51 anos) submetidos
a transplante cardíaco. Corações de controle sem falha foram obtidos de doadores de órgãos (quatro mulheres,
dois homens, com idade média de 41 anos) cujos corações não puderam ser transplantados por motivos não
cardíacos. A seguir estão as medições da atividade do trocador de Na+=Ca2+ para os pacientes com
insuficiência cardíaca terminal (CHF) e controles sem falha (NF).
nota fiscal CHF
0,075 0,221
0,073 0,231
0,167 0,145
0,085 0,112
0,110 0,170
0,083 0,207
0,112
0,291
0,164
0,195
0,185
Fonte: Dados fornecidos por cortesia do Dr. Hans Reinecke.
55. Reichman et al. (A-60) realizaram um estudo com o objetivo de demonstrar que os sintomas negativos são
proeminentes em pacientes com doença de Alzheimer e são distintos da depressão. A seguir estão pontuações
feitas na Escala para Avaliação de Sintomas Negativos na Doença de Alzheimer por pacientes com doença de
Alzheimer (PT) e idosos normais, cognitivamente intactos, sujeitos de comparação (C).
PT C
19 6
5 5
36 10
22 1
1 1
18 0
24 5
17 5
7 4
19 6
5 6
2 7
14 5
9 3
34 5
13 12
(Contínuo )
PT C
0 21 5
30 1
43 2
19 3
31 19
21 3
41 5
24
3 Fonte: Dados fornecidos por
cortesia do Dr. Andrew C. Coyne.
college/daniel
1. Consulte os dados da creatina fosfoquinase em 1005 indivíduos (PCKDATA). Os pesquisadores gostariam de saber se
situações psicologicamente estressantes causam um aumento nos níveis séricos de creatina fosfoquinase (CPK) entre
indivíduos aparentemente saudáveis. Para ajudar os pesquisadores a tomar uma decisão, selecione uma amostra
aleatória simples dessa população, faça uma análise apropriada dos dados da amostra e forneça um relatório narrativo
de suas descobertas e conclusões. Compare seus resultados com os de seus colegas.
2. Consulte os dados do tempo de protrombina em 1.000 bebês (PROTHROM). Selecione uma amostra aleatória simples
de tamanho 16 de cada uma dessas populações e conduza um teste de hipótese apropriado para determinar se deve-
se concluir que as duas populações diferem com relação ao tempo médio de protrombina.
Deixe um ¼ :05. Compare seus resultados com os de seus colegas. Que suposições são necessárias para a validade
do teste?
3. Consulte os dados do perímetro cefálico de 1000 indivíduos pareados (HEADCIRC). Selecione uma amostra aleatória
simples de tamanho 20 da população e realize um teste de hipótese apropriado para determinar se é possível concluir
que indivíduos com anormalidade do cromossomo sexual tendem a ter cabeças menores do que indivíduos normais.
Deixe um ¼ :05. Construa um intervalo de confiança de 95% para a diferença média da população. Que pressupostos
são necessários? Compare seus resultados com os de seus colegas.
4. Consulte os dados de hemoglobina de 500 crianças com anemia por deficiência de ferro e 500 crianças aparentemente
saudáveis (HEMOGLOB). Selecione uma amostra aleatória simples de tamanho 16 da população A e uma amostra
aleatória simples independente de tamanho 16 da população B. Os dados de sua amostra fornecem evidências
suficientes para indicar que as duas populações diferem em relação ao valor médio de Hb? Deixe um ¼ :05. Quais
suposições são necessárias para que seu procedimento seja válido? Compare seus resultados com os de seus
colegas.
5. Consulte as pontuações de destreza manual de 500 crianças com dificuldades de aprendizagem e 500 crianças sem
dificuldades de aprendizagem conhecidas (MANDEXT). Selecione uma amostra aleatória simples de tamanho 10 da
população A e uma amostra aleatória simples independente de tamanho 15 da população B. Suas amostras fornecem
evidências suficientes para você concluir que crianças com dificuldades de aprendizagem, em média, têm pontuações
de destreza manual mais baixas do que crianças sem dificuldades de aprendizagem? Deixe um ¼ :05.
Quais suposições são necessárias para que seu procedimento seja válido? Compare seus resultados com os de seus
colegas.
REFERÊNCIAS
1. MB BROWN e AB FORSYTHE, "Testes robustos para a igualdade de variâncias", Journal of the American Statistical
Association, 69 (1974), 364–367.
2. H. LEVENE, "Testes Robustos para Igualdade de Variâncias", em I. Olkin, ed., Contribuições para Probabilidade e Estatística,
Stanford University Press, Palo Alto, CA, 1960, 278-292.
A-1. NORIMASA NAKAMURA, SHUJI HORIBE, YUKYOSHI TORITSUKA, TOMOKI MITSUOKA, HIDEKI YOSHIKAWA e KONSEI
SHINO, “Acute Grade III Medial Collateral Ligament Injury of the Knee Associated with Anterior Cruciate Ligament Tear,”
American Journal of Sports Medicine, 31 (2003), 261 –267.
A-2. DIANE KLINGLER, ROBBYA GREEN-WEIR, DAVID NERENZ, SUZANNE HAVSTAD, HOWARD S. ROSMAN, LEONARD
CETNER, SAMIR SHAH, FRANCES WIMBUSH e STEVEN BORZAK, “Perceptions of Chest Pain Differ by Race,” American
Heart Journal, 144 (2002) , 51–59.
A-3. A. ESCOBAR, JM QUINTANA, A. BILBAO, J. AZKARATE , e JI GUENAGA € , “Validação da versão em espanhol do
questionário WOMAC para pacientes com osteoartrite de quadril ou joelho,” Clinical Rheumatology, 21 (2002), 466–471.
A-4. PHAMORNSAK THIENPRASIDDHI, VIVIENNE C. GREENSTEIN, CANDICE S. CHEN, JEFFREY M. LIEBMANN, ROBERT
RITCH e DONALD C. HOOD, “Multifocal Visual Evoked Potential Responses in Glaucoma Patients with Unilateral Hemifield
Defects,” American Journal of Ophthalmology, 136 (2003 ), 34-40.
A-5. PF LUGLIE, GUGLIELMO CAMPUS, C. DEIOLA, MG MELA e D. GALLISAI, "Condição Oral, Química da Saliva e Níveis
Salivares de Streptococcus Mutans em Pacientes Talassêmicos", Investigações Orais Clínicas, 6 (2002), 223–226.
A-6. ERIC W. TAM, ARTHUR F. MAK, WAI NGA LAM, JOHN H. EVANS e YORK Y. CHOW, “Pelvic Movement and Interface Pressure
Distribution Durante Manual Wheelchair Propulsion,” Archives of Physical Medicine and Rehabilitation, 84 (2003) , 1466–1472.
A-7. JOHN DERNELLIS e MARIA PANARETOU, “Efeitos da Terapia de Substituição da Tireóide na Pressão Arterial em
Pacientes com hipertensão e hipotireoidismo”, American Heart Journal, 143 (2002), 718–724.
A-8. S. SAIRAM, BA BAETHGE e T. MCNEARNEY, "Análise de Fatores de Risco e Doenças Comórbidas no Desenvolvimento de
Trombose em Pacientes com Anticorpos Anticardiolipina", Reumatologia Clínica, 22 (2003), 24–29.
A-9. MICHEL DABONNEVILLE, PAUL BERTHON, PHILIPPE VASLIN e NICOLE FELLMANN, “The 5 M in Running Field Test: Test
and Retest Reliability on Trained Men and Women,” European Journal of Applied Physiology, 88 (2003), 353–360.
A-10. BM INGLE e R. EASTELL, “Medidas ósseas específicas do local em pacientes com fratura do tornozelo,” Osteoporose
Internacional, 13 (2002), 342–347.
A-11. A. HOEKEMA, B. HOVINGA, B. STEGENGA e LGM DE BONT, "Morfologia Craniofacial e Apnéia Obstrutiva Steep: Uma
Análise Cefalométrica", Journal of Oral Rehabilitation, 30 (2003), 690–696.
A-12. GIAN PAOLO ROSSI, STEFANO TADDEI, AGOSTINO VIRDIS, MARTINA CAVALLIN, LORENZO GHIADONI, STEFANIA
FAVILLA, DANIELE VERSARI, ISABELLA SUDANO, ACHILLE C. PESSINA e ANTONIO SALVETTI , “Os polimorfismos
T786C e Glu298Asp do gene endotelial do óxido nítrico afetam o sangue do antebraço Respostas de fluxo de pacientes
hipertensos caucasianos,” Journal of the American College of Cardiology, 41 (2003), 938–945.
A-13. JOSE GARCS AO~ e JOSE CABRITA, “Avaliação de um Programa de Cuidados Farmacêuticos para Pacientes Hipertensos em
Portugal Rural,” Journal of the American Pharmaceutical Association, 42 (2002), 858–864.
A-14. JOHN M. MORTON, STEVEN P. BOWERS, TANANCHAI A. LUCKTONG, SAMER MATTAR, W. ALAN BRADSHAW, KEVIN E.
BEHRNS, MARK J. KORUDA, CHARLES A. HERBST, WILLIAMMCCARTNEY, RAGHUVEER K. HALKAR, C. DANIEL
SMITH e TIMOTHY M. FARRELL, "Função da Vesícula Biliar Antes e Depois da Fundoplicatura", Journal of Gastrointestinal
Surgery, 6 (2002), 806 –811.
A-15. ELLEN DAVIS JONES, “Terapia de Reminiscência para Mulheres Idosas com Depressão: Efeitos da Classificação da Intervenção
de Enfermagem em Cuidados de Longo Prazo com Vida Assistida”, Journal of Gerontological Nursing, 29 (2003), 26–33.
A-16. JOHNNY BENEY, E. BETH DEVINE, VALBY CHOW, ROBERT J. IGNOFFO, LISA MITSUNAGA, MINA SHAHKARAMI, ALEX
MCMILLAN e LISA A. BERO. “Efeito do acompanhamento por telefone na dimensão do bem-estar físico da qualidade de vida
em pacientes com câncer”, Pharmacotherapy, 22 (2002), 1301–1311.
REFERÊNCIAS 301
A-17. JOHN S. MORLEY, JOHN BRIDSON, TIM P. NASH, JOHN B. MILES, SARAH WHITE e MATTHEW K. MAKIN, “Low-Dose Metadone
Has an Analgesic Effect in Neuropathic Pain: A Double-Blind Randomized Controlled Crossover Trial,” Medicina paliativa, 17 (2003),
576–587.
A-18. WK WOO e KE MCKENNA, "Combinação TL01 Ultraviolet B Phototherapy and Topical Calcipotriol for Psoriasis: A
Prospective Randomized Placebo-Controlled Clinical Trial," British Journal of Dermatology, 149 (2003), 146–150.
A-19. SIMONA PORCELLINI, GIULIANA VALLANTI, SILVIA NOZZA, GUIDO POLI, ADRAINO LAZZARIN, GUISEPPE TABUSSI e ANTONIO
GRASSIA, “Improved Thymopoietic Potential in Aviremic HIV-Infected Individuals with HAART by Intermittent IL-2 Administration,”
AIDS, 17 (2003), 1621 –1630.
A-20. LYNNE E. WAGENKNECHT, CARL D. LANGEFELD, ANN L. SCHERZINGER, JILL M. NORRIS, STEVEN M. HAFFNER, MOHAMMED
F. SAAD e RICHARD N. BERGMAN, "Sensibilidade à insulina, secreção de insulina e gordura abdominal,"
Diabetes, 52 (2003), 2490–2496.
A-21. YVES JACQUEMYN, FATIMA AHANKOUR e GUY MARTENS, “Preferência pessoal dos obstetras flamengos em relação ao modo de
parto e atitude em relação à cesariana sob demanda”, Jornal Europeu de Obstetrícia e Ginecologia e Biologia Reprodutiva, 111
(2003), 164–166.
A-22. LI HUI e A. COLIN BELL, “Excesso de peso e obesidade em crianças de Shenzhen, República Popular da China,”
Health and Place, 9 (2003), 371–376.
A-23. ANNE E. BECKER, REBECCA A. BURWELL, KESAIA NAVARA e STEPHEN E. GILMAN, “Compulsão alimentar e transtorno da
compulsão alimentar periódica em uma sociedade indígena de pequena escala: a visão de Fiji”, International Journal of Eating
Disorders, 34 (2003 ), 423–431.
A-24. JACQUELINE A. NOONAN, RENSKE RAAIJMAKERS e BRYAN D. HALL, “Adult Height in Noonan Syndrome,”
American Journal of Medical Genetics, 123A (2003), 68–71.
A-25. SAI YIN HO, TAI HING LAM, RICHARD FIELDING e EDWARD DENIS JANUS, “Smoking and Perceived Health in Hong Kong Chinese,”
Social Science and Medicine, 57 (2003), 1761–1770.
A-26. MARKUS A. LANDOLT, MARGARETE VOLLRATH, KARIN RIBI, HANSPETER E. GNEHM e FELIX H. SENNHAUSER, "Incidência e
associações de sintomas de estresse pós-traumático parental e infantil em pacientes pediátricos", Journal of Child Psychology and
Psychiatry, 44 (2003), 1199–1207.
A-27. MORELL MICHAEL AVRAM, DANIEL BLAUSTEIN, PAUL A. FEIN, NAVEEN GOEL, JYOTIPRAKAS CHATTOPADYAY e NEAL
MITTMAN, “A hemoglobina prediz a sobrevivência a longo prazo em pacientes em diálise: um estudo longitudinal de centro único de
15 anos e uma tendência de correlação entre a pré-albumina e a hemoglobina ,” Kidney International, 64 (2003), 6–11.
A-28. JUDY P. WILKINS, OSCAR E. SUMAN, DEB A. BENJAMIN e DAVID N. HEMDON, “Comparação da conformidade auto-relatada e
monitorada da injeção diária de hormônio do crescimento humano em crianças queimadas”, Burns, 29 (2003), 697 –701.
A-29. B. ROBINSON, CT HEISE, JW MOORE, J. ANELLA, M. SOKOLOSKI e E. ESHAGHPOUR, “Terapia de redução

de pós-carga em pacientes após operação de baffle intraatrial para transposição das grandes artérias”,
Cardiologia Pediátrica, 23 (2003), 618 –623.
A-30. PETER BORDEN, JOHN NYLAND, DAVID NM CABORN e DAVID PIENOWSKI, “Comparação biomecânica do sistema de sutura de
reparo meniscal FasT-FIX com colchão vertical e setas de menisco”, American Journal of Sports Medicine, 31 (2003), 374–378.
A-31. CLAUDIO DORA, BEAT WA€LCHLI, ACHIM ELFERING, IMRE GAL, DOMINIK WEISHAUPT e NORBERT BOOS, “The Significance of
Spinal Canal Dimensions in Discriminating Symptomatic from Asymptomatic Disc Herniations,” European Spine Journal, 11 (2002),
575–581.
A-32. KIMBERLY K. NAGY, ROXANNE R. ROBERTS, ROBERT F. SMITH, KIMBERLY T. JOSEPH, GARY, C. AN, FARAN BOKHARI e
JOHN BARRETT, “Trans-Mediastinal Gunshot Wounds: Are 'Stable' Patients Really Stable?” World Journal of Surgery, 26 (2002),
1247–1250.
A-33. ROBERT OCHSENKUHN € , THOMAS STROWITZKI, MONIKA GURTNER, ALEXANDER STRAUSS, ANDREAS SCHULZE, HERMANN
HEPP e PETER HILLEMANNS, “Pregnancy Complications, Obstetric Risks, and Neonatal Outcome in Singleton and Twin
Pregnancies after GIFT and IVF,” Archives of Gynecology and Obstetrics, 268 (2003) , 256–261.
A-34. William Tindall e o Centro de Consultoria da Wright State University (2003).
A-35. RONALD F. VAN VOLLENHOVEN, SOFIA ERNESTAM, ANDERS HARJU, JOHAN BRATT e LARS KLARESKOG, “Etanercept Versus
Etanercept Plus Methotrexate: A Registry-Based Study Suggesting that the Combination Is Clinical More Effacious,” Arthritis Research
& Therapy, 5 (2003) , R347–R351.
A-36. KICKO MIYAZAKI, TOSHIYA NISHIBE, FUMIHIRO SATA, TAKAHIRO IMAI, FAVIO A. KUDO, JORGE FLORES, YASUMASA J.
MIYAZAKI e KEISHU YASUDA, “Operação de remoção com escleroterapia para veias varicosas primárias devido ao refluxo da veia
safena magna: resultados de três anos”, World Journal of Surgery, 27 (2003), 551–553.
A-37. CLAUDIO DORA, BEAT WA€LCHLI, ACHIM ELFERING, IMRE GAL, DOMINIK WEISHAUPT e NORBERT BOOS, “The Significance of
Spinal Canal Dimensions in Discriminating Symptomatic from Asymptomatic Disc Herniations,” European Spine Journal, 11 (2002),
575–581.
A-38. SILVIA IANNELO, ANTONINA CAVALERI, PAOLINA MILAZZO, SANTI CANTARELLA e FRANCESCO BELFIORE, “Baixo nível de
triglicerídeos séricos em jejum como marcador precoce de distúrbios autoimunes”, Medscape General Medicine, 5 (3) (2003).
A-39. SUSAN BAZYK, PAULA MICHAUD, GLENN GOODMAN e PAULA PAPP, “Integrating Occupational Therapy Services in a Kindergarten
Curriculum: A Look on the Outcomes”. Submetido ao American Journal of Occupational Therapy, 30 de junho de 2004.
A-40. JOHN J. HONG, STEPHEN M. COHN, A. PETER EKEH, MARTIN NEWMAN, MOISES SALAMA e SUZANNE D. LEBLANG, “Um
Estudo Prospectivo Randomizado de Avaliação Clínica Versus Tomografia Computadorizada para o Diagnóstico de Apendicite
Aguda,” Infecções Cirúrgicas, 4 (2003), 231-239.
A-41. DENNIS DYKSTRA, AL ENRIQUEZ e MICHAEL VALLEY, “Tratamento da Bexiga Hiperativa com Toxina Botulínica Tipo B: Um Estudo
Piloto,” International Urogynecological Journal, 14 (2003), 424–426.
A-42. NETTA HORESH, ISRAEL ORBACH, DORON GOTHELF, MEIR EFRATI e ALAN APTER, “Comparação do comportamento suicida de
pacientes adolescentes internados com transtorno de personalidade limítrofe e depressão maior”, Journal of Nervous and Mental
Disease, 191 (2003), 582–588.
A-43. LARRY B. MAUKSCH, WAYNE J. KATON, JOAN RUSSO, SUZANNE M. TUCKER, EDWARD WALKER e JANET CAMERON, “The
Content of a Low-Income, Uninsured Primary Care Population: Incluindo a agenda do paciente,” Journal of the American Board of
Family Practice, 16 (2003), 278–289.
A-44. DAVID HOSKING, SILVANO ADAMI, DIETER FELSENBERG, JORGE CANNATA ANDIA , MATTI VA€LIMA€KI, LAURENT
BENBAMOU, JEAN-YVES REGINSTER, CAROLYACIK, ANDREA RYBAK-FEGLIN, RICHARD A. PETRUSCHKE, LUNA ZARU e ARTHUR C.
SANTORA, “Comparação de Mudança na Reabsorção Óssea e Densidade Mineral Óssea com Alendronato Uma vez por
Semana e Risedronato Diário: Um Estudo Randomizado, Controlado por Placebo,” Opinião de Pesquisa Médica Atual, 19 (2003),
383–394.
A-45. NORMAN H. BELL, “25-hidroxivitamina D3 [r] reverte a alteração do sistema endócrino da vitamina D em
Blacks,” The American Journal of Medicine, 99 (dezembro de 1995), 597–599.
A-46. P. MONTNER, DM STARK, ML RIEDESEL, G. MURATA, R. ROBERGS, M. TIMMS e TW CHICK, “Pre-exercise Gly cerol Hydration
Improves Cycling Endurance Time,” International Journal of Sports Medicine, 17 (1996), 27–33.
A-47. ALESSANDRA D'ALESSANDRO, WARE KUSHNER, HOFERWONG, HOMER A. BOUSHEY e PAUL D. BLANC, "Respostas
exageradas à inalação de cloro entre pessoas com hiperreatividade não específica das vias aéreas", Chest, 109 (1996), 331–337.
A-48. LR RANGANATH, JA CHRISTOFIDES, JW WRIGHT e V. MARKS, “Efeito da terapia de reposição hormonal em

Composição de ácidos graxos de membrana de plaquetas,” Journal of Endocrinology, 148 (1996), 207–212.
A-49. MICHAEL I. GORAN, PATRICIA DRISCOLL, RACHEL JOHNSON, TIM R. NAGY e GARY HUNTER, “Calibração cruzada de técnicas
de composição corporal contra absorciometria de raios X de energia dupla em crianças pequenas”, American Journal of Clinical
Nutrition, 63 ( 1996), 299-305.
A-50. MANFRED HARTARD, PAUL HABER, DIANA ILIEVA, ELISABETH PREISINGER, GEORG SEIDL e JOHANNES HUBER, “Treinamento
Sistemático de Força como Modelo de Intervenção Terapêutica”, American Journal of Physical Medicine & Rehabilitation, 75 (1996),
21–28.
A-51. M. VITACCA, E. CLINI, W. SPASSINI, L. SCAGLIA, P. NEGRINI e A. QUADRI, “A posição supina piora
Função Respiratória em Idosos?” Gerontologia, 42 (1996), 46–53.
A-52. STEPHEN B. YOUNG, PETER L. ROSENBLATT, DIANE M. PINGETON, ALLISON E. HOWARD e STEPHEN P. BAKER, “The
Mersilene Mesh Suburethral Sling: A Clinical and Urodynamic Evaluation,” American Journal of Obstetrics and Gynecology, 173
(1995 ), 1719-1726.
A-53. PAUL T. DIAMOND, GERALD FELSENTHAL, STEPHEN N. MACCIOCCHI, DONNA H. BUTLER e DENISE LALLY-CASSADY, “Effect
of Cognitive Impairment on Rehabilitation Outcome,” American Journal of Physical Medicine & Rehabilitation, 75 (1996), 40–43 .
A-54. ROBERT E. WEINSTEIN, CATHERINE A. LOBOCKI, SHARON GRAVETT, HILLMAN HUM, RONALD NEGRICH, JONATHAN HERBST,
DANA GREENBERG e DAVID R. PIEPER, “Decreased Adrenal Sex Steroid Levels in the Absence of Glucocorticoid Suppression in
Postmenopausal Asthmatic Women,” Journal of Allergy and Clinical Immunolology, 97 (1996), 1–8.
A-55. BARRY L. GRUBER, DARIUS SORBI, DEBORAH L. FRENCH , MARY J. MARCHESE, GERARD J. NUOVO, RICHARD R. KEW e
LEONARD A. ARBEIT, “Markedly Elevated Serum MMP-9 (Gelatinase B) Levels in Rheumatoid Arthritis: Um marcador laboratorial
potencialmente útil,” Clinical Immunology and Immunopathology, 78 (1996), 161–171.
REFERÊNCIAS 303
A-56. LUIGI BENINI, CARLO SEMBENINI, GRETA CASTELLANI, ENRICO BARDELLI, MARIA TERESA BRENTEGANI,
PIERGIORGIO GIORGETTI e ITALO VANTINI, “Acidificação Esofágica Patológica e Dilatação Pneumática em
Pacientes Acalásicos: Muito ou Pouco?” Doenças Digestivas e Ciências, 41 (1996), 365–371.
A-57. PHILIP N. BAKER, CHRISTOPHER P. STRANKO, SANDRA T. DAVIDGE, PAUL S. DAVIES e JAMES M. ROBERTS,
“O estresse mecânico elimina os efeitos do plasma de pacientes com pré-eclâmpsia nas células endoteliais,”
A-58. MARC H. ZISSELMAN, BARRY W. ROVNER e YOCHI SHMUELY, “Uso de benzodiazepínicos em idosos antes de
Hospitalização Psiquiátrica,” Psychosomatics, 37 (1996), 38–42.
A-59. HANS REINECKE, ROLAND STRUDER, ROLAND VETTER, JURGEN HOLTZ e HELMUT DREXLER, “Cardiac
Na+ /Ca2+ Exchange Activity in Patients with End-Stage Heart Failure,” Cardiovascular Research, 31 (1996), 48–54.
A-60. WILLIAM E. REICHMAN, ANDREW C. COYNE, SATISH AMIRNENI, BRUNO MOLINO e SANDRA EGAN, "Sintomas
negativos na doença de Alzheimer", American Journal of Psychiatry, 153 (1996), 424–426.
CAPÍTULO 8
ANÁLISE DE VARIAÇÃO
Este capítulo apresenta o primeiro de uma série de capítulos dedicados a modelos

lineares. O tópico deste capítulo, análise de variância, fornece uma metodologia
para particionar a variância total calculada de um conjunto de dados em
componentes, cada um dos quais representa a quantidade da variância total que
pode ser atribuída a uma fonte específica de variação. Os resultados desse
particionamento podem então ser usados para estimar e testar hipóteses sobre
variâncias e médias populacionais. Neste capítulo, concentramos nossa atenção
no teste de hipóteses de médias. Especificamente, discutimos o teste de diferenças
entre médias quando há interesse em mais de duas populações ou duas ou mais
variáveis. As técnicas discutidas neste capítulo são amplamente utilizadas nas
ciências da saúde.
TÓPICOS
8.1 INTRODUÇÃO
8.2 O DESENHO TOTALMENTE RANDOMIZADO

8.3 DESENHO DE BLOCO COMPLETO RANDOMIZADO
8.4 O PROJETO DE MEDIDAS REPETIDAS
8.5 O EXPERIMENTO FATORIAL
8.6 RESUMO
Depois de estudar este capítulo, o aluno 1.

entenderá os conceitos estatísticos básicos relacionados a modelos lineares.
2. entender como a variação total em um conjunto de dados pode ser particionada em diferentes
componentes.
3. ser capaz de comparar as médias de mais de duas amostras simultaneamente. 4.
compreender os testes de comparações múltiplas e quando a sua utilização é adequada.
5. entender projetos experimentais comumente usados.
304
8.1 INTRODUÇÃO
Nos capítulos anteriores, os conceitos básicos de estatística foram examinados e fornecem uma base
para este e os próximos capítulos. Neste capítulo e nos três seguintes, fornecemos uma visão geral de
duas das ferramentas analíticas mais comumente empregadas por estatísticos aplicados: análise de
variância e regressão linear. Os fundamentos conceituais dessas ferramentas analíticas são modelos
estatísticos que fornecem representações úteis das relações entre diversas variáveis simultaneamente.
Modelos lineares Um modelo estatístico é uma representação matemática das relações entre as
variáveis. Mais especificamente para os propósitos deste livro, um modelo estatístico é usado com
mais frequência para descrever como as variáveis aleatórias se relacionam umas com as outras em
um contexto no qual o valor de uma variável de resultado, muitas vezes referido com a letra “y”, pode
ser modelado como uma função de uma ou mais variáveis explicativas, muitas vezes referidas com a
letra “x”. Dessa forma, estamos interessados em determinar quanta variabilidade nos resultados pode
ser explicada por variáveis aleatórias que foram medidas ou controladas como parte de um experimento.
O modelo linear pode ser facilmente expandido para uma forma mais generalizada, na qual incluímos
múltiplas variáveis de resultado simultaneamente. Esses modelos são chamados de Modelos Lineares
Gerais e podem ser encontrados em livros de estatística mais avançados.
DEFINIÇÃO
Uma variável de resultado é representada pelo conjunto de valores medidos que

resultam de um experimento ou algum outro processo estatístico. Uma variável
explicativa, por outro lado, é uma variável que é útil para prever o valor da variável
de resultado.
Um modelo linear é qualquer modelo que seja linear nos parâmetros que definem o modelo.
Podemos representar tais modelos genericamente na forma:
Yj ¼ b0 þ b1X1j þ b2X2j þ ... þ bkXkj þ ej (8.1.1)
Nesta equação, bj representa os coeficientes do modelo e ej representa o erro aleatório.

Portanto, qualquer modelo que possa ser representado desta forma, onde os coeficientes são
constantes e a ordem algébrica do modelo é um, é considerado um modelo linear. Embora à primeira
vista essa equação possa parecer assustadora, geralmente é fácil encontrar valores para os parâmetros
usando álgebra ou cálculo básico, como veremos no decorrer do capítulo.
Veremos muitas representações de modelos lineares nesta e em outras formas nos próximos
capítulos. Em particular, vamos nos concentrar no uso de modelos lineares para análise de dados
usando a análise de variância para testar diferenças entre médias, regressão para fazer previsões e
correlação para entender associações entre variáveis. No contexto da análise de variância, as variáveis
preditoras são variáveis de classificação usadas para definir fatores de interesse (por exemplo,
diferenciar entre um grupo de controle e um grupo de tratamento) e, no contexto de correlação e
regressão linear, as variáveis preditoras geralmente são contínuas variáveis, ou pelo menos variáveis
em um nível mais alto do que as classes nominais. Embora os propósitos subjacentes a essas tarefas
possam parecer bastante diferentes, estudar essas técnicas e
306 CAPÍTULO 8 ANÁLISE DE VARIÂNCIA
a estrutura dos modelos usados para representá-los provará ser valiosa para a compreensão de algumas
das estatísticas inferenciais mais comumente usadas.
Análise de variância Este capítulo trata da análise de variância, que pode ser definida como uma técnica
pela qual a variação total presente em um conjunto de dados é particionada em dois ou mais componentes.
Associada a cada uma destas componentes está uma fonte específica de variação, pelo que na análise é
possível averiguar a magnitude das contribuições de cada uma destas fontes para a variação total.
O desenvolvimento da análise de variância (ANOVA) deve-se principalmente ao trabalho de RA

Fisher (1), cujas contribuições para a estatística, abrangendo os anos de 1912 a 1962, tiveram uma
tremenda influência no pensamento estatístico moderno (2,3).
Aplicações A análise de variância encontra sua aplicação mais ampla na análise de dados derivados de
experimentos. Os princípios do planejamento de experimentos são bem abordados em muitos livros,
incluindo os de Hinkelmann e Kempthorne (4), Montgomery (5) e Myers e Well (6). Não estudamos esse
tópico em detalhes, pois para fazer justiça exigiria no mínimo um capítulo adicional. Alguns dos conceitos
importantes no projeto experimental, no entanto, se tornarão aparentes quando discutirmos a análise de
variância.
A análise de variância é usada para dois propósitos diferentes: (1) estimar e testar hipóteses sobre
variações populacionais e (2) estimar e testar hipóteses sobre médias populacionais. Estamos
preocupados aqui com o último uso. No entanto, como veremos, nossas conclusões sobre as médias
dependerão das magnitudes das variâncias observadas.
Os conceitos e técnicas que abordamos sob o título de análise de variância são extensões dos
conceitos e técnicas abordados no Capítulo 7. No Capítulo 7, aprendemos a testar a hipótese nula de
que duas médias são iguais. Neste capítulo, aprendemos a testar a hipótese nula de que três ou mais
médias são iguais. Enquanto, por exemplo, o que aprendemos no Capítulo 7 nos permite determinar se
podemos concluir que dois tratamentos diferem em eficácia, o que aprendemos neste capítulo nos permite
determinar se podemos concluir que três ou mais tratamentos diferem em eficácia. O exemplo a seguir
ilustra algumas ideias básicas envolvidas na aplicação da análise de variância. Estes serão ampliados e
elaborados mais adiante neste capítulo.
EXEMPLO 8.1.1
Suponha que desejamos saber se três drogas diferem em sua eficácia na redução do colesterol sérico
em seres humanos. Alguns indivíduos recebem o medicamento A, alguns medicamentos B e alguns
medicamentos C. Após um período de tempo especificado, são feitas medições para determinar até que
ponto o colesterol sérico foi reduzido em cada indivíduo. Descobrimos que a quantidade pela qual o
colesterol sérico foi reduzido não é a mesma em todos os indivíduos. Em outras palavras, há variabilidade
entre as medições. Por que, nos perguntamos, as medidas não são todas iguais? Presumivelmente, uma
razão pela qual eles não são os mesmos é que os sujeitos receberam drogas diferentes. Agora,
examinamos as medidas dos indivíduos que receberam a droga A.
Descobrimos que a quantidade pela qual o colesterol sérico foi reduzido não é a mesma entre esses
indivíduos. Descobrimos que este é o caso quando olhamos para as medições de assuntos
que receberam a droga B e os indivíduos que receberam a droga C. Vemos que há variabilidade entre as
medições dentro dos grupos de tratamento. Por que, nos perguntamos novamente, essas medidas não
são as mesmas? Entre as razões que vêm à mente estão as diferenças na composição genética dos
sujeitos e as diferenças em suas dietas. Através de uma análise da variabilidade que observamos,
poderemos chegar a uma conclusão sobre a equivalência da eficácia dos três medicamentos. Para isso
empregamos as técnicas e conceitos de análise de variância. &
Variáveis Em nosso exemplo, aludimos a três tipos de variáveis. Achamos que essas variáveis estão
presentes em todas as situações em que o uso da análise de variância é apropriado. Primeiro, temos a
variável de tratamento, que em nosso exemplo era “droga”.
Tínhamos três “valores” dessa variável, droga A, droga B e droga C. O segundo tipo de variável a que nos
referimos é a variável de resposta. No exemplo, é a alteração no colesterol sérico. A variável resposta é a
variável que esperamos exibir valores diferentes quando diferentes “valores” da variável de tratamento são
empregados. Finalmente, temos as outras variáveis que mencionamos — composição genética e dieta.
Estas são chamadas de variáveis estranhas. Essas variáveis podem ter um efeito na variável de resposta,
mas não são o foco de nossa atenção no experimento. A variável de tratamento é a variável de interesse
primário, e a pergunta a ser respondida é: os diferentes “valores” da variável de tratamento resultam em
diferenças, na média, na variável de resposta?
Suposições Subjacente ao uso válido da análise de variância como uma ferramenta de inferência estatística
está um conjunto de suposições fundamentais. Embora um experimentador não deva esperar encontrar
todas as suposições atendidas com perfeição, é importante que o usuário das técnicas de análise de
variância esteja ciente das suposições subjacentes e seja capaz de reconhecer quando elas são
substancialmente insatisfeitas. Como os experimentos nos quais todas as suposições são perfeitamente
atendidas são raros, os resultados da análise de variância devem ser considerados aproximados em vez
de exatos. Essas suposições são apontadas em pontos apropriados nas seções a seguir.
Discutimos a análise de variância como ela é usada para analisar os resultados de dois
delineamentos experimentais diferentes, o delineamento inteiramente casualizado e o de blocos completos
randomizados. Além desses, o conceito de experimento fatorial se dá por meio de sua utilização em
delineamento inteiramente casualizado. Estes não esgotam as possibilidades. Uma discussão sobre
designs adicionais pode ser encontrada nas referências (4–6).
O procedimento ANOVA Em nossa apresentação da análise de variância para os diferentes delineamentos,

seguimos o procedimento de dez etapas apresentado no Capítulo 7. A seguir, uma reafirmação das etapas
do procedimento, incluindo alguns novos conceitos necessários para sua adaptação à análise de variância.
1. Descrição dos dados. Além de descrever os dados da maneira usual, exibimos

os dados de amostra em forma tabular.
2. Suposições. Juntamente com as suposições subjacentes à análise, apresentamos o modelo para
cada projeto que discutimos. O modelo consiste em uma representação simbólica de um valor
típico dos dados que estão sendo analisados.
3. Hipóteses.
5. Distribuição da estatística de teste.
6. Regra de decisão.
7. Cálculo da estatística de teste. Os resultados dos cálculos aritméticos serão resumidos em uma tabela
chamada tabela de análise de variância (ANOVA). As entradas na tabela facilitam a avaliação dos
resultados da análise.
8. Decisão estatística.
9. Conclusão.
Discutimos essas etapas com mais detalhes na Seção 8.2.
O uso de computadores Os cálculos exigidos pela análise de variância são mais longos e complicados do que
aqueles que encontramos nos capítulos anteriores.
Por esta razão, o computador assume um papel importante na análise de variância. Todos os exercícios que
aparecem neste capítulo são adequados para análise de computador e podem ser resolvidos com os pacotes
estatísticos mencionados no Capítulo 1. O resultado dos pacotes estatísticos pode variar ligeiramente daquele
apresentado neste capítulo, mas isso não deve representar um grande problema para aqueles que usam um
computador para analisar os dados dos exercícios. Os conceitos básicos de análise de variância que
apresentamos aqui devem fornecer a base necessária para a compreensão da descrição dos programas e sua
saída em qualquer um dos pacotes estatísticos.
8.2 O DESENHO TOTALMENTE RANDOMIZADO
Vimos no Capítulo 7 como é possível testar a hipótese nula de nenhuma diferença entre duas médias
populacionais. Não é incomum que o investigador esteja interessado em testar a hipótese nula de nenhuma
diferença entre várias médias populacionais. O aluno que encontrar esse problema pela primeira vez pode estar
inclinado a sugerir que todos os pares possíveis de médias amostrais sejam testados separadamente por meio
do teste t de Student. Suponha que haja cinco populações envolvidas. O número de pares possíveis de médias
amostrais é 5C2 ¼ 10. Como a quantidade de trabalho envolvida na realização de tantos testes t é substancial,
valeria a pena se uma alternativa mais eficiente para análise estivesse disponível. Uma consequência mais
importante de realizar todos os testes t possíveis, no entanto, é que é muito provável que isso leve a uma
conclusão falsa.
Suponha que extraímos cinco amostras de populações com médias iguais. Como vimos, haveria 10
testes se fizéssemos cada um dos testes possíveis separadamente. Se selecionarmos um nível de significância
de ¼ :05 para cada teste, a probabilidade de não rejeitar uma hipótese de nenhuma diferença em cada caso
seria :95. Pela regra de multiplicação de probabilidade, se os testes fossem independentes um do outro, a
probabilidade de não rejeitar uma hipótese de nenhuma diferença em todos os 10 casos seria ð Þ :95 ¼ :5987.
10
A probabilidade de rejeitar pelo menos uma hipótese de não diferença,
sabemos
então,em
seria
que
todos
a1 hipótese
:5987
os casos
¼ nula
:4013.
neste
é verdadeira
Como
exemplo
ilustrativo, rejeitar a hipótese nula constitui cometer um erro do tipo I. A longo prazo, então, em
8.2 O DESENHO COMPLETAMENTE RANDOMIZADO 309
testando todos os pares possíveis de médias de cinco amostras, cometeríamos um erro tipo I 40% das
vezes. O problema se torna ainda mais complicado na prática, pois três ou mais testes t baseados nos
mesmos dados não seriam independentes entre si.
Fica claro, então, que algum outro método para testar uma diferença significativa
entre vários meios é necessário. A análise de variância fornece esse método.
ANOVA de uma via O tipo mais simples de análise de variância é aquela conhecida como análise de
variância de uma via, na qual apenas uma fonte de variação, ou fator, é investigada. É uma extensão para
três ou mais amostras do procedimento de teste t (discutido no Capítulo 7) para uso com duas amostras
independentes. Dito de outra forma, podemos dizer que o teste t para uso com duas amostras
independentes é um caso especial de análise de variância unidirecional.
Em uma situação típica, queremos usar a análise de variância unidirecional para testar a hipótese
nula de que três ou mais tratamentos são igualmente eficazes. O experimento necessário é projetado de
forma que os tratamentos de interesse sejam atribuídos de forma totalmente aleatória aos sujeitos ou
objetos nos quais as medições para determinar a eficácia do tratamento serão feitas. Por esta razão, o
delineamento é chamado de delineamento experimental inteiramente casualizado.
Podemos alocar indivíduos aleatoriamente para tratamentos da seguinte maneira. Suponha que
temos 16 sujeitos disponíveis para participar de um experimento no qual desejamos comparar quatro drogas.
Numeramos os assuntos de 01 a 16. Em seguida, vamos a uma tabela de números aleatórios e
selecionamos 16 números consecutivos não duplicados entre 01 e 16. Para ilustrar, vamos usar a Tabela
A do Apêndice e um ponto inicial aleatório que, digamos, está em a interseção da Linha 4 e das Colunas
11 e 12. O número de dois dígitos nesta interseção é 98. Os 16 números de dois dígitos consecutivos
(movendo-se para baixo) entre 01 e 16 são 16, 09, 06, 15, 14, 11 , 02, 04, 10, 07, 05, 13, 03, 12, 01 e 08.
Alocamos os sujeitos 16, 09, 06 e 15 para a droga A; sujeitos 14, 11, 02 e 04 à droga B; sujeitos 10, 07,
05 e 13 à droga C; e sujeitos 03, 12, 01 e 08 para a droga D. Ressaltamos que o número de sujeitos em
cada grupo de tratamento não precisa ser o mesmo. A Figura 8.2.1 ilustra o esquema de alocação aleatória.
Disciplinas
16151413121110090807060504030201
disponíveis
Números
08011203130507100402111415060916
aleatórios
16 0609 15 14 11 02 04 10 07 05 13 03 12 08 01
Tratamento A B C D
FIGURA 8.2.1 Alocação de indivíduos para tratamentos, delineamento completamente aleatório.

TABELA 8.2.1 Tabela de Valores de Amostra para o

Desenho Completamente Aleatório
Tratamento
1 2 3 ... k
x11 x12 x13 ... x1k

x21 x22 x23 ... x2k
x31 x32 x33 ... x3k
.. .. .. .. ..
. . . . .
xn11 xn22 xn33 ... xnk k
Total T:1 T:2 T:3 ... Tk P::
Significar x:1 x:2 x::3 ... xk x::
Etapas do teste de hipóteses Uma vez que decidimos que o delineamento completamente aleatório
é o delineamento apropriado, podemos prosseguir com as etapas do teste de hipóteses.
Discutiremos isso em detalhes primeiro e seguiremos com um exemplo.
1. Descrição dos dados. As medições (ou observações) resultantes de um projeto experimental

completamente aleatório, juntamente com as médias e totais que podem ser calculadas a
partir delas, podem ser exibidas por conveniência como na Tabela 8.2.1. Os símbolos
usados na Tabela 8.2.1 são definidos da seguinte forma:
xij ¼ a i-ésima observação resultante do j-ésimo tratamento ð

Þ há um total de k tratamentos
i ¼ 1; 2; ... ; nj; j ¼ 1; 2; ... ; k
T: j ¼ Xnj xij ¼ total do jésimo tratamento

i¼1
T:j
¼ nj k ¼ média do jésimo tratamento x:j
k
T:: ¼ X T:j ¼ X Xnj xij ¼ total de todas as observações

j¼1 j¼1 i¼1
k
P::
x¼
N ; N¼X nj
j¼1
2. Suposições. Antes de estabelecer as suposições, vamos especificar o modelo para o

experimento descrito aqui.
O Modelo Como já observado, um modelo é uma representação simbólica de um valor típico de

um conjunto de dados. Para escrever o modelo para o delineamento experimental completamente
casualizado, vamos começar identificando um valor típico do conjunto de dados representado pela
amostra exibida na Tabela 8.2.1. Usamos o símbolo xij para representar esse valor típico.
O modelo de análise de variância unidirecional pode ser escrito da seguinte forma:
i ¼ 1; 2; ... ; nj; j ¼ 1; 2; ... ; k (8.2.1)

xij ¼ m þ tj þ eij;
Os termos neste modelo são definidos da seguinte forma:
1. m representa a média de todas as k médias populacionais e é chamada de grande média. 2. tj
representa a diferença entre a média da j-ésima população e a grande média e é chamado de efeito do
tratamento. 3. eij representa o quanto uma medida individual difere da média da população à qual
pertence e é chamado de termo de erro.
Componentes do modelo Olhando para o nosso modelo, podemos ver que uma observação típica do
conjunto total de dados em estudo é composta por (1) a grande média, (2) um efeito de tratamento e (3)
um termo de erro que representa o desvio da observação de sua média de grupo.
Na maioria das situações, estamos interessados apenas nos k tratamentos representados em

nosso experimento. Quaisquer inferências que fizermos se aplicam apenas a esses tratamentos. Não
desejamos estender nossa inferência a qualquer coleção maior de tratamentos. Quando colocamos tal
restrição em nossos objetivos de inferência, nos referimos ao nosso modelo como modelo de efeitos fixos,
ou modelo 1. A discussão neste livro se limita a esse modelo.
Suposições do Modelo As suposições para o modelo de efeitos fixos são as seguintes:
(a) Os k conjuntos de dados observados constituem k amostras aleatórias independentes das respectivas
populações. (b) Cada uma das populações de onde vêm as amostras é normalmente distribuída com média
mj e variância s2 (c) Cada uma das populações tem a mesma variância. Ou seja, s2 ¼ s2
j.
¼ ... s2 ¼ s2 o
1 2 k
variação comum.
(d) Os tj são constantes desconhecidas e Ptj ¼ 0 pois a soma de todos os desvios do mj

de sua média, m, é zero.
(e) Os eij têm média 0, pois a média de xij é mj. (f) Os eij têm
variância igual à variância dos xij, pois os eij e xij diferem apenas por uma constante; ou seja, a variância
do erro é igual a s2, a variância comum especificada na suposição c.
(g) Os eij são normalmente (e independentes) distribuídos.
3. Hipóteses. Testamos a hipótese nula de que todas as médias da população ou tratamento são iguais
contra a alternativa de que os membros de pelo menos um par não são iguais.
Podemos enunciar as hipóteses formalmente da seguinte forma:
H0 : m1 ¼ m2 ¼¼ mk
HA : nem todos os mj são iguais

= ... = 2sk
2
2
= 1 2s
segundos
m1 = m2 = ... = mk
FIGURA 8.2.2 Imagem das populações representadas em um
delineamento completamente aleatório quando H0 é verdadeira e
as suposições são atendidas.
Se as médias populacionais forem iguais, cada efeito de tratamento é igual a zero, de modo que,
alternativamente, as hipóteses podem ser formuladas como
H0 : tj ¼ 0; j ¼ 1; 2; ... ; k
HA : nem todos tj ¼ 0
Se H0 for verdadeiro e as suposições de variâncias iguais e populações normalmente distribuídas

forem atendidas, uma imagem das populações se parecerá com a Figura 8.2.2. Quando H0 é verdadeira,
as médias populacionais são todas iguais e as populações estão centradas no mesmo ponto (a média
comum) no eixo horizontal. Se as populações forem todas normalmente distribuídas com variâncias
iguais, as distribuições serão idênticas, de modo que, ao desenhar suas figuras, cada uma se sobrepõe a
cada uma das outras, e uma única figura representa suficientemente todas elas.
Quando H0 é falso, pode ser falso porque uma das médias da população é diferente das outras,
que são todas iguais. Ou, talvez, todas as médias populacionais sejam diferentes.
Estas são apenas duas das possibilidades quando H0 é falsa. Existem muitas outras combinações
possíveis de meios iguais e desiguais. A Figura 8.2.3 mostra uma imagem das populações quando as
suposições são atendidas, mas H0 é falsa porque não há duas médias populacionais iguais.
4. Estatística de teste. A estatística de teste para análise de variância unidirecional é uma razão de
variância calculada, que designamos por VR como fizemos no Capítulo 7. Os dois
m1 m2 mk
FIGURA 8.2.3 Imagem das populações representadas em um projeto

completamente aleatório quando as suposições de variâncias iguais e
populações normalmente distribuídas são satisfeitas, mas H0 é falsa porque
nenhuma das médias populacionais é igual.
as variações a partir das quais o VR é calculado são computadas a partir dos dados de amostra.
Os métodos pelos quais eles são calculados serão fornecidos na discussão a seguir.
5. Distribuição da estatística de teste. Conforme discutido na Seção 7.8, VR é distribuído como a

distribuição F quando H0 é verdadeiro e as suposições são atendidas.
6. Regra de decisão. Em geral, a regra de decisão é: rejeitar a hipótese nula se o valor calculado de
VR for igual ou maior que o valor crítico de F para o nível a escolhido.
7. Cálculo da estatística de teste. Definimos análise de variância como um processo pelo qual a
variação total presente em um conjunto de dados é particionada em componentes que são
atribuíveis a diferentes fontes. O termo variação usado neste contexto refere-se à soma dos
desvios quadrados das observações de sua média, ou soma dos quadrados para abreviar.
Os cálculos iniciais realizados na ANOVA de uma via consistem na partição da variação total
presente nos dados observados em seus componentes básicos, cada um dos quais é atribuível a uma
fonte identificável.
Aqueles que usam um computador para cálculos podem pular a discussão a seguir
dos cálculos envolvidos na obtenção da estatística de teste.
A Soma Total dos Quadrados Antes de podermos fazer qualquer particionamento, devemos primeiro
obter a soma total dos quadrados. A soma total dos quadrados é a soma dos quadrados dos desvios
das observações individuais da média de todas as observações tomadas em conjunto.
Esta soma total de quadrados é definida como
k
2
SST ¼ X Xnj xij x:: (8.2.2)
j¼1 i¼1
onde Snj i¼1 nos diz para somar os desvios quadrados para cada grupo de tratamento, e Sk diz-nos
j¼1
para somar os k totais do grupo obtidos pela aplicação de i¼1. O leitor reconhecerá a Equação
Snj 8.2.2 como o numerador da variância que pode ser calculada a partir do conjunto completo de
observações tomadas em conjunto.
A soma dos quadrados dentro dos grupos Agora vamos mostrar como calcular o primeiro dos dois
componentes da soma total dos quadrados.
A primeira etapa do cálculo exige a realização de certos cálculos dentro de cada grupo. Esses
cálculos envolvem computar dentro de cada grupo a soma dos desvios quadrados das observações
individuais de sua média. Quando esses cálculos são realizados dentro de cada grupo, obtemos a soma
dos resultados dos grupos individuais. Este componente de variação é chamado de soma dos quadrados
dentro dos grupos e pode ser designado por SSW. Essa quantidade às vezes é chamada de resíduo ou
soma de quadrados de erro. A expressão para esses cálculos é escrita da seguinte forma:
k
2
SSW ¼ X Xnj xij x:j (8.2.3)
j¼1 i¼1
A soma dos quadrados entre grupos Para obter o segundo componente da soma total
dos quadrados, calculamos para cada grupo o desvio quadrado da média geral do grupo
e multiplicamos o resultado pelo tamanho do grupo. Por fim, adicionamos esses
resultados a todos os grupos. Essa quantidade é uma medida da variação entre os
grupos e é chamada de soma dos quadrados entre os grupos ou SSA. A fórmula para
calcular essa quantidade é a seguinte:
k
2
SSA ¼ X njx :jx :: (8.2.4)
j¼1
Em resumo, descobrimos que a soma total dos quadrados é igual à soma dos
o entre e o dentro da soma dos quadrados. Expressamos essa relação da seguinte forma:
SST ¼ SSA þ SSW
A partir das somas dos quadrados que agora aprendemos a calcular, é possível obter duas
estimativas da variância comum da população, s2. Pode-se mostrar que, quando as
suposições são atendidas e as médias da população são todas iguais, tanto a soma dos
quadrados entre quanto a soma dos quadrados, quando dividida por seus respectivos
graus de liberdade, produz estimativas independentes e imparciais de s2.
A primeira estimativa de s2 Dentro de qualquer amostra,
2
Xnj xij x:j
i¼1
1
nj
fornece uma estimativa imparcial da verdadeira variância da população da qual a amostra veio.
Sob a suposição de que as variâncias populacionais são todas iguais, podemos agrupar as k
estimativas para obter
k
2
x Xnj xij x:j
MSW ¼ j¼1 i¼1
(8.2.5)
k
x 1
nj
j¼1
Esta é a nossa primeira estimativa de s2 e pode ser chamada de variância dentro dos grupos,
uma vez que é a soma dos quadrados dentro dos grupos da Equação 8.2.3 dividida pelos
graus de liberdade apropriados. O aluno reconhecerá isso como uma extensão para k
amostras do procedimento de agrupamento de variâncias encontrado nos Capítulos 6 e 7,
quando as variâncias de duas amostras foram reunidas para usar a distribuição t. A
quantidade na Equação 8.2.5 costuma ser chamada de quadrado médio dentro dos grupos,
em vez de variância dentro dos grupos.
O quadrado médio dentro dos grupos é uma estimativa válida de s2 somente se as variâncias
populacionais forem iguais. Não é necessário, entretanto, que H0 seja verdadeira para que o quadrado
médio dentro dos grupos seja uma estimativa válida de s2; ou seja, o quadrado médio dentro dos
grupos estima s2 independentemente de H0 ser verdadeiro ou falso, desde que as variâncias
populacionais sejam iguais.
A segunda estimativa de s2 A segunda estimativa de s2 pode ser obtida a partir da

fórmula familiar para a variância das médias amostrais, s2 ¼ s2=n. Se resolvermos
x equação para s2, a esta
variância da população da qual as amostras foram retiradas, teremos
tenho
s2 ¼ ns2 (8.2.6)
x
Uma estimativa imparcial de s2 calculada

x a partir de dados de amostra é fornecida por
k
2
P x:j x::
j¼1
k1
Se substituirmos essa quantidade na Equação 8.2.6, obteremos a estimativa desejada de s2,
k
2
nP x:j x::
j¼1
MSA ¼ (8.2.7)
k1
O leitor reconhecerá o numerador da Equação 8.2.7 como a soma dos quadrados entre
grupos para o caso especial em que todos os tamanhos de amostra são iguais. Esta soma de
quadrados quando dividida pelos graus de liberdade associados k 1 é chamada de quadrado
médio entre os grupos.
Quando os tamanhos das amostras não são todos iguais, uma estimativa de s2 com base na variabilidade
entre as médias das amostras é fornecida por
k
2
P nj x:j x::j¼1
MSA ¼ (8.2.8)
k1
Se, de fato, a hipótese nula for verdadeira, esperaríamos que essas duas estimativas de s2
fossem razoavelmente próximas em magnitude. Se a hipótese nula for falsa, ou seja, se todas as
médias populacionais não forem iguais, esperaríamos que o quadrado médio entre os grupos, que é
calculado usando os desvios quadrados das médias amostrais da média geral, fosse maior do que
dentro grupos significam quadrado.
Para entender a análise de variância, devemos perceber que o quadrado médio
entre os grupos fornece uma estimativa válida de s2 quando a suposição de população igual
variâncias é atendida e quando H0 é verdadeiro. Ambas as condições, uma hipótese nula verdadeira e variâncias
populacionais iguais, devem ser atendidas para que o quadrado médio entre os grupos seja uma estimativa válida
de s2.
A Razão de Variância O que precisamos fazer agora é comparar essas duas estimativas de s2, e fazemos isso
calculando a seguinte razão de variância, que é a desejada
Estatística de teste:
entre os grupos quadrado médio MSA

V:R: ¼ ¼
dentro dos grupos significa quadrado MSW
Se as duas estimativas forem aproximadamente iguais, VR estará próximo de 1. Uma razão próxima de 1 tende a
apoiar a hipótese de médias populacionais iguais. Se, por outro lado, o quadrado médio entre os grupos for
consideravelmente maior do que o quadrado médio dentro dos grupos, VR será consideravelmente maior que 1.
Um valor de VR suficientemente maior que 1 lançará dúvidas sobre a hipótese de médias populacionais iguais.
Sabemos que, devido aos caprichos da amostragem, mesmo quando a hipótese nula é verdadeira, é
improvável que os quadrados médios entre e dentro dos grupos sejam iguais. Devemos decidir, então, quão
grande deve ser a diferença observada antes de podermos concluir que a diferença se deve a algo diferente da
flutuação da amostragem. Em outras palavras, quão grande é o valor de VR necessário para estarmos dispostos
a concluir que a diferença observada entre nossas duas estimativas de s2 não é resultado apenas do acaso?
O Teste F Para responder à questão que acabamos de colocar, devemos considerar a distribuição amostral da
razão de duas variâncias amostrais. No Capítulo 6, aprendemos que a quantidade s2 1=s2 1 = s2 2=s2 2 segue
uma distribuição
amostrasconhecida
aleatórias
por RAcomo
eFisher
extraídas
distribuição
no início
independentemente
da
F quando
década as
de variâncias
1920,
de populações
tornou-se
da amostra
uma
normais.
das
sãodistribuições
A
calculadas
distribuição
amais
partir
F, introduzida
usadas
de
na estatística moderna. Já nos familiarizamos com seu uso na construção de intervalos de confiança e no teste de
hipóteses sobre variâncias populacionais. Neste capítulo, veremos que é a distribuição fundamental para a análise
de variância. Por esta razão, a razão que designamos por VR é frequentemente referida como F, e o procedimento
de teste é frequentemente chamado de teste F. É interessante notar que a distribuição F é a proporção de duas
distribuições Qui-quadrado.
No Capítulo 7, aprendemos que quando as variâncias da população são as mesmas, elas se cancelam na
expressão s2 1=s2 1 = s2 2=s2 2uma
, deixando
famílias2
de1=s2
distribuições,
2, que é distribuído
e adeterminada
distribuição
comoFsituação
F.
particular
A distribuição
depende
que usamos
Fdo
é realmente
número
em uma
de
graus de liberdade associados à variância da amostra no numerador (graus de liberdade do numerador) e do
número de graus de liberdade associados à variância da amostra no denominador (graus de liberdade do
denominador).
Uma vez determinada a distribuição F apropriada, o tamanho do VR observado que causará a rejeição da
hipótese de variâncias populacionais iguais depende do nível de significância escolhido. O nível de significância
escolhido determina o valor crítico de F, o valor que separa a região de não rejeição da região de rejeição.
TABELA 8.2.2 Análise da Tabela de Variância para o Desenho Completamente Aleatório
Fonte de Graus de variância

Variação soma dos quadrados Liberdade quadrado médio Razão
2 MSA
Entre as amostras SSA ¼ Pk nj xj x:: k1 MSA ¼ SSA=ð Þ k 1 V:R ¼
j¼1 MSW
2
Dentro das amostras SSW ¼ Pk Pnj xij xj Nk MSW ¼ SSW=ð Þ N k
j¼1 i¼1
2
Total SST ¼ Pk Pnj xij x:: N1
j¼1 i¼1
Como vimos, calculamos VR em situações desse tipo colocando o quadrado médio

entre grupos no numerador e o quadrado médio dentro de grupos no denominador, de modo
que os graus de liberdade do numerador sejam iguais 1, , Þ o dos
a ðe ko denominador
1valor número
graus
éde
igual
de
grupos
liberdade
a menos do
k k
X nj 1 ¼ X
j¼1 j¼1 nj ! k ¼ N k
A Tabela ANOVA Os cálculos que realizamos podem ser resumidos e exibidos em uma
tabela como a Tabela 8.2.2 , que é chamada de tabela ANOVA.
8. Decisão estatística. Para chegar a uma decisão, devemos comparar nosso VR

calculado com o valor crítico de F, que obtemos entrando na Tabela G do Apêndice
com k 1 graus de liberdade do numerador e N k graus de liberdade do denominador.
Se o VR calculado for igual ou maior que o valor crítico de F, rejeitamos a hipótese nula.
Se o valor calculado de VR for menor que o valor crítico de F, não rejeitamos a hipótese
nula.
Explicando uma hipótese nula rejeitada Há duas explicações possíveis para uma hipótese
nula rejeitada. Se a hipótese nula for verdadeira, ou seja, se as duas variâncias amostrais
forem estimativas de uma variância comum, sabemos que a probabilidade de obter um
valor de VR tão grande ou maior que o F crítico é igual ao nosso nível de significância
escolhido . Quando rejeitamos H0 podemos, se quisermos, concluir que a hipótese nula é
verdadeira e assumir que por acaso obtivemos um conjunto de dados que deu origem a um
evento raro. Por outro lado, podemos preferir assumir a posição de que nosso grande valor
de VR calculado não representa um evento raro causado pelo acaso, mas, em vez disso,
reflete o fato de que algo diferente do acaso está operando. Concluímos então que temos
uma hipótese nula falsa.
É esta última explicação que normalmente damos para valores calculados de VR que excedem
o valor crítico de F. Em outras palavras, se o valor calculado de VR for maior que o valor crítico de F,
rejeitamos a hipótese nula.
Recorde-se que a hipótese original que nos propusemos a testar era
H0 : m1 ¼ m2 ¼¼ mk
A rejeição da hipótese sobre variâncias implica uma rejeição da hipótese de médias populacionais iguais?
A resposta é sim. Um grande valor de VR resultou do fato de que o quadrado médio entre os grupos era
consideravelmente maior do que o quadrado médio dentro dos grupos. Como o quadrado médio entre os
grupos é baseado na dispersão das médias amostrais em torno de suas médias (chamado de grande
média), essa quantidade será grande quando houver uma grande discrepância entre os tamanhos das
médias amostrais. Por causa disso, então, um valor significativo de VR nos diz para rejeitar a hipótese
nula de que todas as médias populacionais são iguais.
9. Conclusão. Quando rejeitamos H0, concluímos que nem todas as médias populacionais são iguais.
Quando falhamos em rejeitar H0, concluímos que as médias populacionais não são
significativamente diferentes umas das outras.
EXEMPLO 8.2.1
As carnes de caça, incluindo as de cervos de cauda branca e esquilos cinzentos orientais, são usadas
como alimento por famílias, caçadores e outros indivíduos por motivos de saúde, culturais ou pessoais.
Um estudo de David Holben (A-1) avaliou o teor de selênio da carne de veado de cauda branca (veado)
e esquilo cinza (esquilo) obtido de uma região com baixo teor de selênio nos Estados Unidos. Esses
valores de teor de selênio também foram comparados aos da carne bovina produzida dentro e fora da
mesma região. Queremos saber se os níveis de selênio são diferentes entre os quatro grupos de carnes.
Solução:
1. Descrição dos dados. O teor de selênio da carne de veado crua (VEN), carne de
esquilo (SQU), carne bovina criada na região (RRB) e carne bovina não criada na
região (NRB), em mg = 100 g de peso seco, é mostrado na Tabela 8.2.3. Um gráfico
dos dados na forma de um dotplot é mostrado na Figura 8.2.4. Esse gráfico destaca
as principais características dos dados e destaca claramente as diferenças nos
níveis de selênio entre as diferentes carnes.
TABELA 8.2.3 Teor de Selênio, em mg=100 g, de Quatro Diferentes Tipos de Carne
Tipo de carne
VEN SQU RRB NRB
26,72 14.86 37.42 37,57 11.23 15.82 44. 33

28.58 16.47 56,46 25.71 29.63 27.74 76,86
29.71 25.19 51,91 23,97 20.42 22h35 4,45
26,95 37,45 62,73 13.82 10.12 34,78 55.01
10.97 45.08 4,55 42.21 39,91 35.09 58.21
21.97 25.22 39.17 35,88 32,66 32,60 74,72
(Contínuo)
Tipo de carne
VEN SQU RRB NRB
14h35 22.11 38,44 10.54 38.38 37.03 11.84

32.21 33.01 40,92 27,97 36.21 27h00 139.09
19.19 31.20 58,93 41,89 16.39 44,20 69.01
30,92 26,50 61,88 23,94 27.44 13.09 94,61
10.42 32,77 49,54 49,81 17.29 33.03 48,35
35,49 8,70 64,35 30.71 56,20 9.69 37,65
36,84 25,90 82,49 50,00 28,94 32.45 66,36
25.03 29,80 38,54 87,50 20.11 37.38 72,48
33.59 37,63 39,53 68,99 25.35 34,91 87.09
33,74 21.69 21.77 27,99 26.34
18.02 21h49 31.62 22.36 71,24
22.27 18.11 32.63 22.68 90,38
26.10 31,50 30.31 26.52 50,86
20.89 27.36 46.16 46.01
29.44 21.33 56,61 38.04
24.47 30,88
29.39 30.04
40,71 25.91
18.52 18.54
27,80 25.51
19h49
Fonte: Dados fornecidos por cortesia de David H. Holben, Ph.D.
2. Suposições. Assumimos que os quatro conjuntos de dados constituem

amostras aleatórias simples independentes das quatro populações
indicadas. Assumimos que as quatro populações de medições são
normalmente distribuídas com variâncias iguais.
VEN
SQU
carne
tipo
de
RRB
NRB
0 20 40 60 80 100 120 140
Teor de selênio (mg/100 g de peso seco)
FIGURA 8.2.4 Teor de selênio de quatro tipos de carne. VEN ¼ carne de veado, SQU ¼ esquilo, RRB ¼ carne bovina
produzida na região e NRB ¼ carne bovina não produzida na região.
TABELA 8.2.4 Tabela ANOVA para o Exemplo 8.2.1
Fonte SS df EM F
Entre as amostras 21261.82886 3 7087.27629 27.00

Dentro das amostras 36747.22674 140 262.48019
Total 58009.05560 143
3. Hipóteses. H0 : m1 ¼ m2 ¼ m3 ¼ m4 (Em média, as quatro carnes têm o

mesmo teor de selênio.)
HA: Nem todos os m's são iguais (pelo menos uma carne produz um teor
médio de selênio diferente do teor médio de selênio de pelo menos uma outra
carne).
4. Estatística de teste. A estatística de teste é V:R: ¼ MSA=MSW.

5. Distribuição da estatística de teste. Se H0 for verdadeiro e as suposições forem
atendidas, o VR segue a distribuição F com 4 1 ¼ 3 graus de liberdade no
numerador e 144 4 ¼ 140 graus de liberdade no denominador.
6. Regra de decisão. Suponha que deixamos a ¼ :01. O valor crítico de F da
Tabela G do Apêndice é < 3:95. A regra de decisão, então, é rejeitar H0 se a
estatística VR calculada for igual ou maior que 3,95.
SST ¼ 58009:05560
Pela Equação 8.2.4 calculamos

SSA ¼ 21261:82886
SSW ¼ 58009:05560 21261:82886 ¼ 36747:22674
Os resultados de nossos cálculos são exibidos na Tabela 8.2.4.

8. Decisão estatística. Como nosso F calculado de 27,00 é maior que 3,95,
rejeitamos H0.
9. Conclusão. Como rejeitamos H0, concluímos que a hipótese alternativa é
verdadeira. Ou seja, concluímos que os quatro tipos de carne não têm todos o
mesmo teor médio de selênio.
10. valor p. Desde 27:00 > 3:95; p < :01 para este teste. &
Uma palavra de cautela O delineamento inteiramente aleatório é simples e, portanto, amplamente

utilizado. Deve ser utilizado, porém, somente quando as unidades que recebem os tratamentos
forem homogêneas. Se as unidades experimentais não forem homogêneas, o pesquisador deve
considerar um projeto alternativo, como um dos que serão discutidos mais adiante neste capítulo.
Em nosso exemplo ilustrativo, os tratamentos são tratamentos no sentido usual da palavra.
No entanto, nem sempre é esse o caso, pois o termo “tratamento” usado no planejamento
experimental é bastante geral. Podemos, por exemplo, desejar estudar a resposta ao mesmo
Stat ANOVA Unidirecional (Desempilhado) MTB>AOVONEWAY C1-C4
Digite C1-C4 nas respostas (em colunas separadas)

Clique em OK.
Saída:
ANOVA unidirecional: NRB, RRB, SQU, VEN
Análise de variância para selênio
Fonte DF SS EM F P
Tipo de carne 3 21262 7087 27,00 0,000 262
Erro 140 36747 143
Total 58009
ICs individuais de 95% para média
Baseado em StDev agrupado

Nível N StDev médio -------+---------+--------+----------
51.1350.2691BRN 29,08 10,38 43,25 19,51 25,88 8,03 )----*----(
RRB 53 (--*--)
SQU 30 (---*---)
VEN 42 (--*---)
-------+---------+--------+----------
StDeV agrupado = 16,20 30 45 60
tratamento (no sentido usual da palavra) de várias raças de animais. Gostaríamos, no entanto, de nos
referir à raça do animal como o “tratamento”.
Devemos também destacar que, embora as técnicas de análise de variância sejam mais
frequentemente aplicadas a dados resultantes de experimentos controlados, as técnicas também podem
ser usadas para analisar dados coletados por uma pesquisa, desde que as suposições subjacentes
sejam razoavelmente bem atendidas.
Análise de computador A Figura 8.2.5 mostra o procedimento de computador e a saída para o Exemplo
8.2.1 fornecidos por um programa de análise de variância unidirecional encontrado no pacote do
MINITAB. Os dados foram inseridos nas Colunas 1 a 4. Ao comparar a tabela ANOVA nesta impressão
com a fornecida na Tabela 8.2.4, você verá que a impressão usa o rótulo “fator” em vez de “entre
amostras”. Os diferentes tratamentos são referidos na impressão como níveis. Assim, nível 1 ¼
tratamento 1, nível 2 ¼ tratamento 2 e assim por diante. A impressão fornece as quatro médias e desvios
padrão da amostra, bem como os valores agrupados
O Sistema SAS
Procedimento de análise de variância
Variável dependente: selen
Soma de
Fonte DF Quadrados Médios Quadrados Valor F Pr > F 27,00 <,0001
Modelo 3 21261.82886 7087.27629
Erro 140 36747.22674 262.48019
Total Corrigido 143 58009.05560
R-Square Coeff Var Root MSE 0,366526 45,70507 selen significa

16,20124 35.44736
FIGURA 8.2.6 Impressão SAS® parcial para o Exemplo 8.2.1.
desvio padrão. Esta última quantidade é igual à raiz quadrada do quadrado médio do erro mostrado
na tabela ANOVA. Finalmente, a saída do computador fornece representações gráficas dos
intervalos de confiança de 95% para a média de cada uma das quatro populações representadas
pelos dados da amostra.
A Figura 8.2.6 contém uma impressão SAS® parcial resultante da análise dos dados do
Exemplo 8.2.1 por meio do uso da instrução SAS® PROC ANOVA. O SAS® calcula algumas
quantidades adicionais conforme mostrado na saída. R-Quadrado ¼ SSA=SST. Essa quantidade
nos diz qual proporção da variabilidade total presente nas observações é explicada por diferenças
em resposta aos tratamentos. C:V: ¼ 100 (raiz MSE/selen média). A raiz MSE é a raiz quadrada
de MSW e a média de selen é a média de todas as observações.
Observe que a estatística de teste VR é rotulada de forma diferente por diferentes programas
de software estatístico. O MINITAB, por exemplo, usa F em vez de VR SAS® usa o
etiqueta Valor F.
Um dispositivo útil para exibir características importantes de um conjunto de dados
analisados pela análise de variância unidirecional é um gráfico que consiste em boxplots lado a
lado. Para cada amostra, um boxplot é construído usando o método descrito no Capítulo 2. A
Figura 8.2.7 mostra os boxplots lado a lado para o Exemplo 8.2.1. Observe que na Figura 8.2.7 a
variável de interesse é representada pelo eixo vertical em vez do eixo horizontal.
Alternativas Se os dados disponíveis para análise não atenderem às suposições para análise de
variância de uma via conforme discutido aqui, pode-se considerar o uso do procedimento de
Kruskal-Wallis, uma técnica não paramétrica discutida no Capítulo 13.
Testando diferenças significativas entre pares individuais de médias Quando a análise de variância
leva à rejeição da hipótese nula de nenhuma diferença entre as médias populacionais, surge
naturalmente a questão sobre quais pares de médias são diferentes. Na verdade, o desejo, na
maioria das vezes, é realizar um teste de significância em cada par de meios de tratamento. Por
exemplo, em
150
*
100
Selênio
g)mg/
(100
*
50
0
NRB RRB SQU VEN
tipo de carne
FIGURA 8.2.7 Boxplots lado a lado para o Exemplo 8.2.1.
Exemplo 8.2.1, onde há quatro tratamentos, podemos desejar saber, após rejeitar H0 : m1
¼ m2 ¼ m3 ¼ m4, qual das seis possíveis hipóteses individuais deve ser rejeitada. O
experimentador, no entanto, deve ter cuidado ao testar diferenças significativas entre as
médias individuais e deve sempre certificar-se de que o procedimento é válido. A questão
crítica no procedimento é o nível de significância. Embora a probabilidade, a, de rejeitar
uma hipótese nula verdadeira para o teste como um todo seja pequena, a probabilidade de
rejeitar pelo menos uma hipótese verdadeira quando vários pares de médias são testados
é, como vimos, maior que a. Existem vários procedimentos de comparação múltipla
comumente usados na prática. Abaixo, ilustramos dois procedimentos populares, ou seja,
o teste HSD de Tukey e o método de Bonferroni. O aluno interessado é encaminhado para
os livros de Hsu (7) e Westfall et al. (8) para técnicas adicionais.
Teste HSD de Tukey Ao longo dos anos, vários procedimentos para fazer comparações múltiplas
foram sugeridos. Um procedimento de comparação múltipla desenvolvido por Tukey (9) é
freqüentemente usado para testar a hipótese nula de que todos os pares possíveis de médias de
tratamento são iguais quando as amostras são todas do mesmo tamanho. Quando este teste é
empregado, selecionamos um nível de significância geral de a. A probabilidade é a, então, de que
uma ou mais das hipóteses nulas seja falsa.
O teste de Tukey, geralmente chamado de teste HSD (diferença honestamente
significativa), utiliza um único valor com o qual todas as diferenças são comparadas. Este
valor, chamado de HSD, é dado por
fffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
MSE
HSD ¼ qa;k;Nk (8.2.9)
nº
onde a é o nível de significância escolhido, k é o número de médias no experimento, N é o

número total de observações no experimento, n é o número de observações em um
tratamento, MSE é o erro ou dentro do quadrado médio do Tabela ANOVA, e q é obtido
inserindo a Tabela H do Apêndice com a, k e N k.
A estatística q, tabelada na Tabela H do Apêndice, é conhecida como a estatística do intervalo

estudantil. É definido como a diferença entre a maior e a menor média de tratamento de uma ANOVA
(ou seja, é o intervalo das médias de tratamento) dividida pelo quadrado médio do erro sobre n, o
número de observações em um tratamento. A faixa estudantil é discutida em detalhes por Winer (10).
Todas as possíveis diferenças entre pares de médias são computadas, e qualquer diferença
que produz um valor absoluto que excede HSD é declarado significativo.
Teste de Tukey para tamanhos de amostras desiguais Quando as amostras não são todas do
mesmo tamanho, como é o caso do Exemplo 8.2.1, o teste HSD de Tukey dado pela Equação
8.2.9 não é aplicável. O próprio Tukey (9) e Kramer (11), no entanto, estenderam o procedimento
de Tukey para o caso em que os tamanhos das amostras são diferentes. Seu procedimento, às
vezes chamado de método de Tukey-Kramer, consiste em substituir MSE/n na Equação 8.2.9 por
ð Þ MSE=2 1=ni þ 1=nj , onde
comparado. ni e nj são
Se designarmosde os tamanhos
teste
a nova amostrais
quantidade dos dois
por HSD grupos
temos comopara
novoser
critério
,
MSE 1 1
þ (8.2.10)
HSD ¼ qa;k;Nk 2 ni nj
s
Qualquer valor absoluto da diferença entre duas médias de amostra que exceda HSD é
declarado significativo.
Método de Bonferroni Outro teste de comparação múltipla muito usado é baseado em um método
desenvolvido por CE Bonferroni. Assim como no método de Tukey, desejamos manter um nível de
significância geral de a para o total de todos os testes pareados.
No método de Bonferroni, simplesmente dividimos o nível de significância desejado pelo número
de pares individuais que estamos testando. Ou seja, em vez de testar em um nível de significância
a, testamos em um nível de significância a=k, onde k é o número de comparações pareadas. A
soma de todos os termos a=k não pode, então, possivelmente exceder nosso nível declarado de
a. Por exemplo, se alguém tiver três amostras, A, B e C, haverá k ¼ 3 comparações de pares.
Estes são mA ¼ mB; mA ¼ mC e mB ¼ mC. Se escolhermos um nível de significância de a ¼ :05,
prosseguiremos com as comparações e usaremos um nível de significância corrigido por Bonferroni
de a=3 ¼ :017. Portanto, nosso valor de p não deve ser maior que :017 para rejeitar a hipótese
nula e concluir que duas médias diferem.
A maioria dos pacotes de computador computa valores usando o método de Bonferroni e

produz uma saída semelhante ao HSD de Tukey ou outros procedimentos de comparação múltipla.
Em geral, essas saídas relatam o valor real de p corrigido usando o método de Bonferroni. Dada a
relação básica de que p ¼ a=k, então algebricamente podemos multiplicar ambos os lados da
equação por k para obter a ¼ pk. Em outras palavras, o total a é simplesmente a soma de todos
os valores de pk, e o valor de p real corrigido é simplesmente o valor de p calculado multiplicado
pelo número de testes que foram realizados.
EXEMPLO 8.2.2
Vamos ilustrar o uso do teste HSD com os dados do Exemplo 8.2.1.
Solução: O primeiro passo é preparar uma tabela com todas as possíveis diferenças (ordenadas)
entre as médias. Os resultados desta etapa para o presente exemplo são exibidos
na Tabela 8.2.5.
Suponha que deixamos um ¼ :05. Entrando na Tabela H com a ¼ :05, k ¼ 4 e N k ¼ 140,

descobrimos que q < 3:68. O valor real é q ¼ 3:667, que pode ser obtido no SAS®.
Na Tabela 8.2.4 temos MSE ¼ 262:4802.
As hipóteses que podem ser testadas, o valor de HSD , e a decisão estatística para
cada teste são mostrados na Tabela 8.2.6.
O SAS® usa o procedimento de Tukey para testar a hipótese de não haver diferença entre
as médias populacionais para todos os pares possíveis de médias amostrais. A saída também contém
TABELA 8.2.5 Diferenças entre médias amostrais

(valor absoluto) para o exemplo 8.2.2
VEN RRB SQR NRB
VEN – 3.208 17h37 36.171

RRB – 14.163 32.963
SOU – 18.801
NRB –
TABELA 8.2.6 Testes de Comparação Múltipla Usando Dados do Exemplo 8.2.1 e HSD
hipóteses HSO Decisão Estatística

ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
262:4802 1 1
H0: mVEN ¼ mRRB HSD ¼ 3:677 þ ¼ 8:68 Não rejeite H0
2 42 53
s desde 3:208 < 8:68
262:4802 1 1
H0: mVEN ¼ mSQU HSD ¼ 3:677 þ ¼ 10:04 Rejeitar H0
2 42 30
s desde 17:37 > 10:04
262:4802 1 1
H0: mVEN ¼ mNRB HSD ¼ 3:677 þ ¼ 11:61 Rejeitar H0
2 42 19
s desde 36:171 > 11:61
262:4802 1 1
H0: mRRB ¼ mSQU HSD ¼ 3:677 þ ¼ 9:60 Rejeitar H0
2 53 30
s desde 14:163 > 9:60
262:4802 1 1
H0: mRRB ¼ mNRB HSD ¼ 3:677 þ ¼ 11:23 Rejeitar H0
2 53 19
s desde 32:963 > 11:23
262:4802 1 1
H0: mSQU ¼ mNRB HSD ¼ 3:677 þ ¼ 12:32 Rejeitar H0
2 30 19
s desde 18:801 > 12:32
O Sistema SAS
Teste de alcance estudantil de Tukey (HSD) para selen
NOTA: Este teste controla a taxa de erro Experimentwise Tipo I.
ahplA 50,0
modeerF fo seergeD rorrE erauqS naeM rorrE 041
2084.262
Valor crítico da faixa estudantil 3.67719
Comparações significativas no nível 0,05 são indicadas por ***.
Diferença
tipo Entre Simultâneo 95%

Comparação Meios Limites de confiança
NRB - SQU 18.801 6.449 31.152 ***

NRB - RRB 32.963 21.699 44.228 ***
NRB - VEN 36.171 24.524 47.818 ***
SQU - NRB -18.801 -31.152 -6.449 ***
SQU - RRB 14.163 4.538 23.787 ***
SQU - VEN 17.370 7.300 27.440 ***
RRB - NRB -32.963 -44.228 -21.699 ***
RRB - SQU -14.163 -23.787 -4.538 ***
RRB - VEN 3.208 -5,495 11.910
VEN - NRB -36.171 -47.818 -24.524 ***
VEN - SQU -17.370 -27.440 -7.300 ***
VEN - RRB -3.208 -11.910 5.495
FIGURA 8.2.8 Comparações múltiplas SAS® para o Exemplo 8.2.1.
intervalos de confiança para a diferença entre todos os pares possíveis de médias populacionais. Esta
saída SAS para o Exemplo 8.2.1 é exibida na Figura 8.2.8.
Pode-se também usar o SPSS para realizar comparações múltiplas por uma variedade de métodos,
incluindo o de Tukey. As saídas do SPSS para o HSD de Tukey e o método de Bonferroni para os dados
do Exemplo 8.2.1 são mostrados nas Figuras 8.2.9 e 8.2.10, respectivamente. As saídas contêm uma
comparação exaustiva das médias das amostras, junto com os erros padrão associados, valores p e
intervalos de confiança de 95%. &
Múltiplas Comparações
Variável dependente: selênio

Tukey HSD
Significar Intervalo de confiança de 95%

Diferença
(I) Tipo_de_carne (J) Tipo_de_carne (EU J) Padrão Sinal de erro Limite Inferior Limite Superior
VEN SQU 17.370190* 3.872837210 .000 3.2075427 27.44017302 7.30020793

RRB 3.346936628 .773.000
36.170840* 4.479316382 11.91010145 5.49501609
NRB 47.81776286 24.52391634
SQU VEN 17.370190* 3.872837210 .000 7.30020793 14.162648* 27.44017302

RRB 3.701593729 .001 4.53792509 18.800649* 4.750167007
31.15182638
.001 23.78737051
NRB 6.44947187
RRB VEN 3.2075427 3.346936628 .773 5.49501609 14.162648* 11.91010145

SQU 3.701593729 .001 23.78737051 32.963297* 4.332113033 .000 4.53792509
NRB 44.22746845 21.69912540
NRB VEN 36.170840* 4.479316382 .000 24.52391634 47.81776286 18.800649* 4.750167007 .001 6.44947187 31.15182638
SQU 32.963297*
RRB 4.33322113131313121313131212121212121212121212121212121212121212121212121212121212121212121212121212121212121212121212
* A diferença média é significativa no nível 0,05.
FIGURA 8.2.9 Saída SPSS para HSD de Tukey usando dados do Exemplo 8.2.1.
Múltiplas Comparações
Variável dependente: selênio

Bonferroni
Significar Intervalo de confiança de 95%

Diferença
(I) Tipo_de_carne (J) Tipo_de_carne (EU J) Padrão Sinal de erro Limite Inferior Limite Superior
VEN RRB 3,20754 3,34694 1,000 3,87284 12.1648 5.7497

SQU 17,37019* ,000 4,47932 ,000 27.7349 7.0055
NRB 36,17084* 48.1587 24.1830
RRB VEN 3,20754 3,34694 1,000 3,70159 5.7497 12.1648

SQU 14,16265* ,001 4,33211 ,000 24.0691 4.2562
NRB 32,96330* 44.5572 21.3694
SQU VEN 17.37019* 3,87284 .000 7,0055 27.7349

RRB 14.16265* 3,70159 .001 4,2562 24.0691
NRB 18.80065* 4,75017 .001 31,5134 6.0879
NRB VEN 36.17084* 4,47932 .000 24.1830 48.1587

RRB 32.96330* 4,33211 .000 21.3694 44.5572
SQU 18.80065* 4,75017 .001 6.0879 31.5134
* A diferença média é significativa no nível 0,05.
FIGURA 8.2.10 Saída SPSS para o método de Bonferroni usando dados do Exemplo 8.2.1.
327
EXERCÍCIOS
Nos Exercícios 8.2.1 a 8.2.7, percorra os dez passos da análise de teste de hipótese de variância para ver se você
pode concluir que há uma diferença entre as médias populacionais. Deixe um ¼ :05 para cada teste. Use o
procedimento HSD de Tukey para testar diferenças significativas entre pares individuais de médias (se apropriado).
Use o mesmo valor para o teste F. Construa um gráfico de pontos e gráficos de caixa lado a lado dos dados.
8.2.1. Pesquisadores da Case Western Reserve University (A-2) queriam desenvolver e implementar um transdutor, manejável
em ambiente clínico, para quantificar os momentos isométricos produzidos na articulação do cotovelo por indivíduos
com tetraplegia (paralisia ou paresia dos quatro membros). O aparelho, chamado de transdutor de momento do
cotovelo (EMT), mede a força que o cotovelo pode exercer ao flexionar. A variável de saída é a tensão. A máquina
foi testada em quatro ângulos de extensão de cotovelo diferentes, 30, 60, 90 e 120 graus, em um cotovelo simulado
composto por duas vigas de alumínio articuladas. Os dados são mostrados na tabela a seguir.
Ângulo do cotovelo (graus)
30 60 90 120
0,003 1.094 0,000 –0,001 0,000 0,007 0,558 0,003

0,050 1.061 0,053 0,010 0,006 0,012 0,529 0,062
0,272 1.040 0,269 0,028 0,026 0,039 0,524 0,287
0,552 1.097 0,555 0,055 0,053 0,080 0,555 0,555
1,116 1,080 1.103 0,105 0,108 0,118 0,539 1,118
2,733 1,051 2,727 0,272 0,278 0,291 0,536 2,763
0,000 1,094 0,002 0,553 0,555 0,602 0,557 0,006
0,056 1,075 0,052 0,840 0,834 0,884 0,544 0,050
0,275 1,035 0,271 1,100 1,106 1,176 0,539 0,277
0,556 1,096 0,550 1,647 1,650 1,725 1,109 0,557
1.100 1,100 1.097 2.728 2,729 0,003 1,085 1.113
2.723 1.096 2.725 0,001 0,005 0,003 1.070 2,759
0,003 1.108 0,003 0,014 0,023 0,011 1.110 0,010
0,055 1.099 0,052 0,027 0,037 0,060 1.069 0,060
0,273 1.089 0,270 0,057 0,046 0,097 1.045 0,286
0,553 1.107 0,553 0,111 0,134 0,320 1.110 0,564
1.100 1.094 1.100 0,276 0,297 0,593 1.066 1.104
2.713 1.092 2.727 0,555 0,589 0,840 1.037 2.760
0,007 1.092 0,022 0,832 0,876 1.168 2.728 0,003
0,066 1.104 0,075 1.099 1.157 1.760 2.694 0,060
0,258 1.121 0,298 1.651 1.755 0,004 2.663 0,289
0,581 1.106 0,585 2.736 2.862 0,566 2.724 0,585
1.162 1.135 1.168 0,564 0,000 1.116 2.693 1.180
0,008 1.143 0,017 0,556 0,245 2.762 2.670 0,000
0,045 1.106 0,052 0,555 0,497 0,563 2.720 0,034
0,274 1.135 0,258 0,567 0,001 0,551 2.688 0,295
0,604 1.156 0,548 0,559 0,248 0,551 2.660 0,579
1.143 1.112 1.187 0,551 0,498 0,561 0,556 1.165
0,004 1.104 0,019 1.107 0,001 0,555 0,560 0,019
(Contínuo)
EXERCÍCIOS 329
Ângulo do cotovelo (graus)
30 60 90 120
0,050 1.107 0,044 1.104 0,246 0,558 0,557 0,056

0,290 1.107 0,292 1.102 0,491 0,551 0,551 0,270
0,607 1.104 0,542 1.112 0,001 0,566 0,564 0,579
1.164 1.117 1.189 1.103 0,262 0,560 0,555 1.162
1.105 1.101 1.104 0,527 1.107 0,551
1.103 1.114 0,001 1.104 0,563
1.095 0,260 1.109 0,559
1.100 0,523 1.108 1.113
2.739 0,005 1.106 1.114
2.721 0,261 1.102 1.101
2.687 0,523 1.111 1.113
2.732 2.696 1.102 1.113
2,702 2.664 1,107 1,097
2,660 2,722 2,735 1,116
2,743 2,686 2,733 1,112
2,687 2,661 2,659 1,098
2,656 0,548 2,727 2,732
2,733 2,739 0,542 2,722
2,731 2,742 0,556 2.734
2,728 2.747
Fonte: Dados fornecidos por cortesia de SA Snyder, MS
8.2.2. Pacientes que sofrem de doenças reumáticas ou osteoporose frequentemente sofrem perdas críticas na densidade mineral
óssea (BMD). O alendronato é um medicamento prescrito para aumentar ou prevenir a perda adicional de DMO.
Holcomb e Rothenberg (A-3) analisaram 96 mulheres tomando alendronato para determinar se existia uma diferença na
variação percentual média na DMO entre cinco classificações diferentes de diagnóstico primário.
Os pacientes do grupo 1 foram diagnosticados com artrite reumatóide (AR). Os pacientes do grupo 2 eram uma coleção
mista de pacientes com doenças, incluindo lúpus, granulomatose de Wegener e poliarterite e outras doenças vasculíticas
(LUPUS). Os pacientes do grupo 3 apresentavam polimialgia reumática ou artrite temporal (PMRTA). Os pacientes do
grupo 4 apresentavam osteoartrite (OA) e os pacientes do grupo 5 apresentavam osteoporose (O) sem outras doenças
reumáticas identificadas no prontuário. As alterações na DMO são mostradas na tabela a seguir.
Diagnóstico
RA LÚPUS PMRTA OA O
11.091 7.412 2.961 3.669 11.146 2.937

24.414 5.559 0,293 7.816 0,838 15.968
10,025 4.761 8.394 4.563 4.082 5.349
3,156 3.527 2.832 0,093 6.645 1,719
6,835 4,839 1.369 0,185 4,329 6,445
3,321 1,850 11.288 1,302 1,234 20,243
1,493 3,933 3.997 5,299 2,817 3,290
(Contínuo)
Diagnóstico
RA LÚPUS PMRTA OA O
1.864 9.669 7.260 10.734 3.544 8.992

5.386 4.659 5.546 1.399 4.160 6.120
3.868 1.137 0,497 1.160 25.655
6.209 7.521 0,592 0,247
5.640 0,073 3.950 5.372
3.514 8.684 0,674 6.721
2.308 0,372 9.354 9.950
15.981 21.311 2.610 10.820
9.646 10.831 5.682 7.280
5.188 3.351 6.605
1.892 9.557 7.507
16.553 5.075
0,163
12,767
3,481
0,917
15,853
Fonte: Dados fornecidos por cortesia de John P. Holcomb, Ph.D. e Ralph J. Rothenberg, MD
8.2.3. Ilich-Ernst et al. (A-4) investigou a ingestão dietética de cálcio entre uma seção transversal de 113 mulheres saudáveis
com idades entre 20 e 88 anos. Os pesquisadores formaram quatro faixas etárias da seguinte forma: Grupo A, 20,0–
45,9 anos; grupo B, 46,0–55,9 anos; grupo C, 56,0–65,9 anos; e grupo D, acima de 66 anos. O cálcio da ingestão de
alimentos foi medido em mg/dia. Os dados abaixo são consistentes com as estatísticas resumidas fornecidas no artigo.
Faixas etárias (anos) Faixas etárias (anos)
UMA B C D AB C D
1820 191 724 1652 1020 775

2588 1098 613 1309 805 1393
2670 644 918 1002 631 533
1022 136 949 966 641 734
1555 1605 877 788 760 485
222 1247 1368 472 449
1197 1529 1692 471 236
1249 1422 697 771 831
1520 445 849 869 698
489 990 1199 513 167
2575 489 429 731 824
1426 2408 798 1130 448
1846 1064 631 1034 991
1088 629 1016 1261 590
912 1025 42 994
1383 948 767 1781
(Contínuo)
EXERCÍCIOS 331
Faixas etárias (anos) Faixas etárias (anos)
UMA B C D AB C D
1483 1085 752 937

1723 775 804 1022
727 1307 1182 1073
1463 344 1243 948
1777 961 985 222
1129 239 1295 721
944 1676 375
1096 754 1187
8.2.4. Ouro e outros. (A-5) investigaram a eficácia na cessação do tabagismo de um adesivo de nicotina, bupropiona SR ou ambos,
quando coadministrados com terapia cognitivo-comportamental. Pacientes consentidos consecutivos ð n ¼ 164 se atribuíram
a um dos três
fumavam
tratamentos
atualmente
º de acordo
por com
dia eaopreferência
número de pessoal:
anos queadesivo
fumavam.
de nicotina
O “maçoNTP
anos”
ð ðé Þ
o número
BNTP; nmédio
¼ 59 .de
cigarros
maçosque
que
o sujeito fumou por dia multiplicado
; ¼ 92 e bupropiona
pelo
Þ , bupropiona
númeroSRdemais
anos
SR Bð
adesivo
que
Þ nonicotina
¼sujeito
de , Os resultados são mostrados na tabela a seguir.
13 ; nfumou.
Na primeira aula para parar de fumar, os pacientes estimaram o número de maços de
Pacote anos
NTP B BNTP
15 8 60 90 8 80
17 10 60 90 15 80
18 15 60 90 25 82
20 20 60 95 25 86
20 22 60 96 25 87
20 24 60 98 26 90
30 25 60 98 30 90
37 26 66 99 34 90
43 27 66 100 35 90
48 29 67 100 36 90
60 30 68 100 40 95
100 30 68 100 45 99
100 35 70 100 45 100
35 70 100 45 102
39 70 105 45 105
40 75 110 48 105
40 75 110 48 105
40 75 120 49 111
40 75 120 52 113
40 76 123 60 120
40 80 125 60 120
45 80 125 60 125
45 80 126 64 125
(Contínuo)
Pacote anos
NTP B BNTP
45 80 130 64 129
50 80 130 70 130
51 80 132 70 133
52 80 132 70 135
55 84 142 75 140
58 84 157 75 154
60 84 180 76
60 90
Fonte: Dados fornecidos por cortesia de Paul B. Gold, Ph.D.
8.2.5. Em um estudo de Wang et al. (A-6), os pesquisadores examinaram a resistência óssea. Eles coletaram 10 fêmures
cadavéricos de indivíduos em três faixas etárias: jovens (19 a 49 anos), meia-idade (50 a 69 anos) e idosos (70 anos
ou mais). grupo]. Uma das medidas de resultado (W) foi a força em Newtons necessária para fraturar o osso. A tabela
a seguir mostra os dados para as três faixas etárias.
Jovem (Y) Meia-idade (MA) Idoso (E)
193,6 125,4 59,0

137,5 126,5 87,2
122,0 115,9 84,4
145,4 98,8 78.1
117,0 94,3 51,9
105.4 99,9 57.1
99,9 83,3 54,7
74,0 72,8 78,6
74,4 83,5 53,7
112,8 96,0
Fonte: Dados fornecidos por cortesia de Xiaodu Wang, Ph.D.
8.2.6. Em um estudo com 90 pacientes em diálise renal, Farhad Atassi (A-7) avaliou as práticas de cuidados orais domiciliares.
Ele coletou dados de 30 indivíduos que estavam em (1) diálise por menos de 1 ano, (2) diálise por 1 a 3 anos e (3)
diálise por mais de 3 anos. A tabela a seguir mostra as pontuações do índice de placa para esses indivíduos. Uma
pontuação mais alta indica uma maior quantidade de placa.
Grupo 1 Grupo 2 Grupo 3
2,00 2,67 2,83 2,83 1,83 1,83

1,00 2,17 2,00 1,83 2,00 2,67
2,00 1,00 2,67 2,00 1,83 1,33
1,50 2,00 2,00 1,83 1,83 2,17
2,00 2,00 2.83 2,00 2.83 3,00
1,00 2,00 2.17 2.17 2.17 2.33
(Contínuo)
EXERCÍCIOS 333
Grupo 1 Grupo 2 Grupo 3
1,00 2,33 2,17 1,67 2,83 2,50

1,00 1,50 2,00 2,33 2,50 2,83
1,00 1,00 2,00 2,00 2,17 2,83
1,67 2,00 1,67 2,00 1,67 2,33
1,83 .83 2.33 2.17 2.17 2.33
2.17 .50 2,00 3,00 1,83 2.67
1,00 2.17 1,83 2,50 2.83 2,00
2.17 2.33 1,67 2.17 2.33 2,00
2.83 2.83 2.17 2,00 2,00 2,00
Fonte: Dados fornecidos por cortesia de Farhad Atassi, DDS, MSC, FICOI.
8.2.7. A trombocitopenia é uma condição de plaquetas anormalmente baixas que geralmente ocorre durante a enterocolite
necrosante (NEC) – uma doença grave em bebês que pode causar danos nos tecidos do intestino.
Ragazzi et ai. (A-8) investigaram diferenças no log10 da contagem de plaquetas em 178 bebês com ECN.
Os pacientes foram agrupados em quatro categorias de status NEC. O grupo 0 refere-se a lactentes sem gangrena, o
grupo 1 refere-se a indivíduos em que a gangrena é limitada a um único segmento intestinal, o grupo 2 refere-se a
pacientes com dois ou mais segmentos intestinais de gangrena e o grupo 3 refere-se a pacientes com a maioria de
pequenos e intestino grosso envolvidos. A tabela a seguir fornece as contagens de plaquetas log10 para esses indivíduos.
Agrupamento Gangrena
0 1 23
1,97 2.33 2.48 1.38 2.45 1,87 2.37 1,77

0,85 2,60 2.23 1,86 2,60 1,90 1,75 1,68
1,79 1,88 2.51 2.26 1,83 2.43 2.57 1.46
2.30 2.33 2.38 1,99 2.47 1.32 1.51 1.53
1,71 2.48 2.31 1.32 1,92 2.06 1.08 1.36
2.66 2.15 2.08 2.11 2.51 1.04 2.36 1,65
2.49 1.41 2.49 2.54 1,79 1,99 1,58 2.12
2.37 2.03 2.21 2.06 2.17 1.52 1,83 1,73
1.81 2.59 2.45 2.41 2.18 1,99 2,55 1,91
2.51 2.23 1,96 2.23 2.53 2.52 1,80 1,57
2.38 1.61 2.29 2,00 1,98 1,93 2.44 2.27
2,58 1,86 2.54 2.74 1,93 2,29 2.81 1,00
2,58 2.33 2.23 2,00 2.42 1,75 2.17 1.81
2,84 2.34 2,78 2,51 0,79 2.16 2.72 2.27
2,55 1,38 2,36 2.08 1.38 1,81 2,44 2,43
1,90 2,52 1,89 2,46 1,98 1,74
2,28 2,35 2,26 1,66 1,57 1,60
2,33 2,63 1,79 2,51 2,05 2,08
1,77 2,03 1,87 1,76 2,30 2,34
1,83 1,08 2,51 1,72 1,36 1,89
1,67 2.40 2,29 2.57 2.48 1,75
2.67 1,77 2,38 2.30 1,40 1,69
(Contínuo)
Agrupamento Gangrena
0 1 23
1,80 0,70 1,75 2.49

2.16 2.67 1,75
2.17 2.37 1,86
2.12 1.46 1.26
2.27 1,91 2.36
Fonte: Dados fornecidos por cortesia de Simon Eaton, MD
8.2.8. O objetivo do estudo de Romita et al. (A-9) foi determinar se há uma resposta diferente a diferentes
bloqueadores dos canais de cálcio. Duzentos e cinquenta pacientes com hipertensão leve a
moderada foram aleatoriamente designados para 4 semanas de tratamento com doses diárias de
(1) lercanidipina, (2) felodipina ou (3) nifedipina. Antes do tratamento e ao final de 4 semanas, cada
um dos sujeitos teve sua pressão arterial sistólica medida. Os pesquisadores então calcularam a
mudança na pressão arterial sistólica. Qual é a variável de tratamento neste estudo? A variável de resposta?
Quais variáveis estranhas você pode imaginar cujos efeitos seriam incluídos no termo de erro? Quais
são os “valores” da variável de tratamento? Construa uma tabela de análise de variância na qual
você especifica para este estudo as fontes de variação e os graus de liberdade.
8.2.9. Kosmiski et ai. (A-10) realizaram um estudo para examinar a distribuição da gordura corporal de homens
infectados e não infectados pelo HIV, em uso e não de inibidores de protease (IP), com diagnóstico e não
diagnóstico de lipodistrofia. A lipodistrofia é uma síndrome associada ao tratamento do HIV/PI que permanece
controversa. Geralmente, refere-se ao acúmulo de gordura no abdome ou nas vísceras acompanhado de
resistência à insulina, intolerância à glicose e dislipidemia. No estudo, 14 indivíduos estavam tomando
inibidores de protease e foram diagnosticados com lipodistrofia, 12 estavam tomando inibidores de protease,
mas não foram diagnosticados com lipodistrofia, cinco eram HIV positivos, não tomavam inibidores de
protease, nem tinham diagnóstico de lipodistrofia e 43 indivíduos eram HIV negativos e não diagnosticado
com troféu lipodisíaco. Cada um dos indivíduos foi submetido a análises de composição corporal e
distribuição de gordura por absorciometria de raios-X de dupla energia e tomografia computadorizada. Os
pesquisadores puderam então examinar o percentual de gordura corporal no tronco. Qual é a variável de
tratamento? A variável de resposta? Quais são os “valores” da variável de tratamento? Quem são os
sujeitos? Quais variáveis estranhas você pode imaginar cujos efeitos seriam incluídos no termo de erro?
Qual foi o propósito de incluir homens HIV negativos no estudo? Construa uma tabela ANOVA na qual você
especifica as fontes de variação e os graus de liberdade para cada uma. Os autores relataram um VR calculado de 11,79. Qual é o
8.3 DESENHO DE BLOCO COMPLETO

RANDOMIZADO
O delineamento de blocos aleatórios completos foi desenvolvido por volta de 1925 por RA Fisher, que
buscava métodos para melhorar os experimentos de campo agrícola. O delineamento em blocos ao
acaso é um delineamento no qual as unidades (chamadas de unidades experimentais) às quais são
aplicados os tratamentos são subdivididas em grupos homogêneos chamados de blocos, de modo que o
número de unidades experimentais em um bloco seja igual ao número (ou alguns múltiplos) do número)
de tratamentos em estudo. Os tratamentos são então atribuídos aleatoriamente às unidades experimentais
dentro de cada bloco. Deve-se enfatizar que cada tratamento aparece em cada bloco, e cada bloco
recebe todos os tratamentos.
8.3 DESENHO DE BLOCO COMPLETO RANDOMIZADO 335
Objetivo O objetivo ao usar o delineamento de blocos aleatórios completos é isolar e remover

do termo de erro a variação atribuível aos blocos, assegurando ao mesmo tempo que os meios
de tratamento estarão livres de efeitos de bloqueio. A eficácia do projeto depende da capacidade
de obter blocos homogêneos de unidades experimentais. A capacidade de formar blocos
homogêneos depende do conhecimento do pesquisador sobre o material experimental. Quando
o bloqueio é usado de forma eficaz, o quadrado médio do erro na tabela ANOVA será reduzido,
o VR será aumentado e a chance de rejeitar a hipótese nula será melhorada.
Em experimentos com animais, a raça do animal pode ser usada como fator de bloqueio. As
ninhadas também podem ser utilizadas como blocos, caso em que um animal de cada ninhada recebe um
tratamento. Em experimentos envolvendo seres humanos, se for desejado que as diferenças decorrentes
da idade sejam eliminadas, então os sujeitos podem ser agrupados de acordo com a idade, de modo que
uma pessoa de cada idade receba cada tratamento. O delineamento de blocos aleatórios completos
também pode ser empregado de forma eficaz quando um experimento deve ser realizado em mais de um
laboratório (bloco) ou quando vários dias (blocos) são necessários para a conclusão.
A alocação aleatória de tratamentos para indivíduos é restrita no projeto de bloco completo
aleatório. Ou seja, cada tratamento deve ser representado um número igual de vezes (uma ou
mais vezes) dentro de cada unidade de bloqueio. Na prática, isso geralmente é feito atribuindo-
se uma permutação aleatória da ordem dos tratamentos aos sujeitos dentro de cada bloco. Por
exemplo, se houver quatro tratamentos representando três medicamentos e um placebo
(medicamento A, medicamento B, medicamento C e placebo [P]), então haverá 4! ¼ 24
permutações possíveis dos quatro tratamentos: (A, B, C, P) ou (A, C, B, P) ou (C, A, P, B), e assim por dia
Uma permutação é então atribuída aleatoriamente a cada bloco.
Vantagens Uma das vantagens do delineamento em blocos aleatórios é que ele é facilmente
compreendido. Além disso, certas complicações que podem surgir no decorrer de um experimento
são facilmente tratadas quando esse projeto é empregado.
É instrutivo aqui apontar que a análise de comparações pareadas apresentada no Capítulo 7 é
um caso especial do delineamento de blocos aleatórios completos. O Exemplo 7.4.1, por exemplo, pode
ser tratado como um delineamento de blocos aleatórios completos em que os dois pontos no tempo
(Pré-operatório e Pós-operatório) são os tratamentos e os indivíduos nos quais as medições foram feitas
são os blocos.
Exibição de dados Em geral, os dados de um experimento utilizando o delineamento de blocos

completos aleatórios podem ser exibidos em uma tabela como a Tabela 8.3.1. A seguinte nova
notação nesta tabela deve ser observada:
k
total do i-ésimo bloco ¼ Ti: ¼ X xij

j¼1
x xij
j¼1 Ti:
média do i-ésimo bloco ¼ xi: ¼ ¼
k k
total geral ¼ T:: ¼ X Tj ¼ Xn ti

j¼1 i¼1
TABELA 8.3.1 Tabela de Valores de Amostra para o Projeto de Bloco

Completo Randomizado
Tratamentos
Blocos 1 2 3 ... k Total Significar
1 x11 x12 x13 ... x1k T1: x1:

2 x21 x22 x23 ... x2k T2: x2:
3 x31 x32 x33 ... x3k T3: x3:
.. .. .. .. .. .. .. ..
. . . . . . . .
n xn1 xn2 xn3 ... xnk Tn xn
Total T:1 T:2 T:3 ... Tk P::
Significar x:1 x:2 x:3 ... xk x::
indicando que o total geral pode ser obtido adicionando totais de linhas ou somando totais de colunas.
ANOVA de duas vias A técnica para analisar os dados de um projeto de bloco completo aleatório é chamada
de análise de variância de duas vias, pois uma observação é categorizada com base em dois critérios - o
bloco ao qual pertence e o grupo de tratamento ao qual ele pertence.
As etapas para o teste de hipótese quando o delineamento de blocos completos aleatórios é usado
são como segue:
1. Dados. Depois de identificados os tratamentos, os blocos e as unidades experimentais, o

os dados, por conveniência, podem ser exibidos como na Tabela 8.3.1.
2. Suposições. O modelo para o design de blocos completos aleatórios e suas suposições subjacentes
são os seguintes:
O modelo
xij ¼ m þ bi þ tj þ eij
(8.3.1)
i ¼ 1; 2; ... ; n; j ¼ 1; 2; ... ; k
neste modelo
xij é um valor típico da população geral. m é uma constante

desconhecida.
bi representa um efeito de bloco refletindo o fato de que a unidade experimental caiu no i-ésimo
quadra.
tj representa um efeito de tratamento, refletindo o fato de que a unidade experimental recebeu

o jº tratamento.
eij é um componente residual que representa todas as fontes de variação além dos tratamentos
e blocos.
Premissas do Modelo
(a) Cada xij observado constitui uma amostra aleatória independente de tamanho 1 de uma das kn
populações representadas. (b) Cada uma dessas kn populações é normalmente distribuída com média
mij e a mesma variância s2. Isso implica que os eij são independentes e normalmente distribuídos com
média 0 e variância s2.
(c) Os efeitos de bloqueio e tratamento são aditivos. Essa suposição pode ser interpretada
como significando que não há interação entre tratamentos e blocos. Em outras palavras,
uma determinada combinação de tratamento em bloco não produz um efeito maior ou
menor que a soma de seus efeitos individuais. Pode-se mostrar que, quando essa
suposição é atendida,
k
x tj ¼ Xn bi ¼ 0
j¼1 i¼1
As consequências de uma violação dessa suposição são resultados enganosos. Não é

preciso se preocupar com a violação da suposição de aditividade, a menos que a maior
média seja mais de 50% maior que a menor.
Quando essas suposições são verdadeiras, tj e bi são um conjunto de constantes fixas e temos uma
situação que se ajusta ao modelo de efeitos fixos.
3. Hipóteses. podemos testar
H0 : tj ¼ 0; j ¼ 1; 2; ... ; k
contra a alternativa
Um teste de hipótese sobre efeitos de bloco geralmente não é realizado sob as

hipóteses do modelo de efeitos fixos por dois motivos. Primeiro, o interesse primário está nos
efeitos do tratamento, sendo o propósito usual dos blocos fornecer um meio de eliminar uma
fonte estranha de variação. Em segundo lugar, embora as unidades experimentais sejam
atribuídas aleatoriamente aos tratamentos, os blocos são obtidos de maneira não aleatória.
4. Estatística de teste. A estatística de teste é VR
5. Distribuição da estatística de teste. Quando H0 é verdadeira e as suposições são atendidas,

VR segue uma distribuição F.
6. Regra de decisão. Rejeite a hipótese nula se o valor calculado da estatística de teste

VR for igual ou maior que o valor crítico de F.
7. Cálculo da estatística de teste. Pode-se mostrar que a soma total dos quadrados para
o delineamento de blocos completos aleatórios pode ser dividida em três componentes,
cada um atribuível aos blocos (SSBl), tratamentos (SSTr) e erro (SSE). Isso é,
SST ¼ SSBl þ SSTr þ SSE (8.3.2)

As fórmulas para as quantidades na Equação 8.3.2 são as seguintes:

k
2
SST ¼ X Xn xij x:: (8.3.3)
j¼1 i¼1
k
2
SSBl ¼ X Xn ðXI x:: º (8.3.4)
j¼1 i¼1
k
2
SSTr ¼ X Xn xjx :: (8.3.5)
j¼1 i¼1
SSE ¼ SST SSBl SSTr (8.3.6)
Os graus de liberdade apropriados para cada componente da Equação 8.3.2 são
blocos totais kn 1 ¼ tratamentos erro residual ð

ð Þþ n 1 ð Þþ k 1 Þ ð Þ n11 ð Þ k
Os graus de liberdade residuais, como a soma residual dos quadrados, podem ser obtidos por
subtração da seguinte forma:
ð Þ kn 1 ðÞn1 ð Þ¼ k 1 kn 1 n þ 1 k þ 1 ¼ n kð Þ 1
1ð Þ¼ k 1 ð Þ n 1 ð Þ k 1
A Tabela ANOVA Os resultados dos cálculos para o delineamento de blocos aleatórios completos
podem ser exibidos em uma tabela ANOVA, como a Tabela 8.3.2.
8. Decisão estatística. Pode-se mostrar que, quando o modelo de efeitos fixos se aplica e a
hipótese nula de nenhum efeito de tratamento, todos osresidual,
ð Þ ti ¼
quadrado
0quanto
são verdadeiros,
omédio
quadrado
do erro,
tanto
médio
ou
o
dos tratamentos são estimativas da variância comum s2 . Quando a hipótese nula é verdadeira,
portanto, a quantidade
MSTr=MSE
é distribuído como F com k 1 graus de liberdade no numerador e ð Þ ð Þ n 1liberdade

k 1 grausnode
denominador. A razão de variância calculada, portanto, é comparada com o valor crítico de F.
TABELA 8.3.2 Tabela ANOVA para o Projeto de Bloco Completo Randomizado
Fonte SS df EM RV
Tratamentos SSTr kð Þ MSTr ¼ SSTr=ð Þ k 1 MSTr/MSE

Blocos SSBl nð 1 MSBl ¼ SSBl=ð Þ n 1
Residual SSE nð Þ1Þ1ðÞk1 MSE ¼ SSE=ð Þ n 1 ð Þ k 1
Total SST kn 1
9. Conclusão. Se rejeitarmos H0, concluímos que a hipótese alternativa é verdadeira. Se falharmos

em rejeitar H0, concluímos que H0 pode ser verdadeira. 10. valor p.
O exemplo a seguir ilustra o uso do delineamento de blocos aleatórios completos.
EXEMPLO 8.3.1
Um fisioterapeuta desejava comparar três métodos para ensinar os pacientes a usar um determinado
dispositivo protético. Ele sentiu que a taxa de aprendizado seria diferente para pacientes de diferentes
idades e desejou projetar um experimento no qual a influência da idade pudesse ser levada em consideração.
conta.
Solução: O delineamento de blocos aleatórios completos é o delineamento apropriado para este

fisioterapeuta.
1. Dados. Três pacientes em cada uma das cinco faixas etárias foram selecionados
para participar do experimento, e um paciente em cada faixa etária foi designado
aleatoriamente para cada um dos métodos de ensino. Os métodos de instrução
constituem nossos três tratamentos, e as cinco faixas etárias são os blocos. Os
dados mostrados na Tabela 8.3.3 foram obtidos.
2. Suposições. Assumimos que cada uma das 15 observações constitui uma amostra
aleatória simples de tamanho 1 de uma das 15 populações definidas por uma
combinação de bloco-tratamento. Por exemplo, assumimos que o número 7 na
tabela constitui uma resposta selecionada aleatoriamente de uma população de
respostas que resultaria se uma população de indivíduos com menos de 20 anos
recebesse o método de ensino A. Assumimos que as respostas nas 15 populações
representadas são normalmente distribuídos com variâncias iguais.
TABELA 8.3.3 Tempo (em dias) necessário para aprender a usar um determinado
dispositivo protético
Método de ensino
Grupo de idade UMA B C Total Significar
Sub 20 7 9 10 26 8.67
20 a 29 8 9 10 27 9h00
30 a 39 9 9 12 30 10.00
40 a 49 10 9 12 31 10.33
50 anos ou mais 11 12 14 37 12h33
Total 45 48 58 151
Significar 9,0 9.6 11.6 10.07

3. Hipóteses.
H0 : tj ¼ 0 j ¼ 1; 2; 3
4. Estatística de teste. A estatística de teste é V:R: ¼ MSTr=MSE.

5. Distribuição da estatística de teste. Quando H0 é verdadeira e as suposições são
atendidas, VR segue uma distribuição F com 2 e 8 graus de liberdade.
6. Regra de decisão. Deixe um ¼ :05. Rejeite a hipótese nula se o VR calculado for
igual ou maior que o F crítico, que encontramos na Tabela G do Apêndice como
4,46.
7. Cálculo da estatística de teste. Calculamos as seguintes somas de

quadrados:
2 2 2 ¼ 46:9335
SST ¼ ð7 10:07Þ þ ð8 10:07Þ þþð14 10:07Þ
2 2 2 ¼ 24:855
SSBI ¼ 3½ð8:67 10:07Þ þ ð9:00 10:07Þ þþð12:33 10:07Þ
2 2 2 ¼ 18:5335
SSTr ¼ 5½ð9 10:07Þ þ ð9:6 10:07Þ þ ð11:6 10:07Þ
SSE ¼ 46:9335 24:855 18:5335 ¼ 3:545
Os graus de liberdade são total ¼ ð3Þð5Þ 1 ¼ 14, blocos ¼ 5 1 ¼ 4,

tratamentos ¼ 3 1 ¼ 2 e residual ¼ ð5 1Þð3 1Þ ¼
8. Os resultados dos cálculos podem ser exibidos em uma tabela ANOVA como
na Tabela 8.3.4
8. Decisão estatística. Como nossa razão de variância calculada, 20,91, é maior que
4,46, rejeitamos a hipótese nula de nenhum efeito de tratamento na suposição de
que um VR tão grande reflete o fato de que os dois quadrados médios da amostra
não estão estimando a mesma quantidade. A única outra explicação para esse
grande VR seria que a hipótese nula é realmente verdadeira e acabamos de
observar um conjunto incomum de resultados. Descartamos a segunda explicação
em favor da primeira.
TABELA 8.3.4 Tabela ANOVA para o Exemplo 8.3.1
Fonte SS df EM RV
Tratamentos 18.5335 2 9.26675 20.91

Blocos 24.855 4 6.21375
Residual 3.545 8 .443125
Total 46.9335 14
9. Conclusão. Concluímos que nem todos os efeitos do tratamento são iguais a zero, ou
equivalentemente, que nem todas as médias dos tratamentos são iguais. 10. valor
p. Para este teste p < :005.
&
Análise de computador A maioria dos pacotes de software estatístico analisará dados de um projeto de
bloco aleatório completo. Ilustramos a entrada e a saída do MINITAB. Usamos os dados do experimento
para configurar uma planilha do MINITAB composta por três colunas. A coluna 1 contém as observações,
a coluna 2 contém números que identificam o bloco ao qual cada observação pertence e a coluna 3
contém números que identificam o tratamento ao qual cada observação pertence. A Figura 8.3.1 mostra a
planilha do MINITAB para o Exemplo 8.3.1. A Figura 8.3.2 contém a caixa de diálogo do MINITAB que
inicia a análise e a tabela ANOVA resultante.
A tabela ANOVA da saída SAS® para a análise do Exemplo 8.3.1 é mostrada na Figura 8.3.3.
Observe que nesta saída o modelo SS é igual à soma de SSBl e SSTr.
Alternativas Quando os dados disponíveis para análise não atendem às suposições do delineamento de
blocos completos aleatórios conforme discutido aqui, o procedimento de Friedman discutido no Capítulo
13 pode ser uma alternativa não paramétrica adequada.
FILEIRA C1 C2 C3
1 7 1 1
2 9 1 2
3 1013
4 8 2 1
5 9 2 2
6 1023
7 9 3 1
8 9 3 2
9 1233
10 1041
11 9 4 2
12 1243
13 1151
14 1252
15 1453
FIGURA 8.3.1 Planilha do MINITAB para os dados da Figura 8.3.2.

Stat ANOVA Twoway MTB > TWIWAY C1 C2 C3;

SUBC > SIGNIFICA C2 C3.
Digite C1 em Resposta. Digite C2 em Fator de linha
e marque Exibir meios. Digite C3 em Fator de coluna
e marque Exibir meios. Clique em OK.
Saída:
ANOVA de duas vias: C1 versus C2, C3
Análise de Variância para C1

Fonte DF SS EM F P
C2 4 24.933 6.233 14h38 0,001
C3 2 18.533 9.267 21.38 0,001
Erro 8 3.467 0,433
Total 14 46.933
IC individual de 95%
C2 Significar ---+--------+----------+---------+--
1 8.67 (-----*-----) (-----*-----)
2 9h00
00.013 -----( *-----) -----( *-----)
33.014
33.215 -----( *-----)
---+--------+----------+---------+-- 9,00 10,50
12h00 13h50
C3 Significar ---+--------+----------+---------+--
1 9h00 (-----*-----)
2 9,60 (-----*-----)
06.113 ----(*----)
---+--------+----------+---------+-- 9,00 10,00
11h00 12h00
FIGURA 8.3.2 Caixa de diálogo do MINITAB e saída para análise de variância bidirecional, Exemplo 8.3.1.
EXERCÍCIOS
Para os Exercícios 8.3.1 a 8.3.5, execute o procedimento de teste de hipótese de dez etapas para análise de variância.
8.3.1. O objetivo do estudo de Brooks et al. (A-11) foi avaliar a eficácia do uso de uma cozinha virtual para a formação profissional
de pessoas com deficiência intelectual. Vinte e quatro alunos participaram
EXERCÍCIOS 343
O Sistema SAS
Variável dependente: DIAS
Fonte DF Soma dos Quadrados Média Quadrada Valor F Pr > F
ledoM 27.6144444442.776666664.346 4000,0
rorE 33333334.076666664.38
Total corrigido 14 46.93333333
R-Quadrado cv Raiz MSE DIAS Média
0,926136 6,539211 0,65828059 10.06666667
Fonte DF Anova SS Valor F Quadrado Médio Pr > F
PUORG 83.1276666662.933333335.812 83.4133333332.633333339.424 6000,0

EGA 0100,0
FIGURA 8.3.3 Saída SAS® parcial para análise do Exemplo 8.3.1.
no estudo. Cada participante executou quatro tarefas de preparação de alimentos e foram pontuados na qualidade
da preparação. Em seguida, cada participante recebeu treinamento vocacional regular em preparação de alimentos
(treinamento real), treinamento virtual usando uma TV e tela de computador de uma cozinha típica, treinamento em
apostila com materiais de leitura especializados e nenhum treinamento (para servir como controle). Após cada um
desses treinamentos, os sujeitos foram testados na preparação de alimentos. As pontuações de melhoria para cada
um dos quatro métodos de treinamento são mostradas na tabela a seguir.
Nº do Real Virtual pasta de trabalho Não

assunto Treinamento Treinamento Treinamento Treinamento
1 2 10 2 4
2 43 2 1
3 413 01 4 611 21 5 513 51 6 20 1 4
10 17 26 2
7 8 55 2 9 104 5 10 9 8
2
3 6 3
11 11 9 7
12 10 9 6 10
13 5 8 4 1
(Contínuo)
Nº do Real Virtual pasta de trabalho Não

assunto Treinamento Treinamento Treinamento Treinamento
14 11 1 1
15 84 8 2
16 11 8 5 10 2
17 6 11 1 3
18 2 5 1 2
19 3 1 0 3
20 7 5 0 6
21 7 10 4 4
22 8 7 2 8
23 4 9 3 0
24 9 6 3 5
Fonte: Dados fornecidos por cortesia de BM Brooks, Ph.D.
Depois de eliminar os efeitos de assunto, podemos concluir que as pontuações de melhoria diferem entre os métodos de
treinamento? Deixe um ¼ :05.
8.3.2. McConville et ai. (A-12) relatam os efeitos de mascar um pedaço de chiclete de nicotina (contendo 2 mg de nicotina) na frequência
de tiques em pacientes cujo distúrbio de Tourette foi controlado inadequadamente por haloperidol. A seguir estão as
frequências de tiques sob quatro condições:
Número de tiques durante o período de 30 minutos
Após o Fim da Mastigação

Chiclete 0–30 30–60
Paciente Linha de base mastigar Minutos Minutos
1 249 108 93 59
2 1095 593 600 861
3 83 27 32 61
4 569 363 342 312
5 368 141 167 180
6 326 134 144 158
7 324 126 312 260
8 95 41 63 71
9 413 365 282 321
10 332 293 525 455
Fonte: Dados fornecidos por cortesia de Brian J. McConville, M. Harold Fogelson,

Andrew B. Norman, William M. Klykylo, Pat Z. Manderscheid, Karen W.
Parker e Paul R. Sanberg. "Potenciação de nicotina de Haloperidol na
redução da frequência de tiques no transtorno de Tourette", American
Journal of Psychiatry, 148 (1991), 793–794. Copyright # 1991, Associação
Americana de Psiquiatria.
Depois de eliminar os efeitos do paciente, podemos concluir que o número médio de tiques difere entre as quatro condições?
Deixe um ¼ :01.
8.3.3. Uma equipe de remotivação em um hospital psiquiátrico conduziu um experimento para comparar cinco métodos para remotivar
pacientes. Os pacientes foram agrupados de acordo com o nível de motivação inicial. Pacientes em cada
EXERCÍCIOS 345
grupo foram aleatoriamente designados para os cinco métodos. Ao final do período experimental, os pacientes
foram avaliados por uma equipe composta por um psiquiatra, um psicólogo, uma enfermeira e uma assistente
social, nenhum dos quais tinha conhecimento do método a que os pacientes haviam sido designados. A equipe
atribuiu a cada paciente uma pontuação composta como medida de seu nível de motivação. Os resultados foram os seguintes:
Nível de Inicial Método de Remotivação

Motivação
ABCDE
Nada 58 68 60 68 64 62 70 65 80 69 67 78
muito baixo 68 81 70 70 81 70 89 74
Baixo
Média
Esses dados fornecem evidências suficientes para indicar uma diferença nas pontuações médias entre os métodos? Deixe
um ¼ :05.
8.3.4. A supervisora de enfermagem de um departamento de saúde local desejava estudar a influência da hora do dia na
duração das visitas domiciliares da equipe de enfermagem. Pensava-se que as diferenças individuais entre os
enfermeiros poderiam ser grandes, então o enfermeiro foi usado como um fator de bloqueio. A supervisora de
enfermagem coletou os seguintes dados:
Duração da visita domiciliar por hora do dia
Cedo Tarde Cedo Tarde

Enfermeira Manhã Manhã Tarde Tarde
UMA 27 28 30 23
B 31 30 27 20
C 35 38 34 30
D 20 18 20 14
Esses dados fornecem evidências suficientes para indicar uma diferença na duração da visita domiciliar entre os
diferentes horários do dia? Deixe um ¼ :05.
8.3.5. Quatro indivíduos participaram de um experimento para comparar três métodos de alívio do estresse. Cada sujeito foi
colocado em uma situação estressante em três ocasiões diferentes. Cada vez, um método diferente para reduzir o
estresse foi usado com o sujeito. A variável de resposta é a quantidade de diminuição no nível de estresse medida
antes e depois da aplicação do tratamento. Os resultados foram os seguintes:
Tratamento
Sujeito UMA B C
1 16 26 22
2 16 20 23
3 17 21 22
4 28 29 36
Podemos concluir a partir desses dados que os três métodos diferem em eficácia? Deixe um ¼ :05.
8.3.6. Em um estudo de Valencia et al. (A-13), os efeitos da temperatura e umidade ambientais no gasto
energético de 24 horas foram medidos usando calorimetria indireta de corpo inteiro em oito homens
jovens com peso normal que usavam roupas leves padronizadas e seguiam um regime de atividade controlada.
Os efeitos da temperatura foram avaliados por medições a 20, 23, 26 e 30 graus Celsius na umidade
ambiente e a 20 e 30 graus Celsius com alta umidade. Qual é a variável de bloqueio? A variável de
tratamento? Quantos blocos existem? Quantos tratamentos? Construa uma tabela ANOVA na qual
você especifica as fontes de variabilidade e os graus de liberdade para cada uma. Quais são as
unidades experimentais? Quais variáveis estranhas você pode imaginar cujos efeitos seriam incluídos
no termo de erro?
8.3.7. Hodgson et ai. (A-14) realizaram um estudo no qual induziram dilatação gástrica em seis cães
anestesiados e mantidos com dose constante de isoflurano em oxigênio. As medições cardiopulmonares
antes da distensão do estômago (linha de base) foram comparadas com as medições feitas durante
0,1, 0,5, 1,0, 1,5, 2,5 e 3,5 horas de distensão do estômago, analisando a alteração da linha de base.
Após a distensão do estômago, o índice cardíaco aumentou de 1,5 para 3,5 horas. O volume do curso
não mudou. Durante a insuflação, foram observados aumentos na pressão arterial sistêmica, arterial
pulmonar e atrial direita. A frequência respiratória manteve-se inalterada. A PaO2 tendeu a diminuir
durante a dilatação gástrica. Quais são as unidades experimentais? Os blocos? Variável de tratamento?
Variáveis de resposta? Você consegue pensar em alguma variável estranha cujo efeito contribuiria
para o termo de erro? Construa uma tabela ANOVA para este estudo na qual você identifica as fontes
de variabilidade e especifica os graus de liberdade.
8.4 O PROJETO DE MEDIDAS REPETIDAS
Um dos delineamentos experimentais mais utilizados no campo das ciências da saúde é o delineamento de
medidas repetidas.
DEFINIÇÃO
Um projeto de medidas repetidas é aquele em que as medidas da mesma variável são

feitas em cada sujeito em duas ou mais ocasiões diferentes.
As diferentes ocasiões durante as quais as medições são feitas podem ser pontos em
tempo ou condições diferentes, como tratamentos diferentes.
Quando usar medidas repetidas A motivação usual para usar um projeto de medidas repetidas é o desejo de
controlar a variabilidade entre os sujeitos. Em tal projeto, cada sujeito serve como seu próprio controle. Quando
as medições são feitas em apenas duas ocasiões, temos o projeto de comparações pareadas que discutimos
no Capítulo 7. Uma das situações mais freqüentemente encontradas em que o projeto de medidas repetidas é
usado é a situação em que o investigador está preocupado com as respostas ao longo do tempo .
Vantagens A principal vantagem do desenho de medidas repetidas é, como mencionado anteriormente, sua
capacidade de controlar variações estranhas entre os sujeitos. Uma vantagem adicional é o fato de que menos
sujeitos são necessários para o desenho de medidas repetidas do que
8.4 O PROJETO DE MEDIDAS REPETIDAS 347
para um projeto em que diferentes assuntos são usados para cada ocasião em que as medições
são feitas. Suponha, por exemplo, que temos quatro tratamentos (no sentido usual) ou quatro
pontos no tempo em cada um dos quais gostaríamos de ter 10 medições. Se uma amostra diferente
de indivíduos for usada para cada um dos quatro tratamentos ou pontos no tempo, seriam
necessários 40 indivíduos. Se formos capazes de fazer medições no mesmo assunto para cada
tratamento ou ponto no tempo – isto é, se pudermos usar um desenho de medidas repetidas –
apenas 10 assuntos seriam necessários. Isso pode ser uma vantagem muito atraente se os
indivíduos forem escassos ou caros para recrutar.
Desvantagens Um grande problema potencial para o qual estar alerta é o que é conhecido como
efeito de transferência. Quando dois ou mais tratamentos estão sendo avaliados, o investigador
deve certificar-se de que a resposta de um indivíduo a um tratamento não reflita um efeito residual
de tratamentos anteriores. Este problema pode frequentemente ser resolvido permitindo um
intervalo de tempo suficiente entre os tratamentos.
Outro possível problema é o efeito de posição. A resposta de um sujeito a um tratamento
experimentado por último em uma sequência pode ser diferente da resposta que teria ocorrido se
o tratamento tivesse sido o primeiro na sequência. Em certos estudos, como os que envolvem
participação física por parte dos sujeitos, o entusiasmo que é grande no início do estudo pode dar
lugar ao tédio no final. Uma maneira de contornar esse problema é randomizar a sequência de
tratamentos de forma independente para cada sujeito.
Projeto de medidas repetidas de fator único O projeto de medidas repetidas mais simples é aquele
em que, além da variável de tratamento, uma variável adicional é considerada. A razão para
introduzir esta variável adicional é medir e isolar sua contribuição para a variabilidade total entre as
observações. Referimo-nos a esta variável adicional como um fator.
DEFINIÇÃO
O delineamento de medidas repetidas no qual um fator adicional é introduzido no

experimento é chamado de delineamento de medidas repetidas de fator único.
Referimo-nos ao fator adicional como sujeitos. No projeto de medidas repetidas de fator

único, cada sujeito recebe cada um dos tratamentos. A ordem em que os sujeitos são expostos
aos tratamentos, quando possível, é aleatória, e a randomização é feita de forma independente
para cada sujeito.
Suposições A seguir estão as suposições do projeto de medidas repetidas de fator único que
consideramos neste texto. Um projeto em que essas suposições são atendidas é chamado de
projeto aditivo de efeitos fixos.
1. Os sujeitos em estudo constituem uma amostra aleatória simples de uma população de

assuntos semelhantes.
2. Cada observação é uma amostra aleatória simples independente de tamanho 1 de cada uma
das kn populações, onde n é o número de sujeitos ek é o número de tratamentos aos quais
cada sujeito é exposto.
3. As kn populações têm médias potencialmente diferentes, mas todas têm o mesmo

variância.
4. Os k tratamentos são fixos; ou seja, são os únicos tratamentos sobre os quais temos interesse na
situação atual. Não desejamos fazer inferências para uma coleção maior de tratamentos.
5. Não há interação entre tratamentos e sujeitos; ou seja, o tratamento e

os efeitos do sujeito são aditivos.
Os experimentadores podem achar frequentemente que seus dados não estão de acordo com as
suposições de tratamentos fixos e/ou tratamento aditivo e efeitos do sujeito. Para tais casos, as referências
no final deste capítulo podem ser consultadas para orientação.
Além das suposições que acabamos de listar, deve-se notar que em um experimento de medidas
repetidas existe a presunção de que devem existir correlações entre as medidas repetidas. Ou seja, as
medições nos tempos 1 e 2 provavelmente estão correlacionadas, assim como as medições nos tempos
1 e 3, 2 e 3 e assim por diante. Isso é esperado porque as medições são feitas nos mesmos indivíduos ao
longo do tempo.
Uma suposição subjacente do projeto ANOVA de medidas repetidas é que todas essas correlações
são as mesmas, uma condição conhecida como simetria composta. Essa suposição, juntamente com a
suposição 3 sobre variâncias iguais, é chamada de esfericidade. Violações da suposição de esfericidade
podem resultar em um erro tipo I inflado.
A maioria dos programas de computador fornece um teste formal para a suposição de esfericidade junto
com métodos alternativos de estimativa se a suposição de esfericidade for violada.
O Modelo O modelo para o projeto de medidas repetidas de fator único aditivo de efeitos fixos é
xij ¼ m þ bi þ tj þ eij
(8.4.1)
i ¼ 1; 2; ... ; n; j ¼ 1; 2; ... ; k
O leitor reconhecerá este modelo como o modelo para o delineamento de blocos aleatórios discutido na
Seção 8.3. Os sujeitos são os blocos. Conseqüentemente, a notação, exibição de dados e procedimento
de teste de hipótese são os mesmos do delineamento de blocos aleatórios completos, conforme
apresentado anteriormente. O seguinte é um exemplo de um design de medidas repetidas.
EXEMPLO 8.4.1
Licciardone et al. (A-15) examinou indivíduos com dor lombar crônica inespecífica. Neste estudo, 18 dos
indivíduos completaram um questionário de pesquisa avaliando o funcionamento físico no início do estudo
e após 1, 3 e 6 meses. A Tabela 8.4.1 mostra os dados para esses indivíduos que receberam um
tratamento simulado que parecia ser uma manipulação osteopática genuína. Valores mais altos indicam
melhor funcionamento físico. O objetivo do experimento era determinar se os indivíduos relatariam melhora
ao longo do tempo, mesmo que o tratamento recebido proporcionasse uma melhora mínima. Queremos
saber se há diferença nos valores médios da pesquisa entre os quatro pontos no tempo.
TABELA 8.4.1 Pontuações de Saúde SF-36 em Quatro Pontos Diferentes no Tempo
Sujeito Linha de base Mês 1 Mês 3 Mês 6
1 80 60 95 100
2 95 90 95 95
3 65 55 50 45
4 50 45 70 70
5 60 75 80 85
6 70 70 75 70
7 80 80 85 80
8 70 60 75 65
9 80 80 70 65
10 65 30 45 60
11 60 70 95 80
12 50 50 70 60
13 50 65 80 65
14 85 45 85 80
15 50 65 90 70
16 15 30 20 25
17 10 15 55 75
18 80 85 90 70
Fonte: Dados fornecidos por cortesia de John C. Licciardone.
Solução:
1. Dados. Ver Tabela 8.4.1.
2. Suposições. Assumimos que as suposições para o projeto de medidas

repetidas de fator único aditivo de efeitos fixos são atendidas.
3. Hipóteses.
H0: mB ¼ mM1 ¼ mM3 ¼ mM6
HA: nem todos os m's são iguais
4. Estatística de teste. V:R: ¼ tratamento MS=erro MS.

5. Distribuição da estatística de teste. F com 4 1 ¼ 3 graus de liberdade no
numerador e 71 3 17 ¼ 51 graus de liberdade no denominador.
6. Regra de decisão. Deixe um ¼ :05. O valor crítico de F é 2,80 (obtido por
interpolação). Rejeitar H0 se o VR calculado for igual ou superior a 2,80.
7. Cálculo da estatística de teste. Usamos o MINITAB para realizar os cálculos.

Primeiro inserimos as medições na Coluna 1, os códigos de linha (assunto)
na Coluna 2, os códigos de tratamento (período de tempo) na Coluna 3 e
procedemos conforme mostrado na Figura 8.4.1.

SUBC> SIGNIFICA C2 C3.
Digite C1 em Resposta. Digite C2 em Fator de linha e
verifique os meios de exibição. Digite C3 em Fator de coluna
e verifique os meios de exibição. Clique em OK.
Saída:
ANOVA bidirecional: C1 versus C2, C3

Fonte DF SS EM F P
C2 17 20238 1190 8.20 0,000
C3 3 2396 799 5,50 0,002
Erro 51 7404 145
Total 71 30038
FIGURA 8.4.1 Procedimento e saída do MINITAB (tabela ANOVA) para o Exemplo 8.4.1.
8. Decisão estatística. Como V:R: ¼ 5:50 é maior que 2,80, podemos rejeitar a hipótese
nula.
9. Conclusão. Concluímos que há uma diferença nos quatro
população significa.
10. valor p. Como 5,50 é maior que 4,98, o valor F para a ¼ :005 e
df ¼ 40, o valor p é menor que 0,005.
A Figura 8.4.2 mostra a saída SAS® para a análise do Exemplo 8.4.1 e a Figura 8.4.3 mostra a saída
SPSS para o mesmo exemplo. Observe que o SPSS fornece quatro testes potenciais.
O primeiro teste é usado sob uma suposição de esfericidade e corresponde às saídas nas Figuras 8.4.1
e 8.4.2. Os próximos três testes são modificações se a suposição de esfericidade for violada. Observe
que o SPSS modifica os graus de liberdade para esses três testes, o que altera os quadrados médios e
os valores de p, mas não o VR. Observe que a suposição de esfericidade foi violada para esses dados,
mas que a regra de decisão não mudou, pois todos dos valores de p foram inferiores a ¼ :05.
&
Projeto de medidas repetidas de dois fatores ANOVA de medidas repetidas não é útil apenas para testar
médias entre diferentes tempos de observação. As análises são facilmente expandidas para incluir testes
de diferenças entre tempos para diferentes grupos de tratamento. Por exemplo, uma clínica pode querer
testar um tratamento placebo contra um novo tratamento medicamentoso. Os pesquisadores designarão
pacientes aleatoriamente para um dos dois grupos de tratamento e obterão medições ao longo do tempo
para cada sujeito. No final, eles estão interessados
O procedimento ANOVA
Variável dependente: sf36
Fonte DF Soma dos Quadrados Média Quadrada Valor F Pr > F
ledoM 1000.<97.776666.131133333.3362202
rorE 47971.54176661.404715
R-Square Coeff Var Root MSE sf36 Média
0,753503 18,18725 12,04906 66,25000
Fonte DF Anova SS Valor F Quadrado Médio Pr > F
jbus 1000.<02.881144.091100005.7320271
emite 4200.005.511116.89733338.59323
FIGURA 8.4.2 Saída SAS® para análise do Exemplo 8.4.1.
Testes de Efeitos Dentro dos Sujeitos

Medida: MEASURE_1
Tipo III Significar

ecruoS Sum .giSFerauqSfdserauqS fo
fator 1 Esfericidade Assumida 2395.833 798.611 5.501 .002

Greenhouse-Geisser 2395.833 3 1080.998 5.501 934.701 .006
Huynh-Feldt 2395.833 2.216 5.501 2395.833 5.501 .004
Limite inferior 2395.833 2.563 1.000 .031
Erro (fator 1) Esfericidade Assumida 7404.167 145.180

Greenhouse-Geisser 7404.167 51 196.515
Huynh-Feldt 7404.167 37.677 169.919
Limite inferior 7404.167 43.575 17.000435.539
FIGURA 8.4.3 Saída do SPSS para a análise do Exemplo 8.4.1.

em saber se havia diferenças entre os dois tratamentos em assuntos que foram medidos várias vezes.
Suposições As suposições do projeto de medidas repetidas de dois fatores são as mesmas do projeto de
medidas repetidas de fator único. No entanto, não é incomum haver interações entre os tratamentos
neste delineamento, uma violação potencial da Suposição 5, acima. Os efeitos de interação podem ser
interessantes de examinar, mas são complexos de calcular. Por esta razão, e no nível do público-alvo
deste texto, assumiremos que os efeitos de interação, quando presentes, são tratados matematicamente
usando um pacote de software estatístico que fornece cálculos corretos para este problema.
O modelo O modelo para o projeto de medidas repetidas de dois fatores deve representar o fato de que
existem dois fatores, A e B, e eles têm uma interação potencial. Essas características, juntamente com o
efeito de bloqueio e o erro, devem ser consideradas no modelo, que é dado por
xijk ¼ m þ rij þ ai þ bj þ ðabÞij þ eijk i ¼ 1;

(8.4.2)
2; ... ; uma; j ¼ 1; 2; ... ; b; k ¼ 1; 2; ... ; n
neste modelo
xijk é um indivíduo típico da população geral m uma constante

desconhecida rij representa um efeito de bloco aj representa o
efeito principal do fator A bk representa o efeito principal do fator

B ðabÞjk representa o efeito de interação do fator A e do fator B
eijk é um componente residual representando todas as fontes
de variação que não sejam tratamentos
e blocos.
Esse modelo é muito semelhante ao modelo ANOVA de dois fatores apresentado na Seção 8.5.
EXEMPLO 8.4.2
O Mid-Michigan Medical Center (A-16) examinou 25 indivíduos com câncer de pescoço e mediu como
uma das variáveis de resultado um escore de condição de saúde bucal. Os pacientes eram
divididos aleatoriamente em dois grupos de tratamento. Estes foram um tratamento placebo (tratamento
1) e um grupo de suco de aloe (tratamento 2). A saúde do câncer foi medida no início e no final de 2, 4 e
6 semanas de tratamento. O objetivo era discernir se havia alguma mudança na condição de saúde bucal
ao longo do experimento e ver se havia alguma diferença entre as duas condições de tratamento.
Solução:
2. Suposições. Assumimos que as suposições para a equação de dois fatores

experimento de medidas repetidas são atendidas.
TABELA 8.4.2 Pontuações da condição de saúde bucal em quatro pontos diferentes no tempo sob duas condições de
tratamento
Tratamento 1
¼ placebo 2 ¼
Sujeito suco de aloe vera TotalC1 TotalC2 TotalC3 TotalC4
1 1 6667
2 1 9 6 10 9
3 1 7 9 17 19
4 1 6793
5 1 6 7 16 13
6 1 6 6 611
7 1 611 11 10
8 1 611 15 15
9 1 6968
10 1 6487
11 1 7 8 11 11
12 1 6696
13 1 8 8 9 10
14 1 7 16 9 10
15 2 6 10 11 9
16 2 4687
17 2 6 11 11 14
18 2 6766
19 2 12 11 12 9
20 2 5 7 13 12
21 2 6777
22 2 8 11 16 16
23 2 5777
24 2 6 8 16 16
25 2 7 8 10 8
Fonte: Mid-Michigan Medical Center, Midland, Michigan, 1999: Um estudo da condição bucal de pacientes com câncer.
Disponível no domínio público em: http://calcnet.mth.cmich.edu/org/spss/Prj_cancer_data.htm.
3. Hipóteses. uma.
H0: ai ¼ 0 i ¼ 1; 2; ... ; uma
Ha: nem todos ai ¼ 0
j ¼ 1; 2; ... ; b
b. H0: bj ¼ 0 Ha:
nem todos bj ¼ 0
c. H0: ðabÞij ¼ 0 i ¼ 1; 2; ... ; uma; j ¼ 1; 2; ... ; b
Ha: nem tudoðabÞij ¼ 0

4. Estatística de teste. A estatística de teste para cada conjunto de hipóteses é VR
5. Distribuição das estatísticas de teste. Quando H0 é verdadeiro e as suposições são atendidas,

cada uma das estatísticas de teste é distribuída como F. Se todas as suposições forem
atendidas para os efeitos dentro dos assuntos, teremos F com 4 1 ¼ 3 graus de liberdade
do numerador para o fator de tempo, ð4 1Þð2 1Þ ¼ 3 graus de liberdade do numerador
para o fator de interação e ð4 1Þð25 2Þ ¼ 69 graus de liberdade do denominador para
ambos os testes; a interpolação da Tabela G fornece um valor F crítico de 2,74. Além
disso, para o fator entre sujeitos, teremos ð2 1Þ ¼ 1 graus de liberdade do numerador e
25 2 ¼ 23 graus de liberdade do denominador; A Tabela G dá o valor F crítico como sendo
4,28. Se não atendermos às suposições, especificamente de esfericidade, o programa de
computador alterará os graus de liberdade e, portanto, o valor crítico para comparações.
6. Regra de decisão. Deixe um ¼ :05. Rejeitar H0 se o valor p calculado for menor

do que um.
7. Cálculo da estatística de teste. Usamos o SPSS para realizar os cálculos.

Inserimos os dados conforme mostrado na Tabela 8.4.2, embora não seja necessário
inserir o número “Assunto”. O código SPSS e a saída pertinente são mostrados na Figura
8.4.4.
8. Decisão estatística. O SPSS fornece um teste formal para esfericidade chamado “Teste de
Esfericidade de Mauchley”. Como rejeitamos o nulo para este teste de acordo com a saída
da Figura 8.4.2, usaremos a estatística de teste “Greenhouse Geisser”. Como VR é maior
que o valor crítico para TotalC, rejeitamos a hipótese nula para essa variável. No entanto,
tanto os valores críticos para o efeito de interação quanto o fator entre sujeitos são muito
pequenos e menores do que o valor crítico necessário e, portanto, falhamos em rejeitar
essas duas hipóteses nulas.
9. Conclusão. Concluímos que não há diferença estatística entre os tratamentos, mas que os
indivíduos tiveram uma mudança na condição bucal ao longo do tempo, independentemente
do tratamento que receberam.
10. valor p. Conforme visto na Figura 8.4.4, todos os valores de p são fornecidos para cada teste.
Resumindo: como p < :001, rejeitamos a hipótese nula relativa às mudanças ao longo do
tempo. Como p ¼ :931, falhamos em rejeitar a hipótese nula relativa à interação de tempo
e tratamento. Como p ¼ :815, falhamos em rejeitar a hipótese nula relativa às diferenças
entre os tratamentos.
Embora a saída fornecida na Figura 8.4.2 possa ser valiosa para a interpretação estatística, muitas vezes é útil
examinar os gráficos para obter uma interpretação visual dos resultados. A Figura 8.4.5 mostra um gráfico de
médias marginais em relação ao tempo, com linhas representando cada um dos tratamentos.
É evidente que as mudanças na condição bucal ocorreram ao longo do tempo, mas que os dois tratamentos foram
muito semelhantes, como pode ser visto pela proximidade das duas curvas.
Além disso, é evidente que ocorreu interação entre tempo e tratamento, conforme evidenciado pelo cruzamento
das linhas traçadas. &
Código SPSS
GLM TOTALCIN T0TALCW2 TOTALCW4 T0TALCW6 BY TRT
/WSFACTOR¼TotatC 4 Polinômio /
MÉTODO¼SSTYPE(3)
/PLOT¼PROFILE(TRTTotalCTot3lCTRT)
/EMMEANS¼TABELAS(TRT)
/EMMEANS¼TABELAS(TotalC)
/EMMEANS¼TABELAS(TRTTotalC)
/PR!NT¼DESCRITIVO
/CRITÉRIO¼ALFA(.O5)
/WSDESIGN¼TotalC
/DESIGN¼TRT.
Saída SPSS Parcial
Teste de Esfericidade de Mauchlyb
Efeito Dentro dos Assuntos W de Mauchly Aprox. qui-quadrado df Assinar
TotalC .487 15.620 5 0,008
Testes de Efeitos Dentro dos Sujeitos

Digite 111 Soma
Fonte dos Quadrados df quadrado médio F Assinar
TotalC Esfericidade Assumida 233.391 3 77.797 13.926 000

Greenhouse-Geisser 233.391 2.025 115.261 13.926 000
Huynh-Feldt 233.391 2.318 100.682 13.926 000

Limite inferior 233.391 1.000 233.391 13.926 0,001
TotalC TRT Esfericidade Assumida 1.231 3 .410 0,073 0,974

Greenhouse-Geisser 1.231 2.025 .608 0,073 0,931
Huynh-Feldt 1.231 2.318 .531 0,073 0,949

Limite inferior 1.231 1.000 1.231 0,073 0,789
Erro(TotalC) Esfericidade Assumida 385.469 69 5.587

Greenhouse-Geisser 385.469 46.572 8.277
Huynh-Feldt 385.469 53.316 7.230

Limite inferior 385.469 23.000 16.760
Testes de efeitos entre sujeitos
Tipo III Soma

Fonte dos Quadrados df quadrado médio F Assinar
Interceptar 7637.274 1 7637.274 382.508 000
TRT 1.114 1 1.114 0,056 0,815
Erro 459.226 23 19.966
FIGURA 8.4.4 Código SPSS e saída parcial para o Exemplo 8.4.2.

11
10
9
marginal
média
Placebo
8
suco de babosa
6
Tempo 1 Tempo 2 Tempo 3 Tempo 4
Total C
FIGURA 8.4.5 Gráfico de Excel de médias marginais em relação à pontuação total de saúde bucal para os dados
do Exemplo 8.4.2.
EXERCÍCIOS
Para os Exercícios 8.4.1 a 8.4.3, execute o procedimento de teste de hipótese de dez etapas. Deixe um ¼ :05.
8.4.1. Um dos objetivos do estudo de Liu et al. (A-17) foi determinar os efeitos de MRZ 2/579 no déficit neurológico em ratos Sprague-
Dawley. Neste estudo, 10 ratos foram medidos em quatro períodos de tempo após a oclusão da artéria carótida média e
subsequente tratamento com o antagonista não competitivo de Nmetil-D-aspartato MRZ 2/579, que estudos anteriores
sugeriram fornecer atividade neuroprotetora. A variável de resultado foi uma variável de função neurológica medida em uma
escala de 0 a 12. Um número mais alto indica um grau mais alto de comprometimento neurológico.
Rato 60 minutos 24 horas 48 horas 72 horas
11 9 8 4
12 11 7 5 3
11 10 8 6
34 11 4 3 2
5 11 10 9 9
6 11 6 5 5
7 11 6 6 6
8 11 7 6 5
9 11 7 5 5
10 11 9 7 7
Fonte: Dados fornecidos por cortesia de Ludmila Belayev, MD
8.4.2. Amido e outros. (A-18) queria mostrar a eficácia de uma manga central de quatro quadrantes e parafuso na reconstrução do
ligamento cruzado anterior. Os pesquisadores realizaram uma série de reconstruções em oito joelhos cadavéricos. A tabela a
seguir mostra as cargas (em newtons) necessárias para atingir diferentes frouxidão do enxerto (mm) para sete espécimes
(dados não disponíveis para um espécime) usando cinco pesos de carga diferentes. A frouxidão do enxerto é a separação (em
mm) do fêmur e da tíbia nos pontos de fixação do enxerto.
EXERCÍCIOS 357
Existem evidências suficientes para concluir que diferentes cargas são necessárias para produzir diferentes níveis de
frouxidão do enxerto? Deixe um ¼ :05.
Flacidez do Enxerto (mm)
espécime 1 2345
1 297.1 297.1 297.1 297.1 297.1

2 264,4 304.6 336,4 358,2 379,3
3 188,8 188,8 188,8 188,8 188,8
4 159,3 194,7 211.4 222.4 228.1
5 228.2 282.1 282.1 334,8 334,8
6 100,3 105,0 106.3 107,7 108,7
7 116,9 140,6 182,4 209,7 215.4
Fonte: David W. Starch, Jerry W. Alexander, Philip C. Noble, Suraj Reddy e David M.
Lintner, “Fixação de enxerto de tendão de isquiotibiais multitranda com um parafuso central de
quatro quadrantes ou parafuso de interferência tibial padrão para reconstrução do ligamento cruzado anterior,”
American Journal of Sports Medicine, 31 (2003), 338–344.
8.4.3. Holben e outros. (A-19) desenhou um estudo para avaliar a ingestão de selênio em mulheres jovens nos anos da
puberdade. Os pesquisadores estudaram um grupo de 16 mulheres por três verões consecutivos. Uma das
variáveis de desfecho foi a ingestão de selênio por dia. Os pesquisadores examinaram os diários dietéticos dos
indivíduos ao longo de 2 semanas e, em seguida, calcularam a ingestão média diária de selênio. A tabela a seguir
mostra os valores médios diários de ingestão de selênio em ð Þ mg=d para as
estudo.
16 mulheres nos anos 1, 2 e 3 do
Sujeito Ano 1 ano 2 3º ano Sujeito Ano 1 ano 2 3º ano
1 112,51 121,28 94,99 9 95,05 93,89 73,26

2 106,20 121.14 145,69 10 112,65 100,47 145,69
3 102,00 121.14 130,37 11 103,74 121.14 123,97
4 103,74 90,21 135,91 12 103,74 121.14 135,91
5 103.17 121.14 145,69 13 112,67 104,66 136,87
6 112,65 98.11 145,69 14 106,20 121.14 126,42
7 106,20 121.14 136,43 15 103,74 121.14 136,43
8 83,57 102,87 144,35 16 106,20 100,47 135,91
Fonte: Dados fornecidos por cortesia de David H. Holben, Ph.D. e John P. Holcomb, Ph.D.
8.4.4. Linke et ai. (A-20) estudaram sete cães machos sem raça definida. Eles induziram o diabetes injetando nos animais
monohidrato de aloxana. Os pesquisadores mediram a glicose arterial (mg/gl), lactato arterial (mmol/L),
concentração arterial de ácidos graxos livres e concentração arterial de ácido b-hidroxibutírico antes da injeção de
aloxana e novamente nas semanas 1, 2, 3 e 4 pós-injeção. Qual é a(s) variável(is) de resposta? Comente sobre o
efeito de transição e o efeito de posição, pois eles podem ou não ser motivo de preocupação neste estudo.
Construa uma tabela ANOVA para este estudo na qual você identifica as fontes de variabilidade e especifica os
graus de liberdade para cada uma.
8.4.5. Werther et ai. (A-21) examinou a concentração do fator de crescimento endotelial vascular (VEGF) no sangue de
pacientes com câncer de cólon. A pesquisa sugere que a inibição do VEGF pode interromper o crescimento do
tumor. Os pesquisadores mediram a concentração de VEGF (ng/L) para 10 indivíduos e encontraram uma
tendência ascendente nas concentrações de VEGF durante o tempo de coagulação medido na linha de base e
nas horas 1 e 2. Qual é a variável de resposta? Qual é a variável de tratamento? Construa uma tabela ANOVA
para este estudo na qual você identifica as fontes de variabilidade e especifica os graus de liberdade para cada uma.
8.4.6. Yucha et ai. (A-22) realizaram um estudo para determinar se os estudantes de enfermagem que foram designados para um
hospital domiciliar (HH) diferiam daqueles tradicionalmente colocados (TP) em hospitais ao longo de seu treinamento de
enfermagem. Um pequeno subconjunto de dados é fornecido na tabela abaixo. Neste conjunto de dados, a colocação no
hospital é a variável entre sujeitos. A ansiedade, medida pela Escala de Ansiedade do Estado de Spielberger (onde
pontuações mais altas sugerem níveis mais altos de ansiedade), é a variável dentro dos sujeitos e é fornecida em quatro
pontos no tempo durante o treinamento de enfermagem. Há evidências de que o nível de ansiedade mudou ao longo do
tempo para esses estudantes de enfermagem? Existe uma diferença de ansiedade entre aqueles em uma internação
hospitalar em comparação com a internação tradicional? Existe interação significativa entre o tipo de colocação e a
ansiedade? Deixe um ¼ :05.
Sujeito Colocação Hospitalar Ansiedade 1 ansiedade 2 ansiedade 3 ansiedade 4
1 HH 51 33 12 31
2 HH 50 51 50 44
3 HH 65 58 45 37
4 HH 43 40 31 51
5 HH 67 56 50 42
6 HH 46 69 62 46
7 HH 29 28 28 43
8 HH 76 69 62 60
9 HH 66 39 47 38
10 HH 56 46 34 31
11 PT 44 48 51 59
12 PT 44 50 54 40
13 PT 54 49 35 46
14 PT 38 38 32 37
15 PT 25 27 25 24
16 PT 61 60 55 66
17 PT 42 51 42 34
18 PT 36 49 49 51
19 PT 52 63 50 64
20 PT 41 55 56 34
Fonte: Dados fornecidos Cortesia de Carolyn B. Yucha, RN, PhD, FAAN.
8.5 O EXPERIMENTO FATORIAL
Nos projetos experimentais que consideramos até este ponto, estivemos interessados nos efeitos de
apenas uma variável - os tratamentos. Frequentemente, porém, podemos estar interessados em estudar,
simultaneamente, os efeitos de duas ou mais variáveis. Referimo-nos às variáveis nas quais estamos
interessados como fatores. O experimento no qual dois ou mais fatores são investigados simultaneamente
é chamado de experimento fatorial.
As diferentes categorias designadas dos fatores são chamadas de níveis. Suponha, por exemplo,
que estejamos estudando o efeito no tempo de reação de três dosagens de alguma droga.
Diz-se então que o fator droga ocorre em três níveis. Suponha que o segundo fator de interesse no
estudo seja a idade, e acredita-se que duas faixas etárias, abaixo de 65 anos e 65 anos ou mais, devam
ser incluídas. Temos então dois níveis do fator idade. Em geral, dizemos que o fator A ocorre nos níveis
a e o fator B ocorre nos níveis b.
8.5 O EXPERIMENTO FATORIAL 359
Em um experimento fatorial podemos estudar não apenas os efeitos de fatores individuais, mas
também, se o experimento for conduzido adequadamente, a interação entre os fatores. Para ilustrar o
conceito de interação, vamos considerar o seguinte exemplo.
EXEMPLO 8.5.1
Suponha que, em termos de efeito sobre o tempo de reação, seja conhecida a verdadeira relação entre
três níveis de dosagem de alguma droga e a idade dos seres humanos que tomam a droga. Suponha
ainda que a idade ocorra em dois níveis – “jovem” (abaixo de 65 anos) e “velho” (65 anos ou mais). Se a
verdadeira relação entre os dois fatores for conhecida, saberemos, para os três níveis de dosagem, o
efeito médio no tempo de reação dos indivíduos nas duas faixas etárias. Vamos supor que o efeito seja
medido em termos de redução no tempo de reação a algum estímulo. Suponha que essas médias sejam
as mostradas na Tabela 8.5.1.
As seguintes características importantes dos dados na Tabela 8.5.1 devem ser observadas.
1. Para ambos os níveis do fator A, a diferença entre as médias para quaisquer dois níveis do fator B
é a mesma. Ou seja, para ambos os níveis do fator A, a diferença entre as médias dos níveis 1 e
2 é 5, para os níveis 2 e 3 a diferença é 10, e para os níveis 1 e 3 a diferença é 15.
2. Para todos os níveis do fator B, a diferença entre as médias dos dois níveis do fator A é a mesma.
No presente caso, a diferença é de 5 em todos os três níveis do fator B.
3. Uma terceira característica é revelada quando os dados são plotados como na Figura 8.5.1.
Notamos que as curvas correspondentes aos diferentes níveis de um fator são todas paralelas.
Quando os dados populacionais possuem as três características listadas acima, dizemos que não há
interação presente.
TABELA 8.5.1 Redução média no tempo de reação (milissegundos) de

indivíduos em duas faixas etárias em três níveis de dosagem de drogas
Fator B - Dosagem do Medicamento
Fator A - Idade j¼1 j¼2 j¼3
Jovem ði ¼ 1Þ m11 ¼ m12 ¼ 10 m13 ¼ 20

Antigo ði ¼ 2Þ 5 m21 ¼ 10 m22 ¼ 15 m23 ¼ 25
30 Era 30 Dosagem de drogas
25 a2 25 b3
20 a1 20
Redução
reação
tempo
de
do
15 Redução
reação
tempo
de
do
15 b2
10 10 b1
5 5
0 0
b1 b2 b3 a1 a2
Dosagem de drogas Era
FIGURA 8.5.1 Idade e efeitos da droga, sem interação presente.
TABELA 8.5.2 Dados da Tabela 8.5.1 Alterados para Mostrar o Efeito de

um Tipo de Interação
Fator B - Dosagem do Medicamento
Fator A - Idade j¼1 j¼2 j¼3
Jovem ði ¼ 1Þ m11 ¼ m12 ¼ 10 m13 ¼ 20

Antigo ði ¼ 2Þ 5 m21 ¼ 15 m22 ¼ 10 m23 ¼ 5
30 30
25 Era 25
20 a1 20 Dosagem de drogas
Redução
reação
tempo
de
do
15 Redução
reação
tempo
de
do
15 b1
10 10 b2
5 a2 5 b3
0 0
b1 b2 b3 a1 a2
Dosagem de drogas Era
FIGURA 8.5.2 Idade e efeitos de drogas, interação presente.
A presença de interação entre dois fatores pode afetar as características dos dados de várias
maneiras, dependendo da natureza da interação. Ilustramos o efeito de um tipo de interação alterando os
dados da Tabela 8.5.1 conforme mostrado na Tabela 8.5.2.
As características importantes dos dados na Tabela 8.5.2 são as seguintes.
1. A diferença entre as médias para quaisquer dois níveis do fator B não é a mesma para ambos os
níveis do fator A. Notamos na Tabela 8.5.2. por exemplo, que a diferença entre os níveis 1 e 2 do
fator B seja 5 para a faixa etária jovem e þ5 para a faixa etária idosa.
2. A diferença entre as médias para ambos os níveis do fator A não é a mesma em todos os níveis do
fator B. As diferenças entre as médias do fator A são 10, 0 e 15 para os níveis 1, 2 e 3,
respectivamente, do fator B .
3. As curvas de nível de fator não são paralelas, conforme mostrado na Figura 8.5.2.
Quando os dados populacionais apresentam as características ilustradas na Tabela 8.5.2 e na

Figura 8.5.2, dizemos que há interação entre os dois fatores. Enfatizamos que o tipo de interação ilustrada
pelo presente exemplo é apenas um dos muitos tipos de interação que podem ocorrer entre dois fatores.
&
Em resumo, então, podemos dizer que há interação entre dois fatores se uma mudança em um dos
fatores produz uma mudança na resposta em um nível do outro fator diferente daquela produzida em outros
níveis desse fator.
Vantagens As vantagens do experimento fatorial incluem o seguinte.
1. A interação dos fatores pode ser estudada.

2. Há uma economia de tempo e esforço.
No experimento fatorial todas as observações podem ser usadas para estudar os efeitos de cada um dos
fatores sob investigação. A alternativa, quando dois fatores estão sendo investigados, seria realizar dois
experimentos diferentes, um para estudar cada um dos dois fatores. Se isso fosse feito, algumas das observações
forneceriam informações apenas sobre um dos fatores, e o restante forneceria informações apenas sobre o outro
fator. Para atingir o nível de precisão do experimento fatorial, mais unidades experimentais seriam necessárias se
os fatores fossem estudados por meio de dois experimentos. Vê-se, então, que 1 experimento de dois fatores é
mais econômico do que 2 experimentos de um fator.
3. Como os vários fatores são combinados em um experimento, os resultados têm um alcance mais amplo
Alcance da aplicação.
O Projeto de Dois Fatores Completamente Aleatório Um arranjo fatorial pode ser estudado com qualquer um dos
projetos que foram discutidos. Ilustramos a análise de um experimento fatorial por meio de um delineamento
inteiramente casualizado de dois fatores.
1. Dados. Os resultados de um projeto completamente aleatório de dois fatores podem ser apresentados em
forma de tabela, conforme mostrado na Tabela 8.5.3.
Aqui temos a níveis do fator A, b níveis do fator B e n observações para cada combinação de
níveis. Cada uma das combinações ab de níveis de fator A com níveis de fator B é um tratamento. Além
dos totais e médias mostrados na Tabela 8.5.3, notamos que o total e a média da célula ij são
Tij ¼ Xn xijk e xij ¼ Tij=n

k¼1
TABELA 8.5.3 Tabela de dados de amostra de um experimento de dois

fatores completamente aleatório
Fator B
Fator A 1 2 ... b Totais Meios
1 x111 x121 ... x1b1

.. .. .. ..
. . . . T1:: x1::
x11n x12n ... x1 bilhão
2 x211 x221 ... x2b1

.. .. .. ..
. . . . T2:: x2::
x21n x22n ... x2 bilhões
.. .. .. .. .. .. ..
. . . . . . .
uma xa11 xa21 ... xab1

.. .. .. ..
. . . . Tá:: x::
xa1n xa2n ... xabn
Totais T:1: T:2: ... Tb: T...
Meios x:1: x:2: ... x: b: x...

respectivamente. O subscrito i vai de 1 a a e j vai de 1 a b. O número total de observações é nab.
Para mostrar que a Tabela 8.5.3 representa dados de um projeto completamente aleatório,
consideramos que cada combinação de níveis de fator é um tratamento e que temos n observações
para cada tratamento. Uma disposição alternativa dos dados seria obtida listando as observações de
cada tratamento em uma coluna separada. A Tabela 8.5.3 também pode ser usada para exibir dados
de um delineamento de blocos aleatórios de dois fatores se considerarmos a primeira observação em
cada célula como pertencente ao bloco 1, a segunda observação em cada célula como pertencente
ao bloco 2 e assim por diante. a enésima observação em cada célula, que pode ser considerada
pertencente ao bloco n.
Observe a semelhança da exibição de dados para o experimento fatorial, conforme mostrado
na Tabela 8.5.3, para a exibição de dados de blocos aleatórios completos da Tabela 8.3.1. O
experimento fatorial, para que o experimentador possa testar a interação, requer pelo menos duas
observações por célula, ao passo que o delineamento de blocos aleatórios completos requer apenas
uma observação por célula. Usamos análise de variância bidirecional para analisar os dados de um
experimento fatorial do tipo apresentado aqui.
2. Suposições. Assumimos um modelo de efeitos fixos e um design de dois fatores completamente

aleatório. Para uma discussão sobre outros projetos, consulte as referências no final deste capítulo.
O Modelo O modelo de efeitos fixos para o projeto de dois fatores completamente aleatório pode ser escrito
como
xijk ¼ m þ ai þ bj þ ð Þ ab a; j eu j þ eijk
(8.5.1)
i ¼ 1; 2; ... ; ¼ 1; 2; ... ; b; k ¼ 1; 2; ... ; n
onde xijk é uma observação típica, m é uma constante, ai representa um efeito devido ao fator A, bj representa
um efeito devido ao fator B, ð Þ ab representa um efeito
a erro
devido
experimental.
à interação dos fatores A e B, e eijk representa
eu j
Premissas do Modelo
uma. As observações em cada uma das células ab constituem uma amostra aleatória independente de
tamanho n extraída da população definida pela combinação particular dos níveis dos dois fatores.
b. Cada uma das populações ab é normalmente distribuída. c.
Todas as populações têm a mesma variância.
3. Hipóteses. As seguintes hipóteses podem ser testadas:

uma. H0: ai ¼ 0 HA: notall ai ¼ 0 i ¼ 1; 2; ... uma ;
b. H0: bj ¼ 0 HA: nem todos bj ¼ 0 c. H0:
ð Þ ab ¼ 0 HA: nem todos ð Þ ab j ¼ 1; 2; ... ; b
eu j
i ¼ 1; 2; ... ; uma; j ¼ 1; 2; ... ; b
¼0
ij
Antes de coletar os dados, os pesquisadores podem decidir testar apenas uma das
hipóteses possíveis. Nesse caso, eles selecionam a hipótese que desejam testar, escolhem um
nível de significância a e procedem da maneira familiar e direta. Este procedimento está livre
das complicações que surgem se os pesquisadores desejam testar todas as três hipóteses.
Quando todas as três hipóteses são testadas, a situação é complicada pelo fato de que os
três testes não são independentes no sentido probabilístico. Se deixarmos a ser o nível de
significância associado ao teste como um todo,associados
e a0 ; a00; às
e a000 os níveis
hipóteses 1, 2 de
e 3,significância
respectivamente,
encontramos
a<1 ð 1a0 ð 1
Þ a00 Þ
ð1 a000Þ
_ (8.5.2)
3
Se a0 ¼ a00 ¼ a000¼ :05, então a < 1 ð Þ :95, ou < :143. Isso significa que a
probabilidade de rejeitar uma ou mais das três hipóteses é menor que 0,143 quando um nível
de significância de 0,05 foi escolhido para as hipóteses e todas são verdadeiras. Para
demonstrar o procedimento de teste de hipótese para cada caso, realizamos todos os três
testes. O leitor, no entanto, deve estar ciente do problema envolvido na interpretação dos resultados.
5. Distribuição da estatística de teste. Quando H0 é verdadeira e as suposições são atendidas, cada uma
das estatísticas de teste é distribuída como F.
6. Regra de decisão. Rejeite H0 se o valor calculado da estatística de teste for

igual ou maior que o valor crítico de F.
7. Cálculo da estatística de teste. Por uma adaptação do procedimento usado na partição da
soma total dos quadrados para o delineamento completamente aleatório, pode-se mostrar
que a soma total dos quadrados sob o modelo atual pode ser dividida em duas partes,
como segue:
b b b
2 2
Xa
i¼1
x Xn ðxijk x...Þ ¼ Xa
i¼1
x Xn xij x... 2þXa _
i¼1
x Xn xijk xij
j¼1 k¼1 j¼1 k¼1 j¼1 k¼1
(8.5.3)
ou
SST ¼ SSTr þ SSE (8.5.4)
A soma dos quadrados para tratamentos pode ser dividida em três partes, como segue:
b b
2 2
Xa
i¼1
x Xn xij x... ¼ Xa x Xn ðXI:: x... º
j¼1 k¼1 i¼1 j¼1 k¼1
b
2
þ Xa
i¼1
x Xn
k¼1
x:j: x... (8.5.5)
j¼1b
2
þ Xa
i¼1
x Xn xij XI:: x:j: þ x...
j¼1 k¼1
TABELA 8.5.4 Análise da Tabela de Variância para um Experimento de Dois Fatores

Completamente Randomizado (Modelo de Efeitos Fixos)
Fonte SS df EM RV
UMA SSA um 1 MSA ¼ SSA=ð Þ a 1 MSA=MSE

B SSB b1 MSB ¼ SSB=ð Þ b 1 Þ MSB=MSE
AB SSAB að 1 ð Þ b 1 MSAB ¼ SSAB=ð Þ a 1 ð Þ b 1 ab 1 MSAB=MSE
Tratamentos SSTr
Residual SSE ab nð Þ1 MSE ¼ SSE=ab nð Þ1
Total SST abn 1
ou
SSTr ¼ SSA þ SSB þ SSAB
A Tabela ANOVA Os resultados dos cálculos para o modelo de efeitos fixos para um experimento de dois
fatores completamente aleatório podem, em geral, ser exibidos como mostrado na Tabela 8.5.4.
8. Decisão estatística. Se as suposições declaradas anteriormente forem verdadeiras, e se cada

hipótese for verdadeira, pode-se mostrar que cada uma das razões de variância mostradas na
Tabela 8.5.4 segue uma distribuição F com os graus de liberdade indicados. Rejeitamos H0 se os
valores de VR calculados forem iguais ou maiores que os valores críticos correspondentes,
conforme determinado pelos graus de liberdade e pelos níveis de significância escolhidos.
9. Conclusão. Se rejeitarmos H0, concluímos que HA é verdadeiro. Se não rejeitarmos H0 ,

concluir que H0 pode ser verdadeira.
10. valor p.
EXEMPLO 8.5.2
Em um estudo sobre o tempo gasto em visitas domiciliares individuais por enfermeiros de saúde pública,
foram relatados dados sobre o tempo de visita domiciliar, em minutos, por uma amostra de 80 enfermeiros.
Também foi feito um registro da idade de cada enfermeira e do tipo de doença de cada paciente visitado.
Os investigadores desejavam obter da sua investigação respostas às seguintes questões:
1. A duração média da visita domiciliar difere entre as diferentes faixas etárias dos enfermeiros?
2. O tipo de paciente afeta a duração média da visita domiciliar?
3. Existe interação entre a idade do enfermeiro e o tipo de paciente?
Solução:
1. Dados. Os dados sobre tempo de visita domiciliar obtidos durante o estudo são
apresentados na Tabela 8.5.5.
TABELA 8.5.5 Duração da Visita Domiciliar em Minutos por Enfermeiros de Saúde Pública por Faixa Etária do
Enfermeiro e Tipo de Paciente
Níveis do Fator B (Grupo Etário da Enfermeira)
Fator A
(Tipo de paciente) 4
Níveis 1 (20 a 29) 2 (30 a 39) 3 (40 a 49) (50 anos ou mais)
1 (cardíaco) 20 25 24 28
25 30 28 31
22 29 24 26
27 28 25 29
21 30 30 32
2 (Câncer) 30 30 39 40
45 29 42 45
30 31 36 50
35 30 42 45
36 30 40 60
3 (CVA) 31 32 41 42
30 35 45 50
40 30 40 40
35 40 40 55
30 30 35 45
4 (Tuberculose) 20 23 24 29
21 25 25 30
20 28 30 28
20 30 26 27
19 31 23 30
2. Suposições. Para analisar esses dados, assumimos um modelo de efeitos fixos

e um delineamento inteiramente casualizado de dois fatores.
3. Hipóteses. Para nosso exemplo ilustrativo, podemos testar as seguintes hipóteses sujeitas às
condições mencionadas acima.
uma. H0: a1 ¼ a2 ¼ a3 ¼ a4 ¼ 0 b. HA: nem todos ai ¼ 0

H0: b1 ¼ b2 ¼ b3 ¼ b4 ¼ 0 c. H0: HA: nem todos bj ¼ 0
allðabÞij ¼ 0 HA: nem todos ðabÞij ¼ 0
Deixe um ¼ :05

atendidas, cada uma das estatísticas de teste é distribuída como F.
6. Regra de decisão. Rejeite H0 se o valor calculado da estatística de teste for igual ou

maior que o valor crítico de F. Os valores críticos de F para testar as três hipóteses
de nosso exemplo ilustrativo são 2,76, 2,76 e 2,04, respectivamente. Como os graus
de liberdade do denominador iguais a 64 não são mostrados na Tabela G do
Apêndice, 60 foi usado como graus de liberdade do denominador.
7. Cálculo da estatística de teste. Usamos o MINITAB para realizar os cálculos.

Colocamos as medições na Coluna 1, os códigos da linha (fator A) na Coluna 2 e
os códigos da coluna (fator B) na Coluna 3. O conteúdo da coluna resultante é
mostrado na Tabela 8.5.6. A saída do
MINITAB é mostrada na Figura 8.5.3.
TABELA 8.5.6 Conteúdo da coluna para cálculos do MINITAB, Exemplo 8.5.2
Fileira C1 C2 C3 Fileira C1 C2 C3
1 20 1 1 41 31 3 1
2 25 1 1 42 30 3 1
3 22 1 1 43 40 3 1
4 27 1 1 44 35 3 1
5 21 1 1 45 30 3 1
6 25 1 2 46 32 3 2
7 30 1 2 47 35 3 2
8 29 1 2 48 30 3 2
9 28 1 2 49 40 3 2
10 30 1 2 50 30 3 2
11 24 1 3 51 41 3 3
12 28 1 3 52 45 3 3
13 24 1 3 53 40 3 3
14 25 1 3 54 40 3 3
15 30 1 3 55 35 3 3
16 28 1 4 56 42 3 4
17 31 1 4 57 50 3 4
18 26 1 4 58 40 3 4
19 29 1 4 59 55 3 4
20 32 1 4 60 45 3 4
21 30 2 1 61 20 4 1
22 45 2 1 62 21 4 1
23 30 2 1 63 20 4 1
24 35 2 1 64 20 4 1
25 36 2 1 65 19 4 1
26 30 2 2 66 23 4 2
27 29 2 2 67 25 4 2
28 31 2 2 68 28 4 2
(Contínuo)
Fileira C1 C2 C3 Fileira C1 C2 C3
29 30 2 2 69 30 4 2
30 30 2 2 70 31 4 2
31 39 2 3 71 24 4 3
32 42 2 3 72 25 4 3
33 36 2 3 73 30 4 3
34 42 2 3 74 26 4 3
35 40 2 3 75 23 4 3
36 40 2 4 76 29 4 4
37 45 2 4 77 30 4 4
38 50 2 4 78 28 4 4
39 45 2 4 79 27 4 4
40 60 2 4 80 30 4 4
8. Decisão estatística. As razões de variância são V:R: ðAÞ ¼ 997:5= 14:7 ¼

67:86, V:R: ðBÞ ¼ 400:4=14:7 ¼ 27:24 e V:R: ðABÞ ¼ 67:6 = 14:7 ¼ 4:60.
Uma vez que os três valores calculados de VR. são todos maiores que os
valores críticos correspondentes, rejeitamos todas as três hipóteses nulas.
9. Conclusão. Quando H0: a1 ¼ a2 ¼ a3 ¼ a4 é rejeitada, concluímos que

existem diferenças entre os níveis de A, ou seja, diferenças no tempo
médio gasto em visitas domiciliares com diferentes tipos de pacientes. Da
mesma forma, quando H0: b1 ¼ b2 ¼ b3 ¼ b4 é rejeitada, concluímos que
existem diferenças entre os níveis de B, ou seja, diferenças no tempo
médio gasto em visitas domiciliares entre os diferentes enfermeiros quando
agrupados por idade. Quando H0: ðabÞij ¼ 0 é rejeitada, concluímos que
os fatores A e B interagem; ou seja, diferentes combinações de níveis dos
dois fatores produzem efeitos diferentes.
10. valor p. Como 67,86, 27,24 e 4,60 são todos maiores que os valores críticos de
F:995 para os graus de liberdade apropriados, o valor de p para cada um dos
testes é menor que 0,005. Quando a hipótese de não interação é rejeitada, o
interesse pelos níveis dos fatores A e B costuma ficar subordinado ao interesse
pelos efeitos da interação. Em outras palavras, estamos mais interessados em
aprender quais combinações de níveis são significativamente diferentes.
A Figura 8.5.4 mostra a saída SAS® para a análise do Exemplo 8.5.2. &
Tratamos apenas o caso em que o número de observações em cada célula é o mesmo.

Quando o número de observações por célula não é o mesmo para todas as células, a análise torna-
se mais complexa.
Nesses casos, diz-se que o projeto é desequilibrado. Para analisar esses experimentos com
o MINITAB, usamos o procedimento linear geral (GLM). Outros pacotes de software, como o SAS®,
também acomodarão tamanhos de células desiguais.

SUBC > SIGNIFICA C2 C3.
Digite C1 em Resposta. Digite C2 em Fator de linha

e marque Exibir meios. Digite C3 em Fator de coluna
e marque Exibir meios. Clique em OK.
Saída:
ANOVA de duas vias: C1 versus C2, C3

Fonte DF SS EM F P
C2 3 2992.4 997.483 67,94 0,000
C3 3 1201.1 400.350 27.27 0,000
Interação 9 608,5 67.606 4,60 0,000
Erro 64 939,6 14.681
Total 79 5741,5
C2 Significar -+---------+---------+---------+---------+
1 26,70 (----*---)
52.832 ----( *---) ----( *---)
03.833
4 25.45 (----*---)
-+---------+---------+---------+---------+ 24,00 28,00 32,00 36,00 40,00
C3 Significar ------+---------+---------+---------+-----
1 27,85 (----*---) (----*---)
2 29,80
59.233 ----( *---)
01.834 ----( *---) ------
+---------+---------+---------+--- --
28h00 31,50 35,00 38,50
FIGURA 8.5.3 Procedimento do MINITAB e tabela ANOVA para o Exemplo 8.5.2.

EXERCÍCIOS 369
O Sistema SAS
Variável dependente: TEMPO
ecruoS eulaV FerauqS naeMserauqS fo muSFD rP F
ledoM 18.1200000031.02300000059.108451 1000,0
rorE 00052186.4100000006.93946
R-Quadrado cv Raiz MSE TEMPO Média
0,836351 11.90866 3.83161193 32.17500000
ecruoS FD eulaV FerauqS naeMSS avonA rP F
BROTCAF 72.7200000053.00400000050.10213 1000,0

AROTCAF 49.7633333384.79900000054.29923 1000,0
FATORB*FATORA 9 608.450000000 67.60555556 4,60 0,0001
FIGURA 8.5.4 Saída SAS® para análise do Exemplo 8.5.2.
EXERCÍCIOS
Para os Exercícios 8.5.1 a 8.5.4, execute a análise de variância, teste as hipóteses apropriadas no nível de
significância de 0,05 e determine o valor p associado a cada teste.
8.5.1. Uryu et al. (A-23) estudaram o efeito de três doses diferentes de troglitazona ð Þ mM na morte neurocelular.
A morte celular causada por acidente vascular cerebral resulta parcialmente do acúmulo de altas concentrações de
glutamato. Os pesquisadores queriam determinar se diferentes doses de troglitazona (1,3, 4,5 e 13:5 mM) e diferentes
formas de íons ð Þ e þ de LY294002, um inibidor
ratos
de foram
PI3-quinase,
estudados
dariam
em diferentes
cada dose níveis
e nívelde
deneuroproteção.
íon, e a variável
Quatro
medida é a porcentagem de morte celular em comparação com o glutamato. Portanto, um valor maior implica em
menor neuroproteção. Os resultados são exibidos na tabela abaixo.
Porcentagem Troglitazona
Comparada ao Glutamato LY294002 vs þ LY294002 Dose (mM)
73,61 Negativo 1.3

130,69 Negativo 1.3
118.01 Negativo 1.3
140,20 Negativo 1.3
(Contínuo)
Porcentagem Troglitazona
Comparada ao Glutamato LY294002 vs þ LY294002 Dose ð Þ mM
97,11 Positivo 1,3

114,26 Positivo 1,3
120,26 Positivo 1,3
92,39 Positivo 1.3
26,95 Negativo 4.5
53.23 Negativo 4.5
59,57 Negativo 4.5
53.23 Negativo 4.5
28.51 Positivo 4.5
30,65 Positivo 4.5
44,37 Positivo 4.5
36.23 Positivo 4.5
8:83 Negativo 13.5
25.14 Negativo 13.5
20.16 Negativo 13.5
34,65 Negativo 13.5
35:80 Positivo 13.5
7:93 Positivo 13.5
19:08 Positivo 13.5
5.36 Positivo 13.5
Fonte: Dados fornecidos por cortesia de Shigeko Uryu.
8.5.2. Pesquisadores de um centro de trauma desejavam desenvolver um programa para ajudar vítimas de traumas com danos
cerebrais a recuperar um nível aceitável de independência. Foi realizado um experimento envolvendo 72 indivíduos
com o mesmo grau de dano cerebral. O objetivo foi comparar diferentes combinações de tratamento psiquiátrico e
fisioterapia. Cada sujeito foi designado para uma das 24 combinações diferentes de quatro tipos de tratamento
psiquiátrico e seis programas de fisioterapia. Havia três assuntos em cada combinação. A variável de resposta é o
número de meses decorridos entre o início da terapia e o tempo em que o paciente foi capaz de funcionar de forma
independente. Os resultados foram os seguintes:
Físico Tratamento Psiquiátrico

Programa de Terapia ABCD
11,0 9,4 12,5 13,2

EU 9,6 9,6 11,5 13,2
10,8 9,6 10,5 13,5
10.5 10.8 10.5 15,0

II 11.5 10.5 11.8 14.6
12,0 10.5 11.5 14,0
12,0 11.5 11.8 12.8

III 11.5 11.5 11.8 13.7
11.8 12.3 12.3 13.1
(Contínuo)
EXERCÍCIOS 371
Físico Tratamento Psiquiátrico

Programa de Terapia ABCD
11.5 9.4 13.7 14,0

4 11.8 9.1 13.5 15,0
10.5 10.8 12.5 14,0
11,0 11.2 14.4 13,0

V 11.2 11.8 14.2 14.2
10,0 10.2 13.5 13.7
11.2 10,8 11.5 11.8

VI 10.8 11,5 10,2 12.8
11.8 10.2 11,5 12,0
Pode-se concluir com base nesses dados que os diferentes programas de tratamento psiquiátrico têm efeitos
diferentes? Pode-se concluir que os programas de fisioterapia diferem em eficácia? Pode-se concluir que existe
interação entre programas de tratamento psiquiátrico e programas de fisioterapia? Deixe um ¼ :05 para cada teste.
Os exercícios 8.5.3 e 8.5.4 são opcionais, pois possuem tamanhos de células desiguais. Recomenda-se que os
dados para estes sejam analisados usando SAS® ou algum outro pacote de software que aceite desigual
tamanhos de células.
8.5.3. Main e outros. (A-24) afirmam: “A cefaleia primária é uma condição muito comum e que os enfermeiros encontram
em muitos ambientes de cuidados diferentes. No entanto, faltam evidências sobre se o conselho dado aos
pacientes é eficaz e quais melhorias podem ser esperadas nas condições”. Os pesquisadores avaliaram a
frequência de dores de cabeça no início e no final do estudo para 19 indivíduos em um grupo de intervenção
(tratamento 1) e 25 indivíduos em um grupo de controle (tratamento 2).
Os indivíduos do grupo de intervenção receberam educação em saúde de uma enfermeira, enquanto o grupo de
controle não recebeu educação. Nos 6 meses entre pré e pós-avaliação, os sujeitos mantiveram um diário de dor
de cabeça. A tabela a seguir apresenta como variável de resposta a diferença (pré – pós) na frequência de dores
de cabeça ao longo dos 6 meses para dois fatores: (1) tratamento com dois níveis (intervenção e controle) e (2)
status de enxaqueca com dois níveis ( sofre de enxaqueca e não sofre de enxaqueca).
Mudança em Mudança em
Frequência de sofredor de enxaqueca Frequência de sofredor de enxaqueca
dores de cabeça (1 = Não, 2 = Sim) Tratamento dores de cabeça (1 = Não, 2 = Sim) Tratamento
2 1 1 3 22
2 2 1 6 22
33 1 1 11 1 2
6 2 1 64 1 2
6 2 1 65 1 2
98 1 1 14 1 2
2 2 18 1 2
6 2 16 2 2
(Contínuo)
Frequência de sofredor de enxaqueca Frequência de sofredor de enxaqueca
dores de cabeça (1 = Não, 2 = Sim) Tratamento dores de cabeça (1 = Não, 2 = Sim) Tratamento
33 1 1 14 1 2
7 2 1 11 2 2
1 2 1 53 1 2
12 2 1 26 2 2
12 1 1 3 1 2
64 1 1 15 1 2
36 2 1 3 1 2
6 2 1 41 1 2
4 2 1 16 1 2
11 2 1 4 22
0 2 1 6 22
9 12
9 22
3 22
9 22
3 12
4 22
Fonte: Dados fornecidos por cortesia de A. Main, H. Abu-Saad, R. Salt, l. Vlachonikolis, e A. Dowson, “Management by Nurses of Primary
Headache: A Pilot Study,” Current Medical Research Opinion, 18 (2002), 471–478.
Pode-se concluir com base nesses dados que há uma diferença na redução de
frequência de dor de cabeça entre os grupos de controle e tratamento? Pode-se concluir que existe uma
diferença na redução da frequência de cefaléia entre migranosos e não migranosos?
Pode-se concluir que existe interação entre os tratamentos e o estado da enxaqueca? Deixe um ¼ :05 para
cada teste.
8.5.4. O objetivo do estudo de Porcellini et al. (A-25) foi estudar a diferença na resposta das células CD4 em pacientes
recebendo terapia antirretroviral altamente ativa (HAART, tratamento 1) e pacientes recebendo HAART mais
interleucina intermitente (IL-2, tratamento 2). Outro fator de interesse foi a contagem plasmática de RNA do
HIV na linha de base do estudo. Os indivíduos foram classificados como tendo menos de 50 cópias/ml (plasma
1) ou tendo 50 ou mais cópias/ml (plasma 2). A variável de resultado é a alteração percentual na contagem
de células T CD4 desde o início até 12 meses de tratamento. Pode-se concluir que há uma diferença
na variação percentual na contagem de células T CD4 entre os dois tratamentos? Os resultados são mostrados
na tabela a seguir. Pode-se concluir que existe uma diferença na variação percentual na contagem de células
T CD4 entre aqueles que têm menos de 50/ml de cópias plasmáticas de HIV-RNA e aqueles que não têm?
Pode-se concluir que há interação entre tratamentos e níveis plasmáticos? Deixe um ¼ :05 para cada teste.
Percentagem de alteração na célula T CD4 Tratamento Plasma
12:60 1 1
14:60 2 1
28.10 2 1
(Contínuo)
8.6 RESUMO 373
Percentagem de alteração na célula T CD4 Tratamento Plasma
77,30 1 1
0:44 1 1
50,20 1 1
48,60 2 2
86,20 2 2
205,80 1 2
100,00 1 2
34h30 1 2
82,40 1 2
118,30 1 2
Fonte: Dados fornecidos por cortesia de Simona Porcellini, Guiliana

Vallanti, Silvia Nozza, Guido Poli, Adriano Lazzarin, Guiseppe
Tabussi e Antonio Grassia, “Improved Thymopoietic Potential in
Aviremic HIV Infected Individuals with HAART by Intermittent IL-2
Administration,” AIDS, 17 (2003), 1621-1630.
8.5.5. Um estudo de Gorecka et al. (A-26) avaliaram a maneira pela qual entre fumantes de meia-idade o diagnóstico de
limitação do fluxo aéreo (AL) combinado com o conselho para parar de fumar influencia a taxa de cessação do
tabagismo. Suas preocupações eram se ter AL, se o sujeito parou de fumar com sucesso e se a interação entre
AL e tabagismo eram fatores significativos em relação às variáveis basais e variáveis de capacidade pulmonar
no final do estudo. Algumas das variáveis de interesse foram anos anteriores de tabagismo (anos-maço), idade
em que o sujeito começou a fumar, volume expiratório forçado no primeiro segundo ðVEF1Þ e capacidade vital
forçada (CVF). Havia 368 indivíduos no estudo. Quais são os fatores neste estudo? Em quantos níveis cada um
ocorre? Quem são os sujeitos? Qual é (são) a(s) variável(is) de resposta? Você consegue pensar em alguma
variável estranha cujos efeitos estão incluídos no termo de erro?
8.5.6. Um estudo de Meltzer et al. (A-27) examinou a resposta a 5 mg de desloratadina, um antagonista do receptor H1,
em pacientes com alergias sazonais. Durante a temporada de alergia de outono, 172 indivíduos foram
designados aleatoriamente para receber tratamentos de desloratadina e 172 foram designados aleatoriamente
para receber um placebo. Os indivíduos tomaram a medicação por 2 semanas, após o que foram calculadas as
alterações na pontuação dos sintomas nasais. Uma redução significativa foi observada no grupo de tratamento
em comparação com o grupo placebo, mas o sexo não foi um fator significativo. Quais são os fatores do estudo?
Em quantos níveis cada um ocorre? Qual é a variável de resposta?
8.6 RESUMO
O objetivo deste capítulo é apresentar ao aluno as ideias e técnicas básicas de análise
de variância. Dois projetos experimentais, o completamente aleatório e o bloco completo
aleatório, são discutidos em detalhes consideráveis. Além disso, são introduzidos o
conceito de designs de medidas repetidas e um experimento fatorial como usado com
o design completamente aleatório. Indivíduos que desejam aprofundar qualquer aspecto
da análise de variância acharão as referências de metodologia no final do capítulo
muito úteis.
Fórmula
8.2.1 Modelo ANOVA xij ¼ m þ tj þ eij
unidirecional
8.2.2 Soma total dos quadrados 2

SST ¼ Xk Xnj xij x::
j¼1 i¼1
8.2.3 Soma dos 2

quadrados dentro do grupo SSW ¼ Xk Xnj xij x:j
j¼1 i¼1
8.2.4 Soma dos 2

quadrados entre grupos SSA ¼ Xk nj xj x::
j¼1
8.2.5 Variância dentro do grupo 2

xk Xnj xij xj
j¼1 i¼1
MSW ¼
nj 1
xk
j¼1
8.2.6 Variância s2 ¼ ns2 x

entre grupos I
8.2.7 Variância 2
entre grupos II n Xk xjx ::
j¼1
(tamanhos de amostra iguais) MSA ¼
k1
8.2.8 Variância 2
entre grupos III xk nj xj x::
j¼1
(tamanhos de amostras desiguais) MSA ¼
k1
8.2.9 HSD de Tukey MSE

(tamanhos de amostra iguais) HSD ¼ qa;k;Nk
nrs
8.2.10 HSD de Tukey MSE 1

(tamanhos de amostras desiguais) HSD ¼ qa;k;Nk 1þ
2 ni nj
8.3.1 Modelo ANOVA xij ¼ m þ bi þ tj þ eij

bidirecional
8.3.2 Representação de SST ¼ SSBl þ SSTr þ SSE

soma de quadrados
(Contínuo)
8.3.3 Soma dos quadrados total 2

SST ¼ Xk Xn xij x: :
j¼1 i¼1
8.3.4 Bloco de soma de quadrados 2

Xn XI
ð
x: : º
SSBl ¼ Xk
j¼1 i¼1
8.3.5 soma dos quadrados 2

tratamentos SSTr ¼ Xk Xn xj x: :
j¼1 i¼1
8.3.6 Erro da soma dos quadrados SSE ¼ SST SSBl SSTr
8.4.1 ANOVA de efeitos xij ¼ m þ bi þ tj þ eij

fixos, fator único
aditivo, medidas repetidas
modelo
8.4.2 Modelo de medidas xijk ¼ m þ rij þ ai þ bj þ ðabÞij þ eijk

repetidas de dois fatores
8.5.1 Modelo fatorial de efeitos xijk ¼ m þ ai þ bj þ ð Þ ab eu j þ eijk

fixos completamente
aleatórios de dois fatores
8.5.2 Representação a<1 ð 1 a0 ð Þ1 a00 ð Þ 1 a000 Þ

probabilística de um
8.5.3 Soma dos quadrados total I 2 2

Xa Xb Xn xijk x::: ¼ Xa Xb Xn xij x:::
i¼1 j¼1 k¼1 i¼1 j¼1 k¼1
2
þ Xa Xb Xn xijk xij
i¼1 j¼1 k¼1
8.5.4 Soma dos quadrados total II SST ¼ SSTr þ SSE

8.5.5 Partição de tratamento 2
2
Xa Xb Xn xij x::: ¼ Xa Xb Xn ðXI:: x::: º
de soma de quadrados
i¼1 j¼1 k¼1 i¼1 j¼1 k¼1
2
þ Xa Xb Xn xjx :::
i¼1 j¼1 k¼1
2
þ Xa Xb Xn xij xi:: xj þ x:::
i¼1 j¼1 k¼1
Tecla de símbolo a ¼ Probabilidade de erro tipo I ai ¼

efeito do tratamento A bj ¼ efeito do
tratamento B bi ¼ efeito do bloco ð Þ ab

¼ efeito da interação ij eij ¼ termo do
erro
HSD ¼ diferença honestamente significativa

k ¼ número de tratamentos
m ¼ média da população ou média

ð geral Þ n ¼ número
ou quarteirões
nx ¼ tamanho da
amostra rij ¼ efeito de bloco para medidas repetidas de dois fatores em
torno de s2 ¼ variância ð
SSX ¼ soma dos quadrados onde X : A ¼ entre;
Bloco Bl ¼; T ¼ total; Tr ¼ tratamento; W ¼ dentroÞ ti ¼ efeito do
tratamento
xxxx ¼ medida
1. Defina análise de variância.
2. Descreva o delineamento inteiramente aleatório.
3. Descreva o delineamento de blocos aleatórios.
4. Descreva o projeto de medidas repetidas.
5. Descreva o experimento fatorial conforme usado no delineamento inteiramente casualizado.
6. Qual é o objetivo do teste HSD de Tukey?
7. O que é uma unidade experimental?
8. Qual é o objetivo do delineamento de blocos aleatórios completos?
9. O que é interação?
10. O que é um quadrado médio?
11. O que é uma tabela ANOVA?
12. Para cada um dos projetos a seguir, descreva uma situação em seu campo de interesse específico em que o projeto seria um
projeto experimental apropriado. Use dados reais ou realistas e faça a análise de variância apropriada para cada um: (a)
Delineamento completamente aleatório (b) Delineamento em bloco completo aleatório (c) Delineamento totalmente aleatório
com um experimento fatorial (d) Delineamentos de medidas repetidas
13. Werther et al. (A-28) examinou a contagem de leucócitos b 109=L em 51 indivíduos com câncer colorretal e 19 controles
saudáveis. Os pacientes com câncer também foram classificados na classificação de Dukes (A, B, C) para câncer colorretal,
que dá aos médicos um guia sobre o risco, após a cirurgia, de o câncer voltar ou se espalhar para outras partes do corpo.
Uma categoria adicional (D) identificou pacientes com doença que não foram completamente ressecados. Os resultados são
exibidos na tabela a seguir.
Realize uma análise desses dados na qual você identifica as fontes de variabilidade e especifica os graus de liberdade para
cada uma. Esses dados fornecem evidências suficientes para indicar que, em média, as contagens de leucócitos diferem
entre as cinco categorias? Seja a ¼ :01 e encontre o valor de p. Use o procedimento de Tukey para testar diferenças
significativas entre pares individuais de médias amostrais.
Saudável UMA B C D
6.0 7.7 10.4 8,0 9.5

6.3 7.8 5.6 6.7 7,8
5.1 6.1 7,0 9.3 5,7
6.2 9,6 8.2 6.6 8,0
10,4 5,5 9,0 9,3 9,6
4,4 5,8 8,4 7,2 13,7
7,4 4,0 8,1 5,2 6,3
7,0 5,4 8,0 9,8 7,3
5,6 6,5 6,2 6,2
5,3 9,1 10,1
2,6 11,0 9,3
6.3 10.9 9,4
6.1 10.6 6.5
5.3 5.2 5.4
5.4 7.9 7.6
5.2 7.6 9.2
4.3 5.8
4.9 7,0
7.3
4.9
6.9
4.3
5.6
5.1
Fonte: Dados fornecidos por cortesia de Kim Werther, MD, Ph.D.
14. No Exemplo 8.4.1, examinamos dados de um estudo de Licciardone et al. (A-15) sobre manipulação osteopática como tratamento
para dor crônica nas costas. No início desse estudo, havia na verdade 91 indivíduos designados aleatoriamente para um dos
três tratamentos: tratamento manipulativo osteopático (OMT), manipulação simulada (SHAM) ou não intervenção (CONTROL).
Uma variável de resultado importante foi a classificação da dor nas costas no início do estudo. Os pesquisadores queriam
saber se o tratamento tinha essencialmente o mesmo nível médio de dor no início do estudo. Os resultados são exibidos na
tabela a seguir. Os pesquisadores usaram uma escala analógica visual de 0 a 10 cm, onde 10 indicava “a pior dor possível”.
Podemos concluir, com base nesses dados, que, em média, os níveis de dor diferem nos três grupos de tratamento? Seja a
¼ :05 e encontre o valor de p. Se justificado, use o procedimento de Tukey para testar as diferenças entre pares individuais
de médias amostrais.
AO CONTROLE FARSA, FALSO OMT
2.6 5.8 7.8 3.5

5.6 1.3 4.1 3.4
3.3 2.4 1.7 1.1
4.6 1,0 3.3 0,5
8.4 3.2 4.3 5.1
0,0 0,4 6.5 1.9
2.5 5.4 5.4 2.0
(Contínuo)
AO CONTROLE FARSA, FALSO OMT
5,0 4,5 4,0 2,8

1,7 1,5 4,1 3,7
3,8 0,0 2,6 1,6
2,4 0,6 3,2 0,0
1.1 0,0 2.8 0,2
0,7 7.6 3.4 7.3
2.4 3.5 6.7 1.7
3.3 3.9 7.3 7.5
6.6 7,0 2.1 1.6
0,4 7.4 3.7 3.0
0,4 6.5 2.3 6.5
0,9 1.6 4.4 3.0
6.0 1.3 2.8 3.3
6.6 0,4 7.3
6.3 0,7 4.6
7,0 7.9 4.8
1.3 4.9
Fonte: Dados fornecidos por cortesia de JC Licciardone, DO
15. O objetivo de um estudo conduzido por Meshack e Norman (A-29) foi avaliar os efeitos dos pesos no tremor postural das mãos
relacionado à autoalimentação em indivíduos com doença de Parkinson (DP). Cada um dos 16 indivíduos teve a amplitude do
tremor medida (em mm) sob três condições: segurar uma colher cheia (108 gramas), segurar uma colher pesada (248 gramas)
e segurar a colher cheia enquanto usava um pulso pesado manguito (470 gramas). Os dados são exibidos na tabela a seguir.
Amplitude do tremor (mm)
Sujeito Colher Embutida colher ponderada Colher Embutida þ Manguito de Pulso
1 .77 1.63 1.02

2 .78 .88 1.11
3 .17 .14 .14
4 .30 .27 .26
5 .29 .27 .28
6 1,60 1.49 1,73
7 .38 .39 .37
8 .24 .24 .24
9 .17 .17 .16
10 .38 .29 .27
11 .93 1.21 .90
12 .63 .52 .66
13 .49 .73 .76
14 .42 .60 .29
15 .19 .21 .21
16 .19 .20 .16
Fonte: Rubia P. Meshack e Kathleen E. Norman, “A Randomized Controlled Trial of the Effects of Weights
on Amplitude and Frequency of Postural Hand Tremor in People with Parkinson's Disease,”
Reabilitação Clínica, 16 (2003), 481–492.
Pode-se concluir com base nesses dados que as três condições experimentais, em média, têm efeitos diferentes na amplitude do
tremor? Deixe um ¼ :05. Determine o valor p.
16. Em um estudo de efeitos pulmonares em cobaias, Lacroix et al. (A-30) expôs 18 porquinhos-da-índia sensibilizados com ovalbumina e
18 porquinhos-da-índia não sensibilizados ao ar normal, benzaldeído e acetaldeído. No final da exposição, as cobaias foram
anestesiadas e as respostas alérgicas foram avaliadas na lavagem broncoalveolar (BAL). A tabela a seguir mostra a contagem de
células alveolares 106 por grupo de tratamento para cobaias sensibilizadas e não sensibilizadas com ovoalbumina.
Sensibilizado por Ovalbumina Tratamento Contagem alveolar 106
não acetaldeído 49,90

não acetaldeído 44.10
não acetaldeído 36.30
não acetaldeído ar ar 39,15
não ar ar ar ar 24,15
não 24,60
não 22,55
não 25,10
não 22,65
não 26,85
não benzaldeído 31.10
não benzaldeído 18h30
não benzaldeído 27.10
não benzaldeído 21,90
sim acetaldeído 90,30
sim acetaldeído ar 31,70
sim 40,20
sim ar 63,20
sim ar 59.10
sim ar 79,60
sim ar 102,45
sim ar 64,60
Sim benzaldeído 22,15
SIM benzaldeído 22,75
SIM benzaldeído 22,15
sim benzaldeído 37,85
Fonte: Dados fornecidos por cortesia de G. Lacroix, Docteur en Toxicologie.

Teste as diferenças (a) entre resultados sensibilizados e não sensibilizados com ovalbumina, (b) entre as três
exposições diferentes e (c) interação. Deixe um ¼ :05 para todos os testes.
17. Watanabe et al. (A-31) estudou 52 trabalhadores saudáveis de meia-idade. Os pesquisadores usaram o Masstricht
Vital Exhaustion Questionnaire para avaliar a exaustão vital. Com base nas pontuações resultantes, eles dividiram
os participantes em três grupos: VE1, VE2 e VE3. O VE1 indica o menor número de sinais de exaustão e o VE3
indica o maior número de sinais de exaustão. Os pesquisadores também perguntaram aos participantes sobre seus
hábitos de fumar. O status de tabagismo foi categorizado da seguinte forma: SMOKE1 são não fumantes, SMOKE2
são fumantes leves (20 cigarros ou menos por dia), SMOKE3 são fumantes pesados (mais de 20 cigarros por dia).
Uma das variáveis de resultado de interesse foi a amplitude da análise espectral de alta frequência da variabilidade
da frequência cardíaca observada durante um exame de saúde anual. Essa variável, amplitude de HF, foi usada
como um índice da função nervosa parassimpática. Os dados estão resumidos na seguinte tabela:
HF-Amplitude
Condição de fumante
Exaustão Vital
Grupo FUMAR1 FUMAR2 FUMAR3
VE1 23,33 13,37 16,14 16,83

31,82 9,76 20,80 29,40
10.61 22,24 15.44 6,50
42,59 8.77 13.73 10.18
23.15 20.28 13.86
17.29
VE2 20,69 11.67 44,92 27,91

16,21 30.17 36,89
28,49 29,20 16,80
25,67 8,73 17,08
15,29 9,08 18,77
7,51 22,53 18,33
22,03 17,19
10,27
VE3 9.44 17.59 5.57

19.16 18,90 13.51
14.46 17h37
10.63
13.83
Fonte: Dados fornecidos por cortesia de Takemasa Watanabe, MD, Ph.D.
Realize uma análise de variância nesses dados e teste as três hipóteses possíveis. Seja a0 ¼ a00 ¼ a000 ¼ :05.
Determine os valores de p.
18. Os efeitos da poluição térmica em Corbicula fluminea (amêijoas asiáticas) em três diferentes localizações geográficas
foram analisados por John Brooker (A-32). Dados de amostra sobre comprimento, largura e altura da concha são
exibidos na tabela a seguir. Determine se há uma diferença significativa no comprimento, altura ou largura média
(medida em mm) da concha nos três locais diferentes, realizando três análises. Que inferências podem ser feitas a
partir de seus resultados? Quais são as suposições subjacentes às suas inferências? Quais são as populações-alvo?
Local 1 Local 2 Local 3
Comprimento Largura Altura Comprimento Largura Altura Comprimento Largura Altura
7.20 6.10 4,45 7.25 6.25 4,65 5,95 4,75 3.20

7,50 5,90 4,65 7.23 5,99 4.20 7,60 6.45 4.56
6,89 5.45 4,00 6,85 5.61 4.01 6.15 5.05 3,50
6,95 5.76 4.02 7.07 5.91 4.31 7.00 5,80 4.30
6.73 5.36 3,90 6.55 5.30 3,95 6.81 5.61 4.22
7.25 5.84 4,40 7.43 6.10 4,60 7.10 5,75 4.10
7.20 5.83 4.19 7h30 5,95 4.29 6,85 5,55 3,89
6,85 5,75 3,95 6,90 5,80 4.33 6.68 5,50 3,90
7.52 6.27 4,60 7.10 5.81 4.26 5.51 4.52 2,70
7,01 5,65 4.20 6,95 5,65 4,31 6,85 5,53 4,00
6,65 5,55 4.10 7,39 6,04 4,50 7.10 5,80 4,45
7,55 6,25 4,72 6,54 5,89 3,65 6.81 5,45 3,51
7,14 5,65 4,26 6,39 5,00 3,72 7,30 6,00 4,31
7,45 6,05 4,85 6,08 4,80 3,51 7,05 6,25 4,71
7,24 5,73 4,29 6,30 5,05 3,69 6,75 5,65 4,00
7,75 6,35 4,85 6,35 5,10 3,73 6,75 5,57 4,06
6,85 6,05 4,50 7,34 6,45 4,55 7,35 6,21 4,29
6,50 5,30 3,73 6,70 5,51 3,89 6,22 5,11 3,35
6.64 5.36 3,99 7.08 5.81 4,34 6,80 5.81 4,50
7.19 5,85 4,05 7.09 5,95 4.39 6.29 4,95 3,69
7.15 6h30 4,55 7.40 6.25 4,85 7,55 5.93 4,55
7.21 6.12 4.37 6,00 4,75 3.37 7.45 6.19 4,70
7.15 6.20 4.36 6,94 5.63 4.09 6,70 5,55 4,00
7h30 6.15 4,65 7.51 6.20 4,74
6.35 5.25 3,75 6,95 5.69 4.29
7,50 6.20 4,65
Fonte: Dados fornecidos por cortesia de John Brooker, MS e do Wright State University Statistical
Consulting Center.
19. Eleftherios Kellis (A-33) conduziu um experimento em 18 homens na puberdade. Ele registrou a atividade eletromiográfica
(EMG) em nove posições angulares diferentes do músculo bíceps femoral. Os valores EMG são expressos como uma
porcentagem (0-100 por cento) do esforço máximo exercido com o músculo e representam uma média em uma faixa
de ângulos de flexão. As nove posições correspondem ao teste dos ângulos de flexão do joelho de 1–10, 11–20, 21–
30, 31–40, 41–50, 51–60, 61–70, 71–80 e 81–90. Os resultados são exibidos na tabela a seguir. Para o sujeito 1, por
exemplo, o valor de 30,96 por cento representa o percentual máximo médio de esforço nas posições angulares de 1 a
10 graus.
Sujeito 1–10 11–20 21–30 31–40 41–50 51–60 61–70 71–80 81–90
1 30,96 11.32 4.34 5,99 8.43 10,50 4,49 10.93 33.26

2 3.61 1.47 3,50 10,25 3.30 3,62 10.14 11.05 8.78
3 8.46 2,94 1,83 5,80 11.59 15,17 13.04 10.57 8,22
4 0,69 1.06 1.39 1.08 0,96 2,52 2,90 3.27 5,52
5 4,40 3,02 3,74 3,83 3,73 10,16 9,31 12,70 11,45
6 4,59 9,80 10,71 11,64 9,78 6,91 8,53 8,30 11,75
7 3,31 3,31 4,12 12,56 4,60 1,88 2,42 2,46 2,19
8 1,98 6,49 2,61 3,28 10,29 7,56 16,68 14,52 13,49
9 10,43 4,96 12,37 24,32 17,16 34,71 35,30 37,03 45,65
10 20,91 20,72 12,70 15,06 12,03 11,31 28,47 26,81 25,08
11 5,59 3,13 2,83 4,31 6,37 13,95 13,48 11,15 30,97
12 8,67 4.32 2.29 6.20 13.01 19,30 9.33 12h30 12,20
13 2.11 1,59 2.40 2.56 2.83 2,55 5.84 5.23 8.84
14 3.82 5.04 6.81 10.74 10.10 13.14 19h39 13h31 12.02
15 39,51 62,34 70,46 20.48 17h38 54.04 25.76 50,32 46,84
16 3.31 4,95 12h49 9.18 14h00 16.17 25,75 11.82 13.17
17 11.42 7.53 4,65 4,70 7.57 9.86 5.30 4.47 3,99
18 2,97 2.18 2.36 4.61 7.83 17h49 42,55 61,84 39,70
Fonte: Dados fornecidos por cortesia de Eleftherios Kellis, Ph.D.
Podemos concluir com base nesses dados que os valores médios de EMG diferem entre as nove localizações angulares?
Deixe um ¼ :05.
20. Em um estudo da síndrome de Marfan, Pyeritz et al. (A-34) relataram os seguintes escores de gravidade de pacientes sem
ectasia dural leve e acentuada. Podemos concluir, com base nesses dados, que os escores médios de gravidade diferem
entre as três populações representadas no estudo? Seja a ¼ :05 e encontre o valor de p. Use o procedimento de Tukey
para testar diferenças significativas entre pares individuais de médias amostrais.
Sem ectasia dural: 18, 18, 20, 21, 23, 23, 24, 26, 26, 27, 28, 29, 29, 29, 30, 30, 30, 30, 32, 34, 34, 38
Ectasia dural leve: 10, 16, 22, 22, 23, 26, 28, 28, 28, 29, 29, 30, 31, 32, 32, 33, 33,
38, 39, 40, 47
Ectasia dural marcada: 17, 24, 26, 27, 29, 30, 30, 33, 34, 35, 35, 36, 39 Fonte: Dados
fornecidos por cortesia de Reed E. Pyeritz, MD, Ph .D.
21. A tabela a seguir mostra as concentrações plasmáticas de epinefrina arterial (nanogramas por mililitro)
encontrados em 10 animais de laboratório durante três tipos de anestesia:
Animal
Anestesia 1 2 3 4 5 6 7 8 9 10
UMA .28 .50 .68 .27 .31 .99 .26 .35 .38 .34
B .20 .38 .50 .29 .38 .62 .42 .87 .37 .43
C 1.23 1.34 .55 1.06 .48 .68 1.12 1.52 .27 .35
Podemos concluir a partir desses dados que os três tipos de anestesia, em média, têm efeitos diferentes? Deixe um ¼ :05.
22. O objetivo do estudo de Hartman-Maeir et al. (A-35) foi avaliar a consciência dos perfis de déficit entre pacientes com AVC
em reabilitação. Ela estudou 35 pacientes com lesão encefálica no hemisfério direito e 19 pacientes com lesão no
hemisfério esquerdo. Ela também agrupou o tamanho da lesão como
2 ¼ “1-3 cm”; 3 ¼ “3-5 cm”; e 4 ¼ “5 cm ou mais”

Uma das variáveis de resultado foi uma medida de total desconhecimento de cada paciente de suas próprias limitações.
As pontuações variaram de 8 a 24, com pontuações mais altas indicando mais inconsciência.
Pontuação de inconsciência
Tamanho da lesão Deixei Direita

Grupo Hemisfério Hemisfério
2 11 10 8
13 11 10
10 13 9
11 10 9
9 13 9
10 10
9 10
8 9
10 8
3 13 11 10
8 10 11
10 10 12
10 14 11
10 8
4 11 10 11
13 13 9
14 10 19
13 10 10
14 15 9
8 10 de Adina Hartman-Maeir, Ph.D., OTR
Teste a diferença no tamanho da lesão, hemisfério e interação. Deixe um ¼ :05 para todos os testes.
23. Uma amostra aleatória dos registros de nascimentos únicos foi selecionada de cada uma das quatro populações. o
os pesos (gramas) dos bebês ao nascer foram os seguintes:
Amostra
um BCD
2946 3186 2300 2286

2913 2857 2903 2938
2280 3099 2572 2952
3685 2761 2584 2348
(Contínuo)
Amostra
um BCD
2310 3290 2675 2691

2582 2937 2571 2858
3002 3347 2414
2408 2008
2850
2762
Esses dados fornecem evidências suficientes para indicar, no nível de significância de 0,05, que as quatro
populações diferem com relação ao peso médio ao nascer? Teste para uma diferença significativa entre todos os
possíveis pares de médias.
24. A tabela a seguir mostra as pontuações de agressão de 30 animais de laboratório criados em três condições diferentes.
Um animal de cada uma das 10 ninhadas foi designado aleatoriamente para cada uma das três condições de
criação.
Condição de Criação
Extremamente Moderadamente Não

Lixo Lotado Lotado Lotado
1 30 20 10
2 30 10 20
3 30 20 10
4 25 15 10
5 35 25 20
6 30 20 10
7 20 20 10
8 30 30 10
9 25 25 10
10 30 20 20
Esses dados fornecem evidências suficientes para indicar que o nível de aglomeração tem efeito sobre a agressão?
Deixe um ¼ :05.
25. A tabela a seguir mostra as medidas de capacidade vital de 60 homens adultos classificados por ocupação
e faixa etária:
Ocupação
Grupo de idade UMA B C D
1 4,31 4,68 4,17 5,75

4,89 6,18 3,77 5,70
4,05 4,48 5,20 5,53
4,44 4,23 5,28 5,97
4,59 5.92 4.44 5,52
(Contínuo)
Ocupação
Grupo de idade UMA B C D
2 4.13 3.41 3,89 4,58

4.61 3,64 3,64 5.21
3.91 3.32 4.18 5,50
4.52 3.51 4,48 5.18
4.43 3,75 4.27 4.15
3 3,79 4.63 5.81 6,89

4.17 4,59 5.20 6.18
4.47 4,90 5.34 6.21
4.35 5.31 5,94 7.56
3,59 4.81 5.56 6.73
Teste para diferenças entre ocupações, para diferenças entre faixas etárias e para interação.
Deixe um ¼ :05 para todos os testes.
26. Preencha a tabela ANOVA a seguir e indique qual experimento foi usado.
Fonte SS df MS VR p
Tratamentos 154.9199 4
Erro
Total 200.4773 39
27. Preencha a tabela ANOVA a seguir e indique qual experimento foi usado.
Fonte SS df MS VR p
Tratamentos 3
Blocos 183,5 3
Erro 26,0
Total 709,0 15
28. Considere a seguinte tabela ANOVA.
Fonte SS df EM RV p
UMA 12.3152 2 6.15759 29.4021 <0,005

B 19.7844 3 6.59481 31.4898 <0,005
AB 8.94165 6 1.49027 7.11596 <0,005
Tratamentos 41.0413 11
Erro 10.0525 48 0,209427
Total 51.0938 59
(a) Que tipo de análise foi empregada?

(b) O que se pode concluir da análise? Deixe um ¼ :05.
Fonte SS df EM RV
Tratamentos 5.05835 2 2.52917 1.0438

Erro 65.42090 27 2.4230
(a) Que projeto foi empregado?

(b) Quantos tratamentos foram comparados?
(c) Quantas observações foram analisadas?
(d) No nível de significância de 0,05, pode-se concluir que há uma diferença entre os tratamentos?
Porque?
Fonte SS df EM RV
Tratamentos 231.5054 2 115.7527 2.824

Blocos 98.5000 14.0714
Erro 573.7500 7 14 40.9821
(a) Que projeto foi empregado?

(b) Quantos tratamentos foram comparados?
(c) Quantas observações foram analisadas?
(d) No nível de significância de 0,05, pode-se concluir que os tratamentos têm efeitos diferentes? Porque?
31. Em um estudo sobre a relação entre tabagismo e concentrações séricas de colesterol de lipoproteína de alta
densidade (HDL-C), os seguintes dados (codificados para facilitar o cálculo) foram coletados de amostras
de homens adultos não fumantes, fumantes leves, moderados fumantes e fumantes pesados. Queremos
saber se esses dados fornecem evidências suficientes para indicar que as quatro populações diferem com
relação à concentração sérica média de HDL-C. Deixe a probabilidade de cometer um erro tipo I ser 0,05.
Se for encontrada uma diferença global significativa, determine quais pares de médias de amostras
individuais são significativamente diferentes.
não fumantes Claro Moderado Pesado
12 9 5 3
10 8 4 2
11 5 7 1
13 9 9 5
9 95 4
9 107 6
12 8 6 2
32. Polyzogopoulou et al. (A-36) relatam os efeitos da cirurgia bariátrica nos níveis de glicose em jejum (mmol/L) em 12 indivíduos
obesos com diabetes tipo 2 em quatro momentos: pré-operação, aos 3 meses, 6 meses e 12 meses. Podemos concluir,
depois de eliminar os efeitos do sujeito, que os níveis de glicose em jejum diferem ao longo do tempo após a cirurgia? Deixe
um ¼ :05.
Nº do assunto Pré-operatório 3 meses 6 meses 12 meses
108,0 200,0 94,3 92,0

1 96,7 119,0 84,0 93,0
2 77,0 130,0 76,0 74,0
34 92,0 181,0 82,5 80,5
5 97,0 134,0 81,0 76,0
6 94,0 163,0 96,0 71,0
7 76,0 125,0 74,0 75,5
8 100,0 189,0 97,0 88,5
9 82,0 282,0 91,0 93,0
10 103,5 226,0 86,0 80,5
11 85,5 145,0 83,5 83,0
12 74,5 156,0 71,0 87,0
Fonte: Dados fornecidos por cortesia de Theodore K. Alexandrides, MD
33. Consulte o Exercício de revisão 32. Além de estudar os 12 indivíduos com diabetes tipo 2 (grupo 1), Polyzogopoulou et al. (A-36)
estudou cinco indivíduos com tolerância diminuída à glicose (grupo 2) e oito indivíduos com tolerância normal à glicose (grupo
3). Os dados a seguir são os níveis de glicose em jejum pós-operatório de 12 meses para os três grupos.
Grupo
1,0 92,0
1,0 93,0
1,0 74,0
1,0 80,5
1,0 76,0
1,0 71,0
1,0 75,5
1,0 88,5
1,0 93,0
1,0 80,5
1,0 83,0
1,0 87,0
2.0 79,0
2.0 78,0
2.0 100,0
2.0 76,5
2.0 68,0
3.0 81,5
3.0 75,0
3.0 76,5
(Contínuo)
Grupo
3,0 70,5
3,0 69,0
3,0 73,8
3,0 74,0
3.0 80,0

de Theodore K. Alexandrides, MD
Podemos concluir que existe diferença entre as médias dos três grupos? Em caso afirmativo, quais pares de médias
diferem? Deixe um ¼ :05 para todos os testes.
Para os exercícios 34 a 38, faça o seguinte:
(a) Indique qual técnica estudada neste capítulo (o delineamento completamente aleatório, o delineamento em blocos
ao acaso, o delineamento de medidas repetidas ou o experimento fatorial) é apropriado. (b) Identifique a variável de
resposta e as variáveis de tratamento. (c) Conforme apropriado, identifique os fatores e o número de níveis de cada um,
as variáveis de bloqueio e os assuntos. (d) Liste quaisquer variáveis estranhas cujos efeitos você acha que podem ser
incluídos no termo de erro. (e) Conforme apropriado, comente sobre os efeitos de transferência e posição. (f) Construa
uma tabela ANOVA na qual você indique as fontes de variabilidade e o número de graus de liberdade para cada uma.
34. Johnston e Bowling (A-37) estudaram o conteúdo de ácido ascórbico (vitamina C) em vários produtos de suco de laranja.
Um dos produtos examinados era um suco pronto para beber embalado em um recipiente com tampa de rosca que
pode ser fechado novamente. Uma análise analisou o suco quanto ao teor reduzido e oxidado de vitamina C no momento
da compra e reanalisou três vezes por semana durante 4 a 5 semanas.
35. Um estudo de Pittini et al. (A-38) avaliou a eficácia de um currículo baseado em simulador em 30 estagiários aprendendo
a prática básica da amniocentese. O desempenho pré e pós-treinamento foi avaliado com o mesmo instrumento. A
variável de resultado foi a pontuação pós-treinamento - pontuação pré-treinamento. Os estagiários foram agrupados por
anos de experiência de pós-graduação: PGY 0–2, PGY 3–5, Fellows e Docentes.
36. Anim-Nyame et al. (A-39) estudou três conjuntos de mulheres em um esforço para entender os fatores relacionados à pré-
eclâmpsia. Inscritas no estudo estavam 18 mulheres com pré-eclâmpsia, 18 mulheres grávidas normais e 18 mulheres
não grávidas. Amostras de sangue foram obtidas para medir os níveis plasmáticos do fator de crescimento endotelial
vascular, leptina, concentrações plasmáticas de proteína TNF-a e hemograma completo.
37. Em um estudo de lwamoto et al. (A-40) 26 mulheres foram aleatoriamente designadas para o medicamento alfacalcidol
para tratamento da densidade mineral óssea (DMO) lombar. A DMO da coluna lombar foi medida no início e todos os
anos durante 5 anos.
38. Inoue et al. (A-41) estudou o tipo de célula doadora e o genótipo sobre a eficiência da clonagem de células somáticas de
camundongos. Eles realizaram um experimento fatorial com dois tipos de células doadoras (células de Sertoli ou
cumulus) e seis genótipos. As variáveis de resultado foram a taxa de clivagem e a taxa de nascimento de filhotes em
cada combinação de tratamento.
Para os estudos descritos nos Exercícios 39 a 66, faça o seguinte:
(a) Realize uma análise estatística dos dados (incluindo teste de hipótese e construção de intervalo de confiança) que você
acha que renderia informações úteis para os pesquisadores. (b) Determine os valores de p para cada estatística de teste
computada. (c) Declare todas as suposições necessárias para validar sua análise. (d) Descreva a(s) população(ões) sobre
a(s) qual(is) você acha que as inferências baseadas em sua análise seriam aplicáveis.
39. Shirakami et al. (A-42) investigou o significado clínico da endotelina (ET), dos peptídeos natriuréticos e do sistema renina-
angiotensina-aldosterona no transplante hepático pediátrico. Os participantes eram crianças de 6 meses a 12 anos submetidas
a transplante hepático devido a atresia biliar congênita e cirrose hepática grave. Entre os dados coletados estavam os
seguintes níveis séricos de bilirrubina total (mg/dl) após o transplante (h–horas, d–dias):
Tempo Após a Reperfusão do Fígado Doador
Fase anepática de transecção hepática pré-operatória 1h 2h 4h 8h 1d 2 dias 3d
6.2 1.2 0,9 0,8 1.1 1,5 2 1.4 1.6 1.3

17.6 11.9 9.3 3.5 3 6.1 9 6.3 6.4 6.2
13.2 10.2 7.9 5.3 4.9 3.3 3.6 2.8 1.9 1.9
3.9 3.3 3 2.9 2.3 1.4 1.2 0,8 0,8 0,9
20.8 19.4 9.4 8.4 6.8 7.1 3.7 3.8 3.2
1.8 1.8 1.6 1.4 1.4 1.1 1.9 0,7 0,8 0,7
8.6 6.5 4.8 3.1 2.1 1 1.3 1,5 1.6 3.2
13.4 12 10.1 5.8 5.6 4.5 4.1 3 3.1 3.6
16.8 13.9 8.3 3.7 3.7 2.2 2.1 1.9 3.1 4.1
20,4 17,8 17 10.8 9.3 8,9 2.8 3.8 4.8
25 21,5 13.8 7,6 7 5 7 11,5 12.3 10.1 11,4
9.2 6,3 6,8 5,3 4.8 0,2 4.2 3.7 3,5
6,5 6,4 4,1 3,8 3,8 4 3,5 3,1 4,2 2,9 2,8
8 3 4,1 3,4 3,4 3,7 3,3 9,8 8,6 2 1,9
2,9 17,3 13,6 9,2 7,9 7,9 23,6 25 9,37,2 4,7 5,5
21,3 25 24 20,1 19,3 18,6 10 14,4 20,6
25 23,7 15,7 13,2 11 9,6 6,3 6,3
23,3 17,5 16,2 14,4 12,6 12.7 11,5 7.8 5,5 4,9
Falta observação.
Fonte: Dados fornecidos por cortesia do Dr. Gotaro Shirakami.
Observe que há uma observação ausente no conjunto de dados. Você pode lidar com esse problema em pelo menos três
maneiras.
(a) Omita o assunto cujo dado está faltando e analise os dados dos 17 assuntos restantes. (b) Use um pacote de computador
que lide automaticamente com dados ausentes. (c) Analise os dados usando um procedimento de dados perdidos. Para tal
procedimento, consulte Jerome L. Myers e Arnold D. Well, Projeto de Pesquisa e Análise Estatística, Erlbaum Associates,
Hillsdale, NJ, 1995, pp. 256–258.
40. O objetivo de um estudo de Sakakibara e Hayano (A-43) foi examinar o efeito da respiração voluntariamente desacelerada na
resposta parassimpática cardíaca a uma ameaça (a antecipação de um choque elétrico). Os sujeitos foram 30 estudantes
universitários saudáveis, com idade média de 23 anos, com desvio padrão de 1,5 anos. Um número igual de indivíduos foi
designado aleatoriamente para grupos de respiração lenta (seis homens, quatro mulheres), rápida (sete homens, três mulheres)
e sem ritmo (cinco homens, cinco mulheres). Indivíduos nos grupos de respiração lenta e rápida regularam sua taxa de
respiração para 8 e 30 cpm, respectivamente. O grupo não estimulado respirava espontaneamente. A seguir estão as
pontuações dos sujeitos na Pontuação de Ansiedade do Estado do Inventário de Ansiedade Traço-Estado após a linha de base
e o período de ameaça:
Devagar Ritmo acelerado sem ritmo
Ameaça de linha de base Ameaça de linha de base Ameaça de linha de base
39 59 37 49 36 51
44 47 40 42 34 71
48 51 39 48 50 37
50 61 47 57 49 53
34 48 45 49 38 52
54 69 43 44 39 56
34 43 32 45 66 67
38 52 27 54 39 49
44 48 44 44 45 65
39 65 41 61 42 57 cortesia do Dr. Masahito Sakakibara.
41. Takahashi et al. (A-44) investigou a correlação da intensidade do sinal de ressonância magnética com os potenciais evocados da
medula espinhal e a morfologia da medula espinhal após 5 horas de compressão da medula espinhal em gatos.
Vinte e quatro gatos adultos foram divididos em quatro grupos com base em uma medida da função da medula espinhal mais
um grupo controle que não sofreu compressão espinhal. Entre os dados coletados estavam os seguintes valores de taxa de
compressão [(diâmetro sagital/diâmetro transversal) 100] após 5 horas de compressão:
Ao controle 80.542986 Grupo III 36.923077

79.111111 31.304348
70.535714 53.333333
87.323944 55.276382
80,000000 40.725806
82.222222
Grupo IV 66.666667
Grupo I 83.928571 29.565217

84.183673 12.096774
48.181818 34.274194
98.461538 24,000000
Grupo II 30.263158
34.865900
Fonte: Dados fornecidos
43.775100
por cortesia do Dr. Toshiaki
82.439024 Takahashi.
42. O objetivo do estudo de Yamashita et al. (A-45) foi investigar se a pentoxifilina administrada na solução de lavagem ou
durante a reperfusão reduziria a lesão pulmonar de isquemia-reperfusão em aloenxertos pulmonares caninos
preservados. Três grupos de animais foram estudados. A pentoxifilina não foi administrada nos animais do grupo 1 (C),
foi administrada apenas durante o período de reperfusão (P) nos animais do grupo 2 e foi administrada apenas na
solução de flushing nos animais do grupo 3 (F). Um total de 14 alotransplantes de pulmão esquerdo foram realizados.
A seguir estão as leituras da pressão aórtica para cada animal durante o período de avaliação de 6 horas:
0 60 120 180 240 300 360

Grupo min min min min min min min
C 85,0 100,0 85,0 120,0 80,0 72,0 75,0

C 82,0 100,0 75,0 80,0 80,0 85,0 80,0 80,0
C 85,0 98,0 85,0 80,0 82,0
C 57,0 57,0 57,0 30,0
C 57,0 75,0 52,0 56,0 65,0 95,0 75,0
P 112,0 67,0 73,0 90,0 71,0 70,0 66,0
2
P 92,0 70,0 90,0 80,0 75,0 80,0
P 105,0 62,0 73,0 75,0 70,0 55,0 50,0
P 80,0 73,0 50,0 35,0
F 70,0 95,0 105,0 115,0 110,0 105,0 100,0
F 60,0 63,0 140,0 135,0 125,0 130,0 120,0
F 67,0 65,0 75,0 75,0 80,0 80,0 80,0
F 115,0 107,0 90,0 103,0 110,0 112,0 95,0
F 90,0 99,0 102,0 110,0 117,0 118,0 103,0
Falta observação.
Fonte: Dados fornecidos por cortesia do Dr. Motohiro Yamashita.
43. Em um estudo investigando a biodisponibilidade relativa de beta-caroteno (BC) e alfa-caroteno (AC) de diferentes fontes
de cenoura, Zhou et al. (A-46) usaram furões como animais experimentais.
Entre os dados coletados estavam as seguintes concentrações de razões molares BC, AC e AC/BC no soro de 24
furões alimentados com diferentes fontes de carotenóides por 3 dias em sua água potável:
BC AC AC/BC
(mmol/g) (mmol/g) (mol/mol)
Suco não aquecido
0,637 0,506 0,795

0,354 0,297 0,840
0,287 0,249 0,869
0,533 0,433 0,813
0,228 0,190 0,833
0,632 0,484 0,767
suco aquecido
0,303 0,266 0,878

0,194 0,180 0,927
(Continuação)
BC AC AC/BC
(mmol/g) (mmol/g) (mol/mol)
suco aquecido
0,293 0,253 0,864

0,276 0,238 0,859
0,226 0,207 0,915
0,395 0,333 0,843
Cromoplasto não aquecido
0,994 0,775 0,780

0,890 0,729 0,819
0,809 0,661 0,817
0,321 0,283 0,882
0,712 0,544 0,763
0,949 0,668 0,704
Cromoplasto Aquecido
0,933 0,789 0,845

0,280 0,289 1.031
0,336 0,307 0,916
0,678 0,568 0,837
0,714 0,676 0,947
0,757 0,653 0,862 Fonte: Dados fornecidos
por cortesia do Dr. Jin-R. Zhou.
44. Potteiger et al. (A-47) desejava determinar se a ingestão de citrato de sódio melhoraria o desempenho no ciclismo e facilitaria
condições metabólicas favoráveis durante o passeio de bicicleta. Os participantes foram oito ciclistas competitivos do sexo
masculino treinados cuja idade média foi de 25,4 anos com desvio padrão de 6,5. Cada participante completou um contra-
relógio de ciclismo de 30 km em duas condições, após a ingestão de citrato de sódio e após a ingestão de um placebo.
Amostras de sangue foram coletadas antes da ingestão do tratamento (PRE-ING); antes do exercício (PRÉ-EX); durante o
passeio de bicicleta ao completar 10, 20 e 30 km; e 15 minutos após o término do exercício (PÓS-EX). A seguir estão os
valores das pressões parciais de oxigênio (PO2) e dióxido de carbono (PCO2) para cada sujeito, em cada condição, em
cada tempo de medição:
(PO2) (mm Hg)
Tempos de Medição
Sujeito tratamentoa PRE-ING PRÉ-EX 10 km 20 km 30 km 15-POST-EX
42,00 20,00 53,00 51,00 56,00 41,00

11 12 43,00 29,00 58,00 49,00 55,00 56,00
2 1 44,00 38,00 66,00 66,00 76,00 58,00
2 2 40,00 26h00 57,00 47,00 46,00 45,00
3 1 37,00 22h00 59,00 58,00 56,00 52,00
(Contínuo)
(PO2) (mm Hg)
Tempos de Medição
2 36,00 30,00 52,00 65,00 65,00 36,00

3 1 34,00 21,00 65,00 62,00 62,00 59,00
44 2 46,00 36,00 65,00 72,00 72,00 66,00
5 1 36,00 24,00 41,00 43,00 50,00 46,00
5 2 41,00 25,00 52,00 60,00 67,00 54,00
6 1 28,00 31,00 52,00 60,00 53,00 46,00
6 2 34,00 21h00 57,00 58,00 57,00 41,00
7 1 39,00 28h00 72,00 69,00 65,00 72,00
7 2 40,00 27h00 64,00 61,00 57,00 60,00
8 1 49,00 27h00 67,00 61,00 51,00 49,00
8 2 27h00 22h00 56,00 64,00 49,00 34,00
(PCO2) (mm Hg)
Tempos de Medição
1 1 31,70 30.20 28.20 29,80 28.20 30.10

1 2 24,60 24h40 34,40 35.20 30,90 34,00
2 1 27.10 35,90 31h30 35,40 34.10 42,00
2 2 21.70 37,90 31,90 39,90 45.10 48,00
3 1 37,40 49,60 39,90 39,70 39,80 42,80
3 2 38,40 42.10 40,90 37,70 37,70 45,60
4 1 36,60 45,50 34,80 33,90 34,00 40,50
4 2 39,20 40,20 31,90 32h30 33,70 45,90
5 1 33,70 39,50 32,90 30,50 28,50 37.20
5 2 31,50 37h30 32,40 31,90 30.20 31,70
6 1 35,00 41,00 38,70 37.10 35,80 40,00
6 2 27.20 36.10 34,70 36.30 34.10 40,60
7 1 28h00 36,50 30,70 34,60 34h30 38,60
7 2 28.40 31h30 48.10 43,70 35.10 34,70
8 1 22,90 28.40 25,70 28.20 32h30 34,80
8 2 41,40 41,80 29,50 29,90 31h30 39,00
uma
1 ¼ Citrato de sódio; 2 ¼ placebo.

Fonte: Dados fornecidos por cortesia do Dr. Jeffrey A. Potteiger.
45. Teitge et al. (A-48) descrevem um método radiográfico para demonstrar a instabilidade patelar. Os 90 indivíduos tinham idades
entre 13 e 52 anos e foram divididos em quatro grupos com base nos achados clínicos relativos à natureza da instabilidade
do joelho: normal (sem sintomas ou sinais relacionados ao joelho), lateral, medial, e instabilidade multidirecional. Entre os
dados coletados estavam as seguintes medidas radiográficas do ângulo de congruência (graus):
Normal Lateral Medial Multidirecional
8 412 16 16 25 22 20 26 8 8 8 12 14 10 15
18 8 5 26
5 8 10
6 20 12 8 12
32 5 14 40
30 10 20
8 10 18 16
12 28 4 34
20 6 20 14
20 9 20 6
5 10 20 35
10 20 22 24
4 9 15 25
2 10 10 10
6 12 5 16
7 0 5 30
0 35 6 30
2 1 15
15 5 25
5 22 10
22 20
Fonte: Dados fornecidos por cortesia do Dr. Robert A. Teitge.
46. Um estudo de Ikeda et al. (A-49) foi projetado para determinar a dose de aerossol de brometo de ipratrópio que melhora o
desempenho do exercício usando cicloergometria progressiva em pacientes com doença pulmonar obstrutiva crônica
estável. A idade média dos 20 indivíduos do sexo masculino foi de 69,2 anos com desvio padrão de 4,6 anos. Entre os
dados coletados estavam os seguintes valores máximos de ventilação VEmax;L=min no exercício máximo alcançado para
diferentes níveis de dosagem de brometo de ipratrópio ð Þ mg :
Placebo 40 80 160 240
26 24 23 25 28
38 39 43 43 37
49 46 54 57 52
37 39 39 38 38
34 33 37 37 41
42 38 44 44 42
23 26 28 27 22
38 41 44 37 40
37 37 36 38 39
33 35 34 38 36
40 37 40 46 40
52 58 48 58 63
45 48 47 51 38
(Contínuo)
Placebo 40 80 160 240
24 30 23 27 30
41 37 39 46 42
56 54 51 58 58
35 51 49 51 46
28 41 37 33 38
28 34 34 35 35
38 40 43 39 45
Fonte: Dados fornecidos por cortesia do Dr. Akihiko Ikeda.
47. Pertovaara et al. (A-50) comparou o efeito da temperatura da pele na temperatura do limiar crítico provocando dor de calor com
o efeito da temperatura da pele na latência de resposta à primeira sensação de dor de calor. Os indivíduos eram adultos
saudáveis com idades entre 23 e 54 anos. Entre os dados coletados estavam as seguintes latências (segundos) para a
primeira resposta de dor induzida por estimulação de calor radiante em três temperaturas de pele diferentes:
Sujeito 25 C 30 C 35 C
1 6.4 4,5 3.6

2 8.1 5,7 6.3
3 9,4 6,8 3.2
4 6,75 4,6 3,9
5 10 4,5 6,2 6,2
6 4,2 3,4
Fonte: Dados fornecidos por cortesia do Dr. Antti Pertovaara.
48. Um estudo para o desenvolvimento e validação de um método sensível e específico para quantificar as concentrações totais de
ativina-A foi relatado por Knight et al. (A-51). Como parte do estudo, eles coletaram as seguintes concentrações séricas
periféricas de ativina-A em seres humanos de diferentes estados reprodutivos: fase folicular normal (FP), fase lútea normal
(LP), grávida (PREG), ovário hiperestimulado para fertilização in vivo ( HYP), pós-menopausa (PM) e homens adultos
normais. Dica: converta as respostas em logaritmos antes de realizar a análise.
PF LP GRÁVIDA HIP PM Masculino
134,5 78,0 2674,0 253.1 793,1 196,7

159.2 130,4 945,6 294,3 385,1 190,6
133.2 128,3 5507.6 170.2 270,9 185,3
225,0 166,4 7796,5 219,8 640,3 335,4
146,4 115.2 5077.5 165,8 459,8 214,6
180,5 148,9 4541.9 159,0
Fonte: Dados fornecidos por cortesia do Dr. Philip G. Knight.
49. O objetivo de um estudo de Maheux et al. (A-52) foi avaliar o efeito do trabalho de parto na produção e utilização de glicose. Os
sujeitos foram seis mulheres grávidas normais. Entre os dados
coletadas foram as seguintes concentrações de glicose durante quatro estágios do trabalho de parto: fases latente (A1) e
ativa (A2) da dilatação cervical, expulsão fetal (B) e expulsão da placenta (C).
A1 A2 B C
3,60 4,40 5.30 6.20

3,53 3,70 4,10 3,80
4,02 4,80 5,40 5,27
4,90 5,33 6,30 6,20
4,06 4,65 6,10 6,90
3,97 5,20 4,90 4,60
Fonte: Dados fornecidos por cortesia do Dr. Pierre C. Maheux.
50. Trachtman et al. (A-53) conduziu estudos (1) para avaliar o efeito do IGF-I humano recombinante (rh) na nefropatia crônica por
aminonucleosídeo (PAN) de puromicina e (2) para comparar os resultados do tratamento com rhIGF-I versus rhGH em um
modelo de glomeruloesclerose segmentar e focal. Como parte dos estudos, ratos Sprague-Dawley machos foram divididos
em quatro grupos: PAN (IA), PAN + rhIGF-I (IB), normal (IIA) e normal + rhIGF-I (IIB). Os animais produziram os seguintes
dados sobre os níveis de creatinina antes (pré) e após 4, 8 e 12 semanas de tratamento:
Grupo
IA BI IIA IIB
Pré
44 44 44 35
44 44 44 44
44 44 44 44
53 44 44 35
44 44
44 53
4 semanas
97 44 53 44
88 35 44 53
62 44 44 53
53 35 53 44
62 62
53 53
8 semanas
53 53 62 44
53 53 53 62
44 53 62 44
53 44 53 44
62 53
70 62
(Contínuo)
Grupo
IA BI IIA IIB
12 semanas
88 79 53 53
70 79 62 62
53 79 53 53
70 62 62 53
88 79
88 70
Fonte: Dados fornecidos por cortesia do Dr. Howard Trachtman.
51. Doze homens saudáveis, com idades entre 22 e 35 anos, produziram os seguintes níveis séricos de T3ðnmol=LÞ às
08:00 horas após 8 (dia 1), 32 (dia 2) e 56 (dia 3) horas de jejum, respectivamente. Os participantes foram
participantes de um estudo de alterações induzidas pelo jejum na secreção pulsátil de glicoproteínas conduzido por
Samuels e Kramer (A-54).
Sujeito T3 assunto do dia Matéria do dia T3 Matéria do dia T3 T3 Dia
1 88 1 2 115 1 3 119 1 4 164 1

1 73 2 2 77 2 3 93 2 4 120 2
1 59 3 2 75 3 3 65 3 4 86 3
Sujeito T3 assunto do dia Matéria do dia T3 T3 assunto do dia T3 Dia
5 93 1 6 119 1 7 152 1 8 121 1

5 91 2 6 57 2 7 70 2 8 107 2
5 113 3 6 44 3 7 74 3 8 133 3
Sujeito T3 assunto do dia Matéria do dia T3 T3 assunto do dia T3 Dia
9 108 1 10 124 1 11 102 1 12 131 1

9 93 2 10 97 2 11 56 2 12 83 2
9 75 3 10 74 3 11 58 3 12 66 3
Fonte: Dados fornecidos por cortesia da Dra. Mary H. Samuels.
52. Para determinar a natureza e a extensão em que as alterações neurocomportamentais ocorrem em associação com a
toxicidade resultante da exposição ao excesso de ferro (Fe) na dieta, Sobotka et al. (A-55) usou ratos Sprague-
Dawley machos recém-desmamados como sujeitos experimentais. Os pesquisadores designaram aleatoriamente os
animais, de acordo com o peso corporal classificado, em um dos cinco grupos de dieta diferenciados com base na
quantidade de Fe presente: Controle - 35 (1), 350 (2), 3500 (3), 4 (deficiente em ferro ) (4) e 20.000 (5) ppm,
respectivamente. A seguir estão os pesos corporais dos animais (gramas) ao final de 10 semanas.
Dieta Peso Dieta Peso Dieta Peso
1 396 1 335 1 373

2 368 2 349 4 292
3 319 3 302 5 116
(Contínuo)
Dieta Peso Dieta Peso Dieta Peso
4 241 4 220 4 291

5 138 5 118 154
1 331 1 394 54 281
2 325 2 300 5 118
3 331 3 285 4 250
4 232 4 237 5 119
5 116 5 113 4 242
1 349 1 377 5 118
2 364 2 366 4 277
3 392 3 269 5 104
4 310 4 344 5 120
5 131 5 Morto 5 102
1 341 1 336
2 399 2 379
3 274 3 195
4 319 4 277
5 131 5 148
1 419 1 301
2 373 2 368
3 Morto 3 308
4 220 4 299
5 146 5 Morto
Fonte: Dados fornecidos por cortesia do Dr. Thomas J. Sobotka.
53. Hansen (A-56) observa que as concentrações de bilirrubina cerebral são aumentadas por hiperosmolaridade e hipercarbia, e
que estudos anteriores não abordaram a questão de saber se o aumento da bilirrubina cerebral em diferentes condições é
devido a efeitos na entrada ou eliminação de bilirrubina de cérebro. Em um estudo, ele levantou a hipótese de que a
cinética do aumento da concentração de bilirrubina cerebral diferiria na acidose respiratória (hipercapnia) e na
hiperosmolalidade. Quarenta e quatro ratos Sprague-Dawley machos adultos jovens foram sacrificados em vários períodos
de tempo após a infusão com bilirrubina.
A seguir estão os níveis de bilirrubina no sangueð Þ mmol=L de 11 animais imediatamente antes do sacrifício 60 minutos
após o início da infusão de bilirrubina:
Controles hipercapnia Hiperosmolalidade
30 48 102
94 20 118
78 58 74
52 74
Fonte: Dados fornecidos por cortesia do Dr. Thor Willy Ruud Hansen.
54. Johansson et al. (A-57) comparou os efeitos de tratamentos de curto prazo com hormônio de crescimento (GH) e fator de
crescimento semelhante à insulina I (IGF-I) em marcadores bioquímicos do metabolismo ósseo em homens com
osteoporose idiopática. Os indivíduos tinham idades compreendidas entre os 32 e os 57 anos. Entre os dados coletados
estavam as seguintes concentrações séricas de proteína de ligação a IGF-3 em 0 e 7 dias após a primeira injeção e 1, 4, 8
e 12 semanas após a última injeção com GH e IGF-I.
Nº do paciente Tratamento 0 dia 7 dias 1 semana 4 semanas 8 semanas 12 semanas
1 GH 4507 4072 3036 2484 3540 3480

1 IGF-I 3480 3515 4003 3667 4263 4797
2 GH 2055 4095 2315 1840 2483 2354
2 IGF-I 2354 3570 3630 3666 2700 2782
3 GH 3178 3574 3196 2365 4136 3088
3 IGF-I 3088 3405 3309 3444 2357 3831
4 GH 3464 5874 2929 3903 3367 2938
4 IGF-I 2905 2888 2797 3083 3376 3464
5 GH 4142 4465 3967 4213 4321 4990
5 IGF-I 4990 4590 2989 4081 4806 4435
6 GH 3622 6800 6185 4247 4450 4199
6 IGF-I 3504 3529 4093 4114 4445 3622
7 GH 5390 5188 4788 4602 4926 5793
7 IGF-I 5130 4784 4093 4852 4943 5390
8 GH 3161 4942 3222 2699 3514 2963
8 IGF-I 3074 2691 2614 3003 3145 3161
9 GH 3228 5995 3315 2919 3235 4379
9 IGF-I 4379 3548 3339 2379 2783 3000
10 GH 5628 6152 4415 5251 3334 3910
10 IGF-I 5838 5025 4137 5777 5659 5628
11 GH 2304 4721 3700 3228 2440 2698
11 IGF-I 2698 2621 3072 2383 3075 2822
Fonte: Dados fornecidos por cortesia da Dra. Anna G. Johansson.
55. O objetivo de um estudo de Strijbos et al. (A-58) foi comparar os resultados de um programa de reabilitação
ambulatorial de 12 semanas (grupo 1) com os de um programa de reabilitação domiciliar de 12 semanas (grupo 2)
em doença pulmonar obstrutiva crônica com fluxo de ar moderado a grave limitação. Um grupo controle (grupo 3)
não recebeu terapia de reabilitação. Entre os dados coletados estavam os seguintes escores de frequência
respiratória de indivíduos 18 meses após a reabilitação:
Grupo Grupo
1 23123
12 16 24 12 16 24
16 14 16 12 12 14
16 12 18 14 12 15
14 12 18 16 12 16
12 18 24 12 12 16
12 12 24 12 15 18
12 10 18 20 16
Fonte: Dados fornecidos por cortesia do Dr. Jaap H. Strijbos.
56. Sete homens saudáveis (idade média de 27,4 anos com desvio padrão de 4,4) participaram de um estudo de Lambert
et al. (A-59), que mediu a absorção intestinal após ingestão oral e perfusão intestinal de um fluido. Como parte do
estudo, os pesquisadores registraram as seguintes mudanças percentuais em
volume plasmático em seis pontos durante 85 minutos de exercício de ciclo nos experimentos de beber e infusão:
Sujeito 1 2 3
1 8.4151514 7.4902674 8.02277330

2 12.1966790 5.1496679 10.46486300
3 9.7418719 5.9062747 7.06516950
Bebendo 4 15.0291920 14.4165470 16.61268200
5 5.8845683 5.8845683 3.57781750
6 9.7100000 7.5700000 3.52995560
7 6.9787024 6.5752716 5.07020210
1 13.5391010 11.7186910 10.77312900

2 8.8259516 8.9029745 6.38160030
3 4.2410016 1.3448910 2.49740390
Infusão 4 10.7192870 9.7651132 11.12140900
6.9487760 2.9830660 1.77828157
56 7.1160660 5.4111706 7.07086340
7 7.0497788 5.7725485 5.18045500
Sujeito 4 5 6
1 7.35202650 7.89172340 7.84726700

2 8.40517240 9.02789810 5.13333985
3 4.19974130 3.33795970 5.65380700
Bebendo 4 15.36239700 17.63314100 14.43982000
5 5.50433470 5.12242600 6.26313790
6 4.22938570 7.86923080 7.51168220
7 5.94416340 5.21535350 6.34285620
1 11.64145400 12.40814000 8.26411320

2 5.69396590 6.38160030 7.37350920
3 1.01234570 5.58572150 2.81811090
Infusão 4 12.13053100 15.98360700 12.64667500
5 2.28844839 2.59034233 1.56622058
6 8.35430040 10.60663700 9.45689580
7 7.92841880 8.38462720 8.44542770
Fonte: Dados fornecidos por cortesia do Dr. CV Gisolfi.
57. Roemer et al. (A-60) desenvolveu uma medida de auto-relato de transtorno de ansiedade generalizada (TAG) para
uso com populações de graduação. Em estudos de confiabilidade, os alunos de graduação completaram o
questionário GAD (GAD-Q), bem como o Penn State Worry Questionnaire (PSWQ). A seguir estão as pontuações
do PSWQ feitas por quatro grupos de sujeitos determinados por seu status GAD: GAD por questionário, Estudo
II (grupo 1); não GAD por questionário, Estudo II (grupo 2); GAD por questionário, Estudo I (grupo 3); e TAG
clínico (grupo 4).
Grupo
12 3 4
59,0 50,0 46,0 65,0 65,0

51,0 28,0 77,0 62,0 66,0
58,0 43,0 80,0 76,0 69,0
61,0 36,0 60,0 66,0 73,0
64,0 36,0 59,0 78,0 67,0
68,0 30,0 56,0 76,0 78,0
64,0 24,0 44,0 74,0 76,0
67,0 39,0 71,0 73,0 66,0
56,0 29,0 54,0 61,0 55,0
78,0 48,0 64,0 63,0 59,0
48,0 36,0 66,0 75,0 44,0
62,0 38,0 59,0 63,0 68,0
77,0 42,0 68,0 55,0 64,0
72,0 26,0 59,0 67,5 41,0
59,0 35,0 61,0 70,0 54,0
32,0 78,0 70,0 72,0
43,0 70,0 55,0 74,0
55,0 74,0 73,0 59,0
42,0 73,0 80,0 63,0
37,0 79,0 51,0
36,0 79,0 72,0
41,0 61,0 63,0
36,0 61,0 58,0
34,0 72,0 71,0
42,0 67,0
35,0 74,0
51,0 65,0
37,0 68,0
50,0 72,0
39,0 75,0
56,0
Fonte: Dados fornecidos por cortesia do Dr. TD Borkovec.
58. Observando que os linfomas não-Hodgkin (NHL) representam um grupo heterogêneo de doenças em que o
prognóstico é difícil de prever, Christiansen et al. (A-61) relatam os aspectos prognósticos da molécula 1 de adesão
intercelular solúvel (sICAM-1) no LNH. Entre os dados coletados estavam os seguintes níveis séricos de sICAM-1
(ng/ml) em quatro grupos de indivíduos: controles saudáveis (C), NHL de alto grau (hNHL), NHL de baixo grau
(1NHL) e pacientes com células pilosas leucemia (HCL).
C hNHL lNHL HCL
309 460 844 824 961 581 382

329 222 503 496 1097 601 975
314 663 764 656 1099 572 663
(Contínuo)
C hNHL lNHL HCL
254 1235 1088 1038 625 439 429

304 500 470 1050 473 1135 1902
335 739 806 446 654 590 1842
381 1847 482 1218 508 404 314
456 477 734 511 454 382 430
294 818 616 317 889 692 645
450 585 836 334 805 484 637
422 1837 1187 1026 541 438 712
528 362 581 534 655 787 581
461 671 381 292 654 77 860
286 375 699 782 1859 478 448
309 543 1854 1136 619 602 735
226 352 769 476 1837 802
388 443 510 534 568
377 359 571 424 665
310 383 1248 571
261 587 784 420
350 648 514 408
405 782 678 391
319 472 1264 493
289 506 618 1162
310 663 1123 460
227 873 912 1113
206 987 520 572
226 859 1867 653
309 1193 485 1340
382 1836 287 656
325 691 455
522
Fonte: Dados fornecidos por cortesia da Dra. Ilse Christiansen.
59. Cossette et al. (A-62) examinou gênero e parentesco em relação ao uso de apoio formal e informal pelos cuidadores e a dois
modelos de apoio. Entre os dados coletados estavam as seguintes idades de três grupos de cuidadores de um parente
demente vivendo em casa: maridos, esposas e filhas adultas.
Marido Esposa Filha
64 66 73 59 67 40 50
70 58 71 66 67 47 58
55 81 70 80 57 46 46
67 77 71 76 53 45 47
79 76 56 68 50 69 50
67 64 68 53 70 48 53
77 82 76 78 70 53 57
68 85 67 75 50 65
72 63 66 74 47 50
(Contínuo)
Marido Esposa Filha
67 72 67 86 62 43
77 77 72 63 55 59
70 79 72 52 49 44
65 63 70 55 43 45
65 80 66 71 44 41
74 70 73 67 47 50
86 85 78 78 57 58
72 76 64 70 49 35
71 67 78 68 50
78 72 59 78 59
71 60 71 59 45
88 74 70 72 50
77 65 67 73 48
75 53 78 75 51
66 70 67 54 46
80 72 55 65 62
76 74 64 67 55
67 79 69 83 50
65 63 59 70 43
62 77 55 72 39
82 78 75 71 50
75 69 68 76 50
80 65 74 43
74 81 68 28
70 79 69
75 72
Fonte: Dados fornecidos por cortesia de Sylvie Cossette, M.Sc., RN
60. Tasaka et al. (A-63) observam que Corynebacterium parvum (CP) aumenta a suscetibilidade à endotoxina, que está associada
ao aumento da produção do fator de necrose tumoral (TNF). Eles investigaram o efeito do CP-priming na patogênese da
lesão pulmonar aguda causada pela endotoxina intratraqueal de Escherichia coli (lipopolissacarídeo [LPS]). Os animais
experimentais consistiram em cobaias fêmeas divididas em quatro grupos. Os animais em dois grupos receberam um
tratamento de 4 mg/kg de CP 7 dias antes do estudo. Subsequentemente, os animais não pré-tratados receberam solução
salina isolada (Controle) ou endotoxina (somente LPS). Os grupos pré-tratados receberam solução salina (somente CP) ou
LPS CP ð Þ þ LPS . Entre os dados coletados estavam os seguintes valores da proporção de tecido
dopulmonar
ensaio depara
albumina
plasma
sérica radioiodada:
Ao controle CP sozinho LPS sozinho CP þ LPS
0,12503532 0,18191647 0,17669093 0,3651166

0,10862729 0,30887462 0,25344761 0,64062964
0,10552931 0,25011885 0,17372285 0,39208734
0,15587316 0,23858085 0,1786867 0,49942059
0,13672624 0,26558231 0,22209666 0,85718475
0,11290446 0,32298454 0,27064831 0,93030465
Fonte: Dados fornecidos por cortesia do Dr. Sadatomo Tasaka.

61. De acordo com Takahashi et al. (A-64) pesquisas indicam que existe uma associação entre alterações no metabolismo do
cálcio e várias doenças ósseas em pacientes com outras deficiências.
Usando indivíduos com retardo mental grave (idade média de 16 anos) que viveram em instituições durante a maior parte
de suas vidas, Takahashi et al. examinaram a relação entre a alteração óssea e outras variáveis. Os indivíduos foram
divididos em grupos com base na gravidade da alteração óssea. Entre os dados coletados estavam os seguintes valores
de fosfatase alcalina sérica (IU/L):
Grau I: 109, 86, 79, 103, 47, 105, 188, 96, 249
Grau II: 86, 106, 164, 146, 111, 263, 162, 111
Grau III: 283, 201, 208, 301, 135, 192, 135, 83, 193, 175, 174, 193, 224, 192, 233
Fonte: Dados fornecidos por cortesia do Dr. Mitsugi Takahashi.
62. Pesquisas indicam que a deficiência de cobre na dieta reduz a taxa de crescimento em ratos. Em um estudo relacionado,
Allen (A-65) atribuiu ratos Sprague-Dawley machos desmamados a um dos três grupos de alimentos: deficiente em cobre
(CuD), adequado em cobre (CuA) e alimentado por pares (PF). Os ratos do grupo PF foram inicialmente pareados por
peso aos ratos do grupo CuD e, em seguida, alimentados com o mesmo peso da dieta CuA consumida por seus
homólogos CuD. Após 20 semanas, os ratos foram anestesiados, amostras de sangue foram coletadas e os órgãos foram
colhidos. Como parte do estudo, os seguintes dados foram coletados:
Peso Coração Fígado peso renal Peso do

corporal peso peso Baço
Rato Dieta (BW)(g) (HW)(g) (LW)(g) (KW)(g) (SW)(g)
1 253,66 0,89 2.82 1.49 0,41

2 400,93 1.41 3,98 2.15 0,76
3 Ruminação 355,89 1.24 5.15 2.27 0,69
4 404,70 2.18 4,77 2,99 0,76
6 397,28 0,99 2.34 1,84 0,50

7 421,88 1.20 3.26 2.32 0,79
8 PF 386,87 0,88 3.05 1,86 0,84
9 401.74 1.02 2,80 2.06 0,76
10 437,56 1.22 3,94 2.25 0,75
11 490,56 1.21 4.51 2.30 0,78

12 528,51 1.34 4.38 2,75 0,76
13 CuA 485,51 1.36 4,40 2.46 0,82
14 509,50 1.27 4,67 2,50 0,79
15 489,62 1.31 5.83 2.74 0,81
HW/BW (g/ LW/BW (g/ KW/BW (g/ SW/BW Ceruloplasmina

Rato Dieta 100 g) 100 g) 100 g) (g/100 g) (mg/dl)
1 0,00351 0,01112 0,00587 0,00162 nd

2 0,00352 0,00993 0,00536 0,00190 5.27
3 Ruminação 0,00348 0,01447 0,00638 0,00194 4,80
4 0,00539 0,01179 0,00739 0,00188 4,97
(Contínuo)
HW/BW LW/BW KW/BW SW/BW Ceruloplasmina (mg/

Rato Dieta (g/100 g) (g/100 g) (g/100 g) (g/100 g) dl)
6 0,00249 0,00589 0,00463 0,00126 35h30

7 0,00284 0,00773 0,00550 0,00187 39,00
8 PF 0,00227 0,00788 0,00481 0,00217 28h00
9 0,00254 0,00697 0,00513 0,00189 34.20
10 0,00279 0,00900 0,00514 0,00171 45,20
11 0,00247 0,00919 0,00469 0,00159 34,60

12 0,00254 0,00829 0,00520 0,00144 39,00
13 CuA 0,00280 0,00906 0,00507 0,00169 37,10
14 0,00249 0,00917 0,00491 0,00155 33,40
15 0,00268 0,01191 0,00560 0,00165 37h30
nd, sem dados.

Fonte: Dados fornecidos por cortesia de Corrie B. Allen.
63. Hughes e outros. (A-66) destacam que as complicações sistêmicas na pancreatite aguda são as grandes responsáveis pela
mortalidade associada à doença. Eles observam ainda que as citocinas pró-inflamatórias, particularmente o TNFa, podem
desempenhar um papel central na pancreatite aguda, mediando as sequelas sistêmicas. Em sua pesquisa, eles usaram um
modelo de infusão biliar de pancreatite aguda para mostrar a melhora da gravidade da doença, bem como uma melhora na
sobrevida geral pela inibição do TNFa. O material experimental consistiu de ratos Sprague-Dawley machos adultos pesando
entre 250 e 300 gramas divididos em três grupos: não tratado (solução biliar infundida sem tratamento); tratados (solução biliar
infundida precedida de tratamento com anticorpo policlonal anti TNFa); e sham (infusão salina). Entre os dados coletados
estavam os seguintes valores de hematócrito (%) para animais que sobreviveram mais de 48 horas:
Farsa, falso não tratado tratado
38 56 40
40 60 42
32 50 38
36 50 46
40 50 36
40 35
38 40
40 40
38 55
40 35
36
40
40
35
45
Fonte: Dados fornecidos por cortesia do Dr.

A. Osama Gaber.
64. Um estudo de Smarason et al. (A-67) foi motivado pelas observações de outros pesquisadores de que soros de mulheres pré-
eclâmpticas danificavam células endoteliais humanas cultivadas. Os sujeitos do presente estudo foram mulheres com pré-
eclâmpsia, mulheres de controle pareadas com gestações normais e não grávidas.
mulheres em idade reprodutiva. Entre os dados coletados estavam as seguintes observações sobre uma variável
relevante medida em indivíduos nos três grupos.
Pré-eclâmpsia Controles Grávidos Controles não grávidas
113,5 91,4 94,5

106,6 95,6 115,9
39,1 113,1 107,2
95,5 100,8 103,2
43,5 88,2 104,7
49,2 92,2 94,9
99,5 78,6 93,0
102,9 96,9 100,4
101,2 91,6 107.1
104,9 108,6 105,5
75,4 77,3 119.3
71.1 100,0 88.2
73,9 61,7 82.2
76,0 83,3 125,0
81.3 103,6 126.1
72,7 92,3 129.1
75,3 98,6 106,9
55.2 85,0 110,0
90,5 128.2 127.3
55,8 88,3 128,6
Fonte: Dados fornecidos por cortesia do Dr. Alexander Smarason.
65. O objetivo de um estudo de LeRoith et al. (A-68) foi avaliar o efeito de uma administração de 7 semanas de GH humano
recombinante (rhGH) e fator de crescimento semelhante à insulina humano recombinante (rhIGF-I) separadamente e
em combinação na função imunológica em macacos rhesus idosos. O ensaio para a função in vivo do sistema
imunológico baseou-se na resposta a uma imunização com toxóide tetânico. A seguir estão as respostas para os três
grupos de tratamento e um grupo de controle:
Salina rhIGF-I rhGH rhIGF-I þ rhGH
11.2 12.2 12h15 11.5

9,0 9.4 11h20 12.4
10.8 10.7 10,60 10.8
10,0 10.8 11h30 11.9
9.1 11h00 11,0
12.6
Fonte: Dados fornecidos por cortesia do Dr. Jack A. Yanowski.
66. Hampl et al. (A-69) observam que o óxido nítrico (NO) inalado é um vasodilatador pulmonar seletivo. Eles levantaram a
hipótese de que uma nebulização de dietilenotriamina/NO (DETA/NO) permaneceria nas vias aéreas inferiores e
forneceria continuamente NO suficiente para alcançar vasodilatação sustentada na hipertensão pulmonar crônica. O
material experimental consistiu em ratos Sprague Dawley adultos, machos, livres de patógenos específicos, divididos
aleatoriamente em quatro grupos: controles normotensos pulmonares não tratados;
monocrotalina injetada (para induzir hipertensão) sem tratamento (MCT); monocrotalina injetada tratada com uma dose
de 5 mmol ou uma dose de 50 mmol de DETA/NO. Dezenove dias após a indução da hipertensão pulmonar nos dois
grupos de ratos, os pesquisadores iniciaram o procedimento de tratamento, que durou 4 dias. Eles coletaram, entre
outros dados, as seguintes medidas do débito cardíaco dos animais dos quatro grupos:
MCT þ DETA/NO
Ao controle MCT 5mmol 50mmol
71,8 42,8 72,5 47.1

66.1 53.2 62,9 86,6
67,6 56.1 58,9 56,0
66,4 56,5 69.3
Fonte: Dados fornecidos por cortesia do Dr. Stephen L. Archer.
Exercícios para uso com grandes conjuntos de dados disponíveis no seguinte site: www.wiley.com/college/
daniel
1. Em Kreiter et al. (A-70) os exames da faculdade de medicina foram entregues em formato de computador. Como não
havia estações de computador suficientes para testar toda a classe simultaneamente, os exames foram
administrados em 2 dias. Tanto os alunos quanto o corpo docente se perguntaram se os alunos que testam no dia
2 podem ter uma vantagem devido ao tempo extra de estudo ou a uma violação na segurança do teste. Assim, os
pesquisadores examinaram uma grande
múltipla
classe escolha
médica
º ð
den80
¼ 193
itenstestada
de 2 horas.
durante
Os 2
alunos
dias com
receberam
três exames
dias de
deteste
por meio de atribuição pseudo-aleatória. O interessante era se fazer um determinado exame no dia 1 ou no dia 2
teve um impacto significativo nas pontuações. Use o conjunto de dados MEDSCORES para determinar se o teste,
dia ou interação tem impacto significativo nas pontuações do teste. Deixe um ¼ :05.
2. Consulte os dados séricos de ácido siálico ligado a lipídios em 1400 indivíduos (LSADATA). Desejamos realizar um
estudo para determinar se a medição do ácido siálico ligado a lipídios (LSA) sérico pode ser útil na detecção de
câncer de mama. As medições de LSA (mg/dl) são para quatro populações de indivíduos: controles normais, A;
pacientes com doença benigna da mama, B; pacientes com câncer de mama primário, C; e pacientes com câncer
de mama metastático recorrente, D. Selecione uma amostra aleatória simples de tamanho 10 de cada população e
faça uma análise apropriada para determinar se podemos concluir que as quatro médias populacionais são
diferentes. Seja a ¼ :05 e determine o valor de p. Teste todos os pares possíveis de médias amostrais quanto à
significância. Que conclusões se pode tirar da análise? Prepare um relatório verbal das descobertas. Compare seus
resultados com os de seus colegas.
3. Consulte os dados séricos da enzima conversora de angiotensina em 1600 indivíduos (SACEDATA).

A sarcoidose, encontrada em todo o mundo, é uma doença granulomatosa sistêmica de causa desconhecida. O
ensaio da enzima conversora de angiotensina (SACE) sérica é útil no diagnóstico de sarcoidose ativa. A atividade
da SACE geralmente está aumentada em pacientes com a doença, enquanto níveis normais ocorrem em indivíduos
que não tiveram a doença, aqueles que se recuperaram e pacientes com outros distúrbios granulomatosos. Os
dados são os valores do SACE para quatro populações de indivíduos classificados de acordo com o status em
relação à sarcoidose: nunca teve, A; ativo, B; estável, C; recuperado, D. Selecione uma amostra aleatória simples
de 15 indivíduos de cada população e faça uma análise para determinar se você pode concluir que as médias
populacionais são diferentes. Deixe um ¼ :05.
Use o teste de Tukey para testar diferenças significativas entre pares individuais de médias. Prepare um relatório
escrito sobre suas descobertas. Compare seus resultados com os de seus colegas.
4. Consulte os dados do fator estimulador de colônias urinárias em 1500 indivíduos (CSFDATA). Os dados são os
níveis do fator estimulante de colônias urinárias (CSF) em cinco populações: indivíduos normais e indivíduos
com quatro doenças diferentes. Cada observação representa a contagem média de colônias de quatro placas
de uma única amostra de urina de um determinado indivíduo. Selecione uma amostra aleatória simples de
tamanho 15 de cada uma das cinco populações e realize uma análise de variância para determinar se é possível
concluir que as médias populacionais são diferentes. Deixe um ¼ :05. Use a estatística HSD de Tukey para
testar diferenças significativas entre todos os pares possíveis de médias amostrais. Prepare um relatório
narrativo sobre os resultados de sua análise. Compare seus resultados com os de seus colegas.
5. Consulte os dados de glóbulos vermelhos em 1050 indivíduos (RBCDATA). Suponha que você seja um consultor
estatístico de um pesquisador médico que está interessado em aprender algo sobre a relação entre as
concentrações de folato no sangue em mulheres adultas e a qualidade de sua dieta.
O pesquisador tem disponíveis três populações de indivíduos: aqueles cuja qualidade da dieta é classificada
como boa, aqueles cujas dietas são razoáveis e aqueles com dietas ruins. Para cada indivíduo, também está
disponível o valor de folato de glóbulos vermelhos (RBC) (em mg = litro de glóbulos vermelhos). Desenhe uma
amostra aleatória simples de tamanho 10 de cada população e determine se o pesquisador pode concluir que
as três populações diferem em relação ao valor médio de folato de hemácias. Use o teste de Tukey para fazer
todas as comparações possíveis. Seja a ¼ :05 e encontre o valor de p para cada teste. Compare seus resultados
com os de seus colegas.
6. Consulte os dados de colesterol sérico em 350 indivíduos sob três regimes de dieta (SERUMCHO).
Um total de 347 homens adultos com idades entre 30 e 65 anos participaram de um estudo para investigar a
relação entre o consumo de carne e os níveis séricos de colesterol. Cada sujeito comeu carne bovina como sua
única carne por um período de 20 semanas, carne de porco como sua única carne por outro período de 20
semanas e frango ou peixe como sua única carne por outro período de 20 semanas. No final de cada período,
as determinações do colesterol sérico mg ð Þ =100ml foram
aleatória
feitas
simples
em cada
de indivíduo.
10 indivíduos
Selecione
da população
uma amostra
de 350.
Use a análise de variância bidirecional para determinar se deve-se concluir que há uma diferença nos níveis
séricos médios de colesterol da população entre as três dietas. Deixe um ¼ :05. Compare seus resultados com
os de seus colegas.
REFERÊNCIAS
1. RA FISHER, The Design of Experiments, Eighth Edition, Oliver and Boyd, Edimburgo, 1966.
2. RA FISHER, Contributions to Mathematical Statistics, Wiley, Nova York, 1950.
3. RA FISHER, Statistical Methods for Research Workers, Décima Quarta Edição, Hafner, Nova York, 1973.
4. KLAUS HINKELMANN e OSCAR KEMPTHORNE, Projeto e Análise de Experimentos, Edição Revisada, Wiley, Novo
Iorque, 1994.
5. DOUGLAS C. MONTGOMERY, Design and Analysis of Experiments, Quarta Edição, Wiley, Nova York, 1997.
6. JEROME L. MYERS e ARNOLD D. WELL, Projeto de Pesquisa e Análise Estatística, Earlbaum Associates,
Hillsdale, Nova Jersey, 1995.
7. JASON C. HSU, Multiple Comparisons: Theory and Methods, Chapman & Hall, Nova York, 1996.
8. PETER H. WESTFALL, RANDALL D. TOBIAS, DROR ROM, RUSSELL D. WOLFINGER e YOSEF HOCHBERG, Multiple
Comparações e testes múltiplos, SAS Publishing, Cary, NC, 2001.
9. JW TUKEY, “O Problema das Comparações Múltiplas”, Monografia Mimeografada, Universidade de Princeton, 1953; citado em
Yosef Hochberg e Ajit C. Tamhane, Multiple Comparison Procedures, John Wiley and Sons, Nova York, 1987.
10. BJ WINER, Statistical Principles in Experimental Design, segunda edição, McGraw-Hill, Nova York, 1971.
11. CY KRAMER, "Extensão de testes de intervalo múltiplo para médias de grupo com tamanhos de amostra desiguais", Biometria, 63
(1956), 307-310.
REFERÊNCIAS 409
A-1 DAVID H. HOLBEN, "Conteúdo de selênio de carne de veado, esquilo e carne bovina comprada ou produzida em Ohio, uma
região com baixo teor de selênio dos Estados Unidos", Journal of Food Science, 67 (2002), 431–433.
A-2 WD MEMBER, WM MURRY, SI RINGLEB, KL KILGORE e SA SNYDER, “ATransducer to Measure Isometric
Elbow Moments,” Clinical Biomechanics, 16 (2001), 918–920.
A-3 JOHN P. HOLCOMB e RALPH J. ROTHENBERG, “The Effectiveness of Alendronate and Etidronate in Clinical
Prática” (manuscrito não publicado).
A-4 JASMINKA ILICH -ERNST, RHONDA A. BROWNBILL, MARTHA A. LUDEMANN e RONGWEI FU, “Fatores críticos para a
saúde óssea em mulheres em todas as idades: quão importante é a massa muscular?” Medscape Women's Health eJournal,
7 (2002).
A-5 PAUL B. GOLD, ROBERT N. RUBEY e RICHARD T. HARVEY, “Naturalistic, Self-Assignment Comparative Trial of Bupropion
SR, a Nicotine Patch, or Both for Smoking Cessation Treatment in Primary Care,” American Journal on Addictions , 11 (2002),
315–331.
A-6 X. WANG, X. SHEN, X. LI e C. MAULI AGRAWAL, “Mudanças relacionadas à idade na rede de colágeno e resistência do
osso,” Bone, 31 (2002), 1–7.
A-7 FARHAD ATASSI, “Oral Home Care and the Reasons for Seeking Dental Care by Individuals on Renal Dialysis,”
Journal of Contemporary Dental Practice, 3 (2002), 031–041.
A-8 SIMONE RAGAZZI, AGOSTINO PIERRO, MARK PETERS, LORELLA FASOLI e SIMON EATON, “Early Full Blood Count and
Severity of Disease in Neonates with Necrotizing Enterocolitis,” Pediatric Surgery International, 19 (2003), 376–379.
A-9 ROBERTA ROMITO, MARIA IDA PANSINI, FRANCESCO PERTICONE, GIANFRANCO ANTONELLI, MARIAVITTORIA
PITZALIS e PAOLO RIZZON, “Efeito Comparativo de Lercanidipina, Felodipina e Nifedipina FITS na Pressão Arterial e
Frequência Cardíaca em Pacientes com Hipertensão Arterial Leve a Moderada: O Lercanidipina em Adultos (LEAD)
Estudo”, Journal of Clinical Hypertension, 5 (2003), 249–253.
A-10 L. KOSMISKI, D. KURITZKES, J. HAMILTON, T. SHARP, K. LICHTENSTIEN, J. HILL e R. ECKEL, “A distribuição de gordura
é alterada em homens infectados pelo HIV sem evidências clínicas da síndrome de lipodistrofia do HIV ,” HIV Medicine, 4
(2003), 235–240.
A-11 BM BROOKS, FD ROSE, EA ATTREE e A. ELLIOT-SQUARE, “Uma Avaliação da Eficácia do Treinamento de Pessoas com
Dificuldades de Aprendizagem em um Ambiente Virtual,” Deficiência e Reabilitação, 24 (2002), 622–626.
A-12 BRIAN J. MCCONVILLE, M. HAROLD FOGELSON, ANDREW B. NORMAN, WILLIAM M. KLYKYLO, PAT Z. MANDERSCHEID,
KAREN W. PARKER e PAUL R. SANBERG, “Nicotine Potentiation of Haloperidol in Reducing Tic Frequency in Tourette's
Disorder,” American Journal of Psychiatry, 148 (1991), 793-794.
A-13 ME VALENCIA, G. MCNEILL, JM BROCKWAY e JS SMITH, “O efeito da temperatura e umidade ambientais no gasto energético
de 24 horas em homens”, British Journal of Nutrition, 68 (setembro de 1992), 319–327.
A-14 DS HODGSON, CI DUNLOP, PL CHAPMAN e JL GRANDY, "Respostas cardiopulmonares à dilatação gástrica induzida
experimentalmente em cães anestesiados com isoflurano", American Journal of Veterinary Research, 53 (junho de 1992),
938–943.
A-15 JOHN C. LICCIARDONE, SCOTT T. STOLL, KIMBERLY G. FULDA, DAVID P. RUSSO, JEFF SIU, WILLIAM WINN e JOHN
SWIFT, Jr., “Osteopathic Manipulative Treatment for Chronic Low Back Pain: A Randomized Controlled Trial ,”
Spine, 28 (2003), 1355-1362.
A-16 Mid-Michigan Medical Center, Midland, Michigan, 1999; Um estudo da condição bucal de pacientes com câncer.
Disponível online em: http://calcnet.mth.cmich.edu/org/spss/Prj_cancer_data.htm.
A-17 YITAO LIU, LUDMILA BELAYEV, WEIZHAO ZHAO, RAUL BUSTO e MYRON D. GINSBURG, “MRZ 2/579, um novo
antagonista não competitivo do N-metil-D-aspartato, reduz o volume do infarto e o inchaço cerebral e melhora o déficit
neurológico após Isquemia Cerebral Focal em Ratos,” Brain Research, 862 (2000), 111–119.
A-18 DAVID W. STARCH, JERRY W. ALEXANDER, PHILIP C. NOBLE, SURAJ REDDY e DAVID M. LINTNER, “Fixação de enxerto
de tendão de isquiotibiais multitranda com um parafuso central de quatro quadrantes ou um parafuso de interferência tibial
padrão para reconstrução do ligamento cruzado anterior ,” American Journal of Sports Medicine, 31 (2003), 338–344.
A-19 D. HOLBEN, A. SMITH, J. ILICH, J. LANDOLL, J. HOLCOMB e V. MATKOVIK , “Puberty Does Not Negatively Affect Selenium
Status in Young Females,” Journal of the American Dietetic Association, 102 ( 2002), 1082–1087.
A-20 AXEL LINKE, GONG ZHAO, FABIO A. RECCHIA, JEFFREY WILLIAMS, XIAOBIN XU e THOMAS H. HINTZE, “Mudança na
absorção do substrato metabólico pelo coração durante o desenvolvimento do diabetes induzido por aloxana,” American
Journal of Physiology—Heart e Circulatory Physiology, 285 (2003), H1007–H1014.
A-21 K. WERTHER, IJ CHRISTENSEN e HJ NIELSEN, “Determinação do Fator de Crescimento Endotelial Vascular (VEGF) no Sangue
Circulante: Significado do VEGF em Vários Leucócitos e Plaquetas,” Scandinavian Journal of Clinical and Laboratory
Investigation, 62 (2002) , 343–350.
A-22 CAROLYN B. YUCHA, SUSAN KOWALSKI e CHAD L. CROSS. “Estresse Estudantil e Desempenho Acadêmico: Início
Hospital Program,” Journal of Nursing Education, 48 (2009), 631–637.
A-23 SHIGEKO URYU, JUN HARADA, MARIE HISAMOTO e TOMIICHIRO ODA, "Troglitazone Inhibits Both Postglutamate Neurotoxicity and
Low-Potassium-Inposed Apoptosis in Cerebellar Granule Neurons," Brain Research, 924 (2002), 229–236.
A-24 A. MAIN, H. ABU-SAAD, R. SALT, I. VLACHONIKOLIS e A. DOWSON, “Management by Nurses of Primary Headache: A Pilot
Study,” Current Medical Research Opinion, 18 (2002), 471 –478.
A-25 SIMONA PORCELLINI, GUILIANA VALLANTI, SILVIA NOZZA, GUIDO POLI, ADRIANO LAZZARIN, GUISEPPE TABUSSI e ANTONIO
GRASSIA, “Improved Thymopoietic Potential in Aviremic HIV Infected Individuals with HAART by Intermittent IL-2 Administration,”
AIDS, 17 (2003) , 1621–1630.
A-26 DOROTA GoRECKA, MICHAL BENAREK, ADAM NOWINSKI, ELZBIETA PUSCINSKA, ANNA GOLJAN-GEREMEK e JAN ZIELINSKI,
“Diagnóstico de limitação do fluxo de ar combinado com conselhos para parar de fumar aumenta a taxa de parar de fumar”, Chest,
123 (2003), 1916– 1923.
A-27 ELI MELTZER, BRUCE M. PRENNER e ANJULI NAYAK, “Eficácia e tolerância de 5 mg uma vez ao dia de Desloratadina, um
antagonista do receptor H1, em pacientes com avaliação de rinite alérgica sazonal durante as estações de alergia na primavera e no
outono,” Clinical Drug Investigations, 21 (2001), 25–32.
A-28 K. WERTHER, IJ CHRISTENSEN e HJ NIELSEN, “Determinação do Fator de Crescimento Endotelial Vascular (VEGF) no Sangue
Circulante: Significado do VEGF em Vários Leucócitos e Plaquetas,” Scandinavian Journal of Clinical and Laboratory
Investigation, 62 (2002) , 343–350.
A-29 RUBIA P. MESHACK e KATHLEEN E. NORMAN, “Um estudo controlado randomizado dos efeitos dos pesos na amplitude e
frequência do tremor postural da mão em pessoas com doença de Parkinson”, Reabilitação Clínica, 16 (2003), 481–492.
A-30 G. LACROIX, S. TISSOT, F. ROGERIEUX, R. BEAULIEU, L. CORNU, C. GILLET, FR OBIDEL, JP LEFEVRE e FY

BOIS, “Decrease in Ovalbumin-Inposed Pulmonary Allergic Response by Benzaldehyde but Not Acetaldehyde Exposure in a
Guinea Pig Model,” Journal of Toxicology and Environmental Health, Part A (2002), 995–1012.
A-31 TAKEMASA WATANABE , YOSHIKI SUGIYAMA, YOSHIKO SUMI, MISUZU WATANABE , KIYOMI TAKEUCHI, FUMIO KOBAYASHI
e KOICHI KONO, “Efeitos da exaustão vital nas funções nervosas autônomas cardíacas avaliadas pela variabilidade da frequência
cardíaca em repouso em trabalhadores do sexo masculino de meia-idade,” Jornal Internacional de Medicina Comportamental, 9
(2002), 68–75.
A-32 JOHN BROOKER, Dados analisados pelo Centro de Consultoria Estatística da Wright State University, Wright State
Universidade, Dayton, OH (1997).
A-33 ELEFTHERIOS KELLIS, Ph.D., “Crianças na puberdade são incapazes de relaxar durante a correção passiva da gravidade
Procedimento no dinamômetro iscinético,” Isokinetics and Exercise Science, 10 (2002), 97–105.
A-34 REED E. PYERITZ, ELLIOT K. FISHMAN, BARBARA A.BERNHARDT e STANLEY S. SIEGELMAN, “Dural Ectasia Is a
Common Feature of the Marfan Syndrome,” American Journal of Human Genetics, 43 (1988), 726–732.
A-35 ADINA HARTMAN-MAEIR, NACHUM SOROKER, HAIM RING e NOOMI KATZ, “Conscientização sobre déficits no AVC
Reabilitação”, Journal of Rehabilitation Medicine, 34 (2002), 158–164.
A-36 EFTIHIA V. POLYZOGOPOULOU, FOTIOS KALFARENTZOS, APOSTOLOS G. VAGENAKIS e THEODORE K. ALEXANDRIDES,
“Restoration of Euglycemia and Normal Acute Insulin Response to Glucose in Obese Subjects with Type 2 Diabetes After Bariatric
Surgery,” Diabetes, 53 (2003 ), 1098–1103.
A-37 CAROL S. JOHNSTON e DL BOWLING, “Estabilidade do Ácido Ascórbico em Sucos de Laranja Comercialmente Disponíveis,”
Jornal da Associação Dietética Americana, 102 (2002), 525–529.
A-38 R. PITTINI, D. OEPKESS, K. MACRURY, R. REZNICK, J. BEYENE e R. WINDRIM, “Teaching Invasive Perinatal Procedures:
Assessment of a High Fidelity Simulator-Based Curriculum,” Ultrasound Obstetrics and Gynecol ogy , 19 (2002), 478–483.
A-39 NICK ANIM-NYAME, JOHN GAMBLE, SUREN R. SOORANNA, MARK R. JOHNSON e PHILIP J. STEER, “Microvascular Permeability
Is Related to Circulating Levels of Tumor Necrosis Factor-a in Pre-Eclampsia,” Cardiovascular Research, 58 (2003), 162-169.
A-40 JUN IWAMOTO, TSUYOSHI TAKEDA, SHOICHI ICHIMURA e MITSUYOSHI UZAWA, “Efeitos do tratamento de 5 anos com
Elcatonina e Alfacalcidol na Densidade Mineral Óssea Lombar e na Incidência de Fraturas Vertebrais em
REFERÊNCIAS 411
Mulheres pós-menopáusicas com osteoporose: um estudo retrospectivo,” Journal of Orthopaedic Science, 7 (2002),
637–643.
A-41 KIMIKO INOUE, NARUMI OGONUKI, KEIJI MOCHIDA, YOSHIE YAMAMOTO , KAORU TAKANO, FUMITOSHI ISHINO e ATSUO
OGURA, “Efeitos do tipo e genótipo de células doadoras na eficiência da clonagem de células somáticas de camundongos”,
Biologia da reprodução, 69 (2003 ), 1394-1400.
A-42 GOTARO SHIRAKAMI, MASAHIRO MURAKAWA, KOH SHINGU, SUSUMU MASHIMA, SHIN-ICHI SUGA, TATSUO MAGARIBUCHI,
TOYOHIKO O'HIGASHI, TSUTOMU SHICHINO, KAZUWA NAKAO e KENJIRO MORI, “Concentrações plasmáticas perioperatórias
de endotelina e peptídeos natriuréticos em crianças Submetendo-se a Transplante de Fígado Relacionado a Vivos”,
Anestesia e Analgesia, 82 (1996), 235–240.
A-43 MASAHITO SAKAKIBARA e JUNICHIRO HAYANO, “Efeito da Respiração Retardada no Parassimpático Cardíaco
Response to Threat,” Psychosomatic Medicine, 58 (1996), 32–37.
A-44 TOSHIAKI TAKAHASHI, YUJI SUTO, SHINSUKE KATO e EISAKU OHAMA, "Experimental Acute Dorsal Compression of Cat Spinal
Med," Spine, 21 (1996), 166–173.
A-45 MOTOHIRO YAMASHITA, RALPH A. SCHMID, KAN OKABAYASHI, KOEI ANDO, JUN KOBAYASHI, JOEL D. COOPER e G.
ALEXANDER PATTERSON, "Pentoxifilina em solução de descarga melhora a função precoce do aloenxerto pulmonar", Annals of
Thoracic Surgery, 61 (1996), 1055–1061.
A-46 JIN-R. ZHOU, ERIC T. GUGGER e JOHN W. ERDMAN, JR., “A forma cristalina dos carotenos e a matriz alimentar na
raiz da cenoura diminuem a biodisponibilidade relativa do beta e alfa-caroteno no modelo de furão”, Journal of the
American Faculdade de Nutrição, 15 (1996), 84–91.
A-47 JA POTTEIGER, GL NICKEL, MJ WEBSTER, MD HAUB e RJ PALMER, “A ingestão de citrato de sódio melhora o
desempenho de ciclismo de 30 km”, International Journal of Sports Medicine, 17 (1996), 7–11.
A-48 ROBERT A. TEITGE, WADE FAERBER, PATRICIA DES MADRYL e THOMAS M. MATELIC, “Radiografias de estresse da articulação
patelofemoral”, Journal of Bone and Joint Surgery, 78-A (fevereiro de 1996), 193–203.
A-49 AKIHIKO IKEDA, KOICHI NISHIMURA, HIROSHI KOYAMA, MITSUHIRO TSUKINO, MICHIAKI MISHIMA e TAKATERU IZUMI,
“Estudo de resposta à dose de aerossol de brometo de ipratrópio no desempenho máximo do exercício em pacientes estáveis com
doença pulmonar obstrutiva crônica,” Thorax, 51 (1996) , 48–53.
A-50 ANTTI PERTOVAARA, TIMO KAUPPILA e MINNA M. HA€MAL€ AINEN , "Influência da temperatura da pele no limiar de
€
dor por calor em humanos", Experimental Brain Research, 107 (1996), 497–503.
A-51 PG KNIGHT, S. MUTTUKRISHNA e NP GROOME, “Desenvolvimento e Aplicação de um Imunoensaio Enzimático de
Dois Locais para a Determinação de Concentrações 'Totais' de Ativina-A em Soro e Fluido Folicular,” Journal of
Endocrinology, 148 (1996 ), 267-279.
A-52 PIERRE C. MAHEUX, BRIGITTE BONIN, ANNE DIZAZO, PIERRE GUIMOND, DANIELLE MONIER, JOSEE BOURQUE e JEAN
LOUIS CHIASSON, “Glucose Homeostasis Durante o Trabalho Espontâneo na Gravidez Humana Normal,” Journal of Clinical
Endocrinology and Metabolism, 81 (1996 ), 209–215.
A-53 HOWARD TRACHTMAN, JOHN MAESAKA, STEPHEN FUTTERWEIT, CHAN MA, ELSA VALDERRAMA, JAMES CM CHAN e
WINNIE CHAN, “The Effect of Recombinant Human Insulin-Like Growth Factor-I on Chronic Puromycin Aminonucleoside
Nephropathy in Rats,” Pediatric Research , 39 (1996), 13–19.
A-54 MH SAMUELS e P. KRAMER, “Efeitos diferenciais do jejum de curto prazo na tireotropina pulsátil, gonadotropina e
secreção da subunidade a em homens saudáveis - um estudo do centro de pesquisa clínica”, Journal of Clinical
Endocrinology and Metabolism, 81 ( 1996), 32-36.
A-55 TJ SOBOTKA, P. WHITTAKER, JM SOBOTKA, RE BRODIE, DY QUANDER, M. ROBL, M. BRYANT e CN BARTON,
"Disfunções neurocomportamentais associadas à sobrecarga dietética de ferro", Fisiologia e comportamento, 58
(1996), 213–219.
A-56 THOR WILLY RUUD HANSEN, “Entrada de bilirrubina e eliminação do cérebro de rato durante hipercarbia e
Hyperosmolality,” Pediatric Research, 39 (1996), 72–76.
A-57 ANNA G. JOHANSSON, ERIK LINDH, WERNER F. BLUM, GINA KOLLERUP, OLE H. SøRENSEN e SVERKER LJUNGHALL,
“Efeitos do hormônio do crescimento e fator de crescimento semelhante à insulina I em homens com osteoporose idiopática,”
Journal of Clinical Endocrinology and Metabolism, 81 (1996), 44–48.
A-58 JAAP H. STRIJBOS, DIRKJE S. POSTMA , RICHARD ALTENA, FERNANDO GIMENO e GERARD H. KOETER € , “Uma
comparação entre um programa de reabilitação pulmonar baseado em hospital ambulatorial e um programa de
reabilitação pulmonar domiciliar em pacientes com DPOC”, Chest, 109 (1996), 366–372.
A-59 GP LAMBERT, RT CHANG, D. JOENSEN, X. SHI, RW SUMMERS, HP SCHEDL e CV GISOLFI, “Simultaneous
Determination of Gastricing and Intestinal Absorption Durante Cycle Exercise in Humans,” International Journal of
Sports Medicine, 17 (1996), 48–55.
A-60 LIZABETH ROEMER , MARY BORKOVEC, SHARON POSA e TD BORKOVEC, “Uma medida de autodiagnóstico do transtorno de
ansiedade generalizada”, Journal of Behavior Therapy & Experimental Psychiatry, 26 (1995), 345–350.
A-61 ILSE CHRISTIANSEN, CECILIA GIDLOF€ , KARL-MICHAEL KA€LKNER, HANS HAGBERG, HELGE BENNMARKER e THOMAS
T€oTTERMAN, “Elevated Serum Levels of Soluble ICAM-1 in Non-Hodgkin's Lymphomas Correlate with Tumor Burden, Disease
Activity and Other Prognostic Markers,” British Journal of Hematology , 92 (1996), 639–646.
A-62 SYLVIE COSSETTE, LOUISE LEVESQUE e LIANE LAURIN, “Informal and Formal Support for Caregivers of a Demen ted
Parentive: Do Gender and Kinship Make a Difference?” Research in Nursing & Health, 18 (1995), 437–451.
A-63 SADATOMO TASAKA, AKITOSHI ISHIZAKA, KOICHI SAYAMA, FUMIO SAKAMAKI, HIDETOSHI NAKAMURA, TAKESHI TERA
SHIMA, YASUHIRO WAKI, KENZO SOEJIMA, MORIO NAKAMURA, HIROAKI MATSUBARA, SEITARO FUJISHIMA e MINORU
KANAZAWA, “Heat- Killedumyne pardoxin Enhances Lesões com aumento da produção de TNF em cobaias,” American Journal
of Respiratory and Critical Care Medicine, 153 (1996), 1047–1055.
A-64 MITSUGI TAKAHASHI, HIDEO NAGAO e HIROSI MATSUDA, “Estimating Bone Change in Patients with Severe Disability,”
Development Medicine and Child Neurology, 37 (1995), 1085–1093.
A-65 CORRIE B. ALLEN, “Efeitos da Deficiência de Cobre na Dieta sobre a Ingestão Relativa de Alimentos e Eficiência de Crescimento em Ratos,”
Physiology & Behavior, 59 (1996), 247–253.
A-66 CHRISTOPHER B. HUGHES, LILLIAN W. GABER, ABOU BAKR MOHEY EL-DIN, HANI P. GREWAL, MALAK KOTB, LINDA MANN
e A. OSAMA GABER, “A inibição do TNFa melhora a sobrevida em um modelo experimental de pancreatite aguda ,” American
Surgeon, 62 (1996), 8–13.
A-67 ALEXANDER K. SMARASON, IAN L. SARGENT e CHRISTOPHER WG REDMAN, “A proliferação de células endoteliais
é suprimida pelo plasma, mas não pelo soro de mulheres com pré-eclâmpsia”, American Journal of Obstetrics and
Gynecology, 174 (1996), 787–793.
A-68 DEREK LEROITH, JACK YANOWSKI, ERIC P. KALDJIAN, ELAINE S. JAFFE, TANYA LeROITH, KATHY PURDUE, BARBARA D.
COOPER, ROBERT PYLE e WILLIAM ADLER, “Os efeitos do hormônio do crescimento e do fator de crescimento semelhante à
insulina I on the Immune System of Aged Female Monkeys,” Endocrinology, 137 (1996), 1071–1079.
A-69 VACLAV HAMPL, MARTIN TRISTANI-FIROUZI, THOMAS C. HUTSELL e STEPHEN L. ARCHER, “Nebulized Nitric Oxide/
Nucleophile Adds Reduces Chronic Pulmonary Hypertension,” Cardiovascular Research, 31 (1996), 55–62.
A-70 C. KREITER, MW PETERSON, K. FERGUSON e S. ELLIOTT, “Os efeitos dos testes em turnos em uma clínica
Exame Computadorizado do Curso,” Educação Médica, 37 (2003), 202–204.
CAPÍTULO 9
REGRESSÃO LINEAR SIMPLES

E CORRELAÇÃO
Este capítulo fornece uma introdução e visão geral de duas técnicas comuns para
explorar a força da relação entre duas variáveis. A primeira técnica, regressão
linear, nos ajudará a encontrar uma maneira objetiva de prever ou estimar o valor
de uma variável dado o valor de outra variável. A segunda técnica, correlação, nos
ajudará a encontrar uma medida objetiva da força da relação entre duas variáveis.
TÓPICOS
9.1 INTRODUÇÃO
9.2 O MODELO DE REGRESSÃO
9.3 A EQUAÇÃO DE REGRESSÃO AMOSTRA
9.4 AVALIANDO A EQUAÇÃO DE REGRESSÃO
9.5 USANDO A EQUAÇÃO DE REGRESSÃO
9.6 O MODELO DE CORRELAÇÃO
9.7 COEFICIENTE DE CORRELAÇÃO
9.8 ALGUMAS PRECAUÇÕES
9.9 RESUMO
Depois de estudar este capítulo, o aluno será capaz de 1.

obter um modelo de regressão linear simples e usá-lo para fazer previsões. 2. ser capaz de calcular o coeficiente
de determinação e interpretar testes de coeficientes de regressão. 3. ser capaz de calcular correlações entre
variáveis. 4. entender como regressão e correlação diferem e quando o uso de cada um é
apropriado.
413
414 CAPÍTULO 9 REGRESSÃO LINEAR SIMPLES E CORRELAÇÃO
9.1 INTRODUÇÃO
Ao analisar dados para as disciplinas de ciências da saúde, descobrimos que é frequentemente

desejável aprender algo sobre a relação entre duas variáveis numéricas. Podemos, por exemplo, estar
interessados em estudar a relação entre pressão arterial e idade, altura e peso, concentração de uma
droga injetável e frequência cardíaca, nível de consumo de algum nutriente e ganho de peso, intensidade
de um estímulo e tempo de reação , ou renda familiar total e gastos com assistência médica. A natureza
e a força das relações entre variáveis como essas podem ser examinadas por meio de modelos lineares
como a regressão e a análise de correlação, duas técnicas estatísticas que, embora relacionadas,
servem a propósitos diferentes.
Regressão A análise de regressão é útil para avaliar formas específicas da relação entre variáveis, e o
objetivo final quando esse método de análise é empregado geralmente é prever ou estimar o valor de
uma variável correspondente a um determinado valor de outra variável. As ideias de regressão foram
elucidadas pela primeira vez pelo cientista inglês Sir Francis Galton (1822-1911) em relatórios de sua
pesquisa sobre hereditariedade - primeiro em ervilhas-de-cheiro e depois em estatura humana. Ele
descreveu uma tendência da prole adulta, tendo pais baixos ou altos, de voltar à altura média da
população em geral. Ele primeiro usou a palavra reversão e, posteriormente, regressão, para se referir
a esse fenômeno.
Correlação A análise de correlação, por outro lado, preocupa-se em medir a força da relação entre as
variáveis. Quando calculamos medidas de correlação a partir de um conjunto de dados, estamos
interessados no grau de correlação entre as variáveis. Mais uma vez, os conceitos e a terminologia da
análise de correlação originaram-se de Galton, que usou a palavra correlação pela primeira vez em 1888.
Neste capítulo, nossa discussão é limitada à exploração da relação linear entre duas variáveis.
Os conceitos e métodos de regressão são abordados primeiro, começando na próxima seção. Na Seção
9.6 são apresentadas as ideias e técnicas de correlação. No próximo capítulo consideramos o caso em
que há interesse nas relações entre três ou mais variáveis.
A análise de regressão e correlação são áreas nas quais a velocidade e a precisão de um

computador são mais apreciadas. Os dados para os exercícios deste capítulo, portanto, são apresentados
de forma a torná-los adequados para o processamento do computador. Como é sempre o caso, os
requisitos de entrada e os recursos de saída dos programas específicos e pacotes de software a serem
usados devem ser estudados cuidadosamente.
9.2 O MODELO DE REGRESSÃO
No problema típico de regressão, como na maioria dos problemas de estatística aplicada, os

pesquisadores têm disponível para análise uma amostra de observações de alguma população real ou hipotética.
Com base nos resultados de sua análise dos dados da amostra, eles estão interessados em chegar a
decisões sobre a população da qual se presume que a amostra foi extraída. É importante, portanto, que
os pesquisadores entendam a natureza da população na qual estão interessados. Eles devem saber o
suficiente sobre a população para serem capazes de construir um modelo matemático para sua
representação ou determinar se ela se ajusta razoavelmente.
9.2 O MODELO DE REGRESSÃO 415
algum modelo estabelecido. Um pesquisador prestes a analisar um conjunto de dados pelos métodos
de regressão linear simples, por exemplo, deve estar seguro de saber que o modelo de regressão linear
simples é, no mínimo, uma representação aproximada da população. É improvável que o modelo seja
um retrato perfeito da situação real, já que essa característica raramente é encontrada em modelos de
valor prático. Um modelo construído de modo a corresponder precisamente aos detalhes da situação
geralmente é muito complexo para fornecer qualquer informação de valor. Por outro lado, os resultados
obtidos a partir da análise de dados que foram forçados a um modelo que não se ajusta também são
inúteis. Felizmente, porém, um modelo perfeitamente ajustado não é um requisito para a obtenção de
resultados úteis. Os pesquisadores, então, devem ser capazes de distinguir entre a ocasião em que
seus modelos escolhidos e os dados são suficientemente compatíveis para que prossigam e o caso em
que o modelo escolhido deve ser abandonado.
Suposições subjacentes à regressão linear simples No modelo de regressão linear simples, duas
variáveis, geralmente denominadas X e Y, são de interesse. A letra X costuma ser utilizada para
designar uma variável denominada variável independente, pois frequentemente ela é controlada
pelo investigador; ou seja, valores de X podem ser selecionados pelo investigador e, correspondendo
a cada valor pré-selecionado de X, são obtidos um ou mais valores de outra variável, denominada
Y. A variável, Y, portanto, é chamada de variável dependente, e falamos da regressão de Y em X.
A seguir estão as suposições subjacentes ao modelo de regressão linear simples.
1. Os valores da variável independente X são considerados “fixos”. Isso significa que os valores
de X são pré-selecionados pelo investigador para que, na coleta dos dados, eles não possam
variar desses valores pré-selecionados. Nesse modelo, X é referido por alguns escritores
como uma variável não aleatória e por outros como uma variável matemática. Deve-se
ressaltar neste momento que a afirmação dessa suposição classifica nosso modelo como o
modelo de regressão clássico. A análise de regressão também pode ser realizada em dados
nos quais X é uma variável aleatória.
2. A variável X é medida sem erro. Como nenhum procedimento de medição é perfeito, isso
significa que a magnitude do erro de medição em X é desprezível.
3. Para cada valor de X existe uma subpopulação de valores de Y. Para que os procedimentos
inferenciais usuais de estimativa e teste de hipótese sejam válidos, essas subpopulações
devem ser normalmente distribuídas. Para que esses procedimentos possam ser
apresentados, será assumido que os valores de Y são normalmente distribuídos nos
exemplos e exercícios a seguir.
4. As variâncias das subpopulações de Y são todas iguais e denotadas por s2 5. As .
médias das subpopulações de Yall estão na mesma linha reta. Isso é conhecido como a
suposição de linearidade. Essa suposição pode ser expressa simbolicamente como
myjx ¼ b0 þ b1x (9.2.1)
onde myjx é a média da subpopulação de valores de Y para um determinado valor de X, e

b0 e b1 são chamados de coeficientes de regressão da população. Geometricamente, b0 e
b1 representam a interceptação y e a inclinação, respectivamente, da linha na qual se supõe
que todas as médias estejam.
6. Os valores de Y são estatisticamente independentes. Em outras palavras, ao desenhar a amostra,

assume-se que os valores de Y escolhidos em um valor de X não dependem de forma alguma dos
valores de Y escolhidos em outro valor de X.
Essas suposições podem ser resumidas por meio da seguinte equação, que é
chamado de modelo de regressão linear simples:
y ¼ b0 þ b1x þ e (9.2.2)
onde y é um valor típico de uma das subpopulações de Y, b0 e b1 são definidos para a Equação 9.2.1, e e
é chamado de termo de erro. Se resolvermos 9.2.2 para e, teremos
e¼y ðb1
Þx¼b0y þ
myjx
(9.2.3)
e vemos que e mostra a quantidade pela qual y se desvia da média da subpopulação de valores de Y da
qual é extraído. Como consequência da suposição de que as subpopulações de valores de Y são
normalmente distribuídas com variâncias iguais, os e's para cada subpopulação são normalmente
distribuídos com uma variância igual à variância comum das subpopulações de valores de Y.
O acrônimo a seguir ajudará o leitor a lembrar a maioria das suposições necessárias para inferência
na análise de regressão linear:
LINHA [Linear (suposição 5), Independente (suposição 6), Normal (suposição 3),
Variâncias iguais (suposição 4)]
Uma representação gráfica do modelo de regressão é dada na Figura 9.2.1.
f(X, Y)
Y
ÿy|x = ÿ0 +ÿ1 x
x1
ÿy |x1
x2
ÿy |x2
x3
ÿy |x3
x4
ÿy |x4
x
FIGURA 9.2.1 Representação do modelo de regressão linear simples.
9.3 A EQUAÇÃO DE REGRESSÃO AMOSTRA 417
9.3 A EQUAÇÃO DE REGRESSÃO AMOSTRA
Na regressão linear simples, o objeto de interesse do pesquisador é a equação de regressão da população

- a equação que descreve a verdadeira relação entre a variável dependente Y e a variável independente X.
A variável designada por Y às vezes é chamada de variável de resposta e X às vezes é chamada a variável
preditora.
Em um esforço para chegar a uma decisão sobre a forma provável dessa relação, o pesquisador
extrai uma amostra da população de interesse e, usando os dados resultantes, calcula uma equação de
regressão de amostra que forma a base para chegar a conclusões sobre a equação de regressão da
população desconhecida.
Etapas da análise de regressão Na ausência de informações abrangentes sobre a natureza das variáveis
de interesse, uma estratégia freqüentemente empregada é assumir inicialmente que elas estão linearmente
relacionadas. A análise subseqüente, então, envolve os seguintes passos.
1. Determine se as suposições subjacentes a uma relação linear são atendidas ou não

os dados disponíveis para análise.
2. Obtenha a equação para a linha que melhor se ajusta aos dados da amostra.
3. Avalie a equação para obter uma ideia da força do relacionamento e da
utilidade da equação para prever e estimar.
4. Se os dados parecerem estar em conformidade com o modelo linear, use a equação
obtidos a partir dos dados da amostra para prever e estimar.
Quando usamos a equação de regressão para prever, estaremos prevendo o valor que Y
provavelmente terá quando X tiver um determinado valor. Quando usamos a equação para estimar,
estaremos estimando a média da subpopulação de valores de Y que se supõe existir em um determinado valor de X.
Observe que os dados de amostra usados para obter a equação de regressão consistem em valores
conhecidos de X e Y. Quando a equação é usada para prever e estimar Y, somente os valores
correspondentes de X serão conhecidos. Ilustramos as etapas envolvidas na análise de regressão linear
simples por meio do exemplo a seguir.
EXEMPLO 9.3.1
Despres et al. (A-1) destacam que a topografia do tecido adiposo (TA) está associada a complicações
metabólicas consideradas como fatores de risco para doenças cardiovasculares. É importante, afirmam,
medir a quantidade de AT intra-abdominal como parte da avaliação do risco de doença cardiovascular de
um indivíduo. A tomografia computadorizada (TC), a única técnica disponível que mede com precisão e
confiabilidade a quantidade de TA abdominal profundo, no entanto, é cara e requer irradiação do sujeito.
Além disso, a técnica não está disponível para muitos médicos. Despres e seus colegas conduziram um
estudo para desenvolver equações para prever a quantidade de AT abdominal profundo a partir de medidas
antropométricas simples. Seus sujeitos eram homens com idades entre 18 e 42 anos, livres de doenças
metabólicas que exigissem tratamento. Entre as medidas tomadas em cada sujeito estavam o LAn
abdominal profundo obtido por TC e a circunferência da cintura como
mostrado na Tabela 9.3.1. Uma questão de interesse é quão bem se pode prever e estimar o LAn abdominal profundo a partir
do conhecimento da circunferência da cintura. Esta pergunta é típica daquelas que podem ser respondidas por meio da análise
de regressão. Como o TA abdominal profundo é a variável sobre a qual desejamos fazer previsões e estimativas, é a variável
dependente. A variável medida da cintura, cujo conhecimento será utilizado para fazer as previsões e estimativas, é a variável
independente.
TABELA 9.3.1 Circunferência da cintura (cm), X, e AT abdominal profundo, Y, de 109 homens
Sujeito x Y Sujeito x Y Sujeito x Y
1 74,75 25,72 38 103,00 129,00 75 108,00 217,00

2 72,60 25,89 39 80,00 74.02 76 100,00 140,00
3 81,80 42,60 40 79,00 55,48 77 103,00 109,00
4 83,95 42,80 41 83,50 73.13 78 104,00 127,00
5 74,65 29,84 42 76,00 50,50 79 106,00 112,00
6 71,85 21.68 43 80,50 50,88 80 109,00 192,00
7 80,90 29.08 44 86,50 140,00 81 103,50 132,00
8 83,40 32,98 45 83,00 96,54 82 110,00 126,00
9 63,50 11.44 46 107.10 118,00 83 110,00 153,00
10 73,20 32.22 47 94,30 107,00 84 112,00 158,00
11 71,90 28.32 48 94,50 123,00 85 108,50 183,00
12 75,00 43,86 49 79,70 65,92 86 104,00 184,00
13 73,10 38.21 50 79,30 81,29 87 111,00 121,00
14 79,00 42,48 51 89,80 111,00 88 108,50 159,00
15 77,00 30,96 52 83,80 90,73 89 121,00 245,00
16 68,85 55,78 53 85,20 133,00 90 109,00 137,00
17 75,95 43,78 54 75,50 41,90 91 97,50 165,00
18 74,15 33.41 55 78,40 41,71 92 105,50 152,00
19 73,80 43,35 56 78,60 58.16 93 98,00 181,00
20 75,90 29.31 57 87,80 88,85 94 94,50 80,95
21 76,85 36,60 58 86,30 155,00 95 97,00 137,00
22 80,90 40,25 59 85,50 70,77 96 105,00 125,00
23 79,90 35.43 60 83,70 75.08 97 106,00 241,00
24 89,20 60.09 61 77,60 57.05 98 99,00 134,00
25 82,00 45,84 62 84,90 99,73 99 91,00 150,00
26 92,00 70,40 63 79,80 27,96 100 102,50 198,00
27 86,60 83,45 64 108,30 123,00 101 106,00 151,00
28 80,50 84,30 65 119,60 90,41 102 109.10 229,00
29 86,00 78,89 66 119,90 106,00 103 115,00 253,00
30 82,50 64,75 67 96,50 144,00 104 101,00 188,00
31 83,50 72,56 68 105,50 121,00 105 100,10 124,00
32 88.10 89,31 69 105,00 97.13 106 93,30 62,20
33 90,80 78,94 70 107,00 166,00 107 101,80 133,00
34 89,40 83,55 71 107,00 87,99 108 107,90 208,00
35 102,00 127,00 72 101,00 154,00 109 108,50 208,00
36 94,50 121,00 73 97,00 100,00
37 91,00 107,00 74 100,00 123,00
Fonte: Dados fornecidos por cortesia de Jean-Pierre Despres, Ph.D.

O Diagrama de Dispersão
Um primeiro passo que geralmente é útil no estudo da relação entre duas variáveis é preparar um
diagrama de dispersão dos dados, conforme mostrado na Figura 9.3.1. Os pontos são plotados
atribuindo valores da variável independente X ao eixo horizontal e valores da variável dependente Y ao
eixo vertical.
O padrão formado pelos pontos traçados no diagrama de dispersão geralmente sugere a
natureza básica e a força da relação entre duas variáveis. Ao observarmos a Figura 9.3.1, por exemplo,
os pontos parecem estar dispersos em torno de uma linha reta invisível. O diagrama de dispersão
também mostra que, em geral, indivíduos com grande circunferência da cintura também têm maiores
quantidades de AT abdominal profundo. Essas impressões sugerem que a relação entre as duas
variáveis pode ser descrita por uma linha reta que cruza o eixo Y abaixo da origem e faz um ângulo de
aproximadamente 45 graus com o eixo X. Parece que seria simples desenhar, à mão livre, através dos
pontos de dados, a linha que descreve a relação entre X e Y. É altamente improvável, entretanto, que
as linhas traçadas por quaisquer duas pessoas sejam exatamente as mesmas. Em outras palavras,
para cada pessoa desenhando tal linha a olho nu, ou à mão livre, esperaríamos uma linha ligeiramente
diferente. Surge então a questão de qual linha descreve melhor a relação entre as duas variáveis. Não
podemos obter uma resposta a esta questão inspecionando as linhas. De fato, não é provável que
qualquer linha à mão livre
260
240
220
200
180
160
140
abdominal
profunda
(cm2),
Área
AT
Y
120
100
80
60
40
20
0
0 60 65 70 75 80 85 90 95 100 105 110 115 120 125
Circunferência da cintura (cm), X
FIGURA 9.3.1 Diagrama de dispersão dos dados mostrados na Tabela 9.3.1.
desenhada através dos dados será a linha que melhor descreve a relação entre X e Y, uma vez que as
linhas à mão livre refletirão quaisquer defeitos de visão ou julgamento da pessoa que traça a linha. Da
mesma forma, ao julgar qual das duas linhas melhor descreve o relacionamento, a avaliação subjetiva
está sujeita às mesmas deficiências.
O que é necessário para obter a linha desejada é algum método que não seja repleto de
essas dificuldades.
A linha de mínimos quadrados
O método comumente empregado para obter a linha desejada é conhecido como método dos mínimos
quadrados, e a linha resultante é chamada de linha dos mínimos quadrados. A razão para chamar o
método por este nome será explicada na discussão a seguir.
Recordamos da álgebra que a equação geral para uma reta pode ser escrita como
y ¼ a þ bx (9.3.1)
onde y é um valor no eixo vertical, x é um valor no eixo horizontal, a é o ponto onde a linha cruza o eixo
vertical e b mostra a quantidade pela qual y muda para cada mudança de unidade em x. Nos referimos
a a como a interceptação y e b como a inclinação da linha. Para traçar uma linha com base na Equação
9.3.1, precisamos dos valores numéricos das constantes a e b. Dadas essas constantes, podemos
substituir vários valores de x na equação para obter valores correspondentes de y. Os pontos resultantes
podem ser plotados. Como quaisquer duas dessas coordenadas determinam uma linha reta, podemos
selecionar quaisquer duas, localizá-las em um gráfico e conectá-las para obter a linha correspondente à
equação.
Obtendo a linha de mínimos quadrados
A equação da linha de regressão de mínimos quadrados pode ser obtida a partir de dados de amostra
por cálculos aritméticos simples que podem ser realizados manualmente usando as seguintes equações
Pn ðyð
Þ xi x eu sou
º
i¼1
b^
¼
(9.3.2)
1 2
Pn ð Þ xi x
i¼1
b^ ¼ yb^ 1x (9.3.3)
0
onde xi e yi são os valores correspondentes de cada ponto de dados (X, Y), x e y são as médias dos
valores de dados de amostra X e Y, respectivamente, e b^ e b^ 1 são as estimativas
e inclinação da
b1,interceptação
da linha respectivamente,
de regressão b0
0
da população. Como os cálculos manuais necessários são demorados, tediosos e sujeitos a erros, a
equação da linha de regressão é melhor obtida por meio do uso de um pacote de software de computador.
Embora o pesquisador típico não precise se preocupar com a aritmética envolvida, o leitor interessado
os encontrará discutidos nas referências listadas no final deste capítulo.
Para os dados da Tabela 9.3.1, obtemos a equação de regressão de mínimos quadrados por
meio do MINITAB. Após inserir os valores de X na Coluna 1 e os valores de Y na Coluna 2 procedemos
como mostrado na Figura 9.3.2.
Por enquanto, a única informação da saída na Figura 9.3.2 que nos interessa
é a equação de regressão. Outras informações na saída serão discutidas posteriormente.
Stat Regression Regressão Digite y em Resposta MTB > Nome C3 = 'FITS1' C4 = 'RESI1'
ex em Preditores . MTB > Regressar 'y' 1 'x';

Clique em Armazenamento. Verifique Resíduos e Ajustes. SUBC> Adapta-se a 'FITS1';
Clique em OK. SUBC> Constante;
SUBC> Resíduos 'RESI1'.
Saída:
Análise de regressão: y versus x A equação de

regressão é y = -216 + 3,46 x
preditor Coef Stdev t-ratio p

Constante -215,98 21.80 -9,91 0,000
x 3.4589 0,2347 14.74 0,000
s = 33,06 R-sq = 67,0% R-sq(adj) = 66,7%
Análise de variação
FONTE DF SS EM F p
Regressão 1 237549 237549 217.28 0,000
Erro 107 116982 1093
Total 108 354531
Observações incomuns
Obs. x e Ajustar Stdev.Fit Residual St.Resid
58 86 155,00 82,52 3.43 72,48 2.20R
65 120 90,41 197,70 7.23 -107,29 -3,33R
66 120 106,00 198,74 7.29 -92,74 -2,88R
71 107 87,99 154.12 4,75 -66,13 -2.02R
97 106 241,00 150,66 4,58 90,34 2,76R
102 109 229,00 161,38 5.13 67,62 2.07R
103 115 253,00 181,79 6.28 71.21 2.19R
R denota um obs. com um grande st. resid.
FIGURA 9.3.2 Procedimento e saída do MINITAB para obter a equação de regressão de mínimos
quadrados a partir dos dados da Tabela 9.3.1.
Da Figura 9.3.2 vemos que a equação linear para a linha de mínimos quadrados que descreve a
relação entre a circunferência da cintura e o LAn abdominal profundo pode ser escrita, então, como
^y ¼ 216 þ 3:46x Esta
equação nos diz desde b^ origem, e desde b^ canto do

0 é negativo, a linha cruza o eixo Y abaixo da inclinação,
é positivo,
gráfico até o canto superior 1direito. Vemosa linha
aindase estende
que desde a parte inferior esquerda
para cada
aumento de unidade em x, y aumenta em um valor igual a 3,46. O símbolo ^y denota um valor de y
calculado a partir da equação, em vez de um valor observado de Y.
Substituindo dois valores convenientes de X na Equação 9.3.2, podemos obter o

coordenadas necessárias para traçar a linha. Suponha, primeiro, que façamos X ¼ 70 e obtenhamos
^y ¼ 216 þ 3:46 70 ð Þ¼ 26:2

Se fizermos X ¼ 110 obtemos
^y ¼ 216 þ 3:46 110 ð Þ¼ 164
A linha, junto com os dados originais, é mostrada na Figura 9.3.3.
260
240
220
200
180
160
140
abdominal
profunda
(cm2),
Área
AT
Y
120
^
= _216 + 3,46x
anos
100
80
60
40
20
0
0 60 65 70 75 80 85 90 95 100 105 110 115 120 125
FIGURA 9.3.3 Dados originais e linha de mínimos quadrados para o Exemplo 9.3.1.
&
EXERCÍCIOS 423
O critério dos mínimos quadrados Agora que obtivemos o que chamamos de linha de “melhor ajuste” para
descrever a relação entre nossas duas variáveis, precisamos determinar por qual critério ela é considerada
melhor. Antes de estabelecer o critério, examinemos a Figura 9.3.3. Notamos que geralmente a linha de
mínimos quadrados não passa pelos pontos observados que são plotados no diagrama de dispersão. Em
outras palavras, a maioria dos pontos observados se desviam da linha em quantidades variáveis.
A linha que traçamos através dos pontos é melhor neste sentido:
A soma dos desvios quadrados verticais dos pontos de dados observados (yi) da linha de
mínimos quadrados é menor do que a soma dos desvios quadrados verticais dos pontos de
dados de qualquer outra linha.
Em outras palavras, se elevarmos ao quadrado a distância vertical de cada ponto observado (yi)
até a linha de mínimos quadrados e somarmos esses valores ao quadrado para todos os pontos, o total
resultante será menor do que o total calculado de forma semelhante para qualquer outra linha que possa
ser desenhada através dos pontos. Por esta razão, a reta que traçamos é chamada de reta dos mínimos
quadrados.
EXERCÍCIOS
9.3.1 Trace cada uma das seguintes equações de regressão em papel milimetrado e indique se X e Ya estão direta
ou inversamente relacionados. (a) ^y ¼ 3 þ 2x (b) ^y ¼ 3 þ 0:5x (c) ^y ¼ 10 0:75x
9.3.2 As pontuações a seguir representam a avaliação de uma enfermeira (X) e uma avaliação de um médico (Y) do
condição de 10 pacientes no momento da admissão em um centro de trauma.
X: 18 13 18 15 10 12 8 473
Y: 23 20 18 16 14 11 10 7 6 4
(a) Construa um diagrama de dispersão para esses

dados. (b) Trace as seguintes equações de regressão no diagrama de dispersão e indique qual delas você acha
que melhor se ajusta aos dados. Informe o motivo de sua escolha. (1) ^y ¼ 8 þ 0:5x (2) ^y ¼ 10 þ 2x (3) y ¼ 1 þ
1x
Para cada um dos seguintes exercícios (a) desenhe um diagrama de dispersão e (b) obtenha a equação de
regressão e plote-a no diagrama de dispersão.
9.3.3 A metadona é frequentemente prescrita no tratamento da dependência de opiáceos e da dor crónica. Krantz et ai.
(A-2) estudou a relação entre a dose de metadona e o intervalo QT (QTc) corrigido para 17 indivíduos
que desenvolveram torsade de pointes (taquicardia ventricular quase sempre devido a medicamentos).
O QTc é calculado a partir de um eletrocardiograma e é medido em mm/s. Um valor mais alto de QTc
indica um risco maior de mortalidade cardiovascular. Uma questão de interesse é quão bem se pode
prever e estimar o valor do QTc a partir do conhecimento da dose de metadona. Esta pergunta é
típica daquelas que podem ser respondidas por meio da análise de regressão. Como QTc é a variável
sobre o qual desejamos fazer previsões e estimativas, é a variável dependente. A variável dose de metadona, cujo
conhecimento será utilizado para fazer as previsões e estimativas, é a variável independente.
Dose de Metadona Dose de Metadona

(mg/dia) QTc (mm/seg) (mg/dia) QTc (mm/seg)
1000 600 650 785

550 625 600 765
97 560 660 611
90 585 270 600
85 590 680 625
126 500 540 650
300 700 600 635
110 570 330 522
65 540
Fonte: Mori J. Krantz, Ilana B. Kutinsky, Alastair D. Roberston e Philip S. Mehler, “Dose-
Related Effects of Metadone on QT Prolongation in a Series of Patients with Torsade de
Pointes,” Pharmacotherapy, 23 (2003) , 802-805.
9.3.4 Reiss et al. (A-3) comparou ensaios laboratoriais de ponto de atendimento e hospitalar padrão para monitorar pacientes
recebendo um único anticoagulante ou um regime que consiste em uma combinação de anticoagulantes.
É bastante comum, ao comparar duas técnicas de medição, usar a análise de regressão na qual uma variável é usada para
prever outra. No presente estudo, os pesquisadores obtiveram medidas de razão normalizada internacional (INR) por
análise de amostras de sangue capilar e venoso coletadas de 90 indivíduos em uso de varfarina. O INR, usado
especialmente quando os pacientes estão recebendo varfarina, mede a capacidade de coagulação do sangue. O teste no
local de atendimento para INR foi realizado com o produto de ensaio CoaguChek. Os testes hospitalares foram feitos com
ensaios laboratoriais hospitalares padrão. Os autores usaram o nível de INR do ensaio hospitalar para prever o nível de
CoaguChek INR. As medidas são dadas na tabela a seguir.
CoaguChek Hospital CoaguChek Hospital CoaguChek Hospital

(Y) (X) (Y) (X) (Y) (X)
1.8 1.6 2.4 1.2 3.1 2.4

1.6 1.9 2.3 2.3 1.7 1.8
2.5 2.8 2.0 1.6 1.8 1.6
1.9 2.4 3.3 3.8 1.9 1.7
1.3 1,5 1.9 1.6 5.3 4.2
2.3 1.8 1.8 1,5 1.6 1.6
1.2 1.3 2.8 1.8 1.6 1.4
2.3 2.4 2.5 1,5 3.3 3.3
2.0 2.1 0,8 1,0 1,5 1,5
1,5 1,5 1.3 1.2 2.2 2.8
2.1 2.4 3.7 1.4 1.1 1.6
1,5 1,5 2.4 1.6 2.6 2.6
(Contínuo )
EXERCÍCIOS 425

(Y) (X) (Y) (X) (Y) (X)
1,5 1.7 4.1 3.2 6.4 5,0

1.8 2.1 2.4 1.2 1,5 1.4
1,0 1.2 2.3 2.3 3.0 2.8
2,1 1,9 3,1 1.6 2.6 2.3
1,6 1,6 1,5 1,4 1,2 1,2
1,7 1,6 3,6 2,1 2,1 1,9
2,0 1,9 2,5 1,7 1,1 1,1
1,8 1,6 2,1 1,7 1,0 1,0
1,3 4,1 1,8 1,2 1,4 1,5
1,5 1,9 1,5 1.3 1.7 1,3
3.6 2,1 2.5 1.1 1.2 1.1
2.4 2.2 1,5 1.2 2.5 2.4
2.2 2.3 1,5 1.1 1.2 1.3
2.7 2.2 1.6 1.2 2.5 2.9
2.9 3.1 1.4 1.4 1.9 1.7
2.0 2.2 4.0 2.3 1.8 1.7
1,0 1.2 2.0 1.2 1.2 1.1
2.4 2.6 2.5 1,5 1.3 1.1
Fonte: Dados fornecidos por cortesia de Curtis E. Haas, Pharm.D.
9.3.5 A digoxina é um medicamento frequentemente prescrito para tratar doenças cardíacas. O objetivo do estudo de
Parker et al. (A-4) foi examinar as interações da digoxina com suco de toranja comum. Em um experimento, os
indivíduos tomaram digoxina com água por 2 semanas, seguidas por um período de 2 semanas durante o qual
a digoxina foi suspensa. Durante as 2 semanas seguintes, os indivíduos tomaram digoxina com suco de toranja.
Para sete indivíduos, o pico médio da concentração plasmática de digoxina (Cmax) ao ingerir água é dado na
primeira coluna da tabela a seguir. A segunda coluna contém a variação percentual na concentração de Cmax
quando os indivíduos estavam tomando a digoxina com suco de toranja [alteração de GFJ (%)]. Use o nível de
Cmax ao tomar digoxina com água para prever a alteração percentual na concentração de Cmax ao tomar
digoxina com suco de toranja.
Cmax (ngl/ml) com água Mudança em Cmax com GFJ (%)
2.34 29,5
2.46 40,7
1,87 5.3
3.09 23.3
5.59 45:1
4.05 35:3
6.21 44:6
2.34 29,5
Fonte: Dados fornecidos por cortesia de Robert B. Parker, Pharm.D.
9.3.6 Evans et al. (A-5) examinou o efeito da velocidade nas forças de reação do solo (GRF) em cães com claudicação
de um ligamento cruzado cranial rompido. Os cães foram passeados e trotados sobre uma força
plataforma e o GRF registrado (em newtons) durante a fase de apoio. A tabela a seguir contém 22 medições de força
expressas como a média de cinco medições de força por cão ao caminhar e a média de cinco medições de força por
cão ao trotar. Use o valor GRF ao caminhar para prever o valor GRF ao trotar.
GRF-Caminhada GRF-Trote GRF-Caminhada GRF-Trote
31,5 50,8 24,9 30,2

33,3 43,2 33,6 46,3
32,3 44,8 30,7 41,8
28,8 39,5 27,2 32,4
38,3 44,0 44,0 65,8
36,9 60.1 28.2 32.2
14.6 11.1 24.3 29,5
27,0 32.3 31.6 38,7
32,8 41.3 29.9 42,0
27.4 38.2 34.3 37.6
31,5 50,8 24.9 30.2
Fonte: Dados fornecidos por cortesia de Richard Evans, Ph.D.
9.3.7 A taxa de filtração glomerular (TFG) é o parâmetro mais importante da função renal avaliado em receptores de transplante
renal. Embora a depuração da inulina seja considerada a medida padrão-ouro da TFG, seu uso na prática clínica é
limitado. Krieser et ai. (A-6) examinou a relação entre o inverso da Cistatina C (uma proteína catiônica básica medida
em mg/L) e a inulina GFR medida pela depuração (ml/min/ 1,73 m2 ).
Os resultados de 27 testes são mostrados na tabela a seguir. Use DTPA GFR como preditor de Cistatina C inversa.
DTPA GFR 1/Cistatina C DTPA GFR 1/Cistatina C
18 0,213 42 0,485
21 0,265 42 0,427
21 0,446 43 0,562
23 0,203 43 0,463
27 0,369 48 0,549
27 0,568 48 0,538
30 0,382 51 0,571
32 0,383 55 0,546
32 0,274 58 0,402
32 0,424 60 0,592
36 0,308 62 0,541
37 0,498 67 0,568
41 0,398 68 0,800
88 0,667
Fonte: Dados fornecidos por cortesia de David Krieser, MD

9.4 AVALIANDO A EQUAÇÃO DE REGRESSÃO 427
9.4 AVALIANDO A EQUAÇÃO DE REGRESSÃO
Uma vez obtida a equação de regressão, ela deve ser avaliada para determinar se ela
descreve adequadamente a relação entre as duas variáveis e se pode ser usada
efetivamente para fins de previsão e estimativa.
Quando H0 : b1 ¼ 0 não é rejeitado Se na população a relação entre X e Y for linear,

b1, a inclinação da linha que descreve essa relação será positiva, negativa ou zero.
Se b1 for zero, os dados amostrais extraídos da população produzirão, a longo prazo,
equações de regressão com pouco ou nenhum valor para fins de previsão e estimativa.
Além disso, embora assumamos que a relação entre X e Y é linear, pode ser que a
relação possa ser melhor descrita por algum modelo não linear. Quando este for o
caso, os dados amostrais quando ajustados a um modelo linear tenderão a produzir
resultados compatíveis com uma inclinação populacional de zero. Assim, seguindo um
teste no qual a hipótese nula de que b1 é igual a zero não é rejeitada, podemos
concluir (assumindo que não cometemos um erro do tipo II ao aceitar uma falsa
hipótese nula) ou (1) que embora a relação entre X e Y pode ser linear não é forte o
suficiente para que X tenha muito valor na previsão e estimativa de Y, ou (2) que a
relação entre X e Y não é linear; ou seja, algum modelo curvilíneo fornece um melhor
ajuste aos dados. A Figura 9.4.1 mostra os tipos de relações entre X e Y em uma
população que podem impedir a rejeição da hipótese nula de que b1 ¼ 0.
Quando H0 : b1 ¼ 0 é rejeitado Agora vamos considerar as situações em uma

população que podem levar à rejeição da hipótese nula de que b1 ¼ 0. Supondo que
não cometemos um erro tipo I, rejeição da hipótese nula de que b1 ¼ 0 pode ser
atribuído a uma das seguintes condições na população: (1) a relação é linear e de
força suficiente para justificar o uso de equações de regressão amostral para prever e
estimar Y para determinados valores de X; e (2) há um bom ajuste dos dados a um
modelo linear, mas algum modelo curvilíneo pode fornecer um ajuste ainda melhor.
A Figura 9.4.2 ilustra as duas condições populacionais que podem levar à rejeição de
H0 : b1 ¼ 0.
Assim, vemos que antes de usar uma equação de regressão amostral para
prever e estimar, é desejável testar H0 : b1 ¼ 0. Podemos fazer isso usando análise
de variância e a estatística F ou usando a estatística t. Ilustraremos ambos os métodos.
Antes de fazermos isso, porém, vejamos como podemos investigar a força da relação
entre X e Y.
O Coeficiente de Determinação Uma maneira de avaliar a força da equação de

regressão é comparar a dispersão dos pontos sobre a linha de regressão com a
dispersão sobre y, a média dos valores de amostra de Y. Se tomarmos o diagrama de
dispersão para o Exemplo 9.3 .1 e traçar através dos pontos uma linha que intercepta
o eixo Y em y e é paralela ao eixo X, podemos obter uma impressão visual das
magnitudes relativas da dispersão dos pontos sobre esta linha e a linha de regressão.
Isso foi feito na Figura 9.4.3.
x
(uma)
x
(b)
FIGURA 9.4.1 Condições em uma população que podem impedir a rejeição da hipótese nula de
que b1 ¼ 0. (a) A relação entre X e Y é linear, mas b1 é tão próximo de zero que os dados da amostra
provavelmente não produzirão equações que são úteis para prever Y quando X é dado. (b) A relação
entre X e Y não é linear; um modelo curvilíneo fornece um melhor ajuste aos dados; os dados de
amostra provavelmente não produzirão equações que sejam úteis para prever Y quando X é fornecido.
Parece bastante óbvio na Figura 9.4.3 que a dispersão dos pontos sobre a linha
de regressão é muito menor do que a dispersão sobre a linha y. Não desejaríamos, no
entanto, decidir apenas com base nisso que a equação é útil. A situação pode nem
sempre ser tão clara, de modo que uma medida objetiva de algum tipo seria muito
mais desejável. Essa medida objetiva, chamada de coeficiente de determinação, está
disponível.
O Desvio Total Antes de definir o coeficiente de determinação, vamos justificar seu

uso examinando a lógica por trás de seu cálculo. Começamos considerando o ponto
correspondente a qualquer valor observado, yi, e medindo sua distância vertical da
linha y. Chamamos isso de desvio total e o designamos yð eu . º
O Desvio Explicado Se medirmos a distância vertical da linha de regressão à linha y,

eu , º reduzido
obtemos ^yð que é chamado de desvio explicado, pois mostra
quando quanto
a linhao de
desvio
regressão
total é
é ajustada aos pontos.
x
(uma)
x
(b)
FIGURA 9.4.2 Condições populacionais relativas a X e Y que podem causar a rejeição da
hipótese nula de que b1 ¼ 0. (a) A relação entre X e Y é linear e de força suficiente para justificar
o uso de uma equação de regressão amostral para prever e estime Y para determinados valores
de X. (b) Um modelo linear fornece um bom ajuste aos dados, mas algum modelo curvilíneo
forneceria um ajuste ainda melhor.
Desvio Inexplicado Finalmente, medimos a distância vertical do ð ^yi Þ, que é chamado

representa a parcela do desvio total não “explicado” ou contabilizado
de ponto
regressão
desvio
observado
pelo
inexplicável,
para
introdução
da
obter
linha
yi
pois
da
de
linha de regressão. Essas três quantidades são mostradas para um valor típico de Y na
Figura 9.4.4. A diferença entre o valor ð observado de Y e o valor previsto de Y, yi ^yi Þ,
também é chamada de resíduo.
O conjunto de resíduos pode ser usado para testar a linearidade subjacente e as suposições de
igualdade de variância do modelo de regressão descrito na Seção 9.2. Este procedimento é
ilustrado no final desta seção.
Vê-se, então, que o desvio total para um determinado yi é igual à soma dos
desvios explicados e inexplicados. Podemos escrever isso simbolicamente como
yð Þ i y ¼ ^yð Þ i y ð þ yi ^yi Þ (9.4.1)
desvio desvio
desvio total explicado inexplicável
260
240
220
200
180 ^
= _216 + 3,46x
anos
160
140
abdominal
profunda
(cm2),
Área
AT
Y
120
100 –
y = 101,89
80
60
40
20
0
0 60 65 70 75 80 85 90 95 100 105 110 115 120 125
FIGURA 9.4.3 Diagrama de dispersão, linha de regressão de amostra e linha y para o Exemplo 9.3.1.
Se medirmos esses desvios para cada valor de yi e ^yi, eleve ao quadrado cada desvio e
somando os desvios ao quadrado, temos
2 2
X yð eu souº ¼ X ^yð eu souº þ X yi ð ^yi Þ2 (9.4.2)
total explicou inexplicável
soma soma soma
de quadrados de quadrados de quadrados
Essas quantidades podem ser consideradas medidas de dispersão ou variabilidade.
Soma Total de Quadrados A soma total de quadrados (SST), por exemplo, é uma medida da dispersão dos valores
observados de Y sobre sua média y; ou seja, esse termo é uma medida da variação total nos valores observados de
Y. O leitor reconhecerá esse termo como o numerador da fórmula familiar para a variância da amostra.
Soma de quadrados explicada A soma de quadrados explicada mede a quantidade da variabilidade total nos valores
observados de Y que é contabilizada pela relação linear entre os valores observados de X e Y. Essa quantidade
também é chamada de soma de quadrados devido à regressão linear (SSR).
260
240
desvio inexplicável
220
(yi - y^ )
eu
200
Desvio total
180
(yi -y-)
160
desvio
^ explicado
^
y = _216 + 3,46x
140 (y – y_ )
eu
abdominal
profunda
(cm2),
Área
AT
Y
120
100 –
= 101,89
anos
80
60
40
20
0
0 60 65 70 75 80 85 90 95 100 105 110 115 120 125
FIGURA 9.4.4 Diagrama de dispersão mostrando os desvios totais, explicados e não explicados
para um valor selecionado de Y, Exemplo 9.3.1.
Soma inexplicada de quadrados A soma inexplicável de quadrados é uma medida da dispersão

dos valores de Y observados sobre a linha de regressão e às vezes é chamada de soma de
quadrados de erro ou soma de quadrados residual (SSE). É essa quantidade que é minimizada
quando a linha de mínimos quadrados é obtida.
Podemos expressar a relação entre os valores das três somas dos quadrados como
SST ¼ SSR þ SSE
Os valores numéricos dessas somas de quadrados para nosso exemplo ilustrativo aparecem na
análise da tabela de variância na Figura 9.3.2. Assim, vemos que SST ¼ 354531, SSR ¼ 237549,
SSE ¼ 116982 e
354531 ¼ 237549 þ 116982
354531 ¼ 354531
Calculando r2 É intuitivamente atraente especular que, se uma equação de regressão faz um

bom trabalho ao descrever a relação entre duas variáveis, a soma de quadrados explicada ou de
regressão deve constituir uma grande proporção da soma total de
quadrados. Seria interessante, então, determinar a magnitude dessa proporção calculando a razão
entre a soma explicada dos quadrados e a soma total dos quadrados. Isso é exatamente o que é feito
na avaliação de uma equação de regressão com base em dados de amostra, e o resultado é chamado
2
de coeficiente de determinação da amostra, r Ou seja, .
2 SSR
P ^yð r2
Þ i¼y
¼
2 SST
P yð Þ i y
Em nosso presente exemplo, usando as somas dos valores dos quadrados da Figura 9.3.2,
237549
r2 ¼ ¼ :67 354531
O coeficiente de determinação da amostra mede a proximidade do ajuste da amostra ð Þ, a

os valores observados de Y. Quando as quantidades yi ^yi distâncias dos valores
equação
observados
vertical
de regressão
de
para
Y
das equações são pequenas, a soma inexplicada de quadrados é pequeno. Isso leva a uma grande
soma explicada de quadrados que leva, por sua vez, a um grande valor 2 de r
. Isso é ilustrado na Figura 9.4.5.
Na Figura 9.4.5(a), vemos que todas as observações estão próximas da linha de regressão e,
2 2
esperaríamos que ser grande. De fato, o r calculado para esses dados, é 0,986, indicando que
cerca de 99 por cento da variação total no yi seja explicada pela regressão.
Na Figura 9.4.5(b) ilustramos um caso em que os yi estão amplamente dispersos para os dados
2 2
a linha de regressão, e aí suspeitamos que r é 0,403; é pequeno. o r calculado
ou seja, menos de 50% da variação total no yi é explicada pela regressão.
2
O maior valor que r pode assumir é 1, um resultado que ocorre quando toda a variação
no yi é explicada pela regressão. Quando r2 ¼ 1 todas as observações caem na linha de regressão.
Esta situação é mostrada na Figura 9.4.5(c). 2 O limite inferior de r
é 0. Este resultado é obtido quando a linha de regressão e a linha
traçada por y coincidem. Nesta situação, nenhuma variação no yi é explicada pela regressão. A Figura
2
9.4.5(d) ilustra uma situação em que r é próximo de zero.
quando r 2 é grande, então, a regressão foi responsável por uma grande proporção da
variabilidade total nos valores observados de Y, e olhamos com favor para a equação de regressão.
2
Por outro lado, um pequeno r que indica uma falha da regressão em explicar uma grande
proporção da variação total nos valores observados de Y, tende a lançar dúvidas sobre a utilidade da
equação de regressão para fins de previsão e estimativa. No entanto, não fazemos um julgamento
final sobre a equação até que ela tenha sido submetida a um teste estatístico objetivo.
Testando H0 : b1 ¼ 0 com a estatística F O exemplo a seguir ilustra um

método para chegar a uma conclusão sobre a relação entre X e Y.
EXEMPLO 9.4.1
Consulte o Exemplo 9.3.1. Queremos saber se podemos concluir que, na população da qual nossa
amostra foi extraída, X e Y estão linearmente relacionados.
(uma) (b)
Ajuste justo, grande r2 Ajuste ruim, r2 pequeno
(c) (d)
r2 = 1 r2 0
ÿ
2 FIGURA 9.4.5 r como uma medida de proximidade de ajuste da linha de regressão da amostra para a amostra
observações.
Solução: As etapas do procedimento de teste de hipótese são as seguintes:
1. Dados. Os dados foram descritos na declaração de abertura do Exemplo

9.3.1.
2. Suposições. Presumimos que o modelo de regressão linear simples e suas

suposições subjacentes, conforme apresentado na Seção 9.2, sejam aplicáveis.
3. Hipóteses.
H0 : b1 ¼ 0
HA : b1 6¼ 0
a ¼ :05
TABELA 9.4.1 Tabela ANOVA para Regressão Linear Simples
Fonte de Variação SS df EM RV
Regressão linear SSR 1 MSR ¼ SSR = 1 MSR/ MSE

Residual SSE n2 MSE ¼ SSE=ð Þ n 2
Total SST n1
4. Estatística de teste. A estatística de teste é VR, conforme explicado na discussão que

segue.
A partir dos três termos de somas de quadrados e seus graus de liberdade
associados, a tabela de análise de variância da Tabela 9.4.1 pode ser construída.
Em geral, os graus de liberdade associados à soma dos quadrados devido à
regressão são iguais ao número de constantes na equação de regressão menos 1.
No caso linear simples, temos duas estimativas, b0 e b1; portanto, os graus de
liberdade para regressão são 2 1 ¼ 1.
5. Distribuição da estatística de teste. Pode-se mostrar que quando a hipótese de
nenhuma relação linear entre X e Y é verdadeira, e quando as suposições
subjacentes à regressão são atendidas, a razão obtida pela divisão do quadrado
médio da regressão pelo quadrado médio residual é distribuída como F com 1 e n 2
graus de liberdade.
6. Regra de decisão. Rejeitar H0 se o valor calculado de VR for igual ou
maior que o valor crítico de F.
7. Cálculo da estatística de teste. Conforme mostrado na Figura 9.3.2, o valor calculado
de F é 217,28.
8. Decisão estatística. Como 217,28 é maior que 3,94, valor crítico de F (obtido por
interpolação) para 1 e 107 graus de liberdade, a hipótese nula é rejeitada.
9. Conclusão. Concluímos que o modelo linear fornece um bom ajuste para

os dados.
10. valor p. Para este teste, desde 217:28 > 8:25, temos p < :005.
Examinando a Figura 9.3.2, vemos que, de fato, p < .001. &
Estimando o coeficiente de determinação da população O coeficiente de determinação da amostra

fornece uma estimativa pontual de r2 , o coeficiente de determinação da população. O coeficiente de
determinação da população, r2 , tem a ver com a amostra.
2
Mostra qual a proporção
mesma função relativa à população como r da
variação total da população em Y é explicada pela
2
regressão de Y em X. Quando o 2número de graus de
liberdade é pequeno, r Um estimador imparcial deér2 é fornecido por
positivamente enviesado. isto é, rs tende a ser grande.
^yi Þ2 =ð n 2
P yið º
~r2 ¼ 1 2 (9.4.3)
P yð Þ i y =ðÞ n 1
Observe que o numerador da fração na Equação 9.4.3 é o quadrado médio inexplicado e o

denominador é o quadrado médio total. Essas quantidades aparecem na tabela de análise de
variância. Para nosso exemplo ilustrativo temos, usando os dados da Figura 9.3.2,
116982=107
~r2 ¼ 1 ¼ :66695
354531=108
Essa quantidade é rotulada como R-sq(adj) na Figura 9.3.2 e é relatada como 66,7 por cento.
Vemos que esse valor é menor que
116982
r2 ¼ 1 ¼ :67004
354531
2
Vemos que a diferença em r e ~r2 é devido ao fator ð Þ nÞ1n=ð
2 . Quando n é grande e ~r2
2
este fator se aproximará de 1 e a diferença entre r se aproximará de zero.
Testando H0 : b1 ¼ 0 com a estatística t Quando as suposições estabelecidas na Seção 9.2

são atendidas, b^ e b^ 1 são estimadores
0 b0 e b1.
deUma pontuais
vez de
valores Y imparciais
que, são essas dos parâmetros
sob normalmente
suposições, correspondentes
as subpopulações
distribuídas, podemos
construir intervalos de confiança e testar hipóteses sobre b0 e b1. Quando as suposições da
Seção 9.2 forem verdadeiras, as distribuições amostrais de b^
0 e b^ 1 são normalmente distribuídos com médias e variâncias como segue:
mb^0 ¼ b0 (9.4.4)
s2 Px2 eu
s2
b^0
¼
2 (9.4.5)
xi Þ
y=x n Pð x
mb^ 1 ¼ b1 (9.4.6)
s2
yjx
s2
b^1
¼
2 (9.4.7)
PðÞxi x
Nas Equações 9.4.5 e 9.4.7s2 é a variância inexplicável das subpopulações de valores Y y=x .
Com conhecimento das distribuições amostrais de b^ 0 e b^ 1 podemos construir
intervalos de confiança e testar hipóteses relativas a b0 e b1 da maneira usual.

As inferências relativas a a geralmente não são de interesse. Por outro lado, como vimos,
grande parte do interesse centra-se em procedimentos inferenciais com relaçãoAarazão de é1.o
b, esse
fato de que b1 nos diz muito sobre a forma da relação entre X e Y.
Quando X e Ya estão linearmente relacionados, 1 indica que, em geral, Y aumenta à medida que X
um b^ positivo aumenta, e dizemos que existe uma relação linear direta entre X e Y. Um b^ negativo
indica que os
1 valores de Y tendem a diminuir à medida que os valores de X aumentam, e dizemos
Y Y Y
x x x
)uma( )b( )c(
FIGURA 9.4.6 Diagramas de dispersão mostrando (a) relação linear direta, (b) relação linear
inversa e (c) nenhuma relação linear entre X e Y.
que existe uma relação linear inversa entre X e Y. Quando não há relação linear entre X e Y, b^ é igual a
zero. Essas três situações são ilustradas
1 na Figura 9.4.6.
A estatística de teste Para testar hipóteses sobre b1 , a estatística de teste quando s2 é yjx conhecido é
b^ b1 ð Þ0
z¼ 1
(9.4.8)
sb^
1
onde b1 ð Þ0 é o valor hipotético de b1. O valor hipotético de b1 não precisa ser zero, mas na prática, na
maioria das vezes, a hipótese nula de interesse é que b1 ¼ 0.
Como regra, s2 é desconhecido. Quando este for o caso, a estatística de teste é yjx
b^ 1 b1 ð Þ0
t¼ (9.4.9)
sb^
1
onde sb^ 1
é uma estimativa de sb^ 1 e t é distribuído como t de Student com n 2 graus de
liberdade.
Se a probabilidade de observar um valor tão extremo quanto o valor da estatística de teste calculada
pela Equação 9.4.9 quando a hipótese nula é verdadeira for menor que a=2 (já que temos um teste bilateral),
a hipótese nula é rejeitada .
EXEMPLO 9.4.2
Consulte o Exemplo 9.3.1. Queremos saber se podemos concluir que a inclinação da linha de regressão da
população que descreve a relação entre X e Y é zero.
Solução:
1. Dados. Ver Exemplo 9.3.1.
2. Suposições. Presumimos que o modelo de regressão linear simples e

seus pressupostos subjacentes são aplicáveis.
3. Hipóteses.
H0 : b1 ¼ 0
HA : b1 6¼ 0
a ¼ :05

5. Distribuição da estatística de teste. Quando as suposições são atendidas e H0 é
verdadeira, a estatística de teste é distribuída como t de Student com n 2 graus
de liberdade.
6. Regra de decisão. Rejeitar H0 se o valor calculado de t for maior ou igual a 1,9826

ou menor ou igual a 1:9826.
7. Cálculo de estatística. A saída na Figura 9.3.2 mostra que ¼ 3:4589, sb^
b^ 1 ¼ :2347, e
1
3:4589 0 ¼
14:74 t ¼
:2347
8. Decisão estatística. Rejeitar H0 porque 14:74 > 1:9826.

9. Conclusão. Concluímos que a inclinação da verdadeira linha de regressão não é
zero.
10. valor p. O valor de p para este teste é menor que 0,01, pois, quando H0 é
verdadeiro, a probabilidade de obter um valor de t tão grande ou maior que
2,6230 (obtido por interpolação) é 0,005, e a probabilidade de obter um valor de
t tão pequeno quanto ou menor que 2:6230 também é 0,005. Como 14,74 é
maior que 2,6230, a probabilidade de observar um valor de t tão grande ou maior
que 14,74 (quando a hipótese nula é verdadeira) é menor que 0,005.
Nós dobramos este valor para obter 2ð Þ¼ :005 :01.
Tanto a estatística F quanto a estatística t podem ser usadas para testar
H0 : b1 ¼ 0. O valor da razão de variância é igual ao quadrado do valor da
2
estatística t (ou seja, t ¼ F) e, portanto, ambas
conclusão.
as estatísticas
Para o exemplo
levam atual,
à mesmavemos
que ð Þ 14:74 ¼ 217:27, o valor obtido usando a estatística F no Exemplo 9.4.1.
2
Portanto,
estatística
o valor
t. de p correspondente será o mesmo para a estatística f e a
A implicação prática de nossos resultados é que podemos esperar obter

melhores previsões e estimativas de Y se usarmos a equação de regressão
amostral do que obteríamos se ignorássemos a relação entre X e Y.
O fato de b ser positivo nos leva a crer que b1 é positivo e que a relação entre X
e Y é uma relação linear direta. &
Como já foi apontado, a Equação 9.4.9 pode ser usada para testar a hipótese nula de que
b1 é igual a algum valor diferente de 0. O valor hipotético para b1, b1 ð Þ0 é substituído na
Equação 9.4.9. Todas as outras quantidades, bem como os cálculos, são os mesmos do
exemplo ilustrativo. Os graus de liberdade e o método de determinação da significância
também são os mesmos.
Um intervalo de confiança para b1 Uma vez que determinamos que é improvável, à luz da
evidência da amostra, que b1 seja zero, podemos estar interessados em obter uma estimativa
de intervalo de b1. A fórmula geral para um intervalo de confiança,
estimador ð Þconfiabilidade
fator de ð erro padrão da estimativa Þ pode
ser usado. Ao obter um intervalo de confiança para b1, o estimador é b^ o fator de 1, a
confiabilidade é algum valor de z ou t (dependendo se s2 y xj
é conhecido) e
o erro padrão do estimador é
s2
yjx
¼
sb^ 1 2
s PðÞxi x
Quando s2 é desconhecido, sb é estimado por yjx

s2
yjx
¼
sb^ 1 2
s PðÞxi x
onde s2 ¼ MSE yjx
Na maioria das situações práticas, nosso 100 1ð Þ um intervalo de confiança percentual para b é
b^ 1 tðÞ 1a=2 sb^ 1

(9.4.10)
Para nosso exemplo ilustrativo, construímos o seguinte intervalo de confiança

de 95% para b:
3:4589 1:9826ð Þ :2347
ð2:99; 3:92Þ
Interpretamos esse intervalo da maneira usual. Do ponto de vista probabilístico, dizemos que
na amostragem repetida 95 por cento dos intervalos construídos dessa maneira incluirão b1.
A interpretação prática é que temos 95% de confiança de que o único intervalo
construído inclui b1.
Usando o Intervalo de Confiança para Testar H0 : b1 ¼ 0 É instrutivo observar que o

intervalo de confiança que construímos não inclui zero, de modo que zero não é um
candidato para o parâmetro que está sendo estimado. Sentimos, então, que é improvável que b1 ¼ 0.
Isso é compatível com os resultados de nosso teste de hipótese no qual rejeitamos a
hipótese nula de que b1 ¼ 0. Na verdade, podemos sempre testar H0 : b1 ¼ 0 no nível de
significância a construindo o podemos
intervalo de
rejeitar
confiança
ou deixar
100 1ð
de Þ
rejeitar
a por acento
hipótese
para com
b1 , ebase
em se o intervalo inclui ou não zero. Se o intervalo contém zero, a hipótese nula não é
rejeitada; e se o zero não estiver contido no intervalo, rejeitamos a hipótese nula.
Interpretação dos resultados Deve-se enfatizar que a falha em rejeitar a hipótese nula de que
b1 ¼ 0 não significa que X e Y não estejam relacionados. Não apenas é possível que um erro
do tipo II tenha sido cometido, mas também pode ser verdade que X e Y estejam relacionados
de alguma maneira não linear. Por outro lado, quando rejeitamos a hipótese nula de que b1 ¼
0, não podemos concluir que a verdadeira relação entre X e Y é linear. Novamente, pode ser
que embora os dados se ajustem razoavelmente bem ao modelo de regressão linear (como
evidenciado pelo fato de que a hipótese nula de que b1 ¼ 0 é rejeitada), algum modelo não linear
forneceria um ajuste ainda melhor. Conseqüentemente, quando rejeitamos H0 que b1 ¼ 0, o melhor
que podemos dizer é que resultados mais úteis (discutidos abaixo) podem ser obtidos levando em
consideração a regressão de Y em X do que ignorando-a.
Testando as suposições de regressão Os valores do conjunto de resíduos, ð Þ, para um conjunto de dados

são freqüentemente
(suposiçõesusados
4 e 5 da
para
Seção
testar
9.2)
assubjacentes
suposições ao
de modelo
linearidade
de regressão.
e igualdade de variâncias yi ^yi
Isso é feito plotando os valores dos resíduos no eixo y e os valores previstos de y no eixo x. Se
esses gráficos mostrarem uma dispersão relativamente aleatória de pontos acima e ð Þ¼ 0, essas
para um determinado conjuntodasuposições
dehipótese
dados.
^yi são
Um
de linearidade,
padrão
consideradas
não ealeatório
um
abaixo
padrão
de pontos
uma
em forma
linha
pode
horizontal
deindicar
funil dos
violação
empontos
yi
pode indicar violação da hipótese de igualdade de variâncias. Exemplos desses padrões são
mostrados na Figura 9.4.7.
FIGURA 9.4.7 Gráficos de resíduos úteis para testar as suposições de linearidade e igualdade de variâncias
do modelo de regressão. (a) Um padrão aleatório de pontos ilustrando a não violação das suposições. (b)
Um padrão não aleatório ilustrando uma provável violação da suposição de linearidade. (c) Um padrão de
afunilamento ilustrando uma provável violação da suposição de igualdade de variâncias.
FIGURA 9.4.8 Gráfico de resíduos dos dados do Exemplo 9.3.1.
Muitos pacotes de computador fornecerão plotagens residuais automaticamente. Esses gráficos geralmente
usam
padronizados (isto é, ei= interpretados MSE p forma
da mesma ) dos resíduos e valores
que gráficos preditos,
de valores nãomas são valores
padronizados).
EXEMPLO 9.4.3
Consulte o Exemplo 9.3.1. Desejamos usar gráficos residuais para testar as suposições de linearidade e
variâncias iguais nos dados.
Solução: Um gráfico residual é mostrado na Figura 9.4.8.

Uma vez que existe uma dispersão relativamente igual e aleatória de pontos acima
de afunilamento do gráfico
e ð Þ¼
sugere
profunda
0abaixo
daque,
linha,
do
à presume-se
medida
AT
residual
aumenta,
que
yi ^yi
que
otambém
valor
seja
a suposição
válida.
previsto
aumenta
Noda
de
entanto,
área
alinearidade
quantidade
abdominal
a tendência
de
erro. Isso indica que a suposição de variâncias iguais pode não ser válida para esses
dados.
&
EXERCÍCIOS
9.4.1 a 9.4.5 Consulte os Exercícios 9.3.3 a 9.3.7, e para cada um faça o seguinte: (a)
Calcule o coeficiente de determinação. (b) Prepare uma tabela ANOVA
e use a estatística F para testar a hipótese nula de que b1 ¼ 0. Seja
a ¼ :05.
(c) Use a estatística t para testar a hipótese nula de que b1 ¼ 0 no nível de significância de
0,05. (d) Determine o valor de p para cada teste de hipótese. (e) Exponha suas conclusões em
termos do problema. (f) Construa o intervalo de confiança de 95% para b1.
9.5 USANDO A EQUAÇÃO DE REGRESSÃO 441
Se os resultados da avaliação da equação de regressão amostral indicarem que existe uma

relação entre as duas variáveis de interesse, podemos colocar a equação de regressão em
uso prático. Existem duas maneiras de usar a equação. Ele pode ser usado para prever qual
valor Y provavelmente assumirá dado um valor específico de X. Quando a suposição de
normalidade da Seção 9.2 for atendida, um intervalo de previsão para esse valor previsto de
Y pode ser construído.
Também podemos usar a equação de regressão para estimar a média da
subpopulação de valores Y assumidos como existindo em qualquer valor particular de X.
Novamente, se a suposição de populações normalmente distribuídas for válida, um intervalo
de confiança para esse parâmetro pode ser construído. O valor predito de Y e a estimativa
pontual da média da subpopulação de Y serão numericamente equivalentes para qualquer
valor particular de X, mas, como veremos, o intervalo de predição será mais amplo que o
intervalo de confiança.
Prevendo Y para um dado X Se for conhecido, ou se estivermos dispostos a assumir que as

suposições da Seção 9.2 são satisfeitas, e quando s2 é desconhecido,
para Yentão
predição
cento de 100o 1ð
é dado intervalo
Þ a yjxde
por por
2
xp x
^y
tð Þ 1a=2 syjx
1þ 1þ 2 (9.5.1)
n PðÞxi x
vuut
onde xp é o valor particular de x no qual desejamos obter um intervalo de predição para Y e os

graus de liberdade usados na seleção de t são n 2.
Estimando a média de Y para um dado X O intervalo de confiança 100 1ð para myjx, Þ um por cento
quando s2 yjx é desconhecido, é dado por

2
1 xp x
^y
tð Þ 1a=2 syjx
º 2 (9.5.2)
vuut
n PðÞxi x
Usamos o MINITAB para ilustrar, para um valor especificado de X, o cálculo de um intervalo de

confiança de 95% para a média de Yan e um intervalo de previsão de 95% para um Y individual
medição.
Suponha que, para o nosso exemplo atual, desejamos fazer previsões e estimativas sobre o
AT para uma circunferência da cintura de 100 cm. Na caixa de diálogo de regressão, clique em “Opções”.
Insira 100 na caixa “Intervalo de previsão para novas observações”. Clique em “Limites de
confiança” e clique em “Limites de previsão”.
Ajustar Stdev.Fit CI de 95,0% 95,0% PI
129,90 3,69 (122.58, 137.23) (63,93, 195,87)
Interpretamos o intervalo de confiança (IC) de 95% da seguinte maneira.

Se extraíssemos repetidamente amostras de nossa população de homens, fizéssemos uma
análise de regressão e estimássemos myjx¼100 com um intervalo de confiança construído de
forma semelhante, cerca de 95% desses intervalos incluiriam a quantidade média de AT abdominal
profundo para a população. Por esta razão, temos 95% de confiança de que o único intervalo
construído contém a média da população e que está entre 122,58 e 137,23.
Nossa interpretação de um intervalo de previsão (PI) é semelhante à interpretação de um

intervalo de confiança. Se coletarmos amostras repetidamente, fizermos uma análise de regressão
e construirmos intervalos de previsão para homens com circunferência da cintura de 100 cm,
cerca de 95% deles incluirão o valor de AT abdominal profundo do homem. Esta é a interpretação
probabilística. A interpretação prática é que temos 95% de confiança de que um homem com
circunferência da cintura de 100 cm terá uma área abdominal profunda entre 63,93 e 195,87
centímetros quadrados.
Intervalos de confiança e intervalos de previsão simultâneos podem ser calculados para
todos os pontos possíveis ao longo de uma linha de regressão ajustada. A plotagem de linhas
através desses pontos fornecerá uma representação gráfica desses intervalos. Uma vez que dados
os
médios apontam ð Þ X; Y é sempre incluído na equação de regressão, conforme ilustrado pelas
equações 9.3.2 e 9.3.3, os gráficos dos intervalos simultâneos sempre fornecerão as melhores
estimativas no meio da linha e o erro aumentará nas extremidades da linha. Isso ilustra o fato de
que a estimativa dentro dos limites do conjunto de dados, chamada interpolação, é aceitável, mas
a estimativa fora dos limites do conjunto de dados, chamada extrapolação, não é aconselhável,
pois o erro de previsão pode ser muito grande. Consulte a Figura 9.5.1.
A Figura 9.5.2 contém uma impressão parcial da análise de regressão linear simples SAS®
dos dados do Exemplo 9.3.1.
Linha resistente Frequentemente, os conjuntos de dados disponíveis para análise por técnicas de
regressão linear contêm uma ou mais observações “incomuns”; isto é, os valores de x ou y, ou
ambos, podem ser consideravelmente maiores ou consideravelmente menores do que a maioria
das outras medições. Na saída da Figura 9.3.2, vemos que o computador detectou sete
FIGURA 9.5.1 Intervalos de confiança simultâneos (a) e intervalos de predição (b) para os dados do
Exemplo 9.3.1.
9.5 USANDO A EQUAÇÃO DE REGRESSÃO 443
O Sistema SAS
Modelo: MODELO1
Variável dependente: Y
Soma de Significar
Fonte DF quadrados Quadrado F Valor Prob >F
Modelo 1 237548.51620 237548.51620 217.279 0,0001

Erro 107 116981.98602 1093.28959
C Total 108 354530.50222
Raiz MSE 33.06493 R-quadrado 0,6700

CV médio do 101.89404 Adj R-sq 0,6670
departamento 32.45031
Estimativas de Parâmetros
Parâmetro Padrão T para H0:

DF variável Estimativa Erro Parâmetro =0 Prob > |T|
INTERCEP 1 -215.981488 21.79627076 -9.909 0,0001

x 1 3,458859 0,23465205 14.740 0,0001
FIGURA 9.5.2 Impressão parcial da análise computacional dos dados fornecidos no Exemplo 9.3.1,
usando o pacote de software SAS®.
observações incomuns na circunferência da cintura e dados do AT abdominal profundo mostrados na

Tabela 9.3.1.
O método dos mínimos quadrados para ajustar uma linha reta aos dados é sensível a
observações incomuns, e a localização da linha ajustada pode ser substancialmente afetada por elas.
Devido a essa característica do método dos mínimos quadrados, diz-se que a linha de mínimos
quadrados resultante carece de resistência à influência de observações incomuns. Vários métodos
foram desenvolvidos para lidar com esse problema, incluindo um desenvolvido por John W. Tukey. A
linha resultante é chamada de linha de Tukey e linha resistente.
Com base nas medianas, que, como vimos, são medidas descritivas resistentes a valores
extremos, a metodologia da linha resistente é uma ferramenta exploratória de análise de dados que
permite ao pesquisador ajustar rapidamente uma linha reta a um conjunto de dados formado por
medidas x, y. A técnica envolve a divisão, com base na variável independente, das medições da
amostra em três grupos de tamanho o mais próximo possível: as menores medições, as maiores
medições e as intermediárias.
A linha resistente é a linha ajustada de tal forma que há um número igual de valores
Linha Resistente Stat EDA MTB > Nome C3 'RESI1' C4 'FITS1'

MTB > RLinha C2 C1 'RESI1' 'FITS1';
SUBC> MaxIterações 10.
Digite C2 em Resposta e C1 em Preditores.

Verifique Resíduos e Ajustes. Clique em OK.
Saída:
Ajuste de linha resistente: C2 versus C1
Inclinação = 3,2869 Nível = -203,7868 Relação de meia inclinação = 0,690
FIGURA 9.5.3 Procedimento de linha resistente do MINITAB e saída para os dados da Tabela 9.3.1.
acima e abaixo dela, tanto no grupo menor quanto no grupo maior. A inclinação resultante e as
estimativas de interceptação y são resistentes aos efeitos de valores extremos de y, valores
extremos de x ou ambos. Para ilustrar o ajuste de uma linha resistente, usamos os dados da
Tabela 9.3.1 e do MINITAB. O procedimento e a saída são mostrados na Figura 9.5.3.
Vemos na saída da Figura 9.5.3 que a linha resistente tem uma inclinação de 3,2869 e uma
interceptação y de 203:7868. A relação de meia inclinação, mostrada na saída como igual a 0,690,
é um indicador do grau de linearidade entre x e y. Uma inclinação, chamada de meia inclinação, é
calculada para cada metade dos dados da amostra. A razão entre a meia-inclinação direita, bR, e
a meia-inclinação esquerda, bL, é igual a bR=bL. Se a relação entre x e y for reta, as meias
inclinações serão iguais e sua razão será 1. Uma razão de meia inclinação que não seja próxima
de 1 indica uma falta de linearidade entre x e y.
A metodologia da linha resistente é discutida com mais detalhes por Hartwig e Dearing
(1), Johnstone e Velleman (2), McNeil (3) e Velleman e Hoaglin (4).
EXERCÍCIOS
Em cada exercício, consulte o exercício anterior apropriado e, para o valor de X indicado, (a)
construa o intervalo de confiança de 95 por cento para myjx e (b) construa o intervalo de predição
de 95 por cento para Y.
9.5.1 Consulte o Exercício 9.3.3 e seja X ¼ 400.
9.5.2 Consulte o Exercício 9.3.4 e seja X ¼ 1:6.
9.5.5 Consulte o Exercício 9.3.7 e seja X ¼ 35.

9.6 O MODELO DE CORRELAÇÃO 445
9.6 O MODELO DE CORRELAÇÃO
No modelo de regressão clássico, que tem sido o modelo subjacente em nossa discussão até este
ponto, apenas Y, que tem sido chamado de variável dependente, precisa ser aleatório.
A variável X é definida como uma variável fixa (não aleatória ou matemática) e é chamada de
variável independente. Lembre-se, também, que sob este modelo as observações são
freqüentemente obtidas pré-selecionando valores de X e determinando os valores correspondentes de Y.
Quando Y e X são variáveis aleatórias, temos o que é chamado de modelo de correlação.
Normalmente, sob o modelo de correlação, as observações da amostra são obtidas selecionando
uma amostra aleatória das unidades de associação (que podem ser pessoas, lugares, animais,
pontos no tempo ou qualquer outro elemento no qual as duas medições são feitas) e assumindo
cada uma uma medida de X e uma medida de Y. Nesse procedimento, os valores de X não são
pré-selecionados, mas ocorrem aleatoriamente, dependendo da unidade de associação selecionada
na amostra.
Embora a análise de correlação não possa ser realizada de forma significativa no modelo
de regressão clássico, a análise de regressão pode ser realizada no modelo de correlação.
A correlação envolvendo duas variáveis implica uma correlação entre variáveis que as coloca em pé
de igualdade e não as distingue referindo-se a uma como variável dependente e a outra como variável
independente. De fato, nos procedimentos computacionais básicos, que são os mesmos do modelo de
regressão, podemos ajustar uma linha reta ao Þ2 ou minimizando os dados Pð Þ ou minimizando P yi
2
de X em Y, bem como uma regressão ð ^yi xi X.
^xiAEm
de Ydiferente,
em outras
linha
e surge palavras,
ajustada
uma questãopodemos
nos dois
lógica
casos.sobre
faça uma
qual regressão
ajustar.
em geral será
linha
Se o objetivo for apenas obter uma medida da força da relação entre as duas variáveis, não
importa qual linha é ajustada, pois a medida normalmente calculada será a mesma em ambos os
casos. Se, no entanto, for desejado usar a equação que descreve a relação entre as duas variáveis
para os propósitos discutidos nas seções anteriores, importa qual linha é ajustada. A variável para
a qual desejamos estimar médias ou fazer previsões deve ser tratada como a variável dependente;
ou seja, esta variável deve ser regredida na outra variável.
A distribuição normal bivariada Sob o modelo de correlação, assume-se que X e Y variam juntos
no que é chamado de distribuição conjunta. Se essa distribuição conjunta for uma distribuição
normal, ela será chamada de distribuição normal bivariada. Inferências a respeito dessa população
podem ser feitas com base nos resultados de amostras devidamente retiradas dela. Se, por outro
lado, a forma da distribuição conjunta for conhecida como não normal, ou se a forma for
desconhecida e não houver justificativa para assumir a normalidade, os procedimentos inferenciais
são inválidos, embora medidas descritivas possam ser calculadas.
Suposições de correlação As seguintes suposições devem ser válidas para que as inferências
sobre a população sejam válidas quando a amostragem for de uma distribuição bivariada.
1. Para cada valor de X existe uma subpopulação normalmente distribuída de valores de Y.

2. Para cada valor de Y existe uma subpopulação normalmente distribuída de valores de X.
3. A distribuição conjunta de X e Y é uma distribuição normal chamada de normal bivariada
distribuição.
)Y ,X(f )Y ,X(f
Y x Y x
)uma( )b(
f(X, Y)
Y x
(c)
FIGURA 9.6.1 Uma distribuição normal bivariada. (a) Uma distribuição normal bivariada. (BA
corte mostrando subpopulação normalmente distribuída de Y para dado X. (c) Um corte mostrando subpopulação
normalmente distribuída de X para dado Y.
4. Todas as subpopulações de valores Y têm a mesma variância.

5. Todas as subpopulações de valores X têm a mesma variância.
A distribuição normal bivariada é representada graficamente na Figura 9.6.1. Nesta

ilustração, vemos que, se cortarmos o monte paralelo a Y em algum valor de X, o corte revela
a distribuição normal correspondente de Y. Da mesma forma, um corte no monte paralelo a X
em algum valor de Y revela a distribuição normalmente correspondente subpopulação de X.
9.7 COEFICIENTE DE CORRELAÇÃO
A distribuição normal bivariada discutida na Seção 9.6 tem cinco parâmetros, sx, sy,
mx, my e r. Os quatro primeiros são, respectivamente, os desvios padrão e as médias
associadas às distribuições individuais. O outro parâmetro, r, é chamado de população
9.7 O COEFICIENTE DE CORRELAÇÃO 447
x
FIGURA 9.7.1 Diagrama de dispersão para r ¼ 1.
coeficiente de correlação e mede a força da relação linear entre X e Y.
O coeficiente de correlação populacional é a raiz quadrada positiva ou negativa de r2, o

coeficiente de determinação populacional discutido anteriormente, e como o coeficiente de
determinação assume valores entre 0 e 1 inclusive, r pode assumir qualquer valor entre 1 e þ1. Se r
¼ 1 existe uma correlação linear direta perfeita entre as duas variáveis, enquanto r ¼ 1 indica
correlação linear inversa perfeita. Se r ¼ 0 as duas variáveis não são linearmente correlacionadas.
O sinal de r sempre será o mesmo que o sinal de b1, a inclinação da linha de regressão populacional
para X e Y.
O coeficiente de correlação da amostra, r, descreve a relação linear entre as observações da
amostra em duas variáveis da mesma forma que r descreve a relação em uma população. O
coeficiente de correlação da amostra é a raiz quadrada do coeficiente de determinação da amostra
que foi definido anteriormente.
As Figuras 9.4.5(d) e 9.4.5(c), respectivamente, mostram diagramas de dispersão típicos onde
2
r ! 0 rð Þ 2¼º1! .0AeFigura
r ¼ 1 rð
9.7.1 mostra um diagrama de dispersão típico onde r ¼ 1.
Normalmente estamos interessados em saber se podemos concluir que r 6¼ 0, ou seja, que

X e Y são linearmente correlacionados. Como r geralmente é desconhecido, extraímos uma amostra
aleatória da população de interesse, calculamos r, a estimativa de r e testamos H0 : r ¼ 0 contra a
alternativa r 6¼ 0. O procedimento será ilustrado no exemplo a seguir.
EXEMPLO 9.7.1
O objetivo do estudo de Kwast-Rabben et al. (A-7) foi analisar os potenciais evocados

somatossensoriais (PES) e suas inter-relações após a estimulação dos dígitos I, III e V na mão. Os
pesquisadores queriam estabelecer critérios de referência em uma população de controle. Assim,
voluntários saudáveis foram recrutados para o estudo. No futuro, esta informação pode ser bastante
valiosa, pois os SEPs podem fornecer um método para demonstrar distúrbios funcionais em pacientes
com suspeita de lesão da raiz cervical que apresentam dor e sintomas sensoriais. No estudo, a
estimulação abaixo da intensidade do nível da dor foi aplicada nos dedos. Gravações da coluna vertebral
as respostas foram feitas com eletrodos fixados por creme de eletrodo adesivo na pele do sujeito. Uma das relações de interesse
foi a correlação entre a altura de um indivíduo (cm) e o pico de latência espinhal (Cv) do SEP. Os dados para 155 medições são
TABELA 9.7.1 Medidas de Altura e Coluna SEP (Cv) da Estimulação do Dígito I

para 155 Indivíduos Descritos no Exemplo 9.7.1
Altura Cv Altura Cv Altura Cv
149 14.4 168 16.3 181 15.8

149 13.4 168 15.3 181 18.8
155 13.5 168 16,0 181 18.6
155 13.5 168 16.6 182 18,0
156 13,0 168 15.7 182 17.9
156 13.6 168 16.3 182 17.5
157 14.3 168 16.6 182 17.4
157 14.9 168 15.4 182 17,0
158 14,0 170 16.6 182 17.5
158 14,0 170 16,0 182 17.8
160 15.4 170 17,0 184 18.4
160 14.7 170 16.4 184 18.5
161 15,5 171 16.5 184 17.7
161 15.7 171 16.3 184 17.7
161 15.8 171 16.4 184 17.4
161 16,0 171 16.5 184 18.4
161 14.6 172 17.6 185 19,0
161 15.2 172 16.8 185 19.6
162 15.2 172 17,0 187 19.1
162 16.5 172 17.6 187 19.2
162 17,0 173 17.3 187 17.8
162 14.7 173 16.8 187 19.3
163 16,0 174 15,5 188 17.5
163 15.8 174 15,5 188 18,0
163 17,0 175 17,0 189 18,0
163 15.1 175 15.6 189 18.8
163 14.6 175 16.8 190 18.3
163 15.6 175 17.4 190 18.6
163 14.6 175 17.6 190 18.8
164 17,0 175 16.5 190 19.2
164 16.3 175 16.6 191 18.5
164 16,0 175 17,0 191 18.5
164 16,0 176 18,0 191 19,0
165 15.7 176 17,0 191 18.5
165 16.3 176 17.4 194 19.8
(Contínuo )
Altura Cv Altura Cv Altura Cv
165 17.4 176 18.2 194 18.8

165 17,0 176 17.3 194 18.4
165 16.3 177 17.2 194 19,0
166 14.1 177 18.3 195 18,0
166 14.2 179 16.4 195 18.2
166 14.7 179 16.1 196 17.6
166 13.9 179 17.6 196 18.3
166 17.2 179 17.8 197 18.9
167 16.7 179 16.1 197 19.2
167 16.5 179 16,0 200 21,0
167 14.7 179 16,0 200 19.2
167 14.3 179 17.5 202 18.6
167 14.8 179 17.5 202 18.6
167 15,0 180 18,0 182 20,0
167 15,5 180 17.9 190 20,0
167 15.4 181 18.4 190 19.5
168 17.3 181 16.4
Fonte: Dados fornecidos por cortesia de Olga Kwast-Rabben, Ph.D.
Solução: O diagrama de dispersão e a linha de regressão de mínimos quadrados são mostrados na Figura 9.7.2.
Vamos supor que o investigador deseja obter uma equação de regressão para usar para
fins de estimativa e previsão. Nesse caso, o coeficiente de correlação da amostra será obtido
pelos métodos discutidos no modelo de regressão.
21
20
19
18
(unidades)
CV
17
16
15
14
13
150 160 170 180 190 200
Altura (cm)
FIGURA 9.7.2 Altura e potenciais cervicais (coluna) na estimulação do dedo I

para os dados descritos no Exemplo 9.7.1.
A equação de regressão é Cv = -3,20 + 0,115 Altura
preditor Coef SE Coef T P

Constante -3.198 1.016 -3,15 0,002
Altura 0,114567 0,005792 19.78 0,000
S = 0,8573 R-Sq = 71,9% R-Sq(ajuste) = 71,7%
Fonte DF SS EM F P
Regressão 1 287,56 287,56 391,30 0,000
Erro Residual 153 112,44 0,73
Total 154 400,00
Obs Altura 39 166 Cv Ajustar SE Fit Residual St Resid

14.1000 15.8199 0,0865 -1,7199 -2.02R
42 166 13,9000 15.8199 0,0865 -1,9199 -2,25R
105 181 15,8000 17.5384 0,0770 -1,7384 -2,04R
151 202 18,6000 19.9443 0,1706 -1,3443 -1,60 X
152 202 18,6000 19.9443 0,1706 -1,3443 -1,60 X
153 182 20,0000 17.6529 0,0798 2.3471 2,75R
R denota uma observação com um grande resíduo padronizado X denota uma observação cujo valor de X lhe dá grande
influência.
FIGURA 9.7.3 Saída do MINITAB para o Exemplo 9.7.1 usando o procedimento de regressão simples.
A equação de regressão
Vamos supor que desejamos prever os níveis de Cv a partir do conhecimento das alturas. Nesse caso,
tratamos a altura como a variável independente e o nível Cv como a variável dependente e obtemos a
equação de regressão e o coeficiente de correlação com o MINITAB conforme mostrado na Figura
fffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
de regressão Para este exemplo

9.7.3. :719
r¼p é¼
positiva.
:848. Sabemos
Também que
podemos
r é positivo
usar oporque
procedimento
a inclinação
de correlação
da linha
do MINITAB para obter r conforme mostrado na Figura 9.7.4.
A impressão do procedimento de correlação SAS® é mostrada na Figura 9.7.5. Observe que o

procedimento SAS® fornece medidas descritivas para cada variável, bem como o valor de p para
o coeficiente de correlação.
Quando um computador não está disponível para realizar os cálculos, r pode ser
obtido por meio das seguintes fórmulas:
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
2
1
Px2 Pð Þ xi =n
hb^2 eu
r¼ (9.7.1)
vuut Py2 eu
Pyið iÞ2 = n
Dados:
C1: Altura
C2: CV
oB golaiD :x nammoc noisseS :d
Correlação estatística básica estatística MTB > Correlação C1 C2.
Digite C1 C2 em Variáveis. Clique em OK.
SAÍDA:
Correlações: Altura, Cv
Correlação de Pearson de Altura e Cv = 0,848 P-Value = 0,000
FIGURA 9.7.4 Procedimento do MINITAB para o Exemplo 9.7.1 usando o comando de correlação.
O Procedimento CORR
2 Variáveis: ALTURA CV
Estatísticas Simples
Variável N Desvio Padrão Médio Soma Mínimo Máximo

ALTURA 155 175.04516 11.92745 27132 149.00000 202.00000
cv 155 16.85613 1,61165 2613 13,00000 21,00000
Coeficientes de correlação de Pearson, N = 155

Problema > |r| sob H0: Rho=0
ALTURA cv
ALTURA 1,00000 0,84788
<.0001
cv 0,84788 1,00000
<.0001
FIGURA 9.7.5 Impressão SAS® para o Exemplo 9.7.1.

Uma fórmula alternativa para calcular r é dada por
n Pxiyi Pð Þ xi Pyi ð Þ
r¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
(9.7.2)
2
q n Px2 eu Pð Þ xi q n Py2 eu Pyið _ Þ2
Uma vantagem dessa fórmula é que r pode ser calculado sem primeiro calcular b.
Este é o procedimento desejável quando não se prevê que a equação de regressão será usada.
Lembre-se de que o coeficiente de correlação da amostra, r, sempre terá o mesmo sinal que a
inclinação da amostra, b. &
EXEMPLO 9.7.2
Consulte o Exemplo 9.7.1. Queremos ver se o valor amostral de r ¼ :848 é de magnitude suficiente
para indicar que, na população, os níveis de altura e Cv SEP estão correlacionados.
Solução: Conduzimos um teste de hipótese da seguinte forma.
1. Dados. Veja a discussão inicial do Exemplo 9.7.1.

2. Suposições. Presumimos que as premissas fornecidas na Seção 9.6 sejam
aplicáveis.
3. Hipóteses.
H0 : r ¼ 0
HA : r 6¼ 0
4. Estatística de teste. Quando r ¼ 0, pode-se mostrar que o teste apropriado

estatística é
n2
t¼r (9.7.3)
1 r2 r

atendidas, a estatística de teste é distribuída como a distribuição t de Student
com n 2 graus de liberdade.
6. Regra de decisão. Se deixarmos a ¼ :05, os valores críticos de t no presente
exemplo são 1:9754 (por interpolação). Se, a partir de nossos dados, calcularmos
um valor de t que seja maior ou igual a þ1:9754 ou menor ou igual a 1:9754,
rejeitaremos a hipótese nula.
7. Cálculo da estatística de teste. Nosso valor calculado de t é
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
153
t ¼ :848 ¼ 19:787
1:719r
8. Decisão estatística. Como o valor calculado da estatística de teste excede o valor

crítico de t, rejeitamos a hipótese nula.
9.7 COEFICIENTE DE CORRELAÇÃO 453
9. Conclusão. Concluímos que, na população, os níveis de altura e SEP

na coluna estão linearmente correlacionados.
10. valor p. Desde t ¼ 19:787 > 2:6085 (valor interpolado de t para 153,
.995), temos para este teste, p < :005. &
Pode-se notar também que a estatística de teste para o coeficiente de correlação é equivalente à
estatística de teste para a inclinação da linha de regressão. Portanto, o quadrado da estatística t na etapa 7 da
solução resulta na estatística F fornecida na Figura 9.7.3. Isso pode ser útil quando se usa um pacote de
computador que não fornece rotineiramente a estatística t para o coeficiente de correlação (por exemplo, SPSS)
e não se deseja calcular a estatística de teste manualmente.
Um teste para uso quando o r hipotético é um valor diferente de zero O uso da estatística t calculada no teste
acima é apropriado apenas para testar H0 : r ¼ 0. Se for desejado testar H0 : r ¼ r0, onde r0 é algum valor
diferente de zero, devemos usar outra abordagem. Fisher (5) sugere que r seja transformado em zr da seguinte
forma:
1 1þr
1r ln zr ¼ 2 (9.7.4)
onde ln é um logaritmo natural. Pode ser mostrado que zr é aproximadamente normalmente distribuído ð ln 1 f Þ
12
þ r =ð Þ g com uma média de zr ¼ 1 r e desvio padrão estimado de
1
szr
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
(9.7.5)
¼n3p
Para testar a hipótese nula de que r é igual a algum valor diferente de zero, a estatística de teste é
Z¼ zr zr ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
(9.7.6)
n 3 p 1=
que segue aproximadamente a distribuição normal padrão.

Para determinar zr para um r observado e zr para um r hipotético, consultamos a Tabela I, evitando assim
o uso direto de logaritmos naturais.
Suponha que em nosso presente exemplo desejamos testar
H0 : r ¼ :80
contra a alternativa
HA : r 6¼ :80
no nível de significância de 0,05. Consultando a Tabela I (e interpolando), descobrimos que para
r¼ :848; zr ¼ 1:24726
e para
r ¼ :80; zr ¼ 1:09861
Nossa estatística de teste, então, é
1:24726 1:09861 ¼ 1:83

Z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
155 3p 1=
Como 1,83 é menor que o valor crítico de z ¼ 1:96, não podemos rejeitar H0. Concluímos que o coeficiente
de correlação populacional pode ser 0,80.
Para tamanhos de amostra menores que 25, a transformação Z de Fisher deve ser usada com
cautela, se for o caso. Um procedimento alternativo de Hotelling (6) pode ser usado para tamanhos de
amostra iguais ou maiores que 10. Neste procedimento, a seguinte transformação de r é empregada:
3zr þ r
z ¼ zr (9.7.7)
4n
O desvio padrão de z é
1
sz ¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
(9.7.8)
n1p
A estatística de teste é
z z
Z¼n ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ zð zn 1 p Þ (9.7.9)
1 p 1=
Onde
3zr þ r 4n
zð¼
Þ pronunciado
zr zeta
Os valores críticos para fins de comparação são obtidos a partir da distribuição normal padrão.
Em nosso exemplo atual, para testar H0 : r ¼ :80 contra HA : r 6¼ :80 usando o Hotel
transformação ling e um ¼ :05, temos
3 1ð Þþ :24726 :848
z ¼ 1:24726 ¼ 1:2339 4
155 ð Þ¼3 1:0920
1ð Þþ :09861
4 155 ð:8Þ
155 1 p
z ¼ 1:09861
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
Z ¼ ð Þ 1:2339 1:0920 ¼ 1:7609
Como 1,7609 é menor que 1,96, a hipótese nula não é rejeitada e chega-se à mesma conclusão de
quando a transformação de Fisher é usada.
Alternativas Em algumas situações, os dados disponíveis para análise não atendem às suposições
necessárias para o uso válido dos procedimentos aqui discutidos para testar hipóteses sobre um coeficiente
de correlação populacional. Nesses casos, pode ser mais apropriado usar a técnica de correlação de
classificação de Spearman discutida no Capítulo 13.
Intervalo de confiança para r A transformação de Fisher pode ser usada para construir 100 1ð Þ intervalos
de confiança percentuais para r. A fórmula geral para um intervalo de confiança
estimador ð Þ fator
ð Þ de
erroconfiabilidade
padrão
EXERCÍCIOS 455
está empregado. Primeiro convertemos nosso estimador,r, em zr, construímos um intervalo de confiança sobre
zr e então reconvertemos os limites para obter um intervalo de confiança de 100 1ð Þ um percentual sobre r.
A fórmula geral torna-se então
z 1= n 3 p zr (9.7.10)
Para o nosso exemplo atual, o intervalo de confiança de 95 por cento para zr é dado por
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
1:24726 1:96 1= 155 3 p
ð1:08828; 1:40624Þ
A conversão desses limites (por interpolação na Tabela I do Apêndice), que são valores de zr, em
valores de r dá
zr r
1.08828 0,7962
1.40624 0,8866
Temos 95% de confiança, portanto, de que r está contido no intervalo de 0,7962 a 0,88866. Devido às entradas
limitadas na tabela, esses limites devem ser considerados apenas aproximados.
EXERCÍCIOS
Em cada um dos seguintes exercícios:
(a) Prepare um diagrama de dispersão.
(b) Calcule o coeficiente de correlação amostral. (c) Teste H0 :
r ¼ 0 no nível de significância de 0,05 e apresente suas conclusões. (d) Determine o valor de p para o
teste. (e) Construa o intervalo de confiança de 95% para r.
9.7.1 O objetivo do estudo de Brown e Persley (A-8) foi caracterizar a hepatite A aguda em pacientes com mais de 40 anos. Eles realizaram
uma revisão retrospectiva de prontuários de 20 indivíduos que foram diagnosticados com hepatite A aguda, mas não foram
hospitalizados. De interesse foi o uso da idade (anos) para prever os níveis de bilirrubina (mg/dl). Os seguintes dados foram
coletados.
Anos de idade) Bilirrubina (mg/dl) Anos de idade) Bilirrubina (mg/dl)
78 7.5 44 7,0
72 12.9 42 1.8
81 14.3 45 .8
59 8,0 78 3,8
64 14,1 47 3,5
48 10,9 50 5,1
46 12,3 57 16,5
(Contínuo )
Anos de idade) Bilirrubina (mg/dl) Anos de idade) Bilirrubina (mg/dl)
42 1,0 52 3.5
58 5.2 58 5.6
52 5.1 45 1.9
Fonte: Dados fornecidos por cortesia de Geri R. Brown, MD
9.7.2 Outra variável de interesse no estudo de Reiss et al. (A-3) (ver Exercício 9.3.4) foi a tromboplastina parcial (aPTT), o teste
padrão usado para monitorar a anticoagulação da heparina. Use os dados na tabela a seguir para examinar a correlação
entre os níveis de aPTT medidos pelo ensaio CoaguCheck no local de atendimento e o ensaio laboratorial hospitalar
padrão em 90 indivíduos recebendo heparina isoladamente, heparina com varfarina e varfarina e exoenoxaparina.
Varfarina e
heparina Varfarina Exoenoxaparina
CoaguCheck Hospital CoaguCheck Hospital CoaguCheck Hospital

aPTT aPTT aPTT aPTT aPTT aPTT
49,3 71,4 18,0 77,0 56,5 46,5

57,9 86,4 31,2 62,2 50,7 34,9
59,0 75,6 58,7 53,2 37,3 28,0
77,3 54,5 75,2 53,0 64,8 52,3
42,3 57,7 18,0 45,7 41,2 37,5
44,3 59,5 82,6 81,1 90,1 47,1
90,0 77,2 29,6 40,9 23,1 27.1
55,4 63.3 82,9 75,4 53.2 40,6
20.3 27.6 58,7 55,7 27.3 37,8
28,7 52,6 64,8 54,0 67,5 50.4
64,3 101.6 37,9 79,4 33.6 34.2
90,4 89,4 81.2 62,5 45.1 34,8
64,3 66.2 18,0 36,5 56.2 44.2
89,8 69,8 38,8 32,8 26,0 28.2
74,7 91,3 95,4 68,9 67,8 46.3
150,0 118,8 53,7 71.3 40,7 41,0
32.4 30.9 128,3 111.1 36.2 35,7
20.9 65.2 60,5 80,5 60,8 47.2
89,5 77,9 150,0 150,0 30.2 39,7
44,7 91,5 38,5 46,5 18,0 31.3
61,0 90,5 58,9 89.1 55,6 53,0
36.4 33.6 112,8 66,7 18,0 27.4
52,9 88,0 26,7 29,5 18,0 35,7
57,5 69,9 49,7 47,8 78,3 62,0
39,1 41,0 85,6 63,3 75,3 36,7
74,8 81,7 68,8 43,5 73,2 85,3
32,5 33,3 18,0 54,0 42,0 38,3
125,7 142,9 92,6 100,5 49,3 39,8
77,1 98,2 46,2 52,4 22,8 42,3
143,8 108,3 60,5 93,7 35,8 36,0

EXERCÍCIOS 457
9.7.3 No estudo de Parker et al. (A-4) (ver Exercício 9.3.5), os autores também analisaram a alteração na AUC (área sob a curva
da concentração plasmática de digoxina) ao comparar os níveis de digoxina tomados com e sem suco de toranja. A
tabela a seguir apresenta a AUC quando a digoxina foi consumida com água ng ð Þ hr=ml e a alteração na AUC em
comparação com a alteração na AUC quando a digoxina é ingerida com suco de toranja (GFJ, %).
Nível de AUC da água Alteração na AUC

ð ng hr=ml Þ com GFJ (%)
6,96 17,4
5,59 24,5
5,31 8,5
8,22 20,8
11,91 26,7
9,50 29.3
11.28 16.8
Fonte: Dados fornecidos por cortesia de Robert B. Parker,

Pharm.D.
9.7.4 Um artigo de Tuzson et al. (A-9) em Archives of Physical Medicine and Rehabilitation relatou os seguintes dados sobre o
pico de velocidade do joelho ao caminhar (medido em graus por segundo) em flexão e extensão para 18 indivíduos com
paralisia cerebral.
Flexão ð Þ =s Extensão ð Þ =s
100 100
150 150
210 180
255 165
200 210
185 155
440 440
110 180
400 400
160 140
150 250
425 275
375 340
400 400
400 450
300 300
300 300
320 275
Fonte: Ann E. Tuzson, Kevin P. Granata e

Mark F. Abel, “Spastic Velocity Threshold Constrains
Functional Performance in Cerebral Palsy,” Archives
of Physical Medicine and Rehabilitation, 84 (2003),
1363–1368.
9.7.5 A esclerose lateral amiotrófica (ALS) é caracterizada por um declínio progressivo da função motora. O processo
degenerativo afeta o sistema respiratório. Butz et ai. (A-10) investigou o impacto longitudinal da ventilação
noturna não invasiva com pressão positiva em pacientes com ELA. Antes do tratamento, eles mediram a
pressão parcial de oxigênio arterial (Pao2) e a pressão parcial de dióxido de carbono arterial (Paco2) em
pacientes com a doença. Os resultados foram os seguintes:
Paco2 Pao2
40,0 101,0
47,0 69,0
34,0 132,0
42,0 65,0
54,0 72,0
48,0 76,0
53,6 67.2
56,9 70,9
58,0 73,0
45,0 66,0
54,5 80,0
54,0 72,0
43,0 105,0
44.3 113,0
53,9 69.2
41,8 66,7
33,0 67,0
43.1 77,5
52.4 65.1
37,9 71,0
34,5 86,5
40.1 74,7
33,0 94,0
59,9 60,4
62,6 52,5
54,1 76,9 Fonte: M. Butz, KH Wollinsky, U. Widemuth-Catrinescu, A.
45,7 65,3 Sperfeld, S. Winter, HH Mehrkens, AC Ludolph e H.
40,6 80,3 Schreiber, “Efeitos longitudinais da ventilação por pressão
56,6 53,2 positiva não invasiva em pacientes com esclerose lateral
59,0 71,9 amiotrófica,” American Journal of Medical Rehabilitation, 82
(2003) 597–604.
9.7.6 Uma amostra aleatória simples de 15 crianças aparentemente saudáveis com idade entre 6 meses e 15 anos
produziu os seguintes dados sobre idade, X, e volume do fígado por unidade de peso corporal (ml/kg), Y:
XYXY
.5 41 10,0 26
.7 55 10.1 35
2.5 41 10.9 25
4.1 39 11.5 31
(Contínuo )
9.8 ALGUMAS PRECAUÇÕES 459
XYXY
5,9 50 12.1 31
6,1 32 14,1 29
7,0 41 15,0 23
8.2 42
9.8 ALGUMAS PRECAUÇÕES
A análise de regressão e correlação são ferramentas estatísticas poderosas quando empregadas adequadamente.
Seu uso inadequado, no entanto, pode levar apenas a resultados sem sentido. Para auxiliar no uso adequado
dessas técnicas, fazemos as seguintes sugestões:
1. As suposições subjacentes à análise de regressão e correlação devem ser revisadas cuidadosamente antes
que os dados sejam coletados. Embora seja raro encontrar que as suposições sejam atendidas com
perfeição, os praticantes devem ter alguma ideia sobre a magnitude da lacuna que existe entre os dados a
serem analisados e as suposições do modelo proposto, para que possam decidir se devem escolher outro
modelo; prossiga com a análise, mas tenha cautela na interpretação dos resultados; ou use o modelo
escolhido com confiança.
2. Na regressão linear simples e na análise de correlação, as duas variáveis de interesse são medidas na
mesma entidade, denominada unidade de associação. Se estivermos interessados na relação entre altura
e peso, por exemplo, essas duas medidas são feitas no mesmo indivíduo. Geralmente não faz sentido falar
da correlação, digamos, entre as alturas de um grupo de indivíduos e os pesos de outro grupo.
3. Não importa quão forte seja a indicação de uma relação entre duas variáveis, ela não deve ser interpretada
como uma relação de causa e efeito. Se, por exemplo, for observado um coeficiente de correlação amostral
significativo entre duas variáveis X e Yi, isso pode significar uma das várias coisas: (a) X causa Y. (b) Y
causa X. (c) Algum terceiro fator, diretamente ou indiretamente, causa X e Y. (d) Ocorreu um evento
improvável e um grande coeficiente de correlação amostral foi gerado por acaso a partir de uma população
na qual X e Y não são, de fato, correlacionados.
(e) A correlação é puramente sem sentido, uma situação que pode surgir quando a medida
elementos de X e Y não são tomados em uma unidade comum de associação.
4. A equação de regressão da amostra não deve ser usada para prever ou estimar fora da faixa de valores da
variável independente representada na amostra. Conforme ilustrado na Seção 9.5, essa prática, chamada
extrapolação, é arriscada. A verdadeira relação entre duas variáveis, embora linear ao longo de um intervalo
da variável independente, às vezes pode ser descrita na melhor das hipóteses como uma curva fora desse
intervalo. Se nossa amostra por acaso for extraída apenas do intervalo onde a relação é linear, teremos
apenas um
Y
Extrapolação
Extrapolação
Intervalo amostrado
FIGURA 9.8.1 Exemplo de extrapolação.
representação limitada da população e projetar os resultados da amostra além do intervalo

representado pela amostra pode levar a conclusões falsas. A Figura 9.8.1 ilustra as possíveis
armadilhas da extrapolação.
9.9 RESUMO
Neste capítulo, duas importantes ferramentas de análise estatística, regressão linear simples e
correlação, são examinadas. O seguinte esquema para a aplicação dessas técnicas foi sugerido.
1. Identifique o modelo. Os profissionais devem saber se o modelo de regressão ou o modelo de

correlação é o apropriado para responder às suas perguntas.
2. Reveja as suposições. Já foi apontado várias vezes que a validade das conclusões depende de
quão bem os dados analisados se ajustam ao modelo escolhido.
3. Obtenha a equação de regressão. Vimos como a equação de regressão é obtida pelo método
dos mínimos quadrados. Embora os cálculos, quando feitos à mão, sejam bastante longos,
complicados e sujeitos a erros, esse não é o problema hoje como era no passado. Os
computadores estão agora em uso tão difundido que o pesquisador ou estatístico sem acesso a
um é a exceção e não a regra.
Nenhum pedido de desculpas por longos cálculos é necessário para o pesquisador que tem um
computador disponível.
4. Avalie a equação. Vimos que a utilidade da equação de regressão para fins de estimativa e
previsão é determinada por meio da análise de
9.9 RESUMO 461
variância, que testa a significância do quadrado médio da regressão. A força da

relação entre duas variáveis sob o modelo de correlação é avaliada testando a
hipótese nula de que não há correlação na população. Se esta hipótese puder ser
rejeitada podemos concluir, no nível de significância escolhido, que as duas
variáveis estão correlacionadas.
5. Use a equação. Uma vez determinado que é provável que a equação de regressão
forneça uma boa descrição da relação entre duas variáveis, X e Y, ela pode ser
usada para um de dois propósitos: (a) Prever qual valor Y provavelmente assumirá ,
dado um valor particular de X, ou (b) Para estimar a média da subpopulação de
valores Y para um valor particular
de X.
Este tratamento necessariamente abreviado de regressão linear simples e

correlação pode ter levantado mais questões do que respondeu. Pode ter ocorrido ao
leitor, por exemplo, que uma variável dependente pode ser prevista com mais precisão
usando duas ou mais variáveis independentes em vez de uma. Ou, talvez, ele ou ela
pode sentir que o conhecimento da força da relação entre diversas variáveis pode ser
mais interessante do que o conhecimento da relação entre apenas duas variáveis. A
exploração dessas possibilidades é o assunto do próximo capítulo, e a curiosidade do
leitor nesse sentido deve ser pelo menos parcialmente aliviada.
Para aqueles que gostariam de aprofundar o tema da análise de regressão, estão
disponíveis várias referências excelentes, incluindo as de Dielman (7), Hocking (8),
Mendenhall e Sincich (9) e Neter et al. (10).
Fórmula
9.2.1 Suposição de myjx ¼ b0 þ b1x

linearidade
9.2.2 Modelo de y ¼ b0 þ b1x þ e

regressão linear simples
9.2.3 Termo de erro (residual) ð Þ¼ xy myjx e ¼ y b0 þ b1
9.3.1 y ¼ a þ bx
Representação
algébrica de uma reta
9.3.2 Estimativa de
Pn ð yð
Þ xiÞ xi y
mínimo quadrado do i¼1
¼
b^ 1
inclinação de 2
uma linha de regressão
Pn ðxi x º
i¼1
(Contínuo )
9.3.3 Estimativa de mínimos b^0 ¼ yb^ 1x

quadrados da interceptação
de uma linha de regressão
9.4.1 equação de desvio yð Þ¼ i y ^yð Þþ i y ð yi ^yi Þ
9.4.2 Equação da soma P yð Þ i y

2
¼ P ^yð Þ i y
2
ð þ P yi ^yi Þ2
dos quadrados
9.4.3 Coeficiente
P yið =ðÞ2
^yi Þ n 2
~r2 ¼ 1
estimado 2
P yð Þ i y =ðÞ n 1
de determinação
da população
9.4.4–9.4.7 Meios e mb^0 ¼ b0

variações de
s2 yjx Px2
estimadores ¼
eu
s2
pontuais a e b b^0
2
n Xn ðxi x º
i¼1
mb^ 1
¼ b1
s2
yjx
s2 ¼
b^1
2
Xn
ð Þ xi x
i¼1
9.4.8 estatística z para

z ¼ b^ 1 b1 ð Þ0 sb^
testar hipóteses sobre
0
b
9.4.9 estatística t para b^ 1
t¼ b1 ð Þ0
testar hipóteses
sb^0
sobre b
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
9.5.1 Predição 2
intervalo para Y xp x
^y 11þ º
tðÞ 1a=2 sy=x 2
para um determinado X vuut
n PðÞ xi x
9.5.2
Confiança
1 xp x
intervalo para ^y º
s n
tð Þ 1a=2 syjx
a média de Y PðÞxi x
para um determinado X
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
9.7.1–9.7.2 Coeficiente de correlação 2

b^
1 Px2 Pð Þ xi =n
2h eu
eu
r¼
vuut Py2 eu
Pyið _ Þ2 =n
¼
n Pxiyi Pð Þ xi Pyi ð Þ
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
2
q n Px2 eu
Pð Þ xi q n Py2 eu
Pyið _ Þ2
9.9 RESUMO 463

9.7.3 estatística t para n2

coeficiente de correlação t¼r
1 r2 r
9.7.4 estatística z para 1 1 þ r ln zr

¼21r
coeficiente de correlação
9.7.5 Padrão estimado 1

szp ¼
desvio para a estatística z n3p
9.7.6 estatística Z para zr zp

Z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
coeficiente de correlação n 3 p 1=
9.7.7 estatística Z para 3zr þ r

z ¼ zr
coeficiente de correlação 4n
quando n < 25
9.7.8 Desvio padrão para 1

sz ¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
z n3p
9.7.9 Estatística Z para z j

Z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ zj Þ n1pð , Onde
coeficiente de correlação
3zpnþ1rp4n
1=
j ¼ Zp
9.7.10 Intervalo de confiança n3p

Zr ¼ Z 1=
para r
Tecla de símbolo b0 ¼ termo de interceptação de

0 regressão
regressão b^ ¼estimada
interceptação de
a ¼ probabilidade de
erro tipo I ou interceptação de regressão b^ ¼ inclinação de regressão
1
estimada b1 ¼ inclinação de regressão e ¼ termo de erro
mx ¼ média populacional da estatística=variável xn ¼

tamanho da amostra s2 ¼ variância populacional da
estatística=variável xr ¼ coeficiente
x população r ¼ coeficiente de correlação
de correlação da
da amostra r2
¼ coeficiente de determinação da amostra t ¼ testatística
xi ¼ valor da variável independente em ix ¼

média amostral da variável independente yi ¼ valor
da variável dependente em iy ¼ média amostral da
variável dependente ^y ¼ estimativa yz ¼ zestatística
1. Quais são as suposições subjacentes à análise de regressão linear simples quando um dos objetivos é fazer inferências sobre a
população da qual os dados da amostra foram extraídos?
2. Por que a equação de regressão é chamada de equação de mínimos quadrados?
3. Explique o significado de b^ 4. 0 na equação de regressão de amostra.
Explique o significado de b^ 1 na equação de regressão de amostra.
5. Explique os seguintes termos: (a) Soma
total dos quadrados (b) Soma
explicada dos quadrados (c) Soma não
explicada dos quadrados
6. Explique o significado e o método de cálculo do coeficiente de determinação.
7. Qual é a função da análise de variância na análise de regressão?
8. Descreva três maneiras pelas quais alguém pode testar a hipótese nula de que b^ 1 ¼ 0.
9. Para quais dois propósitos uma equação de regressão pode ser usada?
10. Quais são as suposições subjacentes à análise de correlação simples quando a inferência é um objetivo?
11. O que significa unidade de associação na análise de regressão e correlação?
12. Quais são as possíveis explicações para um coeficiente de correlação amostral significativo?
13. Explique por que é arriscado usar uma equação de regressão de amostra para prever ou estimar fora do intervalo
de valores da variável independente representada na amostra.
14. Descreva uma situação em sua área de interesse particular em que a análise de regressão simples seria útil. Use dados reais ou
realistas e faça uma análise de regressão completa.
15. Descreva uma situação em sua área de interesse em que uma análise de correlação simples seria útil. Use dados reais ou realistas
e faça uma análise de correlação completa.
Em cada um dos exercícios a seguir, faça a análise necessária e teste as hipóteses nos níveis de significância indicados.
Calcule o valor de p para cada teste.
16. Um estudo de Scrogin et al. (A-11) foi projetado para avaliar os efeitos de manipulações simultâneas de NaCl dietético e cálcio na
pressão arterial, bem como na pressão arterial e nas respostas das catecolaminas ao estresse. Os sujeitos eram ratos machos
espontaneamente hipertensos e sensíveis ao sal. Entre as análises realizadas pelos investigadores, havia uma correlação entre
a pressão arterial basal e a concentração plasmática de epinefrina (E). Os seguintes dados sobre essas duas variáveis foram
coletados.
Deixe um ¼ :01.
PA PlasmaE PA PlasmaE
163,90 248,00 143,20 179,00

195,15 339,20 166,00 160,40
170,20 193,20 160,40 263,50
171,10 307,20 170,90 184,70
(Contínuo )
PA PlasmaE PA PlasmaE
148,60 80,80 150,90 227,50

195,70 550,00 159,60 92,35
151,00 70,00 141,60 139,35
166,20 66,00 160,10 173,80
177,80 120,00 166,40 224,80
165,10 281,60 162,00 183,60
174,70 296,70 214,20 441,60
164,30 217,30 179,70 612,80
152,50 88,00 178,10 401,60
202,30 268,00 198,30 132,00
171,70 265,50
Fonte: Dados fornecidos por cortesia de Karie E. Scrogin.
17. Dean Parmalee (A-12) desejava saber se as notas de fim de ano atribuídas aos alunos da Wright State University Medical
School predizem suas pontuações no conselho do segundo ano. A tabela a seguir mostra, para 89 alunos, a nota final do
ano (AVG, em percentual de 100) e a nota no exame médico do segundo ano (BOARD).
AVG MÉDIA DA PLACA MÉDIA DA PLACA PLACA
95,73 257 85,91 208 82.01 196

94.03 256 85,81 210 81,86 179
91,51 242 85,35 212 81,70 207
91,49 223 85,30 225 81,65 202
91.13 241 85,27 203 81,51 230
90,88 234 85,05 214 81.07 200
90,83 226 84,58 176 80,95 200
90,60 236 84,51 196 80,92 160
90,30 250 84,51 207 80,84 205
90,29 226 84,42 207 80,77 194
89,93 233 84,34 211 80,72 196
89,83 241 84,34 202 80,69 171
89,65 234 84,13 229 80,58 201
89,47 231 84,13 202 80,57 177
88,87 228 84,09 184 80,10 192
88,80 229 83,98 206 79,38 187
88,66 235 83,93 202 78,75 161
88,55 216 83,92 176 78,32 172
88,43 207 83,73 204 78,17 163
88,34 224 83,47 208 77,39 166
87,95 237 83,27 211 76,30 170
87,79 213 83.13 196 75,85 159
87.01 215 83,05 203 75,60 154
86,86 187 83.02 188 75.16 169
86,85 204 82,82 169 74,85 159
86,84 219 82,78 205 74,66 167
(Contínuo )
AVG PLACA AVG PLACA AVG PLACA
86,30 228 82,57 183 74,58 154

86.13 210 82,56 181 74.16 148
86,10 216 82,45 173 70,34 159
85,92 212 82,24 185
Fonte: Dados fornecidos por cortesia de Dean Parmalee, MD e do Wright State University
Statistical Consulting Center.
Realize uma análise de regressão completa com AVG como variável independente. Deixe um ¼ :05 para todos os testes.
18. Maria Mathias (A-13) realizou um estudo com crianças hiperativas. Ela mediu a atitude, hiperatividade e comportamento social
das crianças antes e depois do tratamento. A tabela a seguir mostra para 31 indivíduos a idade e os escores de melhora
do pré-tratamento ao pós-tratamento para atitude (ATT), comportamento social (SOC) e hiperatividade (HYP). Uma
pontuação negativa para HYP indica uma melhora na hiperatividade; uma pontuação positiva em ATT ou SOC indica
melhora. Realize uma análise para determinar se há evidências que indiquem que a idade (anos) está correlacionada com
qualquer uma das três variáveis de resultado. Deixe um ¼ :05 para todos os testes.
Sujeito Nº IDADE ATT HYP SOC
1 9 1:2 1:2 0,0

2 9 0,0 0,0 1,0
3 13 0:4 0,0 0,2
4 6 0:4 0:2 1.2
5 9 1,0 0:8 0,2
6 8 0,8 0,2 0,4
7 8 0:6 0:2 0,6
8 9 1:2 0:8 0:6
9 7 0,0 0,2 0,8
10 12 0,4 0:8 0,4
11 9 0:8 0,8 0:2
12 10 1,0 0:8 1,2
13 12 1,4 1:6 0,6
14 1,0 0:2 0:2
15 9 12 0,8 0:8 1,0
16 9 1,0 0,4 0,4
17 10 0,4 0:2 0,6
18 7 0,0 0:4 0,6
19 12 1.1 0:6 0,8
20 9 0,2 0:4 0,2
21 7 0,4 0:2 0,6
22 6 0,0 3:2 1,0
23 11 0,6 0:4 0,0
24 11 0,4 0:4 0,0
25 11 1,0 0:7 0:6
26 11 0,8 0:8 0,0
(Contínuo )
Sujeito Nº IDADE ATT HYP SOC
27 11 1.2 0,6 1,0

28 11 0,2 0,0 0:2
11 0,8 1:2 0,3
29
cortesia de Maria Mathias, MD e
30 8 0,0 0,0 0:4
do Wright State University
31 9 0,4 0:2 0,2
19. Um estudo de Triller et al. (A-14) examinou o tempo necessário para que enfermeiras de assistência domiciliar
reembalem os medicamentos de um paciente em vários organizadores de medicamentos (isto é, caixas de
comprimidos). Para os 19 pacientes do estudo, os pesquisadores registraram o tempo necessário para reembalar os
medicamentos. Eles também registraram o número de problemas encontrados na sessão de reempacotamento.
Reembalagem Reembalagem
Nº do paciente Nº de problemas Tempo (minutos) Nº do paciente Nº de problemas Tempo (minutos)
1 9 38 11 1 10
2 2 25 12 2 15
3 0 5131 17
4 6 18 14 0 18
5 5 15 15 0 23
6 3 25 16 10 29
7 3 10 17 0 5
8 1 5181 22
9 2 10 19 1 20
10 0 15
Fonte: Dados fornecidos por cortesia de Darren M. Triller, Pharm.D.
Realize uma análise de regressão completa desses dados usando o número de problemas para prever o tempo
necessário para concluir uma sessão de reempacotamento. Deixe um ¼ :05 para todos os testes. Que conclusões
podem ser tiradas de sua análise? Como seus resultados podem ser usados pelos profissionais de saúde?
20. A seguir estão os valores de fluxo sanguíneo pulmonar (PBF) e volume sanguíneo pulmonar (PBV)
registrados para 16 bebês e crianças com cardiopatia congênita:
Y x
PBV (ml/m²) PBF (L/min/m²)
168 4.31
280 3,40
391 6.20
420 17h30
303 12h30
429 13,99
605 8.73
522 8,90
224 5.87
291 5,00
(Contínuo )
Y x
PBV (ml/m²) PBF (L/min/m²)
233 3.51
370 4.24
531 19,41
516 16,61
211 7,21
439 11,60
2
Encontre a equação de regressão que descreve a relação linear entre as duas variáveis, calcule r e teste H0 : ,
b1 ¼ 0 tanto pelo teste F quanto pelo teste t. Deixe um ¼ :05.
21. Quinze espécimes de soros humanos foram testados comparativamente para anticorpos tuberculínicos por dois métodos.
Os logaritmos dos títulos obtidos pelos dois métodos foram os seguintes:
Método
A (X) DE)
3.31 4.09
2.41 3,84
2.72 3,65
2.41 3.20
2,11 2,97
2,11 3,22
3,01 3,96
2,13 2,76
2,41 3,42
2,10 3,38
2,41 3,28
2.09 2,93
3,00 3.54
2.08 3.14
2.11 2.76
2
Encontre a equação de regressão que descreve a relação entre as duas variáveis, calcule o teste H0 : b1 ,e
¼ 0 tanto pelo teste F quanto pelo teste t.
22. A tabela a seguir mostra a ingestão de metil mercúrio e os valores de mercúrio no sangue total em 12 indivíduos
expostos ao metil mercúrio por meio do consumo de peixe contaminado:
x Y
Metilo Mercúrio em
Ingestão de Mercúrio sangue total
ð mg Hg=dia Þ (ng/g)
180 90
200 120
230 125
410 290
(Contínuo )
x Y
Metilo Mercúrio em
Ingestão de Mercúrio Cheio de sangue
ð mg Hg=dia Þ (ng/g)
600 310
550 290
275 170
580 375
105 70
250 105
460 205
650 480
2
Encontre a equação de regressão que descreve a relação linear entre as duas variáveis, calcule r e teste H0 : b1 ¼ 0 pelos ,
testes F e t.
23. A seguir estão os pesos (kg) e os níveis de glicose no sangue (mg/100 ml) de 16 aparentemente saudáveis
machos adultos:
Peso (X) Glicose (Y)
64,0 108
75,3 109
73,0 104
82,1 102
76,2 105
95,7 121
59,4 79
93,4 107
82.1 101
78,9 85
76,7 99
82.1 100
83,9 108
73,0 104
64,4 102
77,6 87
Encontre a equação de regressão linear simples e teste H0 : b1 ¼ 0 usando ANOVA e o teste t. Teste H0 : r ¼ 0 e construa
um intervalo de confiança de 95% para r. Qual é o nível de glicose previsto para um homem que pesa 95 kg? Construa o
intervalo de predição de 95 por cento para seu peso. Deixe um ¼ :05 para todos os testes.
24. A seguir estão as idades (anos) e pressão arterial sistólica de 20 adultos aparentemente saudáveis:
Idade (X) PA (Y) Idade (X) PA (Y)
20 120 46 128
43 128 53 136
63 141 70 146
(Contínuo )
Idade (X) PA (Y) Idade (X) PA (Y)
26 126 20 124
53 134 63 143
31 128 43 130
58 136 26 124
46 132 19 121
58 140 31 126
70 144 23 123
Encontre a equação de regressão linear simples e teste H0 : b1 ¼ 0 usando ANOVA e o teste t.

Teste H0 : r ¼ 0 e construa um intervalo de confiança de 95% para r. Encontre o intervalo de previsão de 95% para a pressão
arterial sistólica de uma pessoa de 25 anos. Deixe um ¼ :05 para todos os testes.
25. Os seguintes dados foram coletados durante um experimento no qual animais de laboratório foram inoculados com um patógeno.
As variáveis são o tempo em horas após a inoculação e a temperatura em graus Celsius.
Tempo Temperatura Tempo Temperatura
24 38,8 44 41.1
28 39,5 48 41.4
32 40.3 52 41.6
36 40,7 56 41,8
40 41,0 60 41,9
Encontre a equação de regressão linear simples e teste H0 : b1 ¼ 0 usando ANOVA e o teste t. Teste H0 : r ¼ 0 e construa um
intervalo de confiança de 95% para r. Construa o intervalo de previsão de 95% para a temperatura 50 horas após a inoculação.
Deixe um ¼ :05 para todos os testes.
Para cada um dos estudos descritos nos Exercícios 26 a 28, responda ao máximo possível das perguntas a seguir. (a) Qual é
mais relevante, análise de regressão ou análise de correlação, ou ambas as técnicas são igualmente relevantes? (b) Qual é a
variável independente? (c) Qual é a variável dependente? (d) Quais são as hipóteses nula e alternativa apropriadas? (e) Você
acha que a hipótese nula foi rejeitada? Explique por que ou por que não. (f) Qual é o objetivo mais relevante, previsão ou
estimativa, ou os dois são igualmente relevantes?
(g) Qual é a população amostrada? (h) Qual é a
população-alvo? (i) As variáveis estão direta ou
inversamente relacionadas?
26. Lamarre-Cliche et al. (A-15) afirmam: “Acredita-se que o intervalo QT corrigido para a frequência cardíaca (QTc) reflita o equilíbrio
simpatovagal. Também foi estabelecido que os b-bloqueadores influenciam o sistema nervoso autônomo.” Os pesquisadores
realizaram análises de correlação para medir a associação entre intervalo QTc, frequência cardíaca, alteração da frequência
cardíaca e resposta terapêutica da pressão arterial para 73
hipertensos em uso de b-bloqueadores. Os pesquisadores descobriram que a duração do intervalo QTc, a frequência
cardíaca pré-tratamento e a alteração da frequência cardíaca com a terapia não eram bons preditores da resposta da
pressão arterial aos b-bloqueadores seletivos de b1 em indivíduos hipertensos.
27. Skinner et al. (A-16) realizou uma pesquisa telefônica transversal para obter um recordatório alimentar de 24 horas sobre
a ingestão de alimentos de bebês e crianças pequenas, conforme relatado por mães ou outros cuidadores primários.
Uma descoberta interessante foi que entre 561 crianças com idades entre 15 e 24 meses, a idade em semanas da
criança foi negativamente relacionada à densidade
1 ade
idade
vitamina
em semanas
C b^ ¼ :43,
da criança
p ¼ :01.produziu
Ao prever
umacoeficiente
densidade de
de inclinação
cálcio,
de 1:47 com p de 0,09.
28. Park et al. (A-17) estudou 29 indivíduos do sexo masculino com cirrose clinicamente confirmada. Entre outras
variáveis, eles mediram os níveis de manganês no sangue total (MnB), manganês no plasma (MnP), manganês
na urina (MnU) e índice palidal (PI), uma medida da intensidade do sinal na ressonância magnética (MRI)
ponderada em T1. Eles encontraram um coeficiente de correlação de 0,559, p < :01, entre MnB e PI. No
entanto, não houve correlações significativas entre MnP e Pi ou MnU e Pi (r ¼ :353, p > :05, r ¼ :252, p > :05,
respectivamente).
Para os estudos descritos nos Exercícios 29 a 46, faça o seguinte: (a) Realize
uma análise estatística dos dados (incluindo teste de hipótese e construção do intervalo de confiança) que
você acha que forneceriam informações úteis para os pesquisadores. (b) Construa gráficos que você acha que
seriam úteis para ilustrar as relações entre as variáveis.
(c) Onde achar apropriado, use técnicas aprendidas em outros capítulos, como análise de variância e teste de
hipótese e estimativa de intervalo em relação a médias e proporções. (d) Determine os valores de p para cada
estatística de teste computada. (e) Declare todas as suposições necessárias para validar sua análise. (f)
Descreva a(s) população(ões) sobre a qual você acha que as inferências baseadas em sua análise seriam
aplicáveis. (g) Se disponível, consulte a referência citada e compare suas análises e resultados com os dos
autores.
29. Moerloose et al. (A-18) realizaram um estudo para avaliar a utilidade clínica de uma nova técnica laboratorial
(método A) para uso no diagnóstico de embolia pulmonar (EP). O desempenho da nova técnica foi comparado
com o de uma técnica padrão (método B). Os sujeitos consistiram em pacientes com suspeita clínica de EP
que foram admitidos na enfermaria de emergência de um hospital universitário europeu. A seguir estão as
medidas obtidas pelas duas técnicas para 85 pacientes. Os pesquisadores realizaram duas análises: (1) em
todos os 85 pares de medições e (2) nos pares de medições para os quais o valor do método B foi inferior a
1.000.
B AB A B UMA
9 119 703 599 2526 1830

84 115 725 610 2600 1880
86 108 727 3900 2770 2100
190 182 745 4050 3100 1780
208 294 752 785 3270 1870
218 226 884 914 3280 2480
251 311 920 1520 3410 1440
(Contínuo )
B AB A B UMA
252 250 966 972 3530 2190

256 312 985 913 3900 2340
264 403 994 556 4260 3490
282 296 1050 1330 4300 4960
294 296 1110 1410 4560 7180
296 303 1170 484 4610 1390
311 336 1190 867 4810 1600
344 333 1250 1350 5070 3770
371 257 1280 1560 5470 2780
407 424 1330 1290 5576 2730
418 265 1340 1540 6230 1260
422 347 1400 1710 6260 2870
459 412 1530 1333 6370 2210
468 389 1560 1250 6430 2210
481 414 1840 764 6500 2380
529 667 1870 1680 7120 5220
540 486 2070 1310 7430 2650
562 720 2120 1360 7800 4910
574 343 2170 1770 8890 4080
646 518 2270 2240 9930 3840
664 801 2490 1910
670 760 2520 2110
Fonte: Dados fornecidos por cortesia do Dr. Philippe de Moerloose.
30. Pesquisa de Huhtaniemi et al. (A-19) enfocou a qualidade do hormônio luteinizante (LH) sérico durante a maturação puberal
em meninos. Os indivíduos, consistindo de meninos saudáveis entrando na puberdade (idades de 11 anos e 5 meses a
12 anos), foram estudados durante um período de 18 meses. A seguir estão as concentrações (IU/L) de LH bioativo (B-
LH) e LH imunorreativo (I-LH) em amostras de soro retiradas dos indivíduos. Apenas as observações nas quais a razão
B/I dos participantes foi superior a 3,5 são relatadas aqui.
I-LH B-LH I-LH B-LH
.104 .37 .97 3,63

.041 .28 .49 2,26
.124 .64 1 4,55
0,808 2.32 1.17 5,06
.403 1.28 1.46 4.81
.27 .9 1,97 8.18
.49 2.45 .88 2.48
.66 2.8 1.24 4.8
.82 2.6 1.54 3.12
1.09 4.5 1,71 8.4
1.05 3.2 1.11 6
.83 3,65 1.35 7.2
0,89 5.25 1,59 7.6
0,75 2.9
Fonte: Dados fornecidos por cortesia do Dr. Ilpo T. Huhtaniemi.

31. Tsau et al. (A-20) estudaram a excreção urinária do fator de crescimento epidérmico (EGF) em crianças normais e naquelas
com insuficiência renal aguda (IRA). Amostras aleatórias de urina seguidas de coleta de urina de 24 horas foram obtidas de
25 crianças. Os indivíduos variaram em idade de 1 mês a 15 anos. A excreção urinária de EGF foi expressa como uma
proporção de EGF urinário para concentração de creatinina urinária (EGF/Cr). Os autores concluem a partir dos resultados
de suas pesquisas que é razoável usar testes aleatórios de urina para
monitoramento da excreção de EGF. A seguir estão as concentrações aleatórias (spot) e urinárias de EGF/Cr de 24 horas
(pmol/mmol) para os 25 indivíduos:
Urina 24h Spot Urina Urina 24h Spot Urina

Sujeito EGF/Cr (x) EGF/Cr (y) Sujeito EGF/Cr (x) EGF/Cr (y)
1 772 720 14 254 333

2 223 271 15a 93 84
3 494 314 16 303 512
4 432 350 17 408 277
5a 79 79 18 711 443
6a 155 118 19 209 309
7 305 387 20 131 280
318 432 21 165 189
8 9a 174 97 22 151 101
10 1318 1309 23 165 221
11 482 406 24 125 228
12 436 426 25 232 157
13 527 595
uma
Indivíduos com IRA.

Fonte: Dados fornecidos por cortesia do Dr. Yong-Kwei Tsau.
32. Uma das razões para um estudo de Usaj e Starc (A-21) foi o interesse no comportamento da cinética do pH durante condições
de resistência de longo prazo e resistência de curto prazo entre corredores saudáveis. Os nove sujeitos participantes do
estudo eram maratonistas com idade entre 26 e 5 anos. Os autores relatam que obtiveram uma boa correlação entre a
cinética do pH e a resistência de curto e longo prazo.
A seguir estão as velocidades de curto (VSE) e longo prazo (VLE) e as medições de pH do sangue para os indivíduos
participantes.
VLE VSE Faixa de pH
5.4 5.6 0,083

4,75 5.1 .1
4.6 4.6 0,021
4.6 5 0,065
4,55 4.9 0,056
4.4 4.6 .01
4.4 4.9 0,058
4.2 4.4 0,013
4.2 4.5 .03
cortesia de Anton Usaj, Ph.D.
33. Bean et al. (A-22) conduziu um estudo para avaliar o desempenho do procedimento de focagem isoelétrica/imunoblotting/
densitometria a laser (IEF/IB/LD) para avaliar a transfer ferrina deficiente em carboidratos (CDT) derivada de manchas de
sangue seco. Os investigadores avaliaram soro pareado (S) e seco
amostras de sangue (DBS) simultaneamente para CDT. A avaliação do CDT serve como um marcador para o abuso de álcool.
O uso de manchas de sangue seco como fonte de CDT para análise por IEF/IB/LD resulta em amostragem simplificada,
armazenamento e transporte de amostras. A seguir estão os valores de IEF/IB/LD em unidades de densitometria (DU) de CDT
de 25 amostras de soro e sangue seco:
N.º do espécime S DBS Amostra No. S DBS
64 23 14 9 13
1 74 38 15 10 8
2 75 37 16 17
34 103 53 17 38 7 14
5 10 9 18 9 9
6 22 18 19 15 9
7 33 20 20 70 31
8 10 5 21 61 26
9 31 14 22 42 14
10 30 15 23 20 10
11 28 12 24 58 26
12 16 9 25 31 12
13 13 7 da Dra. Pamela Bean.
34. Kato et al. (A-23) mediu a concentração plasmática de adrenomedulina (AM) em pacientes com insuficiência cardíaca congestiva
crônica devido a várias doenças cardíacas. AM é um peptídeo hipotensor, que, com base em outros estudos, dizem os autores,
tem um papel implícito como hormônio circulante na regulação do sistema cardiovascular. Outros dados coletados dos
participantes incluíram concentrações plasmáticas de hormônios conhecidos por afetar o sistema cardiovascular. A seguir
estão os valores de plasma AM (fmol/ml) e atividade de renina plasmática (PRA) ng ð Þ =L s para 19 pacientes com
insuficiência cardíaca:
Paciente Sexo Idade SOU PRA

Não. 1ð ¼ M; 2 ¼ F (anos)
º (fmol/ml) ng ð Þ =L s
1 70 12,11 .480594
1 1 44 7,306 .63894
2 1 72 6,906 1.219542
34 1 62 7,056 .450036
2 52 9,026 .19446
56 2 65 10,864 1.966824
7 2 64 7.324 .29169
8 1 71 9.316 1.775142
9 2 61 17.144 9.33408
10 1 68 6.954 .31947
11 1 63 7.488 1.594572
12 2 59 10.366 .963966
13 2 55 10.334 2.191842
14 2 57 13 3.97254
15 2 68 6.66 0,52782
16 2 51 8.906 .350028
17 1 69 8.952 1,73625
18 1 71 8.034 .102786
Fonte: Dados fornecidos
19 1 46 13.41 1.13898 por cortesia do Dr. Johji Kato.
35. Em um estudo relatado em Archives of Disease in Childhood, Golden et al. (A-24) testaram a hipótese de que a concentração
plasmática de calprotectina (PCal) (uma proteína citosólica de neutrófilos liberada durante a ativação ou morte de neutrófilos)
é um indicador precoce e sensível de inflamação associada à infecção bacteriana na fibrose cística (FC). Os participantes
eram crianças com FC confirmada e um grupo de controle de crianças de mesma idade e sexo sem a doença. Entre os dados
coletados estavam as seguintes medições de calprotectina plasmática ð Þ mg=L e cobre plasmático (PCu) ð Þ mmol=L. O
cobre plasmático é um índice
de 0,48
de resposta
entre a calprotectina
de fase agudaplasmática
na fibrose(log10)
cística.eOs
o cobre
autores
plasmático.
relataram um coeficiente de correlação
CF CF CF
Nº do Nº do Nº do
assunto PCal PCu assunto PCal PCu assunto PCal PCu
1 452 17.46 12 1548 15.31 22 674 18.11

2 590 14.84 13 708 17h00 23 3529 17.42
3 1958 27.42 14 8050 20h00 24 1467 17.42
4 2015 18.51 15 9942 25h00 25 1116 16.73
5 417 15.89 16 791 13.10 26 611 18.11
6 2884 17,99 17 6227 23h00 27 1083 21.56
7 1862 21.66 18 1473 16.70 28 1432 21.56
8 10471 19.03 19 8697 18.11 29 4422 22.60
9 25850 16.41 20 621 18.80 30 3198 18.91
10 5011 18.51 21 1832 17.08 31 544 14h37
11 5128 22.70
Nº do Nº do
assunto assunto
de controle PCal PCu de controle PCal PCu
1 674 16.73 17 368 16.73

2 368 16.73 18 674 16.73
3 321 16.39 19 815 19.82
4 1592 14h32 20 598 16.1
5 518 16.39 21 684 13.63
6 815 19.82 22 684 13.63
7 684 17.96 23 674 16.73
8 870 19.82 24 368 16.73
9 781 18.11 25 1148 24.15
10 727 18.11 26 1077 22h30
11 727 18.11 27 518 9,49
12 781 18,11 28 1657 16,10
13 674 16,73 29 815 19,82
14 1173 20,53 30 368 16,73
15 815 19,82 31 1077 22,30
16 727 18,11
Fonte: Dados fornecidos por cortesia da Dra. Barbara E. Golden.

36. Gelb et al. (A-25) conduziram um estudo no qual exploraram a relação entre a limitação moderada a grave do fluxo aéreo expiratório e a
presença e extensão de enfisema morfológico e tomográfico em pacientes ambulatoriais consecutivos com doença pulmonar obstrutiva
crônica. Entre os dados coletados estavam as seguintes medidas de TC pulmonar e patologia (PATH) para pontuação de enfisema:
Pontuação CT CAMINHO Pontuação CT CAMINHO
15 45 50
5 70 45 40
90 20 85 75
50 25 7 0
10 12 25 80 85
35 10 15 5
40 35 45 40
45 30 37 35
5 5 75 45
25 50 5 5
60 60 5 20
70 60
Fonte: Dados fornecidos por cortesia do Dr. Arthur F. Gelb.
37. O objetivo do estudo de Witteman et al. (A-26) foi investigar a reatividade da pele com os principais alérgenos purificados e avaliar a relação
com os níveis séricos de anticorpos imunoglobulina E (IgE) e determinar quais fatores adicionais contribuem para o resultado do teste
cutâneo. Os indivíduos consistiam em pacientes com rinite alérgica, asma alérgica ou ambos, que foram atendidos em um centro
médico europeu. Como parte do estudo, os pesquisadores coletaram, de 23 indivíduos, as seguintes medições de IgE específica (IU/
ml) e teste cutâneo (ng/ml) na presença de Lol p 5, um alérgeno purificado do pólen de gramíneas. Queremos saber a natureza e a
força da relação entre as duas variáveis. (Observação: os autores converteram as medições em logaritmos naturais antes de investigar
essa relação.)
IgE Teste de Pele
24,87 .055
12,90 .041034
9,87 .050909
8,74 .046
6,88 0,039032
5,90 0,050909
4,85 0,042142
3.53 0,055
2.25 4.333333
2.14 .55
1,94 0,050909
1.29 .446153
0,94 .4
.91 0,475
(Contínuo )
IgE Teste de Pele
.55 4.461538
.30 4.103448
.14 7.428571
.11 4,461538
.10 6,625
.10 49.13043
.10 36.47058
.10 52.85714
.10 47.5

cortesia do Dr. Jaring S. van der Zee.
38. Garland et al. (A-27) conduziram uma série de experimentos para delinear a complexa farmacocinética materno-fetal e os
efeitos da zidovudina (AZT) em babuínos maternos e fetais cronicamente instrumentados (espécies de Papio) durante
infusão intravenosa em estado estacionário e regimes de dosagem oral em bolus . Entre os dados coletados estavam as
seguintes medições de dosagem (mg/kg/h) e concentração plasmática materna de AZT em estado estacionário (ng/ml):
AZT AZT
Concentração de Dosagem Concentração de Dosagem
2.5 832 2.0 771

2.5 672 1.8 757
2.5 904 0,9 213
2.5 554 0,6 394
2.5 996 0,9 391
1.9 878 1.3 430
2,1 815 1,1 440
1,9 805 1,4 352
1,9 592 1,1 337
0,9 391 0,8 181
1,5 710 0,7 174
1,4 591 1,0 470
1.4 660 1.1 426
1,5 694 0,8 170
1.8 668 1,0 360
1.8 601 0,9 320
Fonte: Dados fornecidos por cortesia da Dra. Marianne Garland.
39. O objetivo de um estudo de Halligan et al. (A-28) foi avaliar a variação diurna da pressão arterial (PA) em mulheres
normotensas e com pré-eclâmpsia. Os indivíduos eram semelhantes em idade, peso e duração média da gestação (35
semanas). Os pesquisadores coletaram as seguintes leituras de PA. Como parte de sua análise, eles estudaram a relação
entre as medições diurnas e noturnas médias e as diferenças dia/noite para PA diastólica e sistólica em cada grupo.
C1 C2 C3 C4 C5 C1 C2 C3 C4 C5
0 75 56 127 101 1 94 78 137 119

0 68 57 113 104 1 90 86 139 138
0 72 58 115 105 1 85 69 138 117
0 71 51 111 94 1 80 75 133 126
0 81 61 130 110 1 81 60 127 112
0 68 56 111 101 1 89 79 137 126
0 78 60 113 102 1 107 110 161 161
0 71 55 120 99 1 98 88 152 141
0 65 51 106 96 1 78 74 134 132
0 78 61 120 109 1 80 80 121 121
0 74 60 121 104 1 96 83 143 129
0 75 52 121 102 1 85 76 137 131
0 68 50 109 91 1 79 74 135 120
0 63 49 108 99 1 91 95 139 135
0 77 47 132 115 1 87 67 137 115
0 73 51 112 90 1 83 64 143 119
0 73 52 118 97 1 94 85 127 123
0 64 62 122 114 1 85 70 142 124
0 64 54 108 94 1 78 61 119 110
0 66 54 106 88 1 80 59 129 114
0 72 49 116 101 1 98 102 156 163
0 83 60 127 103 1 100 100 149 149
0 69 50 121 104 1 89 84 141 135
0 72 52 108 95 1 98 91 148 139
C1 ¼ grupo 0ð ¼ normotenso; 1 ¼ pré-eclâmptica; C2ºdiastólica de ¼ dia; C3 ¼ noite diastólica; C4

¼ dia sistólico; C5 ¼ noite sistólica.
Fonte: Dados fornecidos por cortesia do Dr. Aidan Halligan.
40. Marks e outros. (A-29) realizaram um estudo para determinar os efeitos da rápida perda de peso na contração da vesícula
biliar e para avaliar os efeitos do ursodiol e do ibuprofeno na saturação, nucleação e crescimento e contração. Os
indivíduos eram pacientes obesos aleatoriamente designados para receber ursodiol, ibuprofeno ou placebo. Entre os
dados coletados estavam os seguintes valores de índice de saturação de colesterol (CSI) e tempos de nucleação (NT) em
dias de 13 (seis homens, sete mulheres) tratados com placebo no final de 6 semanas:
CSI NT
1.20 4,00
1.42 6,00
1.18 14h00
.88 21h00
1.05 21h00
1,00 18h00
1.39 6,00
1.31 10.00
1.17 9h00
(Contínuo )
CSI NT
1.36 14h00
1.06 21h00
13h30 8h00
1,71 2,00

cortesia do Dr. Jay W. Marks.
41. O objetivo do estudo de Peacock et al. (A-30) foi investigar se a osteoartrite da coluna vertebral é responsável pelo fato de que a densidade
mineral óssea (DMO) da coluna lombar é maior quando medida no plano anteroposterior do que quando medida no plano lateral. Foram
estudadas radiografias laterais da coluna de mulheres (faixa etária de 34 a 87 anos) que compareceram a um ambulatório de hospital
para medição da densidade óssea e foram submetidas a radiografia da coluna lombar. Entre os dados coletados estavam as seguintes
medidas de DMO anteroposterior (A) e lateral (L) (g/cm2 ):
ABMD LBMD ABMD LBMD ABMD LBMD
0,879 .577 1.098 .534 1.091 0,836

0,824 0,622 0,882 0,570 0,746 .433
0,974 .643 .816 0,558 1.127 0,732
.909 .664 1.017 0,675 1.411 0,766
0,872 0,559 .669 0,590 0,751 .397
0,930 .663 0,857 .666 0,786 .515
.912 .710 0,571 0,474 1.031 .574
0,758 0,592 1.134 .711 0,622 .506
1.072 0,702 0,705 0,492 0,848 .657
0,847 0,655 0,775 .348 0,778 .537
1.000 .518 0,968 .579 .784 .419
.565 .354 0,963 .665 .659 .429
1.036 .839 0,933 .626 .948 .485
.811 .572 .704 .194 .634 .544
.901 .612 .624 .429 .946 .550
1.052 .663 1.119 .707 1.107 .458
.731 .376 .686 .508 1.583 .975
.637 .488 .741 .484 1.026 .550
.951 .747 1.028 .787
.822 .610 .649 .469
0,951 .710 1.166 0,796
1.026 .694 0,954 .548
1.022 0,580 .666 0,545
1.047 .706
.737 .526
Fonte: Dados fornecidos por cortesia do Dr. Cyrus Cooper.
42. Sloan et al. (A-31) observam que a ativação simpática cardíaca e a retirada parassimpática resultam em aumentos da frequência cardíaca
durante o estresse psicológico. Como indicadores da atividade adrenérgica cardíaca, a epinefrina (E) e a norepinefrina (NE) plasmáticas
geralmente aumentam em resposta ao desafio psicológico.
A análise espectral de potência da variabilidade do período cardíaco também fornece estimativas de
atividade do sistema nervoso. Os autores conduziram um estudo para determinar a relação entre neuro-humoral
e duas estimativas espectrais diferentes da atividade do sistema nervoso simpático cardíaco durante uma linha
de base de repouso tranquila e em resposta a uma tarefa aritmética psicologicamente desafiadora.
Os indivíduos eram voluntários saudáveis, do sexo masculino e feminino, sem medicação, com idade média de 37,8 anos.
Nenhum tinha história de doença cardíaca, respiratória ou vascular. Entre os dados coletados estavam as
seguintes medições em E, NE, índices espectrais de potência de baixa frequência (LF) e frequência muito baixa
(VLF) e relações de baixa frequência/alta frequência (LH/HF). As medições são dadas por três períodos: linha
de base (B), uma tarefa de aritmética mental (MA) e mudança da linha de base para a tarefa (DELTA).
Nº do paciente E NE LF/HF LF Período VLF
5 3,55535 6.28040 0,66706 7.71886B 7.74600

5 0,05557 0,13960 0,48115 0,99826 DELTA 2.23823
5 3.61092 6.41999 0,18591 6,72059 MA 5.50777
6 3,55535 6.24611 2.48308 7.33729B 6.64353
6 0,10821 0,05374 2.03738 0,77109 DELTA 1.27196
6 3,66356 6.19236 0,44569 6,56620 MA 5.37157
7 3.29584 4.91998 0,15473 7.86663B 7.99450
7 0,59598 0,53106 0,14086 0,81345 DELTA 2.86401
7 3.89182 5.45104 0,01387 7.05319 MA 5.13049
8 4.00733 5.97635 1.58951 8.18005B 5.97126
8 0,29673 0,11947 0,11771 1,16584 DELTA 0,39078
8 4.30407 6.09582 1,47180 7.01421 MA 5.58048
12 3.87120 5.35659 0,47942 6.56488B 5.94960
12 0,19379 0,03415 DELTA 0,50134
12 0,67321 6,59903 MA 6.45094
13 3.97029 5.85507 0,13687 6.27444 B 5,58500
13 0,20909 0,10851 1,05965 0,49619 DELTA 1,68911
13 3,76120 5,96358 1,19652 5,77825 MA 6,08877 B 3,89589
14 3,63759 5,62040 0,88389 6,12490
14 0,31366 0,07333 1,06100 1,37098 DELTA 1,07633
14 3,95124 5,69373 1,94489 7,45975 MA 7,52268 5,04857
18 4,44265 5,88053 0,99200 B 0,57142 DELTA 7,19376
18 0,35314 0,62824 0,10297 6,95126 MA 6,90677 2,06150
18 4,79579 6,50877 0,88903 B 0,94413 DELTA 5,13226
19 5.03044 0,62446 7,85090 MA 7,39854
19 0,69966 0,09578 0,88309
19 2.94444 5,73010 0,72024 6,51545
20 3.91202 5.86363 1.11825 8.26341B 6.89497
20 0,02020 0,21401 0,60117 1,13100 DELTA 1.12073
20 3.89182 6.07764 0,51708 7.13241 MA 5.77424
21 3,55535 6.21860 0,78632 8.74397B 8.26111
21 0,31585 0,52487 1.92114 2,38726 DELTA 2.08151
21 3.87120 5.69373 1.13483 6,35671 MA 6.17960
22 4.18965 5.76832 0,02785 8.66907B 7.51529
22 0,16705 0,05459 0,93349 0,89157 DELTA 1,00414
22 4.35671 5.71373 0,90563 7,77751 MA 6.51115
(Contínuo )
23 3,95124 5,52545 0,24196 6,75330 B 6.93020

23 0,26826 0,16491 0,00661 0,18354 DELTA 1.18912
23 4,21951 5,69036 0,24856 6,93684 MA 6,26453 B 5.74108
24 3,78419 5,59842 0,67478 6.45268
24 0,32668 0,17347 1,44970 0,52169 DELTA 0,39277
24 4.11087 5.42495 0,77493 6,78622 MA 6,84545
1 3.36730 6.13123 0,19077 6.75395B 6.13708
1 0,54473 0,08538 0,79284 0,34637 DELTA 0,56569
1 3.91202 6.21661 0,98361 7.10031 MA 5.57139
3 2.83321 5.92158 1,89472 7.92524B 6.30664
3 1.15577 0,64930 0,75686 1,58481 DELTA 1.95636
3 3.98898 6.57088 1.13786 6,34042 MA 4.35028
4 4.29046 5.73657 1.81816 7.02734B 7.02882
4 0,14036 0,47000 0,26089 1,08028 DELTA 1,43858
4 4.43082 6.20658 1.55727 5,94705 MA 5.59024
5 3.93183 5.62762 1,70262 6,76859B 6.11102
5 0,80437 0,67865 0,26531 0,29394 DELTA 0,94910
5 4.73620 6.30628 1.43731 6,47465 MA 5.16192
6 3.29584 5.47227 0,18852 6.49054B 6.84279
6 0,16034 0,27073 0,16485 1,12558 DELTA 1,84288
6 3,13549 5,74300 0,02367 5,36496 MA 4.99991
8 3,25810 5,37064 0,09631 7,23131 B 7,16371
8 0,40547 0,13953 0,97906 0,62894 DELTA 2,15108
8 3,66356 5,23111 0,88274 6,60237 MA 5,86126 5,01263
9 3,78419 5,94542 0,77839 B 0,53530 DELTA 6,22910
9 0,64663 0,05847 0,42774 5,32595 MA 6,71736 2,18430
9 4,43082 6,00389 0,35066 B 0,00873 DELTA 4,04480
10 4,07754 5,87493 2,32137 6,59769
10 0,23995 0,00563 0,25309 0,75357
10 4,31749 5.86930 2,06827 6,70863 MA 5.84412
11 4.33073 5.84064 2.89058 7.22570B 5.76079
11 3.63759 0,01464 1.22533 1,33514 DELTA 0,55240
11 0,69315 5,82600 1,66525 5,89056 MA 5.20839
12 3,55535 6.04501 1.92977 8.50684B 7.15797
12 0,13353 0,12041 0,15464 0,84735 DELTA 0,13525
12 3.68888 6.16542 1.77513 7,65949 MA 7.29322
13 3.33220 4.63473 0,11940 6.35464B 6.76285
13 1.16761 1,05563 0,85621 0,63251 DELTA 0,52121
13 4.49981 5.69036 0,73681 6,98716 MA 6.24164
14 3.25810 5.96358 1.10456 7.01270B 7.49426
14 0,26353 1.20066 DELTA 3.15046
14 1.36809 5,81204 MA 4.34381
15 5.42935 6.34564 2.76361 9.48594B 7.05730
15 1.14662 1,58468 DELTA 0,08901
15 1.61699 7,90126 MA 6.96829
16 4,11087 6,59441 0,23319 6.68269B 6,76872
16 0,06782 0,54941 0,34755 0,29398 DELTA 1,80868
(Continuação)
16 4.04305 6,04501 0,11437 6,38871 MA 4,96004

17 6,28040 1,40992 6,09671 B 0,05945 4,82671
17 0,12766 0,17490 DELTA 6,03726 MA 0,69993
17 6,15273 1,23501 5,52665
18 2,39790 6.03548 0,23183 6,39707 B 6.60421
18 1,06784 0,11299 0,27977 0,38297 DELTA 1.92672
18 3,46574 6.14847 0,51160 6.01410 MA 4,67749
19 4.21951 6.35784 1.08183 5.54214B 5.69070
19 0,21131 0,00347 0,12485 0,54440 DELTA 1.49802
19 4.43082 6.35437 1.20669 4,99774 MA 4.19268
20 4.14313 5.73334 0,89483 7.35045B 6.93974
20 0,11778 0,00000 0,17129 0,58013 DELTA 1.72916
20 4,02535 5.73334 1.06612 6,77032 MA 5.21058
21 3,66356 6.06843 0,87315 5.09848B 6.02972
21 0,20764 0,10485 0,41178 0,33378 DELTA 2.00974
21 3.87120 5.96358 0,46137 4,76470 MA 4.01998
22 3.29584 5.95324 2.38399 7.62877B 7.54359
22 0,36772 0,68139 0,75014 0,89992 DELTA 1,25555
22 3,66356 6.63463 1.63384 6,72884 MA 6.28804
¼ dados ausentes.
Fonte: Dados fornecidos por cortesia do Dr. Richard P. Sloan.
43. O objetivo de um estudo de Chati et al. (A-32) foi verificar o papel do descondicionamento físico nas anormalidades
metabólicas do músculo esquelético em pacientes com insuficiência cardíaca crônica (ICC). Os indivíduos
incluíram pacientes ambulatoriais com CHF (12 homens, duas mulheres) com idades entre 35 e 74 anos. Entre os
dados coletados estavam as seguintes medidas, durante o exercício, de carga de trabalho (WL) em condições
controladas, pico de consumo de oxigênio (Vo2), limiar ventilatório anaeróbio (LA), ambos medidos em ml/kg/min,
e tempo total de exercício (ET ) em segundos.
WL Vo2 NO ET WL Vo2 NO ET
7.557 32.800 13.280 933.000 3.930 22.500 18.500 720.000

3,973 8.170 6.770 255.000 3.195 17.020 8.520 375.000
5,311 16.530 11.200 480.000 2,418 15.040 12.250 480.000
5,355 15.500 10.000 420.000 0,864 7.800 4.200 240.000
6,909 24.470 11.550 960.000 2,703 12.170 8.900 513.000
1,382 7.390 5.240 346.000 1,727 15.110 6.300 540.000
8,636 19.000 10.400 600.000 7,773 21.100 12.500 1200.000
Fonte: Dados fornecidos por cortesia do Dr. Zuka€ÿ Chati.
44. Czader et al. (A-33) investigou certos fatores prognósticos em pacientes com linfomas não-Hodgkin centroblásticos
centrocíticos (CB/CC NHL). Os indivíduos consistiam em homens e mulheres com idades entre 20 e 84 anos no
momento do diagnóstico. Entre os dados coletados estavam as seguintes medições em dois fatores relevantes, A
e B. Os autores relataram uma correlação significativa entre os dois.
UM BABAB
20h00 .154 22.34 .147 48,66 .569

36,00 .221 18h00 .132 20h00 .227
6,97 .129 18h00 .085 17.66 .125
13,67 0,064 22,66 .577 14,34 .089
36,34 .402 45,34 .134 16,33 .051
39,66 .256 20,33 .246 18,34 .100
14,66 .188 16,00 .175 26,49 .202
27,00 .138 15,66 .105 13,33 .077
2,66 .078 23,00 .145 6,00 .206
22,00 .142 27,33 .129 15,67 .153
11,00 .086 6,27 .062 32,33 .549
20h00 .170 24.34 .147
22.66 .198 22.33 0,769
7.34 0,092 11.33 .130
29.67 .227 6.67 0,099
11.66 .159
8.05 .223
22.66 0,065
Fonte: Dados fornecidos por cortesia da Dra. Magdalena Czader e da Dra. Anna Porwit-MacDonald.
45. A fleroxacina, um derivado de fluoroquinolona com amplo espectro antibacteriano e potente atividade in vitro contra
bactérias gram-negativas e muitas gram-positivas, foi objeto de um estudo de Reigner e Welker (A-34). Os objetivos de
seu estudo foram estimar os valores típicos de depuração sobre a disponibilidade sistêmica (CL/F) e o volume de
distribuição sobre a disponibilidade sistêmica (V/F) após a administração de doses terapêuticas de fleroxacina e
identificar fatores que influenciam a disposição da fleroxacina e quantificar o grau em que o fazem. Os participantes
foram 172 voluntários saudáveis do sexo masculino e feminino e pacientes não infectados representando uma ampla
faixa etária. Entre os dados analisados estavam as seguintes medidas (ml/min) de CL/F e depuração de creatinina
(CLcr). Segundo os autores, estudos anteriores mostraram que existe correlação entre as duas variáveis.
CL/F CLer CL/F CLer CL/F CLer CL/F CLer
137.000 96.000 77.000 67.700 152.000 109.000 132.000 111.000

106.000 83.000 57.000 51.500 100.000 82.000 94.000 118.000
165.000 100.000 69.000 52.400 86.000 88.000 90.000 111.000
127.000 101.000 69.000 65.900 69.000 67.000 87.000 124.000
139.000 116.000 76.000 60.900 108.000 68.700 48.000 10.600
102.000 78.000 77.000 93.800 77.000 83.200 26.000 9.280
72.000 84.000 66.000 73.800 85.000 72.800 54.000 12.500
86.000 81.000 53.000 99.100 89.000 82.300 36.000 9.860
85.000 77.000 26.000 110.000 105.000 71.100 26.000 4.740
122.000 102.000 89.000 99.900 66.000 56.000 39.000 7.020
76.000 80.000 44.000 73.800 73.000 61.000 27.000 6.570
57.000 67.000 27.000 65.800 64.000 79.500 36.000 13.600
62.000 41.000 96.000 109.000 26.000 9.120 15.000 7.600
90.000 93.000 102.000 76.800 29.000 8.540 138.000 100.000
(Contínuo )
CL/F CLer CL/F CLer CL/F CLer CL/F CLer
165.000 88.000 159.000 125.000 39.100 93.700 127.000 108.000

132.000 64.000 115.000 112.000 75.500 65.600 203.000 121.000
159.000 92.000 82.000 91.600 86.000 102.000 198.000 143.000
148.000 114.000 96.000 83.100 106.000 105.000 151.000 126.000
116.000 59.000 121.000 88.800 77.500 67.300 113.000 111.000
124.000 67.000 99.000 94.000 87.800 96.200 139.000 109.000
76.000 56.000 120.000 91.500 25.700 6.830 135.000 102.000
40.000 61.000 101.000 83.800 89.700 74.800 116.000 110.000
23.000 35.000 118.000 97.800 108.000 84.000 148.000 94.000
27.000 38.000 116.000 100.000 58.600 79.000 221.000 110.000
64.000 79.000 116.000 67.500 91.700 68.500 115.000 101.000
44.000 64.000 87.000 97.500 48.900 20.600 150.000 110.000
59.000 94.000 59.000 45.000 53.500 10.300 135.000 143.000
47.000 96.000 96.000 53.500 41.400 11.800 201.000 115.000
17.000 25.000 163.000 84.800 24.400 7.940 164.000 103.000
67.000 122.000 39.000 73.700 42.300 3.960 130.000 103.000
25.000 43.000 73.000 87.300 34.100 12.700 162.000 169.000
24.000 22.000 45.000 74.800 28.300 7.170 107.000 140.000
65.000 55.000 94.000 100.000 47.000 6.180 78.000 87.100
69.000 42.500 74.000 73.700 30.500 9.470 87.500 134.000
55.000 71.000 70.000 64.800 38.700 13.700 108.000 108.000
39.000 34.800 129.000 119.000 60.900 17.000 126.000 118.000
58.000 50.300 34.000 30.000 51.300 6.810 131.000 109.000
37.000 38.000 42.000 65.900 46.100 24.800 94.400 60.000
32.000 32.000 48.000 34.900 25.000 7.200 87.700 82.900
66.000 53.500 58.000 55.900 29.000 7.900 94.000 99.600
49.000 60.700 30.000 40.100 25.000 6.600 157.000 123.000
40.000 66.500 47.000 48.200 40.000 8.600
34.000 22.600 35.000 14.800 28.000 5.500
87.000 61.800 20.000 14.400
Fonte: Dados fornecidos por cortesia do Dr. Bruno Reigner.
46. Yasu et al. (A-35) usou espectroscopia de ressonância magnética não invasiva para determinar os efeitos de curto
e longo prazo da comissurotomia mitral transvenosa percutânea (PTMC) na capacidade de exercício e nas
respostas metabólicas dos músculos esqueléticos durante o exercício. Os dados foram coletados em 11 pacientes
(2 homens, 9 mulheres) com estenose mitral sintomática. A média de idade foi de 52 anos com desvio padrão
de 11. Entre os dados coletados estavam as seguintes medidas de alterações na área da válvula mitral (d-MVA)
e pico de consumo de oxigênio (d-Vo2) 3, 30 e 90 dias após PTMC:
Dias d-Vo2
Sujeito Pós-PTMC d-MVA (cm2 ) (ml/kg/min)
1 3 0,64 0,3
2 3 0,76 0:9
3 3 0,3 1.9
4 3 0,6 3:1
Dias d-Vo2
Sujeito Pós-PTMC d-MVA (cm2 ) (ml/kg/min)
5 3 0,3 0:5
6 3 0,4 2:7
7 3 0,7 1,5
8 3 0,9 1.1
9 3 0,6 7:4
10 3 0,4 0:4
11 3 0,65 3,8
1 30 0,53 1,6
2 30 0,6 3,3
3 30 0,4 2,6
4 30 0,5
5 30 0,3 3.6
6 30 0,3 0,2
7 30 0,67 4.2
8 30 0,75 3
9 30 0,7 2
10 30 0,4 0,8
11 30 0,55 4.2
1 90 0,6 1.9
2 90 0,6 5.9
3 90 0,4 3.3
4 90 0,6 5
5 90 0,25 0,6
6 90 0,3 2.5
7 90 0,7 4.6
8 90 0,8 4
9 90 0,7 1
10 90 0,38 1.1
11 90 0,53
¼ Dados ausentes.
Fonte: Dados fornecidos por cortesia do Dr. Takanori Yasu.
college/daniel
1. Consulte os dados de 1050 indivíduos com edema cerebral (CEREBRAL). Edema cerebral com consequente aumento
da pressão intracraniana freqüentemente acompanha lesões resultantes de traumatismo craniano e outras condições
que afetam adversamente a integridade do cérebro. Os tratamentos disponíveis para edema cerebral variam em
eficácia e efeitos colaterais indesejáveis. Um desses tratamentos é o glicerol, administrado por via oral ou intravenosa.
De interesse para os médicos é a relação entre a pressão intracraniana e a concentração plasmática de glicerol.
Suponha que você seja um consultor estatístico com uma equipe de pesquisa investigando a relação entre essas
duas variáveis. Selecione uma amostra aleatória simples da população e faça a análise que você acha que seria útil
para os pesquisadores. Apresente suas descobertas e conclusões em forma de narrativa e ilustre com gráficos quando
apropriado. Compare seus resultados com os de seus colegas.
2. Consulte os dados de 1050 indivíduos com hipertensão essencial (HYPERTEN). Suponha que você
seja um consultor estatístico de uma equipe de pesquisa médica interessada em hipertensão
essencial. Selecione uma amostra aleatória simples da população e faça as análises que você acha
que seriam úteis para os pesquisadores. Apresente suas descobertas e conclusões em forma de
narrativa e ilustre com gráficos quando apropriado. Compare seus resultados com os de seus
colegas. Consulte seu instrutor sobre o tamanho da amostra que você deve selecionar.
3. Consulte os dados de 1200 pacientes com artrite reumatóide (CALCIUM). Cem pacientes receberam
o medicamento em cada dose. Suponha que você seja um pesquisador médico que deseja obter
informações sobre a natureza da relação entre o nível de dosagem de prednisolona e o cálcio
corporal total. Selecione uma amostra aleatória simples de três pacientes de cada grupo de nível de
dose e faça o seguinte. (a) Use o número total de pares de observações para obter a equação dos
mínimos quadrados que descreve a relação entre o nível de dose (a variável independente) e o
cálcio corporal total. (b) Desenhe um diagrama de dispersão dos dados e plote a equação. (c)
Calcule r e teste a significância no nível 0,05. Encontre o valor p. (d) Compare seus resultados com
os de seus colegas.
REFERÊNCIAS
1. FREDERICK HARTWIG com BRAIN E. DEARING, Exploratory Data Analysis, Sage Publications, Beverly Hills, 1979.
2. IAIN M. JOHNSTONE e PAUL F. VELLEMAN, “The Resistant Line and Related Regression Methods,” Journal of the
Associação Estatística Americana, 80 (1985), 1041–1054.
3. DONALD R. MCNEIL, Interactive Data Analysis: A Practical Primer, Wiley, Nova York, 1977.
4. PAUL F. VELLEMAN e DAVID C. HOAGLIN, Applications, Basics, and Computing of Exploratory Data Analysis,
Duxbury, Belmont, CA, 1981.
5. RA FISHER, “Sobre o provável erro de um coeficiente de correlação deduzido de uma amostra pequena,” Metron, 1
(1921), 3–21.
6. H. HOTELLING, “Nova luz sobre o coeficiente de correlação e suas transformações”, Journal of the Royal Statistical
Society, Série B, 15 (1953), 193–232.
7. TERRY E. DIELMAN, Análise de Regressão Aplicada para Negócios e Economia, Segunda Edição, Duxbury, Belmont,
CA, 1996.
8. RONALD R. HOCKING, Methods and Applications of Linear Models: Regression and the Analysis of Variance, Wiley, Nova York,
1996.
9. WILLIAM MENDENHALL e TERRY SINCICH, A Second Course in Statistics: Regression Analysis, Quinta Edição, Prentice Hall,
Upper Saddle River, NJ, 1996.
10. JOHN NETER, MICHAEL H. KUTNER, CHRISTOPHER J. NACHTSHEIM e WILLIAM WASSERMAN, Linear Aplicado
Modelos de Regressão, Terceira Edição, Irwin, Chicago, 1996.
A-1. JEAN-PIERRE DESPRES , DENIS PRUD'HOMME, MARIE-CHRISTINE POULIOT, ANGELO TREMBLAY e CLAUDE BOUCHARD,
"Estimativa de acúmulo de tecido adiposo abdominal profundo a partir de medições antropométricas simples em homens",
American Journal of Clinical Nutrition, 54 (1991), 471–477.
A-2. MORI J. KRANTZ, ILANA B. KUTINSKY, ALASTAIR D. ROBERSTON e PHILIP S. MEHLER, “Efeitos relacionados à dose da
metadona no prolongamento do QT em uma série de pacientes com Torsade de Pointes,” Farmacoterapia, 23 (2003), 802 –805.
A-3. ROBERT A. REISS, CURTIS E. HAAS, DEBORAH L. GRIFFIS, BERNADETTE PORTER e MARY ANN TARA, “Monitoramento no
local de atendimento versus laboratório de pacientes que recebem diferentes terapias com anticoagulantes”, Farmacoterapia,
22 (2002), 677–685 .
REFERÊNCIAS 487
A-4. ROBERT B. PARKER, RYAN YATES, JUDITH E. SOBERMAN e CASEY LAIZURE, “Efeitos do suco de toranja na glicoproteína P
intestinal: avaliação usando digoxina em humanos”, farmacoterapia, 23 (2003), 979–987.
A-5. RB EVANS, W. GORDON e M. CONZEMIUS, "Efeito da velocidade nas forças de reação do solo em cães com claudicação
atribuível ao rompimento do ligamento cruzado cranial", American Journal of Veterinary Research, 64 (2003), 1479–1481.
A-6. DAVID KRIESER, ANDREW ROSENBERG e GAD KAINER, "A relação entre creatinina sérica, cistatina C sérica e taxa de filtração
glomerular em receptores de transplante renal pediátrico: um estudo piloto", Transplante pediátrico, 6 (2002), 392–395.
A-7. OLGA KWAST-RABBEN, ROLF LIBELIUS e HANNU HEIKKILA, “Somatosensory Evoked Potentials following
Stimulation of Digital Nerves,” Muscle and Nerve, 26 (2002), 533–538.
A-8. GERI R. BROWN e KIM PERSLEY, “Hepatitis A Epidemic in the Elderly,” Southern Medical Journal, 95 (2002),
826-833.
A-9. ANN E. TUZSON, KEVIN P. GRANATA e MARK F. ABEL, "Limiar de velocidade espástica restringe o desempenho
funcional na paralisia cerebral", Archives of Physical Medicine and Rehabilitation, 84 (2003), 1363–1368.
A-10. M. BUTZ, KH WOLLINSKY, U. WIDEMUTH-CATRINESCU, A. SPERFELD, S. WINTER, HH MEHRKENS, AC LUDOLPH e
H. SCHREIBER, "Efeitos longitudinais da ventilação de pressão positiva não invasiva em pacientes com esclerose lateral
amiotrófica", American Journal of Medical Rehabilitation, 82 (2003), 597–604.
A-11. KARIE E. SCROGIN, DANIEL C. HATTON e DAVID A. MCCARRON, “The Interactive Effects of Dietary Sodium Chloride
and Calcium on Cardiovascular Stress Responses,” American Journal of Physiology (Regulatory Integrative Comp.
Physiol. 30) 261 (1991), R945–R949.
A-12. DEAN PARMALEE, Dados analisados pelo Centro de Consultoria Estatística da Wright State University, Wright State
A-13. MARIA MATHIAS, Dados analisados pelo Centro de Consultoria Estatística da Wright State University, Wright State
A-14. DARREN M. TRILLER, STEVEN L. CLAUSE e CHRISTOPHER DOMAREW, "Análise de atividades de gerenciamento de medicamentos
para pacientes domiciliares", American Journal of Health-System Pharmacy, 59 (2002), 2356–2359.
A-15. MAXIME LAMARRE-CLICHE, YVES LACOURCIERE , JACQUES DE CHAMPLAIN, LUC POIRIER e PIERRE LAROCHELLE, “O
intervalo QTc prediz a resposta a betabloqueadores e bloqueadores dos canais de cálcio em hipertensos?” Coração e Doenças, 5
(2003), 244–252.
A-16. JEAN D. SKINNER, PAULA ZIEGLER e MICHAEL PONZA, “Transitions in Infants' and Toddlers' Beverage Patterns,”
Jornal da Associação Dietética Americana, Suplemento, 104 (2004), 45–50.
A-17. NEUNG HWA PARK, JI KANG PARK, YOUNGHEE CHOI, CHEOL-IN YOO, CHOONG RYEOL LEE, HUN LEE, HYO KYUNG KIM,
SUNG-RYUL KIM, TAE-HEUM JEONG, JUNGSUN PARK, CHUNG SIK YOON e YANGHO KIM, “Todo Manganês no sangue se
correlaciona com altas intensidades de sinal em ressonância magnética ponderada em T em pacientes com cirrose hepática,”
NeuroToxicology, 24 (2003), 909–915.
A-18. PHILIPPE DE MOERLOOSE, SYLVIE DESMARAIS, HENRI BOUNAMEAUX, GUIDO REBER, ARNAUD PERRIER, GEORGES DUPUY
e JEAN-LOUIS PITTET, “Contribution of a New, Rapid, Individual and Quantitative Automated D-Dimer ELISA to Exclude Pulmonary
Embolism”, Trombose e Hemostasia , 75 (1996), 11–13.
A-19. ILPO T. HUHTANIEMI, ANNE-MAARIT HAAVISTO, RAIJA ANTTILA, MARTTI A. SIIMES e LEO DUNKEL, “Sensitive Immunoassay and
In Vitro Bioassay Demonstre Constant Bioactive/Immunoreactive Ratio of Luteinizing Hormone in Healthy Boys Durante a Pubertal
Maturation,” Pediatric Research, 39 (1996), 180-184.
A-20. YONG-KWEI TSAU, JI-NAN SHEU, CHIUNG-HUI CHEN, RU-JENG TENG e HUI-CHI CHEN, “Diminuição do fator de
crescimento epidérmico urinário em crianças com insuficiência renal aguda: fator de crescimento epidérmico/taxa de
creatinina não é um parâmetro confiável para Urinary Epidermal Growth Factor Excretion,” Pediatric Research, 39 (1996), 20–24.
A-21. A. USAJ e V. STARC, “Blood pH and Lactate Kinetics in the Assessment of Running Endurance,” International
Journal of Sports Medicine, 17 (1996), 34-40.
A-22. PAMELA BEAN, MARY SUSAN SUTPHIN, PATRICIA NECESSARY, MELKON S. AGOPIAN, KARSTEN LIEGMANN, CARL LUDVIGSEN
e JAMES B. PETER, “Carbohydrate-Deficient Transferrin Evaluation in Dry Blood Spots,” Alcohol ism: Clinical and Experimental
Research, 20 (1996 ), 56–60.
A-23. JOHJI KATO, KOHJI KOBAYASHI, TAKUMA ETOH, MIHO TANAKA, KAZUO KITAMURA, TAKUROH IMAMURA, YASUSHI KOIWAYA,
KENJI KANGAWA e TANENAO ETO, “Plasma Adrenomedullin Concentration in Patients with Heart Failure,” Journal of Clinical
Endocrinology and Metabolism, 81 (1996) , 180–183.
A-24. BE GOLDEN, PA CLOHESSY, G. RUSSELL e MK FAGERHOL, “Calprotectin como um marcador de inflamação em
Cystic Fibrosis,” Archives of Disease in Childhood, 74 (1996), 136–139.
A-25. ARTHUR F. GELB, JAMES C. HOGG, NESTOR L. MU€ LLER, MARK J. SCHEIN, JOSEPH KUEI, DONALD P. TASHKIN, JOEL D.
EPSTEIN, JOZEF KOLLIN, ROBERT H. GREEN, NOE ZAMEL, W. MARK ELLIOTT e LIDA HADJIAGHAI, “Contribution of Enphysema and
Small Airways in COPD,” Chest, 109 (1996), 353–359.
A-26. AGNES M. WITTEMAN, STEVEN O. STAPEL, GERRARD J. PERDOK, DEMAN HS SJAMSOEDIN, HENK M. JANSEN, ROB C.
AALBERSE e JARING S. VAN DER ZEE, “A relação entre RAST e resultados de testes cutâneos em pacientes com asma ou rinite: um estudo
quantitativo com alérgenos principais purificados”, Journal of Allergy and Clinical Immunology, 97 (1996), 16–25 .
A-27. MARIANNE GARLAND, HAZEL H. SZETO, SALHA S. DANIEL, PAMELA J. TROPPER, MICHAEL M. MYERS e RAYMOND I.
STARK, "Zidovudine Kinetics in the Pregnant Baboon," Journal of Acquired Immune Deficiency Syndromes and Human
Retrovirology, 11 (1996), 117–127.
A-28. A. HALLIGAN, A. SHENNAN, PC LAMBERT, M. DE SWIET e DJ TAYLOR, “Diurnal Blood Pressure Difference in the Assessment
of Preeclampsia,” Obstetrics & Gynecology, 87 (1996), 205–208.
A-29. JAY W. MARKS, GEORGE G. BONORRIS e LESLIE J. SCHOENFIELD, "Efeitos do Ursodiol ou Ibuprofeno na Contração da
Vesícula Biliar e Bile Entre Pacientes Obesos Durante Perda de Peso", Doenças Digestivas e Ciências, 41 (1996), 242–249.
A-30. DJ PEACOCK, P. EGGER, P. TAYLOR, MID CAWLEY e C. COOPER, “Medições de Densidade Óssea Lateral em
Osteoarthritis of the Lumbar Spine,” Annals of the Rheumatic Diseases, 55 (1996), 196–198.
A-31. RP SLOAN, PA SHAPIRE, E. BAGIELLA, JT BIGGER, ES LO e JM GORMAN, “Relationships Between Circulating Catecholamines
and Low Frequency Heart Period Variability as Indices of Cardiac Sympathic Activity during Mental Stress,” Psychosomatic
Medicine, 58 (1996) 25 –31.
A-32. ZUKA€I CHATI, FA€IEZ ZANNAD, CLAUDE JEANDEL, BRIGITTE LHERBIER, JEAN-MARIE ESCANYE, JACQUES ROBERT e ETIENNE ALIOT,
“O descondicionamento físico pode ser um mecanismo para as anormalidades do metabolismo de fosfato de energia muscular esquelética na
insuficiência cardíaca crônica”, americano Heart Journal, 131 (1996), 560-566.
A-33. MAGDALENA CZADER, JOANNA MAZUR, MIKAEL PETTERSSON, JAN LILIEMARK, MATS STROMBERG , BIRGER CHRISTENSSON,
BERNARD TRIBUKAIT, GERT AUER, AKE O € ST e ANNA PORWIT, “Significado Prognóstico de Frações Proliferativas e Apoptóticas em
Linfomas Não Hodgkin Derivados de Células do Centro Folicular de Baixo Grau,” Câncer, 77 (1996), 1180–1188.
A-34. BG REIGNER e HA WELKER, "Fatores que influenciam a eliminação e distribuição de fleroxacina: Metaanálise de dados individuais
de 10 estudos farmacocinéticos", Agentes antimicrobianos e quimioterapia, 40 (1996), 575–580.
A-35. TAKANORI YASU, TAKA'AKI KATSUKI, NOBUHIRO OHMURA, IKUKO NAKADA, MAFUMI OWA, MIKIHISA FUJII, AKIRA SAKAGUCHI e
MUNEYASU SAITO, “Melhoria tardia no metabolismo muscular esquelético e capacidade de exercício em pacientes com estenose mitral após
melhora hemodinâmica imediata por transvenosa mitral percutânea Comissurotomia,” American Journal of Cardiology, 77 (1996), 492–497.
CAPÍTULO 10
REGRESSÃO MÚLTIPLA
E CORRELAÇÃO
Este capítulo fornece extensões dos modelos de regressão linear simples e

correlação bivariada discutidos no Capítulo 9. Os conceitos e técnicas discutidos
aqui são úteis quando o pesquisador deseja considerar simultaneamente as
relações entre mais de duas variáveis. Embora os conceitos, cálculos e
interpretações associados à análise de dados de múltiplas variáveis possam
parecer complexos, eles são extensões naturais do material explorado nos capítulos
anteriores.
TÓPICOS
10.1 INTRODUÇÃO
10.2 O MODELO DE REGRESSÃO LINEAR MÚLTIPLA
10.3 OBTENÇÃO DA EQUAÇÃO DE REGRESSÃO MÚLTIPLA
10.4 AVALIANDO A EQUAÇÃO DE REGRESSÃO MÚLTIPLA
10.5 USANDO A EQUAÇÃO DE REGRESSÃO MÚLTIPLA
10.6 O MODELO DE CORRELAÇÃO MÚLTIPLA
10.7 RESUMO
Depois de estudar este capítulo, o aluno 1. entenderá

como incluir mais de uma variável independente em uma regressão
equação.
2. ser capaz de obter um modelo de regressão múltipla e usá-lo para fazer previsões. 3. ser capaz de avaliar
os coeficientes de regressão múltipla e a adequação do modelo de regressão. 4. entender como calcular e
interpretar coeficientes de correlação múltiplos, bivariados e parciais.
489
490 CAPÍTULO 10 REGRESSÃO MÚLTIPLA E CORRELAÇÃO
10.1 INTRODUÇÃO
No Capítulo 9 exploramos os conceitos e técnicas para analisar e fazer uso da relação linear
entre duas variáveis. Vimos que essa análise pode levar a uma equação linear que pode ser
usada para prever o valor de alguma variável dependente dado o valor de uma variável
independente associada.
A intuição nos diz que, em geral, devemos ser capazes de melhorar nossa capacidade de
previsão incluindo mais variáveis independentes em tal equação. Por exemplo, um pesquisador
pode descobrir que as pontuações de inteligência de indivíduos podem ser previstas a partir de
fatores físicos, como ordem de nascimento, peso ao nascer e duração da gestação, juntamente
com certos fatores hereditários e ambientais externos. O tempo de internação em hospital de
doenças crônicas pode estar relacionado à idade, estado civil, sexo e renda do paciente, sem
contar o fator óbvio do diagnóstico. A resposta de um animal experimental a alguma droga pode
depender do tamanho da dose e da idade e peso do animal. Um supervisor de enfermagem pode
estar interessado na força da relação entre o desempenho de uma enfermeira no trabalho, a
pontuação no exame do conselho estadual, o histórico escolar e a pontuação em algum
desempenho ou teste de aptidão. Ou um administrador de hospital estudando admissões de
várias comunidades atendidas pelo hospital pode estar interessado em determinar quais fatores
parecem ser responsáveis pelas diferenças nas taxas de admissão.
Os conceitos e técnicas para analisar as associações entre diversas variáveis são
extensões naturais daqueles explorados nos capítulos anteriores. Os cálculos, como seria de
esperar, são mais complexos e tediosos. No entanto, conforme apontado no Capítulo 9, isso não
representa nenhum problema real quando um computador está disponível. Não é incomum
encontrar pesquisadores investigando as relações entre uma dúzia ou mais de variáveis. Para
aqueles que têm acesso a um computador, a decisão de quantas variáveis incluir em uma análise
é baseada não na complexidade e extensão dos cálculos, mas em considerações como seu
significado, o custo de sua inclusão e a importância de sua contribuição.
Neste capítulo, seguimos de perto a sequência do capítulo anterior. O modelo de regressão

é considerado primeiro, seguido por uma discussão do modelo de correlação. Ao considerar o
modelo de regressão, os seguintes pontos são abordados: uma descrição do modelo, métodos
para obter a equação de regressão, avaliação da equação e os usos que podem ser feitos da
equação. Em ambos os modelos são discutidos os possíveis procedimentos inferenciais e suas
suposições subjacentes.
10.2 O MODELO DE REGRESSÃO LINEAR

MÚLTIPLA
No modelo de regressão múltipla, assumimos que existe uma relação linear entre alguma variável
Y, que chamamos de variável dependente, e k variáveis independentes, X1; X2; ...
; Xk. As variáveis independentes às vezes são chamadas de variáveis explicativas,
devido ao seu uso para explicar a variação em Y. Elas também são chamadas de variáveis
preditoras, devido ao seu uso na previsão de Y.
10.2 O MODELO DE REGRESSÃO LINEAR MÚLTIPLA 491
Suposições As suposições subjacentes à análise de regressão múltipla são as seguintes.
1. Os Xi são variáveis não aleatórias (fixas). Essa suposição distingue o modelo de regressão múltipla do
modelo de correlação múltipla, que será apresentado na Seção 10.6. Essa condição indica que
quaisquer inferências extraídas de dados de amostra se aplicam apenas ao conjunto de valores X
observados e não a uma coleção maior de X's.
Sob o modelo de regressão, a análise de correlação não é significativa. Sob o modelo de correlação a
ser apresentado posteriormente, as técnicas de regressão a seguir podem ser aplicadas.
2. Para cada conjunto de valores Xi existe uma subpopulação de valores Y. Para construir certos intervalos
de confiança e testar hipóteses, deve-se saber, ou o pesquisador deve estar disposto a assumir, que
essas subpopulações de valores de Y são normalmente distribuídas.
Como desejaremos demonstrar esses procedimentos inferenciais, a suposição de normalidade será
feita nos exemplos e exercícios deste capítulo.
3. As variâncias das subpopulações de Y são todas iguais.
4. Os valores de Y são independentes. Ou seja, os valores de Y selecionados para um conjunto de valores

de X não dependem dos valores de Y selecionados em outro conjunto de valores de X.
A equação do modelo As suposições para análise de regressão múltipla podem ser apresentadas de forma
mais compacta como
yj ¼ b0 þ b1x1j þ b2x2j þþ bkxkj þ ej (10.2.1)
onde yj é um valor típico de uma das subpopulações de valores de Y; os bi são chamados

de coeficientes de regressão; x1j; x2j;
variáveis
... ; xkj são,
independentes
respectivamente,
X1; X2;valores
... Xk; eparticulares
ej é uma das
variável aleatória com média 0 e variância s2; a variância comum das subpopulações de
valores de Y. Para construir intervalos de confiança e testar hipóteses sobre os coeficientes
de regressão, assumimos que os ej são normalmente e independentemente distribuídos. As
afirmações sobre ej são consequência das suposições sobre as distribuições dos valores de
Y. Vamos nos referir à Equação 10.2.1 como o modelo de regressão linear múltipla.
Quando a Equação 10.2.1 consiste em uma variável dependente e duas independentes

variáveis, ou seja, quando o modelo é escrito
yj ¼ b0 þ b1x1j þ b2x2j þ ej (10.2.2)
um plano no espaço tridimensional pode ser ajustado aos pontos de dados conforme ilustrado na Figura
10.2.1. Quando o modelo contém mais de duas variáveis independentes, ele é descrito geometricamente
como um hiperplano.
Na Figura 10.2.1, o observador deve visualizar alguns dos pontos localizados acima do plano e outros
localizados abaixo do plano. O desvio de um ponto do plano é representado por
ej ¼ yj b0 b1x1j b2x2j (10.2.3)
Na Equação 10.2.2, b0 representa o ponto onde o plano corta o eixo Y; ou seja, representa a
interceptação Y do plano. b1 mede a mudança média em Y para uma unidade
plano de regressão
avião
Desvios
do
X2 X1
FIGURA 10.2.1 Plano de regressão múltipla e dispersão de pontos.
mudança em X1 quando X2 permanece inalterado, e b2 mede a mudança média em Y para uma

mudança de unidade em X2 quando X1 permanece inalterado. Por esta razão, b1 e b2 são referidos
como coeficientes de regressão parcial.
10.3 OBTENÇÃO DA EQUAÇÃO DE REGRESSÃO

MÚLTIPLA
Estimativas imparciais dos parâmetros b0; b1; ... ; bk do modelo especificado na Equação 10.2.1 são
obtidos pelo método dos mínimos quadrados. Isso significa que a soma dos desvios quadrados dos
valores observados de Y da superfície de regressão resultante é minimizada.
No caso de três variáveis, conforme ilustrado na Figura 10.2.1, a soma dos desvios quadrados das
observações do plano é mínima quando b0; b1; e b2 são estimados pelo método dos mínimos
quadrados. Em outras palavras, pelo método dos mínimos quadrados, amostramos estimativas de b0;
b1; ... ; bk são selecionados de forma que a quantidade
2
Xe2 j ¼ X yj b0 b1x1j b2x2j bkxkj
é minimizado. Esta quantidade, referida como a soma dos quadrados dos resíduos, também pode ser
escrita como
2
Xe2 j ¼ X yj ^yj (10.3.1)
indicando o fato de que a soma dos quadrados dos desvios dos valores observados de Y dos valores
de Y calculados a partir da equação estimada é minimizada.
10.3 OBTENÇÃO DA EQUAÇÃO DE REGRESSÃO MÚLTIPLA 493
As estimativas dos parâmetros de regressão múltipla podem ser obtidas por meio de
cálculos aritméticos realizados em uma calculadora portátil. Esse método de obtenção das
estimativas é tedioso, demorado, sujeito a erros e uma perda de tempo quando há um computador
disponível. Os interessados em examinar ou usar a abordagem aritmética podem consultar as
edições anteriores deste texto ou as de Snedecor e Cochran (1) e Steel e Torrie (2), que fornecem
exemplos numéricos para quatro variáveis, e Anderson e Bancroft (3), que ilustrar os cálculos
envolvidos quando há cinco variáveis. No exemplo a seguir, usamos o software SPSS para ilustrar
um resumo gráfico interessante dos dados amostrais coletados em três variáveis. Em seguida,
usamos o MINITAB e o SAS para ilustrar a aplicação da análise de regressão múltipla.
EXEMPLO 10.3.1
Os pesquisadores Jansen e Keller (A-1) usaram a idade e o nível de escolaridade para prever a
capacidade de direcionar a atenção (CDA) em idosos. CDA refere-se a mecanismos inibitórios
neurais que focam a mente no que é significativo enquanto bloqueiam as distrações. O estudo
coletou informações sobre 71 mulheres idosas residentes na comunidade com estado mental
normal. A medição CDA foi calculada a partir de resultados em medidas visuais e auditivas padrão
que requerem a inibição de estímulos competitivos e distrativos. Neste estudo, as pontuações do
CDA variaram de 7:65 a 9,61, com pontuações mais altas correspondendo a um melhor
funcionamento atencional. As medidas de CDA, idade em anos e escolaridade (anos de estudo)
para 71 sujeitos são apresentadas na Tabela 10.3.1. Desejamos obter a equação de regressão múltipla amo
TABELA 10.3.1 Pontuações CDA, Idade e Nível de Educação para 71 Indivíduos

Descritos no Exemplo 10.3.1
Era Nível Ed CDA Era Nível Ed CDA
72 20 4.57 79 12 3.17
68 12 3.04 87 12 1.19
65 13 1.39 71 14 0,99
85 14 3,55 81 16 2,94
84 13 2.56 66 16 2.21
90 15 4,66 81 16 0,75
79 12 2,70 80 13 5.07
74 10 0,30 82 12 5.86
69 12 4.46 65 13 5,00
87 15 6.29 73 16 0,63
84 12 4.43 85 16 2.62
79 12 0,18 83 17 1,77
71 12 1.37 83 8 3,79
76 14 3.26 76 20 1.44
73 14 1.12 77 12 5.77
86 12 0,77 83 12 5.77
69 17 3,73 79 14 4.62
66 11 5.92 69 12 2.03
(Contínuo )
Era CDA de Nível Ed Era Nível Ed CDA
65 16 5.74 66 14 2.22
71 14 2.83 75 12 0,80
80 18 2.40 77 16 0,75
81 11 0,29 78 12 4,60
66 14 4.44 83 20 2.68
76 17 3.35 85 10 3,69
70 12 3.13 76 18 4,85
76 12 2.14 75 14 0,08
67 12 9.61 70 16 0,63
72 20 7.57 79 16 5.92
68 18 2.21 75 18 3.63
102 12 2.30 94 8 7.07
67 12 1,73 76 18 6.39
66 14 6.03 84 18 0,08
75 18 0,02 79 17 1.07
91 13 7,65 78 16 5.31
74 15 4.17 79 12 0,30
90 15 0,68
Fonte: Dados fornecidos por cortesia de Debra A. Jansen, Ph.D., RN
Antes de analisar os dados usando técnicas de regressão múltipla, é útil construir gráficos das relações entre as
variáveis. Isso é feito fazendo gráficos separados de cada par de variáveis, (X1, X2), (X1, Y ) e (X2, Y ). Um pacote de software
como o SPSS exibe cada combinação simultaneamente em um formato de matriz conforme mostrado na Figura 10.3.1. A partir
desta figura, é evidente que devemos esperar uma relação negativa
FIGURA 10.3.1 Gráfico de dispersão da matriz SPSS dos dados da Tabela 10.3.1.
10.3 OBTENÇÃO DA EQUAÇÃO DE REGRESSÃO MÚLTIPLA 495
Stat Regression Regressão Tipo Y em Resposta e MTB > Nome C4 = `SRES1'
X1 X2 em Preditores. C5 = `FITS1' C6 = `RESI1'
MTB > Regressão `y' 2 `x1' `x2'; SUBC> SResiduais `SRES1';

Verifique Resíduos. SUBC> Adapta-se a `FITS1'; SUBC> Constante; SUBC>
Verifique os residentes padrão. Resíduos `RESI1'.
Verifique OK.
Saída:
Análise de regressão: Y versus X1, X2
A equação de regressão é Y = 5,49 - 0,184 X1 +

0,611 X2

Constante 5.494 4.443 1.24 0,220
X1 -0,18412 0,04851 -3,80 0,000
X2 0,6108 0,1357 4,50 0,000
S = 3,134 R-Sq = 37,1% R-Sq (ajuste) = 35,2%
Fonte DF SS EM F P
Regressão 2 393,39 196,69 20.02 0,000
Erro residual 68 667,97 9.82
Total 70 1061.36
Fonte DF Seq SS
1X 42.4911 51.9911
2X
Obs X1 Y Ajustar SE Fit Residual St Resid
28 67 9.610 0,487 0,707 9.123 2,99R
31 102 -2.300 -5,957 1.268 3.657 1,28X
44 80 5.070 -1,296 0,425 6.366 2.05R
67 94 -7.070 -6,927 1.159 -0,143 -0,05X
R designa uma observação com um grande resíduo padronizado.

X denota uma observação cujo valor de X lhe confere grande influência.

O Procedimento REG
Modelo: MODELO1
Variável dependente: CDA
Soma de Significar
Fonte DF quadrados Quadrado F Valor Pr > F
Modelo 2 393.38832 196.69416 20.02 <.0001

Erro 68 667.97084 9.82310
Raiz MSE 3.13418 R-Quadrado 0,3706
Média Dependente 0,00676 Aj R-Sq 0,3521

Coeff Var 46360
Parâmetro Padrão
Variável DF Estimativa Erro valor t Pr > |t|
Interceptar 1 5.49407 4.44297 1.24 0,2205

ERA 1 -0,18412 0,04851 -3,80 0,0003
EDUC 1 0,61078 0,13565 4,50 <.0001
FIGURA 10.3.3 Saída SAS® para o Exemplo 10.3.1.
entre CDA e idade e uma relação positiva entre CDA e Ed-Level. Veremos que esse é
realmente o caso quando usarmos o MINITAB para analisar os dados.
Solução: Inserimos as observações sobre idade, nível educacional e CDA em c1 a c3 e

os nomeamos X1, X2 e Y, respectivamente. A caixa de diálogo do MINITAB
e o comando de sessão, bem como a saída, são mostrados na Figura 10.3.2.
Vemos na saída que a equação de regressão múltipla de amostra, na
notação da Seção 10.2, é
^yj ¼ 5:49 :184x1j þ :611x2j
Outras entradas de saída serão discutidas nas seções a seguir.

A saída SAS para o Exemplo 10.3.1 é mostrada na Figura 10.3.3. &
Após a obtenção da equação de regressão múltipla, o próximo passo envolve sua

avaliação e interpretação. Cobrimos essa faceta da análise na próxima seção.
EXERCÍCIOS 497
EXERCÍCIOS
Obtenha a equação de regressão para cada um dos seguintes conjuntos de dados.

10.3.1 Machiel Naeije (A-2) estudou a relação entre a abertura máxima da boca e as medidas do maxilar inferior (mandíbula). Ele
mediu a variável dependente, abertura máxima da boca (MMO, medida em mm), bem como variáveis preditoras,
comprimento mandibular (ML, medido em mm) e ângulo de rotação da mandíbula (RA, medido em graus) de 35
indivíduos.
MMO (Y) ML (X1) RA (X2) MMO (Y) ML (X1) RA (X2)
52,34 100,85 32,08 50,82 90,65 38,33

51,90 93,08 39,21 40,48 92,99 25,93
52,80 98,43 33,74 59,68 108,97 36,78
50,29 102,95 34,19 54,35 91,85 42.02
57,79 108,24 35,13 47,00 104,30 27.20
49,41 98,34 30,92 47.23 93,16 31.37
53.28 95,57 37,71 41.19 94,18 27.87
59,71 98,85 44,71 42,76 89,56 28.69
53.32 98,32 33.17 51,88 105,85 31.04
48,53 92,70 31.74 42,77 89,29 32,78
51,59 88,89 37.07 52.34 92,58 37,82
58,52 104.06 38,71 50,45 98,64 33.36
62,93 98,18 43,89 43.18 83,70 31.93
57,62 91.01 41.06 41,99 88,46 28.32
65,64 96,98 41,92 39,45 94,93 24.82
52,85 97,85 35,25 38,91 96,81 23.88
64,43 96,89 45.11 49.10 93,13 36.17
57,25 98,35 39,44
Fonte: Dados fornecidos por cortesia de M. Naeije, DDS
10.3.2 O cuidado familiar de idosos é mais comum na Coréia do que nos Estados Unidos. Filho e outros. (A-3) estudaram 100
cuidadores de idosos com demência em Seul, Coreia do Sul. A variável dependente foi a sobrecarga do cuidador medida
pelo Korean Burden Inventory (KBI). As pontuações variaram de 28 a 140, com pontuações mais altas indicando maior
sobrecarga. As variáveis explicativas eram índices que mediam o seguinte:
AVD: total de atividades da vida diária (baixos escores indicam que o idoso realiza atividades
independentemente).
MEM: problemas de memória e de comportamento (pontuações mais altas indicam mais problemas).
COG: comprometimento cognitivo (pontuações mais baixas indicam maior grau de comprometimento cognitivo).
Os dados informados são os seguintes:
KBI (Y ) ADL (X1) MEM (X2) COG (X3) KBI (Y ) ADL (X1) MEM (X2) COG (X3)
28 39 4 18 88 76 50 5
68 52 33 9 54 79 44 11
59 89 17 3 73 48 57 9
91 57 31 7 87 90 33 6
(Contínuo )
KBI (Y ) ADL (X1) MEM (X2) COG (X3) KBI (Y ) ADL (X1) MEM (X2) COG (X3)
70 28 35 19 47 55 11 20
38 34 25 60 83 24 11
46 42 3 17 65 50 21 25
57 52 16 6 26 57 44 31 18
89 88 41 13 85 79 30 20
48 90 24 28 24 5 22
74 38 22 3 40 40 20 17
78 83 41 13 11 87 35 15 27
43 30 24 80 55 9 21
76 45 9 33 14 49 45 28 17
72 47 36 18 57 46 19 17
61 90 17 0 32 37 4 21
63 63 14 16 52 47 29 3
77 34 35 22 42 28 23 21
85 76 33 23 49 61 8 7
31 26 13 18 63 35 31 26
79 68 34 26 89 68 65 6
92 85 28 10 67 80 29 10
76 22 12 16 43 43 8 13
91 82 57 3 47 53 14 18
78 80 51 3 70 60 30 16
103 80 20 18 99 63 22 18
99 81 20 1 53 28 9 27
73 30 7 17 78 35 18 14
88 27 27 27 112 37 33 17
64 72 9 0 52 82 25 13
52 46 15 22 68 88 16 0
71 63 52 13 63 52 15 0
41 45 26 18 49 30 16 18
85 77 57 0 42 69 49 12
52 42 10 19 56 52 17 20
68 60 34 11 46 59 38 17
57 33 14 14 72 53 22 21
84 49 30 15 95 65 56 2
91 89 64 0 57 90 12 0
83 72 31 3 88 88 42 6
73 45 24 19 81 66 12 23
57 73 13 3 104 60 21 7
69 58 16 15 88 48 14 13
81 33 17 21 115 82 41 13
71 34 13 18 66 88 24 14
91 90 42 6 92 63 49 5
48 48 7 23 97 79 34 3
94 47 17 18 69 71 38 17
57 32 13 15 112 66 48 13
49 63 32 15 88 81 66 1
Fonte: Dados fornecidos por cortesia de Gwi-Ryung Son, RN, Ph.D.

EXERCÍCIOS 499
10.3.3 Em um estudo de fatores considerados relacionados a padrões de internação em um grande hospital geral, um
administrador obteve estes dados em 10 comunidades na área de abrangência do hospital:
Índice de
Pessoas por 1000 Disponibilidade de
População Admitida Outros Saúde Índice de
Durante o período de estudo Serviços indigência
Comunidade (Y) (X1) (X2)
1 61,6 6,0 6,3

2 53,2 4,4 5,5
65,5 9,1 3,6
34 64,9 8,1 5,8
5 72,7 9,7 6.8
6 52.2 4,8 7.9
7 50.2 7.6 4.2
8 44,0 4.4 6.0
9 53,8 9.1 2.8
10 53,5 6.7 6.7
Total 571,6 69,9 55,6
10.3.4 O administrador de um hospital geral obteve os seguintes dados sobre 20 pacientes cirúrgicos durante um estudo
para determinar quais fatores parecem estar relacionados à duração da internação:
pós-operatório pré-operatório
Comprimento de Número de corrente Comprimento de
ficar em dias Problemas médicos ficar em dias

(Y) (X1) (X2)
6 11
6 21
11 2 2
9 13
16 3 3
16 1 5
4 11
8 31
11 2 2
13 3 2
13 1 4
9 12
17 3 3
17 2 4
12 4 1
6 11 5 11
(Contínuo )
pós-operatório pré-operatório
Comprimento de Número de corrente Comprimento de
ficar em dias Problemas médicos ficar em dias

(Y) (X1) (X2)
12 3 2
8 12
9 22
Total 208 38 43
10.3.5 Uma amostra aleatória de 25 enfermeiras selecionadas de um registro estadual forneceu as seguintes informações sobre
a pontuação de cada enfermeira no exame do conselho estadual e sua pontuação final na escola. Ambas as pontuações
relacionam-se com a área de atuação do enfermeiro. Informações adicionais sobre a nota obtida por cada enfermeira em
um teste de aptidão, feito no momento do ingresso na escola de enfermagem, foram disponibilizadas ao pesquisador. Os
dados completos são os seguintes:
Pontuação do Conselho Estadual Pontuação final Pontuação do teste de aptidão

(Y) (X1) (X2)
440 87 92
480 87 79
535 87 99
460 88 91
525 88 84
480 89 71
510 89 78
530 89 78
545 89 71
600 89 76
495 90 89
545 90 90
575 90 73
525 91 71
575 91 81
600 91 84
490 92 70
510 92 85
575 92 71
540 93 76
595 93 90
525 94 94
545 94 94
600 94 93
625 94 73
Total 13.425 2263 2053

10.4 AVALIANDO A EQUAÇÃO DE REGRESSÃO MÚLTIPLA 501
10.3.6 Os seguintes dados foram coletados em uma amostra aleatória simples de 20 pacientes com hipertensão. o
variáveis são
Y ¼ pressão arterial média mm Hg ð Þ

X1 ¼ anos de idade ð Þ
X2 ¼ peso kg ð Þ
X3 ¼ área de superfície corporal m² ð Þ
X4 ¼ duração da hipertensão anos ð Þ
X5 ¼ pulsação basalthn ð Þ =min
X6 ¼ medida de tensão
Paciente Y X1 X2 X3 X4 X5 X6
1 105 47 85,4 1,75 5.1 63 33

2 115 49 94,2 2.10 3.8 70 14
3 116 49 95,3 1,98 8.2 72 10
4 117 50 94,7 2.01 5.8 73 99
5 112 51 89,4 1,89 7,0 72 95
6 121 48 99,5 2.25 9.3 71 10
7 121 49 99,8 2.25 2.5 69 42
8 110 47 90,9 1,90 6.2 66 8
9 110 49 89.2 1,83 7.1 69 62
10 114 48 92,7 2.07 5.6 64 35
11 114 47 94,4 2.07 5.3 74 90
12 115 49 94.1 1,98 5.6 71 21
13 114 50 91,6 2.05 10.2 68 47
14 106 45 87.1 1,92 5.6 67 80
15 125 52 101,3 2.19 10,0 76 98
16 114 46 94,5 1,98 7.4 69 95
17 106 46 87,0 1,87 3.6 62 18
18 113 46 94,5 1,90 4,3 70 12
19 110 48 90,5 1,88 9,0 71 99
20 122 56 95,7 2,09 7,0 75 99
10.4 AVALIANDO A EQUAÇÃO DE REGRESSÃO MÚLTIPLA
Antes de usar uma equação de regressão múltipla para prever e estimar, é desejável
determinar primeiro se vale a pena usá-la. Em nosso estudo de regressão linear simples,
aprendemos que a utilidade de uma equação de regressão pode ser avaliada por uma
consideração do coeficiente de determinação da amostra e inclinação estimada. Ao
avaliar uma equação de regressão múltipla, focamos nossa atenção no coeficiente de
determinação múltipla e nos coeficientes de regressão parcial.
O Coeficiente de Determinação Múltipla No Capítulo 9, o coeficiente de determinação é

discutido em detalhes consideráveis. O conceito se estende logicamente
para o caso de regressão múltipla. A variação total presente nos valores de Y pode ser dividida em
dois componentes - a variação explicada, que mede a quantidade da variação total que é explicada
pela superfície de regressão ajustada, e a variação inexplicada, que é a parte da variação total não
explicado ajustando a superfície de regressão. A medida de variação em cada caso é uma soma de
desvios quadrados. A variação total é a soma dos desvios quadrados de cada observação de Y da
média das observações e é designada por P yj y ou SST. A variação explicada, designada
2
P ^yj y ou
SST, é a soma dos desvios quadrados dos valores 2calculados da média dos valores Y observados.
Essa soma
dos desvios quadrados é chamada de soma dos quadrados
inexplicada,
devido
escrita
à regressão
como P(SSR).
yj é a soma
A variação
dos
desvios quadrados das observações originais dos valores calculados. Esta quantidade é referida como
a soma dos quadrados sobre a regressão
2
ou a soma dos quadrados do erro (SSE). Podemos resumir
a relação entre as três somas de quadrados
^yj , com a seguinte equação:
2 2 2
P yj y ¼ P ^yj y þ P yj ^yj
SST ¼ SSR þ SSE

(10.4.1)
soma total dos quadrados ¼ regressão explicada ð Þsoma dos quadrados þ
erro não explicado ð Þsoma dos quadrados
O coeficiente de determinação múltipla, R2 y:12...k é obtido dividindo-se o

soma dos quadrados explicada pela soma total dos quadrados. Isso é,
2
P ^yj y SSR
R2 ¼ ¼
(10.4.2)
a:12...k 2
SST
P yj y
O subscrito y:12 ... k indica que na análise Y é tratado como variável dependente e as variáveis X de
X1 a Xk são tratadas como variáveis independentes. O valor de R2 indica qual proporção da variação
total nos valores
da node Y observados
qualidade é y:12...k explicada pela regressão de Yon X1; X2; ... é uma medida
calculada Capítulodo9.ajuste da superfície de regressão. Esta quantidade é análoga à que foi
; Xk. Em outras palavras, podemos dizer que R2 a:12...k
2 r,
EXEMPLO 10.4.1
Consulte o Exemplo 10.3.1. Calcular R2 e: 12.
Solução: Para nosso exemplo ilustrativo temos na Figura 10.3.1
SST ¼ 1061:36
SSR ¼ 393:39
SSE ¼ 667:97
393:39
R2
a:12
¼ ¼ :3706 :371
1061:36
Dizemos que cerca de 37,1% da variação total dos valores de Y é explicada pelo plano
de regressão ajustado, ou seja, pela relação linear com a idade e o nível de escolaridade.
&
Testando a hipótese de regressão Para determinar se a regressão geral é significativa (isto é, para
determinar se R2 é significativo), podemos realizar um teste de hipótese como segue.
a:12
1. Dados. A situação da pesquisa e os dados gerados pela pesquisa são examinados para
determinar se a regressão múltipla é uma técnica apropriada para análise.
2. Suposições. Assumimos que o modelo de regressão múltipla e seus fundamentos
as premissas apresentadas na Seção 10.2 são aplicáveis.
3. Hipóteses. Em geral, a hipótese nula é H0: b1 ¼ b2 ¼ b3 ¼¼ bk ¼ 0 e a alternativa é HA: nem
todos bi ¼ 0. Em palavras, a hipótese nula afirma que todas as variáveis independentes não
têm valor para explicar a variação nos valores de Y.
4. Estatística de teste. A estatística de teste apropriada é VR, que é calculada como parte de uma
análise de variância. A tabela ANOVA geral é mostrada na Tabela 10.4.1. Na Tabela 10.4.1,
MSR significa quadrado médio devido à regressão e MSE significa quadrado médio sobre a
regressão ou, como às vezes é chamado, quadrado médio do erro.
5. Distribuição da estatística de teste. Quando H0 é verdadeiro e as suposições são atendidas, VR é

distribuído como F com k e nk 1 graus de liberdade.
6. Regra de decisão. Rejeitar H0 se o valor calculado de VR for igual ou maior que o valor crítico de
F.
7. Cálculo da estatística de teste. Ver Tabela 10.4.1.
8. Decisão estatística. Rejeitar ou deixar de rejeitar H0 de acordo com a regra de decisão.

9. Conclusão. Se rejeitarmos H0 concluímos que, na população de onde foi extraída a amostra, a
variável dependente está linearmente relacionada com as variáveis independentes como um
grupo. Se falharmos em rejeitar H0, concluímos que, na população da qual nossa amostra foi
extraída, pode não haver relação linear entre a variável dependente e as variáveis independentes
como um grupo. 10. valor p. Obtemos o valor p da tabela da distribuição F.
Ilustramos o procedimento de teste de hipóteses por meio do exemplo a seguir.
TABELA 10.4.1 Tabela ANOVA para Regressão Múltipla
Fonte SS df EM RV
Devido à regressão SSR k MSR ¼ SSR = k MSR=MSE

Sobre a regressão SSE nk 1 MSE ¼ SSE=ð nk 1 Þ
Total SST n1
EXEMPLO 10.4.2
Desejamos testar a hipótese nula de nenhuma relação linear entre as três variáveis discutidas no Exemplo
10.3.1: pontuação CDA, idade e nível educacional.
Solução:
1. Dados. Veja a descrição dos dados fornecidos no Exemplo 10.3.1.

2. Suposições. Assumimos que as suposições discutidas na Seção
10.2 são atendidos.
3. Hipóteses.
H0: ¼ b1 ¼ b2 ¼ 0
HA: ¼ nem todos bi ¼ 0
4. Estatística de teste. A estatística de teste é VR
5. Distribuição da estatística de teste. Se H0 for verdadeiro e as suposições forem

atendidas, a estatística de teste é distribuída como F com 2 numeradores e 68 graus
de liberdade no denominador.
6. Regra de decisão. Vamos usar um nível de significância de ¼ :01. A regra de decisão,
então, é rejeitar H0 se o valor calculado de VR for igual ou maior que 4,95 (obtido
por interpolação).
7. Cálculo da estatística de teste. A ANOVA para o exemplo é mostrada na Figura 10.3.1,
onde vemos que o valor calculado de VR é 20,02.
8. Decisão estatística. Como 20,02 é maior que 4,95, rejeitamos H0.
9. Conclusão. Concluímos que, na população de onde provém a amostra, existe uma
relação linear entre as três variáveis.
10. valor p. Como 20,02 é maior que 5,76, o valor de p para o teste é menor &
do que 0,005.
Inferências sobre b0 s individuais Freqüentemente, desejamos avaliar a

força da relação linear entre Y e as variáveis independentes individualmente.
Ou seja, podemos querer testar a hipótese nula de que bi ¼ 0 contra a alternativa bi 6¼ 0ð i ¼ 1; 2; ... Þ k .
; A validade desse procedimento repousa nas suposições declaradas
anteriormente: que para cada combinação de valores de Xi existe uma subpopulação normalmente
distribuída de valores de Y com variância s2.
Testes de hipótese para o bi Para testar a hipótese nula de que bi é igual a algum valor particular, digamos,
bi0, a seguinte estatística t pode ser calculada:
b^ bi0 sb^
t¼ eu
(10.4.3)
eu
é o desvio padrão de
onde os graus de liberdade são iguais a nk 1, e sb^ o b^ eu
eu.
Os desvios padrão dos pacotes de eu são fornecidos como parte da saída da maioria dos computadores
software b^ que fazem análise de regressão.
EXEMPLO 10.4.3
Vamos nos referir ao Exemplo 10.3.1 e testar a hipótese nula de que a idade (anos) é irrelevante na
predição da capacidade de direcionar a atenção (CDA).
Solução:
1. Dados. Ver Exemplo 10.3.1.

2. Suposições. Consulte a Seção 10.2.
3. Hipóteses.
H0: b1 ¼ 0
HA: b1 6¼ 0
Deixe um ¼ :05
4. Estatística de teste. Consulte a Equação 10.4.3.

atendidas, a estatística de teste é distribuída como t de Student com 68 graus de
liberdade.
6. Regra de decisão. Rejeitar H0 se o t calculado for maior ou igual a 1,9957 (obtido por
interpolação) ou menor ou igual a
1:9957.
7. Cálculo da estatística de teste. Pela Equação 10.4.3 e dados da Figura 10.3.2

calculamos
b^ 1 0 :18412
t¼ ¼ ¼ 3:80
sb^ 1
:04851
8. Decisão estatística. A hipótese nula é rejeitada, pois o cálculo

valor de t, 3:80, é menor que 1:9957.
9. Conclusão. Concluímos, então, que existe uma relação linear entre idade e CDA na
presença de escolaridade.
10. valor p. Para este teste, p < 2ð Þ¼ :005 :01 porque 3:80 < 2:6505 (obtido por
interpolação). Conforme mostrado na Figura 10.3.2, o valor-p é <0,001 para este
teste.
&
Agora, vamos realizar um teste semelhante para o segundo coeficiente de regressão parcial, b2:
H0: b2 ¼ 0
HA: b2 6¼ 0
a ¼ :05
b^2 0 :6108
t¼ ¼ ¼ 4:50
sb^2
:1357
Neste caso também a hipótese nula é rejeitada, pois 4,50 é maior que 1,9957. Concluímos que existe
uma relação linear entre nível educacional e CDA na idade de presença, e que o nível educacional,
usado dessa maneira, é uma variável útil para prever o CDA. [Para este teste, p < 2ð Þ¼ :005 :01.
Intervalos de confiança para o bi Quando o pesquisador for levado a concluir que um coeficiente de
regressão parcial não é 0, ele pode estar interessado em obter um intervalo de confiança para esse bi.
Os intervalos de confiança para o bi podem ser construídos da maneira usual, usando um valor da
distribuição t para o fator de confiabilidade e erros padrão fornecidos acima.
A 100 1ð Þ um intervalo de confiança percentual para bi é dado por
b^ i t1ð Þ a=2 ; nk1sb^ eu
Para nosso exemplo ilustrativo, podemos calcular os seguintes intervalos de confiança de 95%
para b1 e b2.
O intervalo de confiança de 95% para b1 é
:18412 1:9957ð Þ :04851

:18412 :0968
ð:28092; :08732Þ
O intervalo de confiança de 95% para b2 é
:6108 ð Þ 1:9957 ð Þ :1357

:6108 :2708
ð:3400; :8816Þ
Podemos dar a esses intervalos as interpretações probabilísticas e práticas usuais. Temos 95% de
confiança, por exemplo, de que b2 está contido no intervalo de 0,3400 a 0,8816, pois, na amostragem
repetida, 95% dos intervalos que podem ser construídos dessa maneira incluirão o parâmetro verdadeiro.
Algumas precauções Deve-se estar ciente dos problemas envolvidos na realização de vários testes de
hipóteses e na construção de vários intervalos de confiança a partir dos mesmos dados de amostra. O
efeito sobre a realização de múltiplos testes de hipóteses a partir dos mesmos dados é discutido na
Seção 8.2. Um problema semelhante surge quando se deseja construir intervalos de confiança para dois
ou mais coeficientes de regressão parciais. Os intervalos não serão independentes, de modo que o
coeficiente de confiança tabulado não se aplica, em geral. Em outras palavras, todos esses intervalos
não seriam intervalos de confiança de 100 1ð Þ a por cento.
Para manter intervalos de confiança aproximados de 100 1ð Þ a para coeficientes de regressão
parcial, ajustes devem ser feitos no cálculo dos erros nas equações anteriores. Esses ajustes às vezes
são chamados de taxas de erro familiares e podem ser encontrados em muitos pacotes de software de
computador. O tópico é discutido em detalhes por Kutner, et al. (4).
10.5 USANDO A EQUAÇÃO DE REGRESSÃO MÚLTIPLA 507
Outro problema às vezes encontrado na aplicação da regressão múltipla é uma aparente incompatibilidade
nos resultados dos vários testes de significância que se podem realizar. Em um dado problema para um dado
nível de significância, uma ou outra das seguintes situações pode ser observada.
1. R2 e todos os b^ significativos
eu
2. R2 e alguns, mas não todos os b^ eu

significativo
3. R2 significativos, mas nenhum dos b^ 4. eu

significativo
Todos os b^ significativo, mas não R2

eu
5. Alguns b^ significativos,
todos, nemmas
eu
não
R2 6. Nem R2 nem
nenhum b^ eu
significativo
Observe que a situação 1 existe em nosso exemplo ilustrativo, onde temos um R2 significativo e dois
coeficientes de regressão significativos. Esta situação não ocorre em todos os casos. De fato, a situação 2 é
muito comum, especialmente quando um grande número de variáveis independentes foi incluído na equação de
regressão.
EXERCÍCIOS
10.4.1 Consulte o Exercício 10.3.1. (a) Calcule o coeficiente de determinação múltipla; (b) realizar uma análise de
variância; (c) teste a significância de cada b^ ið Seja a ¼ :05 para todos
Þ i > 0os
. determine
testes de significância
o valor de p para
e
todos os testes; (d) construa um intervalo de confiança de 95 por cento para cada inclinação amostral
significativa.
10.4.2 Consulte o Exercício 10.3.2. Faça a análise sugerida no Exercício 10.4.1.

MÚLTIPLA
Como aprendemos no capítulo anterior, uma equação de regressão pode ser usada para obter um valor calculado
de Y, ^y, quando um valor específico de X é fornecido. Da mesma forma, podemos usar nossa equação de
regressão múltipla para obter um valor ^y quando recebemos valores específicos de duas ou mais variáveis X
presentes na equação.
Assim como na regressão linear simples, podemos, na regressão múltipla, interpretar um valor de ^y de
duas maneiras. Primeiro, podemos interpretar ^y como uma estimativa da média da subpopulação de valores de
Y que se supõe existir para combinações particulares de valores de Xi . Sob essa interpretação, ^y é chamado
de estimativa e, quando é usado para esse propósito, a equação é considerada uma equação de estimativa. A
segunda interpretação de ^y é que é o valor que Y provavelmente assumirá para determinados valores de Xi.
Neste caso ^y
é chamado de valor predito de Y, e a equação é chamada de equação de predição. Em ambos os casos,

intervalos podem ser construídos em torno do valor ^y quando a suposição de normalidade da Seção 10.2 for
verdadeira. Quando ^y é interpretado como uma estimativa de uma média populacional, o intervalo é chamado
de intervalo de confiança, e quando ^y é interpretado como um valor previsto de Y, o intervalo é chamado de
intervalo de previsão. Agora vamos ver como cada um desses intervalos é construído.
O Intervalo de Confiança para a Média de uma Subpopulação de Valores de Y Dados Valores Particulares de Xi
Vimos que um intervalo de confiança de 100 1ð Þ para um parâmetro pode ser construído pelo procedimento
geral de adicionar
multiplicado
e subtrair
pelo erro
do estimador
padrão douma
estimador.
quantidade
Também
igual ao
vimos
fatorque
de na
confiabilidade
regressão múltipla
correspondente
o estimador
a 1 éa
^yj ¼ b^ 0 þ b^ 1x1j þ b^ 2x2j þþ b^ kxkj (10.5.1)
Se designarmos o erro padrão deste estimador por s^y, o intervalo 100 1ð para a Þ uma porcentagem de confiança
média de Y, dado Xi especificado, é o seguinte:
^yj tð Þ 1a=2 ;nk1s^yj (10.5.2)
O intervalo de previsão para um valor particular de Y Dados valores particulares de Xi Quando interpretamos ^y
como o valor que Y provavelmente assumirá quando valores particulares de Xi forem observados, podemos
construir um intervalo de previsão da mesma maneira o intervalo de confiança foi construído. A única diferença
entre os dois é o erro padrão. O erro padrão da previsão é um pouco maior que o erro padrão da estimativa, o
que faz com que o intervalo de previsão seja maior que o intervalo de confiança.
Se designarmos o erro padrão da previsão por s0 ^y; intervalo de previsão

é o 100 1ð Þ um por cento
^yj tð Þ 1a=2 ;nk1s ^yj (10.5.3)
Os cálculos de s^yj e s0 no caso deOregressão

leitor quemúltipla sãocomo
quiser ver complicados e ^yj não serão
essas estatísticas abordadospode
são calculadas neste texto.
consultar
o livro de Anderson e Bancroft (3), outras referências listadas no final deste capítulo e no capítulo 9, e edições
anteriores deste texto. O exemplo a seguir ilustra como o MINITAB pode ser usado para obter intervalos de
confiança para a média dos intervalos de previsão de Yan para um determinado valor de Y.
EXEMPLO 10.5.1
Referimo-nos ao Exemplo 10.3.1. Primeiro, desejamos construir um intervalo de confiança de 95% para o escore
CDA médio (Y) em uma população de indivíduos de 68 anos (X1) que completaram 12 anos de escolaridade
(X2). Em segundo lugar, suponha que temos um sujeito com 68 anos de idade
EXERCÍCIOS 509
e tem um nível de escolaridade de 12 anos. O que prevemos ser a pontuação CDA desse sujeito?
Solução: A estimativa pontual da pontuação CDA média é
^y ¼ 5:494 :18412 68 ð Þþ :6108 12 ð Þ¼ :3034
A previsão pontual, que é a mesma que a estimativa pontual obtida anteriormente,

também é
^y ¼ 5:494 :18412 68 ð Þþ :6108 12 ð Þ¼ :3034
Para obter o intervalo de confiança e o intervalo de predição para os

parâmetros para os quais acabamos de calcular uma estimativa pontual e uma
predição pontual, usamos o MINITAB como segue. Depois de inserir as informações
para uma análise de regressão de nossos dados, conforme mostrado na Figura
10.3.2, clicamos em Opções na caixa de diálogo. Na caixa denominada “Intervalos
de previsão para novas observações”, digitamos 68 e 12 e clicamos em OK duas
vezes. Além da análise de regressão, obtemos a seguinte saída:
Novo Obs Ajuste SE Ajuste CI de 95,0% 95,0% PI

1 0,303 0,672 (1,038, 1,644) (6,093, 6,699)
Interpretamos esses intervalos das formas usuais. Olhamos primeiro para o

intervalo de confiança. Temos 95% de confiança de que o intervalo de 1:038 a 1,644
inclui a média da subpopulação de valores Y para a combinação especificada de
valores Xi , pois esse parâmetro seria incluído em cerca de 95% dos intervalos que
podem ser construídos no maneira mostrada.
Agora considere o sujeito que tem 68 anos e 12 anos de estudo. Temos 95%
de confiança de que esse sujeito teria uma pontuação CDA entre 6:093 e 6,699. O
fato de o PI ser mais amplo do que o IC não deveria ser surpreendente. Afinal, é
mais fácil estimar a resposta média do que estimar uma observação individual.
&
EXERCÍCIOS
Para cada um dos exercícios a seguir, calcule o valor de y e construa (a) 95% de confiança e (b)
intervalos de previsão de 95% para os valores especificados de Xi.
10.5.1 Consulte o Exercício 10.3.1 e seja x1j ¼ 95 e x2j ¼ 35:
10.5.2 Consulte o Exercício 10.3.2 e seja x1j ¼ 50; x2j ¼ 20 e x3j ¼ 22: 10.5.3 Consulte o
Exercício 10.3.3 e seja x1j ¼ 5 e x2j ¼ 6:

10.5.6 Consulte o Exercício 10.3.6 e seja x1j ¼ 50; x2j ¼ 95:0; x3j ¼ 2:00; x4j ¼ 6:00; x5j ¼ 75, e
x6j ¼ 70:
10.6 O MODELO DE CORRELAÇÃO MÚLTIPLA
Apontamos no capítulo anterior que, embora a análise de regressão se preocupe com a forma
da relação entre as variáveis, o objetivo da análise de correlação é obter uma percepção da
força da relação. Isso também é verdade no caso multivariável, e nesta seção investigamos
métodos para medir a força da relação entre diversas variáveis. Primeiro, porém, vamos definir
o modelo e as suposições sobre as quais nossa análise se baseia.
A equação do modelo Podemos escrever o modelo de correlação como
yj ¼ b0 þ b1x1j þ b2x2j þþ bkxkj þ ej (10.6.1)
onde yj é um valor típico da população de valores da variável Y, os b's são os coeficientes de

regressão definidos na Seção 10.2, e os xij são valores particulares (conhecidos) das variáveis
aleatórias Xi. Este modelo é semelhante ao modelo de regressão múltipla, mas há uma distinção
importante. No modelo de regressão múltipla, dado na Equação 10.2.1, os Xi são variáveis não
aleatórias, mas no modelo de correlação múltipla os Xi são variáveis aleatórias.
Em outras palavras, no modelo de correlação há uma distribuição conjunta de Y e Xi que
chamamos de distribuição multivariada. Nesse modelo, as variáveis não são mais pensadas
como dependentes ou independentes, pois logicamente são intercambiáveis e qualquer um dos
Xi pode desempenhar o papel de Y.
Normalmente, amostras aleatórias de unidades de associação são extraídas de uma
população de interesse e medições de Y e Xi são feitas.
Um plano ou hiperplano de mínimos quadrados é ajustado aos dados da amostra pelos
métodos descritos na Seção 10.3, e os mesmos usos podem ser feitos da equação resultante.
Inferências podem ser feitas sobre a população da qual a amostra foi extraída se for possível
assumir que a distribuição subjacente é normal, ou seja, se for possível assumir que a
distribuição conjunta de Yan e Xi é uma distribuição normal multivariada. Além disso, medidas
amostrais do grau de relacionamento entre as variáveis podem ser calculadas e, sob a hipótese
de que a amostragem é de uma distribuição normal multivariada, os parâmetros correspondentes
podem ser estimados por meio de intervalos de confiança e testes de hipóteses podem ser realizados .
Especificamente, podemos calcular uma estimativa do coeficiente de correlação múltipla que
mede a dependência entre Y e Xi. Essa é uma extensão direta do conceito de correlação entre
duas variáveis que discutimos no Capítulo 9. Também podemos calcular coeficientes de
correlação parcial que medem a intensidade da relação entre quaisquer duas variáveis quando
a influência de todas as outras variáveis foi removida.
O coeficiente de correlação múltipla Como primeiro passo na análise das relações entre as
variáveis, examinamos o coeficiente de correlação múltipla.
10.6 O MODELO DE CORRELAÇÃO MÚLTIPLA 511
O coeficiente de correlação múltipla é a raiz quadrada do coeficiente de determinação

múltipla e, consequentemente, o valor da amostra pode ser calculado tomando a raiz
quadrada da Equação 10.4.2. Isso é,
2 fffiffiffiffiffiffiff
SSR
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
R2 P ^yj y
Ry:12...k ¼ a:12...k q¼ 2
¼
(10.6.2)
SST r
vuut P yj y
Para ilustrar os conceitos e técnicas da análise de correlação múltipla, vamos

considerar um exemplo.
EXEMPLO 10.6.1
Wang et ai. (A-4), usando fêmures humanos cadavéricos de indivíduos com idades entre 16
e 19 anos, investigou as propriedades de resistência do osso e as medidas da rede de
colágeno dentro do osso. Duas variáveis que medem a rede de colágeno são a porosidade
(P, expressa como uma porcentagem) e uma medida da resistência à tração da rede de
colágeno (S). A medida de tenacidade (W, Newtons), é a força necessária para a fratura
óssea. Os 29 fêmures de cadáveres usados no estudo estavam livres de patologias ósseas.
Queremos analisar a natureza e a força da relação entre as três variáveis. As medidas são
mostradas na tabela a seguir.
TABELA 10.6.1 Resistência óssea e propriedades

da rede de colágeno para 29 fêmures
PS
193,6 6.24 30.1

137,5 8.03 22.2
145,4 11.62 25,7
117,0 7.68 28.9
105.4 10.72 27.3
99,9 9.28 33.4
74,0 6.23 26.4
74,4 8.67 17.2
112,8 6.91 15.9
125,4 7.51 12.2
126,5 10.01 30,0
115,9 8,70 24,0
98,8 5.87 22.6
94,3 7,96 18.2
99,9 12.27 11.5
83,3 7.33 23.9
72,8 11.17 11.2
83,5 6.03 15.6
59,0 7,90 10.6
(Continuação)
PS
87.2 8.27 24,7

84,4 11.05 25.6
78.1 7.61 18.4
51,9 6.21 13.5
57.1 7.24 12.2
54,7 8.11 14.8
78,6 10.05 8.9
53,7 8.79 14.9
96,0 10h40 10.3 Fonte: Dados fornecidos por
89,0 11.72 15.4 cortesia de Xiaodu Wang, Ph.D.
Solução: Usamos o MINITAB para realizar a análise de nossos dados. Os leitores interessados na derivação
das fórmulas subjacentes e nos procedimentos aritméticos envolvidos podem consultar os
textos listados no final deste capítulo e no Capítulo 9, bem como as edições anteriores deste
texto. Se uma equação de predição de mínimos quadrados e um coeficiente de correlação
múltipla forem desejados como parte da análise, podemos obtê-los usando o procedimento de
regressão múltipla do MINITAB descrito anteriormente. Quando fazemos isso com os valores
de amostra de Y, X1 e X2, armazenados nas Colunas 1 a 3, respectivamente, obtemos a saída
mostrada na Figura 10.6.1.
A equação dos mínimos quadrados, então, é
^yj ¼ 35:61 þ 1:451x1j þ 2:3960x2j
A equação de regressão é Y = 35,6 + 1,45 X1 +

2,40 X2

Constante 35,61 29,13 1,22 0,232
X1 1.451 2,763 0,53 0,604
X2 2.3960 0,7301 3,28 0,003
S = 27,42 R-Sq = 29,4% R-Sq(ajuste) = 24,0%
Fonte DF SS EM F P
Regressão 2 8151.1 4075,6 5.42 0,011
Erro residual 26 28 19553.5 752,1
Total 27704.6
FIGURA 10.6.1 Saída do procedimento de regressão múltipla do MINITAB para os dados da

Tabela 10.6.1.
Essa equação pode ser usada para fins de estimativa e previsão e pode ser
avaliada pelos métodos discutidos na Seção 10.4.
Como vemos na Figura 10.6.1, a saída da regressão múltipla também
nos dá o coeficiente de determinação múltipla, que, em nosso exemplo atual, é
R2 ¼ :294 a:12
O coeficiente de correlação múltipla, portanto, é

fffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
Ry:12 ¼ :294 p ¼ :542
Interpretação de Ry:12
Interpretamos Ry:12 como uma medida da correlação entre as variáveis força necessária para
fraturar, porosidade e força da rede de colágeno na amostra de 29 ossos do fêmur de
indivíduos com idades entre 16 e 19 anos. amostra da população de tais pessoas, podemos
usar Ry:12 como uma estimativa de ry:12, o verdadeiro coeficiente de correlação múltipla da
população. Podemos também interpretar Ry:12 como o coeficiente de correlação simples
entre yj e ^y, os valores observados e calculados, respectivamente, da variável “dependente”.
A correspondência perfeita entre os valores observados e calculados de Y resultará em um
coeficiente de correlação de 1, enquanto uma completa falta de uma relação linear entre os
valores observados e calculados produz um coeficiente de correlação de 0. O coeficiente de
correlação múltipla sempre recebe um sinal positivo.
Podemos testar a hipótese nula de que ry:12...k ¼ 0 calculando
R2 nk 1
a:12...k
F¼ (10.6.3)
1 R2
a:12...k
k
O valor numérico obtido da Equação 10.6.3 é comparado com o valor tabelado de F com k e nk 1 graus de liberdade. O leitor
se lembrará de que isso é idêntico ao teste de H0: b1 ¼ b2 ¼¼ bk ¼ 0 descrito na Seção 10.4.
Para o nosso presente exemplo, vamos testar a hipótese nula de que ry:12 ¼ 0 contra o
alternativa que ry:12 6¼ 0. Calculamos
:294 29 2 1 ¼
F¼ 5:41
1:294 2
Como 5,41 é maior que 4,27, p < :025, para que possamos rejeitar a hipótese nula no nível de
significância de 0,025 e concluir que a força necessária para a fratura está correlacionada
com a porosidade e a medida da força da rede de colágeno na população amostrada .
O valor calculado de F para testar H0 de que o coeficiente de correlação múltipla da
população é igual a zero é dado na análise da tabela de variância na Figura 10.6.1 e é 5,42.
Os dois valores calculados de F diferem como resultado de diferenças de arredondamento
nos cálculos intermediários. &
Correlação Parcial O pesquisador pode desejar ter uma medida da força da relação linear
entre duas variáveis quando o efeito das variáveis remanescentes tiver sido removido. Tal
medida é fornecida pelo coeficiente de correlação parcial.
Por exemplo, o coeficiente de correlação de amostra parcial ry:12 é uma medida da correlação entre
Y e X1 após controlar o efeito de X2.
Os coeficientes de correlação parciais podem ser calculados a partir dos coeficientes de
correlação simples. Os coeficientes de correlação simples medem a correlação entre duas variáveis
quando nenhum esforço foi feito para controlar outras variáveis. Em outras palavras, são os
coeficientes de qualquer par de variáveis que seriam obtidos pelos métodos de correlação simples
discutidos no Capítulo 9.
Suponha que temos três variáveis, Y, X1 e X2. O coeficiente de correlação parcial da amostra
que mede a correlação entre Y e X1 após o controle de X2, por exemplo, é escrito ry1:2. No subscrito,
o símbolo à direita da vírgula indica a variável cujo efeito está sendo controlado, enquanto os dois
símbolos à esquerda da vírgula indicam quais variáveis estão sendo correlacionadas. Para o caso de
três variáveis, existem dois outros coeficientes de correlação parcial de amostra que podemos calcular.
Eles são ry2:1 e r12:y.
O Coeficiente de Determinação Parcial O quadrado do coeficiente de correlação parcial é chamado

de coeficiente de determinação parcial. Ele fornece informações úteis sobre as inter-relações entre as
variáveis. Considere ry1:2, por exemplo. Seu quadrado, r2 , nos diz qual proporção da variabilidade
restante em Y Y.
a1:2 é explicada por X1 depois que X2 explicou o máximo possível da variabilidade total em
Cálculo dos coeficientes de correlação parcial Para três variáveis, os seguintes coeficientes de
correlação simples podem ser calculados:
ry1, a correlação simples entre Y e X1

ry2, a correlação simples entre Y e X2
r12, a correlação simples entre X1 e X2
O procedimento de correlação do MINITAB pode ser usado para calcular esses coeficientes
de correlação simples, conforme mostrado na Figura 10.6.2. Conforme observado anteriormente, as
observações de amostra são armazenadas nas Colunas 1 a 3. A partir da saída da Figura 10.6.2,
vemos que r12 ¼ :08;ry1 ¼ :043 e ry2 ¼ :535.
Os coeficientes de correlação parcial da amostra que podem ser calculados a partir dos
coeficientes de correlação simples no caso de três variáveis são:
1. A correlação parcial entre Y e X1 após controlar o efeito de X2:

ry1:2 ¼ ry1 ry2r12 = (10.6.4)

q 1r2 ðy2 Þ 1r2 ð Þ12
2. A correlação parcial entre Y e X2 após controlar o efeito de X1:

ry2:1 ¼ ry2 ry1r12 = (10.6.5)

q 1r2 ðy1 Þ 1r2 ð Þ12
3. A correlação parcial entre X1 e X2 após controlar o efeito de Y:

r12:y ¼ r12 ry1ry2 = (10.6.6)

q 1r2 ðy1 Þ 1r2 ðy2 º
:xob golaiD :dnammoC noisseS
Stat Estatísticas Básicas Correlação MTB> CORRELAÇÃO C1-C3
Digite C1-C3 em Variáveis. Clique em OK.
Saída:
Y X1
X1 0,043
0,823
X2 0,535 -0,080
0,003 0,679
Conteúdo da Célula: Correlação de Pearson

Valor P
FIGURA 10.6.2 Procedimento do MINITAB para calcular os coeficientes de correlação simples para os
EXEMPLO 10.6.2
Para ilustrar o cálculo dos coeficientes de correlação parcial da amostra, vamos nos referir ao
Exemplo 10.6.1 e calcular os coeficientes de correlação parcial entre as variáveis força à fratura
(Y ), porosidade (X1) e resistência da rede de colágeno (X2).
Solução: Em vez de calcular os coeficientes de correlação parcial dos coeficientes de correlação

simples pelas Equações 10.6.4 a 10.6.6, usamos o MINITAB para obtê-los.
O procedimento do MINITAB para calcular coeficientes de correlação

parcial é baseado no fato de que um determinado coeficiente de correlação
parcial é ele próprio a correlação simples entre dois conjuntos de resíduos. Um
conjunto de resíduos é obtido como segue. Suponha que temos medições em
duas variáveis, X (independente) e Y (dependente). Obtemos a equação de
predição dos mínimos
0 um resíduo,
quadrados,
x. que^y
é ¼ b^ þ b^ Para cada valor de X calculamos
ð igual a yi ^yi Þ, a diferença entre o valor observado de Y e o valor previsto de Y
associado ao X.
Agora, suponha que temos três variáveis, X1; X2 e Y. Queremos calcular o
coeficiente de correlação parcial entre X1 e Y mantendo X2 constante. Regredimos
X1 em X2 e calculamos os resíduos, que podemos chamar de conjunto residual
A. Regredimos Y em X2 e calculamos os resíduos, que podemos chamar de
conjunto residual B. O coeficiente de correlação simples que mede a força da
relação entre o conjunto residual A e o conjunto residual B é o coeficiente de
correlação parcial entre X1 e Y após controlar o efeito de X2.
Ao usar o MINITAB, armazenamos cada conjunto de resíduos em uma

coluna diferente para uso futuro no cálculo dos coeficientes de correlação
simples entre eles.
Usamos comandos de sessão em vez de uma caixa de diálogo para
calcular os coeficientes de correlação parcial quando usamos o MINITAB. Com
as observações em X1; X2 e Y armazenados nas Colunas 1 a 3, respectivamente,
o procedimento para os dados da Tabela 10.6.1 é mostrado na Figura 10.6.3.
A saída mostra que ry1:2 ¼ :102;r12:y ¼ :122 e ry2:1 ¼ :541.
As correlações parciais podem ser calculadas diretamente usando o software
SPSS, conforme mostrado na Figura 10.6.5. Este software exibe, em uma tabela
sucinta, tanto o coeficiente de correlação parcial quanto o valor p associado a cada
correlação parcial. &
Testando hipóteses sobre coeficientes de correlação parcial Podemos testar a hipótese nula
de que qualquer um dos coeficientes de correlação parcial da população é 0 por meio do
teste t. Por exemplo, para testar H0: ry1:2...k ¼ 0, calculamos
nk 1 1 r2
t ¼ ry1:2...k (10.6.7)
y1:2...k s
que é distribuído como t de Student com nk 1 graus de liberdade.

Vamos ilustrar o procedimento para nosso exemplo atual testando H0: ry1:2 ¼
0 contra a alternativa, HA: ry1:2 6¼ 0. O t calculado é
29 2 1
t ¼ :102 2 ¼ :523
s
1 ð Þ :102
Como o t calculado de 0,523 é menor que o t tabulado de 2,0555 para 26 graus de liberdade e
um ¼ :05 (teste bilateral), deixamos de rejeitar H0 no nível de significância de 0,05 e concluímos
que pode haver nenhuma correlação entre a força necessária para a fratura e a porosidade após
o controle do efeito da força da rede de colágeno. Testes de significância para os outros dois
coeficientes de correlação parcial serão deixados como exercício para o leitor. Observe que os
valores de p para esses testes são calculados pelo MINITAB conforme mostrado na Figura 10.6.3.
O pacote de software estatístico SPSS para o PC fornece um procedimento conveniente
para obter coeficientes de correlação parcial. Para usar esse recurso, escolha “Analisar” na barra
de menu, depois “Correlacionar” e, finalmente, “Parcial”. Seguindo esta sequência de escolhas,
a caixa de diálogo Parcial Correlations aparece na tela. Na caixa denominada “Variáveis:,” digite
os nomes das variáveis para as quais as correlações parciais são desejadas. Na caixa
denominada “Controlando para:” digite os nomes da(s) variável(is) que você deseja controlar.
Selecione um nível de significância bilateral ou unilateral. A menos que a opção seja desmarcada,
os níveis de significância reais serão exibidos. Para o Exemplo 10.6.2, a Figura 10.6.4 mostra
os coeficientes de correlação parcial calculados pelo SPSS entre as outras duas variáveis ao
controlar, sucessivamente, para X1 (porosidade), X2 (resistência da rede de colágeno) e Y (força
necessária para fratura).
MTB > regressão C1 1 C2; SUBC> resíduos

C4.

C5.

C6.

C7.

C8.

C9.
MTB > corr C4 C5
Correlações: C4, C5
Correlação de Pearson de C4 e C5 = 0,102 Valor P = 0,597
BTT > corr C6 C7
Correlação de Pearson de C6 e C7 = -0,122 Valor P = 0,527
MTB > corr C8 C9
Correlação de Pearson de C8 e C9 = 0,541 Valor P = 0,002
FIGURA 10.6.3 Procedimento do MINITAB para calcular coeficientes de correlação parcial a partir dos
Controlando para: X1
X2 Y
X2 1,0000 .5412
( 0) ( 26)
P= . P= 0,003
Y .5412 1,0000
( 26) ( 0)
P= 0,003 P= .
Controlando para: X2
Y X1
Y 1,0000 .1024
( 0) (26)
P= . P= 0,604
X1 .1024 1,0000
( 26) ( 0)
P= 0,604 P= .
Controlando para: Y
X1 X2
X1 1,0000 0) -.1225 (26)

(
P= . P = 0,535
X2 -.1225 (26) 1,0000 0)

(
P = 0,535 P= .
(Coeficiente / (DF) / Significância 2-caudais) “.” é impresso se um coeficiente não

puder ser calculado
FIGURA 10.6.4 Coeficientes parciais obtidos com SPSS para Windows, Exemplo 10.6.2.
correlações
Forçar a
selbaira V lortnoC )1X(ytisoroP)Y(erutcarF
Resistência à Tração (X2) Força para Correlação à Fratura (Y) 1.000 .102
Significado (bilateral) fd . .604
0 62
Porosidade (X1) Correlação .102 1.000

Significado (bilateral) fd .604 .
62 0
(uma)
correlações
Porosidade Tração
selbaira V lortnoC )2X(htgnertS)1X(
Força para fraturar (Y) Porosidade (X1) Correlação 1.000 .122

0 62
Correlação de Resistência à Tração (X2) .122 1.000

62 0
(b)
correlações
Tração Forçar
selbaira V lortnoC para (erutcarF)2X( htgnertS )Y
Porosidade (X1) Correlação de Resistência à Tração (X2) 1.000 .541

0 62
Força para Correlação de Fratura (Y) .541 1.000

62 0
(c)
FIGURA 10.6.5 Coeficientes de correlação parcial para os dados do Exemplo 10.6.1. (a) ry1.2, (b)
r12.y e (c) ry2.1.
Embora nossa ilustração da análise de correlação seja limitada ao caso de três

variáveis, os conceitos e técnicas se estendem logicamente ao caso de quatro ou mais variáveis.
O número e a complexidade dos cálculos aumentam rapidamente à medida que o número
de variáveis aumenta.
EXERCÍCIOS
10.6.1 O objetivo do estudo de Anton et al. (A-5) foi investigar a estrutura de correlação de múltiplas medidas da carga de HIV em amostras
de sangue e tecido. Eles mediram a carga do HIV de quatro maneiras. Duas medições foram derivadas de amostras de sangue
e duas medições foram feitas no tecido retal.
As duas medições de sangue foram baseadas em ensaios de DNA de HIV e um segundo ensaio de co-cultura que foi uma
modificação da primeira medição. A terceira e quarta medições foram quantificações de DNA e RNA de HIV-1 de tecido de
biópsia retal. A tabela abaixo fornece dados sobre os níveis de HIV dessas medições para 34 indivíduos.
ADN do VIH co-cultura de HIV HIV DNA Retal HIV RNA Retal
Sangue (Y) Sangue (X1) Tecido (X2) Tecido (X3)
115 .38 899 56

86 1,65 167 158
19 .16 73 152
6 .08 146 35
23 .02 82 60
147 1,98 2483 1993
27 .15 404 30
140 .25 2438 72
345 .55 780 12
92 .22 517 5
85 0,09 346 5
24 .17 82 12
109 .41 1285 5
5 .02 380 5
95 .84 628 32
46 .02 451 5
25 .64 159 5
187 .20 1335 121
.04 30
5 .02 13 5
47 .24
118 112 .72 5 30
79 .45 625 5
52 .23 719 83 70 167
52 .06 309 27 29
7 .37 199 5
13 .13 510 42
80 .24 271 15
86 0,96 273 45
26 .29 534 71
53 .25 473 264
185 .28 2932 108
30 .19 658 33
9 .03 103 5
76 .21 2339 5
(Contínuo )
EXERCÍCIOS 521
ADN do VIH co-cultura de HIV HIV DNA Retal HIV RNA Retal
Sangue (Y) Sangue (X1) Tecido (X2) Tecido (X3)
51 0,09 31 36
73 .06 158 5
47 .08 773 5
48 .12 545 67
16 .03 5 5
Fonte: Dados fornecidos por cortesia de Peter A. Anton, MD
(a) Calcule os coeficientes de correlação simples entre todos os pares possíveis de variáveis. (b) Calcule
o coeficiente de correlação múltipla entre as quatro variáveis. Teste a correlação geral para significância. (c) Calcule
as correlações parciais entre o DNA do sangue do HIV e cada uma das outras variáveis, controlando as outras duas.
(Estes são chamados de coeficientes de correlação parcial de segunda ordem.) (d) Calcule a correlação parcial entre
o sangue de co-cultura do HIV e o DNA do HIV, controlando as outras duas variáveis.
(e) Calcule a correlação parcial entre o sangue da cocultura do HIV e o RNA do HIV, controlando as outras duas
variáveis.
(f) Calcule as correlações parciais entre o DNA do HIV e o RNA do HIV, controlando as outras duas variáveis.
10.6.2 Os seguintes dados foram obtidos em 12 homens com idades entre 12 e 18 anos (todas as medidas estão em centímetros):
Altura comprimento do raio Comprimento do fêmur

(Y) (X1) (X2)
149,0 21h00 42,50

152,0 21.79 43,70
155,7 22h40 44,75
159,0 23h00 46,00
163,3 23,70 47,00
166,0 24h30 47,90
169,0 24,92 48,95
172,0 25,50 49,90
174,5 25,80 50,30
176.1 26.01 50,90
176,5 26.15 50,85
179,0 26h30 51.10
Total 1.992,1 290,87 573,85
(a) Encontre o coeficiente de correlação múltipla da amostra e teste a hipótese nula de que ry:12 ¼ 0. (b) Encontre
cada um dos coeficientes de correlação parcial e teste cada um quanto à significância. Deixe um ¼ :05 para todos os
testes.
(c) Determine o valor de p para cada teste. (d)

Exponha suas conclusões.
10.6.3 Os seguintes dados foram coletados em 15 meninas obesas:
Peso em Corpo magro média diária

Quilogramas Peso Ingestão calórica
(Y) (X1) (X2)
79,2 54.3 2670

64,0 44,3 820
67,0 47,8 1210
78,4 53,9 2678
66,0 47,5 1205
63,0 43,0 815
65,9 47,1 1200
63,1 44,0 1180
73.2 44.1 1850
66,5 48.3 1260
61,9 43,5 1170
72,5 43.3 1852
101.1 66,4 1790
66.2 47,5 1250
99,9 66.1 1789
Total 1087,9 741.1 22739
(a) Encontre o coeficiente de correlação múltipla e teste sua significância. (b) Encontre cada
um dos coeficientes de correlação parcial e teste a significância de cada um. Deixe um ¼ :05 para todos
testes.
(c) Determine o valor de p para cada teste. (d)
Exponha suas conclusões.
10.6.4 Foi realizado um projeto de pesquisa para estudar as relações entre inteligência, afasia e apraxia.
Os sujeitos eram pacientes com dano focal no hemisfério esquerdo. As pontuações nas seguintes variáveis foram obtidas por
meio da aplicação de testes padronizados.
Y ¼ inteligência X1
¼ apraxia ideomotora X2 ¼
apraxia construtiva X3 ¼ pixels
do volume da lesão ð Þ X4 ¼
gravidade da afasia Os resultados
são apresentados na tabela a seguir. Encontre o coeficiente de correlação múltipla e teste

para significância. Seja a ¼ :05 e encontre o valor de p.
Sujeito Y X1 X2 X3 X4
66 7,6 7,4 2296,87 2

12 78 13,2 11,9 2975,82 8
79 13,0 12,4 2839,38 11
34 84 14,2 13,3 3136,58 15
(Continuação)
Sujeito Y X1 X2 X3 X4
5 77 11.4 11.2 2470,50 5
6 82 14.4 13.1 3136,58 9
7 82 13.3 12.8 2799,55 8
8 75 12.4 11.9 2565,50 6
9 81 10.7 11.5 2429,49 11
10 71 7.6 7.8 2369,37 6
11 77 11.2 10.8 2644,62 7
12 74 9.7 9.7 2647,45 9
13 77 10.2 10,0 2672,92 7
14 74 10.1 9.7 2640,25 8
15 68 6.1 7.2 1926,60 5
10.7 RESUMO
Neste capítulo, examinamos como os conceitos e técnicas de regressão linear simples e

análise de correlação são estendidos ao caso de múltiplas variáveis. O método de mínimos
quadrados de obtenção da equação de regressão é apresentado e ilustrado. Este capítulo
também se preocupa com o cálculo de medidas descritivas, testes de significância e os
usos a serem feitos da equação de regressão múltipla. Além disso, são discutidos os
métodos e conceitos de análise de correlação, incluindo correlação parcial.
Quando os pressupostos subjacentes aos métodos de regressão e correlação
apresentados neste e no capítulo anterior não forem atendidos, o pesquisador deve
recorrer a técnicas alternativas, como as discutidas no Capítulo 13.
Fórmula
10.2.1 Representação da yj ¼ b0 þ b1x1j þ b2x2j þþ bkxkj þ ej

equação de
regressão linear
múltipla
10.2.2 Representação yj ¼ b0 þ b1x1j þ b2x2j þ ej

da equação de
regressão linear
múltipla com duas
variáveis
independentes
(Contínuo )
10.2.3 Desvio aleatório de ej ¼ yj b0 b1x1j b2x2j

um ponto de um
plano quando
são dois
variáveis
independentes
2
10.3.1 Resíduos da soma Pe2 j¼ P yj ^yj
dos quadrados
2 2 2
10.4.1 Equação da soma
P yj y ¼ P ^yj y þ P yj ^yj
dos quadrados
SST ¼ SSR þ SSE
2
10.4.2 Coeficiente de SSR
R2 ¼
P ^yj y ¼
a:12...k 2 SST
determinação múltipla P yj y
10.4.3 estatística t para

b^ eu bi0
t¼
testando hipóteses
sb^ eu
sobre bi
10.5.1 Estimativa
^yj ¼ b^ 0 þ b^ 1x1j þ b^ 2x2j þþ b^ kxkj
equação para
regressão linear
múltipla
10.5.2 Intervalo de confiança ^yj tð Þ 1a=2 ;nk1s^yj

para a média de Y
para um determinado X
10.5.3 Intervalo de previsão ^yj Þ 1a=2 ;nk1s0 ^yj tð

para Y para um dado X
10.6.1 Modelo yj ¼ b0 þ b1x1j þ b2x2j þþ bkxkj þ ej

de correlação múltipla
10.6.2 2
Coeficiente ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
fffiffiffiffiff
P ^yj y SSR
de correlação Ry:12...k ¼ a:12...k q ¼ R2
2
¼
SST q
múltipla vuutP yj y
10.6.3 F estatística para R2 nk 1

y:12...k
F¼
testando a correlação 1R2 _ k
a:12...k
múltipla
coeficiente
10.6.4–10.6.6 correlação parcial

r12:3 ¼ ð Þ r12 r13r23 = q 1 r213 1 r223
Entre dois
variáveis (1 e 2)
depois de controlar
para um terceiro (3)
10.6.7 estatística t para testar nk 1

hipóteses sobre t ¼ ry1:2...k
1 r2
coeficientes de y1:2...k s
correlação parcial
Tecla de símbolo b^x ¼ regressão estimada=coeficiente de correlação x bx

¼ regressão=coeficiente de correlação e ¼ termo de erro
do modelo k ¼ número de variáveis independentes n ¼
tamanho da amostra r12,3 ¼ coeficiente de correlação
parcial da amostra entre 1 e 2 após controlar para 3 R ¼
correlação da amostra coeficiente R2 ¼ coeficiente múltiplo de
determinação
t ¼ testatística
xi ¼ valor da variável independente em ix ¼
média amostral da variável independente yi ¼
valor da variável dependente em iy ¼ média
amostral da variável dependente ^y ¼ estimativa
yz ¼ z estatística
1. Quais são as suposições subjacentes à análise de regressão múltipla quando se deseja inferir sobre o
população da qual os dados amostrais foram retirados?
2. Quais são as suposições subjacentes ao modelo de correlação quando a inferência é um objetivo?
3. Explique completamente os seguintes termos:
(a) Coeficiente de determinação múltipla (c) (b) Coeficiente de correlação múltipla

Coeficiente de correlação simples (d) Coeficiente de correlação parcial
4. Descreva uma situação em sua área de interesse em que a análise de regressão múltipla seria útil. Use dados reais
ou realistas e faça uma análise de regressão completa.
5. Descreva uma situação em sua área específica de interesse em que a análise de correlação múltipla seria útil. Use
dados reais ou realistas e faça uma análise de correlação completa.
Nos Exercícios 6 a 11, execute a análise indicada e teste as hipóteses nos níveis de significância indicados.
Calcule o valor de p para cada teste.
6. Aprendemos no Exemplo 9.7.1 que o propósito de um estudo de Kwast-Rabben et al. (A-6) foi analisar os potenciais
evocados somatossensoriais (PES) e suas inter-relações após a estimulação dos dedos I, III e V na mão.
Voluntários saudáveis foram recrutados para o estudo. Os pesquisadores aplicaram estimulação abaixo da
intensidade da dor nos dedos. As gravações das respostas da coluna vertebral foram feitas com eletrodos fixados
por creme adesivo para eletrodos na pele do sujeito. Os resultados são mostrados na tabela a seguir para
114 assuntos. Use a regressão múltipla para ver o quão bem você pode prever o pico de latência espinhal (Cv) do
SEP para o dígito I quando a idade (anos) e o comprimento do braço (cm) são as variáveis preditoras. Avalie a utilidade
de sua equação de previsão.
Age Arm Length Cv Dig.I Age Arm Length Cv Dig.I Idade Comprimento do braço Cv Dig.I
35,07 76,5 13,50 32,00 82,0 16,30 42.08 94,0 17h70

35,07 76,5 13,50 32,00 82,0 15,40 40,09 94,0 17,70
21,01 77,0 13,00 38,09 86,5 16,60 40,09 94,0 17,40
21,01 77,0 13,60 38,09 86,5 16,00 42,09 92,5 18,40
47,06 75,5 14,30 58,07 85,0 17,00 20,08 95,0 19,00
47,06 75,5 14,90 58,07 85,0 16,40 50,08 94,5 19,10
26,00 80,0 15,40 54,02 88,0 17,60 50,08 94,5 19,20
26,00 80,0 14,70 48,10 92,0 16,80 47,11 97,5 17,80
53.04 82,0 15,70 48.10 92,0 17h00 47.11 97,5 19h30
53.04 82,0 15,80 54.02 88,0 17h60 26.05 96,0 17h50
43.07 79,0 15.20 45.03 91,5 17h30 26.05 96,0 18h00
39.08 83,5 16h50 45.03 91,5 16,80 43.02 98,0 18h00
39.08 83,5 17h00 35.11 94,0 17h00 43.02 98,0 18.80
43.07 79,0 14.70 26.04 88,0 15,60 32.06 98,5 18h30
29.06 81,0 16h00 51.07 87,0 16,80 32.06 98,5 18.60
29.06 81,0 15,80 51.07 87,0 17h40 33.09 97,0 18.80
50.02 86,0 15.10 26.04 88,0 16h50 33.09 97,0 19h20
25.07 81,5 14.60 35.11 94,0 16.60 35.02 100,0 18h50
25.07 81,5 15,60 52,00 88,5 18h00 35.02 100,0 18h50
25.10 82,5 14.60 44.02 90,0 17h40 26.05 96,0 19h00
47.04 86,0 17h00 44.02 90,0 17h30 26.05 96,0 18h50
47.04 86,0 16h30 24.05 91,0 16h40 25.08 100,5 19.80
37,00 83,0 16h00 24h00 87,0 16.10 25.06 100,0 18.80
37,00 83,0 16,00 24h00 87,0 16,10 25,06 100,0 18h40
34,10 84,0 16,30 24,00 87,0 16,00 25,08 100,5 19,00
47,01 87,5 17,40 24,00 87,0 16,00 30,05 101,0 18,00
47,01 87,5 17,00 53,05 90,0 17,50 30,05 101,0 18,20
30,04 81,0 14,10 53,05 90,0 17,50 36,07 104,5 18,90
23,06 81,5 14,20 52,06 90,0 18,00 36,07 104,5 19,20
23,06 81,5 14,70 52,06 90,0 17,90 35,09 102,0 21,00
30,04 81,0 13,90 53,04 93,0 18,40 35,09 102,0 19,20
78,00 81,0 17,20 22.04 90,0 16h40 21,01 101,5 18,60
41.02 83,5 16.70 22.04 90,0 15,80 21.01 101,5 18.60
41.02 83,5 16h50 46.07 95,5 18.80 40,00 95,5 20h00
28.07 78,0 14,80 46.07 95,5 18.60 42.09 92,5 18h40
28.07 78,0 15h00 47,00 93,5 18h00 42.08 94,0 18h50
36.05 88,0 17h30 47,00 93,5 17,90 35.04 86,0 16h00
35.04 86,0 15h30 39.05 94,5 17h40 36.05 88,0 16.60
Fonte: Dados fornecidos por cortesia de Olga Kwast-Rabben, Ph.D.
7. A tabela a seguir mostra o peso e os níveis totais de colesterol e triglicerídeos em 15 pacientes com hiperlipoproteinemia
primária tipo II imediatamente antes do início do tratamento:
X1 X2
Colesterol total Triglicerídeos
Y Peso (kg) (mg/100 ml) (mg/100 ml)
76 302 139
97 336 101
83 220 57
52 300 56
70 382 113
67 379 42
75 331 84
78 332 186
70 426 164
99 399 205
75 279 230
78 332 186
70 410 160
77 389 153
76 302 139
Calcule o coeficiente de correlação múltipla e teste a significância no nível 0,05.
8. Em um estudo da relação entre excreção de creatinina, altura e peso, os dados mostrados no

tabela a seguir foram coletadas em 20 bebês do sexo masculino:
Creatinina
Excreção
(mg/dia) Peso (kg) Altura (cm)
Infantil Y X1 X2
1 100 9 72
2 115 10 76
3 52 6 59
4 85 8 68
5 135 10 60
6 58 5 58
7 90 8 70
8 60 7 65
9 45 4 54
10 125 11 83
11 86 7 64
12 80 7 66
13 65 6 61
14 95 8 66
15 25 5 57
16 125 11 81
17 40 5 59
(Contínuo )
Creatinina
Excreção
(mg/dia) Peso (kg) Altura (cm)
Infantil Y X1 X2
18 95 9 71
19 70 6 62
20 120 10 75
(a) Encontre a equação de regressão múltipla que descreve a relação entre essas variáveis. (b) Calcule R2
e faça uma análise de variância. (c) Seja X1 ¼ 10 e X2 ¼ 60 e encontre o valor previsto de Y.
9. Foi realizado um estudo para examinar as variáveis consideradas relacionadas à satisfação no trabalho de
funcionários hospitalares não profissionais. Uma amostra aleatória de 15 funcionários deu os seguintes resultados:
codificado Índice de
Pontuação no trabalho Inteligência Pessoal
Satisfação Pontuação Ajustamento
Teste (Y) (X1) (X2)
54 15 8
37 13 1
30 15 1
48 15 7
37 10 4
37 14 2
31 8 3
49 12 7
43 1 9
12 3 1
30 15 1
37 14 2
61 14 10
31 9 1
31 4 5
(a) Encontre a equação de regressão múltipla que descreve a relação entre essas variáveis. (b) Calcule o
coeficiente de determinação múltipla e faça uma análise de variância. (c) Seja X1 ¼ 10 e X2 ¼ 5 e encontre
o valor previsto de Y.
10. Uma equipe de pesquisa médica obteve o índice de adiposidade, insulina basal e valores basais de glicose em 21
indivíduos normais. Os resultados são mostrados na tabela a seguir. Os pesquisadores desejavam investigar a
força da associação entre essas variáveis.
Índice de Insulina basal Glicose basal

Adiposidade (mU/ml) (mg/100 ml)
Y X1 X2
90 12 98
112 10 103
127 14 101
137 11 102
103 10 90
140 38 108
105 9 100
92 6 101
92 8 92
96 6 91
114 9 95
108 9 95
160 41 117
91 7 101
115 9 86
167 40 106
108 9 84
156 43 117
167 17 99
165 40 104
168 22 85
Calcule o coeficiente de correlação múltipla e teste a significância no nível 0,05.
11. Como parte de um estudo para investigar a relação entre o estresse e algumas outras variáveis, os seguintes dados foram
coletados em uma amostra aleatória simples de 15 executivos corporativos. (a) Encontre a equação de regressão de
mínimos quadrados para esses dados. (b) Construa a tabela de análise de variância e teste a hipótese nula de nenhuma
relação entre as cinco variáveis.
(c) Teste a hipótese nula de que cada inclinação no modelo de regressão é igual a zero. (d) Encontre o
coeficiente múltiplo de determinação e o coeficiente de correlação múltipla. Seja a ¼ :05 e encontre o valor de p para cada
teste.
Anual
Medida de Número de anos no Salário
Medida de Tamanho da Empresa presente (1000)
Estresse (Y) (X1) Posição (X2) (X3) Idade (X4)
101 812 15 $ 30 38
60 334 8 20 52
10 377 5 20 27
27 303 10 54 36
(Contínuo )
Anual
Medida de Número de anos no Salário
Medida de Tamanho da Empresa presente (1000)
Estresse (Y) (X1) Posição (X2) (X3) Idade (X4)
89 505 13 52 34
60 401 4 27 45
16 177 6 26 50
184 598 9 52 60
34 412 16 34 44
17 127 2 28 39
78 601 8 42 41
141 297 11 84 58
11 205 4 31 51
104 603 5 38 63
76 484 8 41 30
Para cada um dos estudos descritos nos Exercícios 12 a 16, responda ao máximo possível das seguintes perguntas: (a)
Qual é mais relevante, análise de regressão ou análise de correlação, ou ambas as técnicas são igualmente relevantes?
(b) Qual é a variável dependente? (c) Quais são as variáveis independentes? (d) Quais são as hipóteses nula e alternativa
apropriadas? (e) Quais hipóteses nulas você acha que foram rejeitadas? Porque? (f) Qual é o objetivo mais relevante,
previsão ou estimativa, ou os dois são igualmente relevantes?
Explique sua resposta.

(g) Qual é a população amostrada? (h) Qual
é a população-alvo? (i) Quais variáveis estão
relacionadas a quais outras variáveis? As relações são diretas ou inversas?
(j) Escreva a equação de regressão usando números apropriados para estimativas de parâmetros. (k) Qual é
o valor numérico do coeficiente de determinação múltipla? (l) Forneça valores numéricos para quaisquer
coeficientes de correlação que você puder.
12. Hashimoto et al. (A-7) desenvolveu um modelo de regressão múltipla para prever o número de visitas às salas de emergência
dos hospitais da Universidade Jikei em Tóquio para crianças com crise de asma. Os pesquisadores descobriram que o
número de visitas por noite aumentou significativamente quando as condições climáticas mostraram uma rápida
diminuição da pressão barométrica mais alta, da temperatura do ar mais alta e da umidade mais alta, bem como da
menor velocidade do vento. O modelo final demonstrou que 22% da variação no número de visitas foi explicada pela
variação nas variáveis preditoras mencionadas acima com outras oito variáveis climáticas significativas.
13. A correlação foi um dos muitos procedimentos discutidos em um estudo relatado por Stenvinkel et al. (A-8). Em uma coorte
de 204 indivíduos com doença renal em estágio terminal, eles não encontraram correlações significativas entre log dos
níveis de adiponectina plasmática e idade e nenhuma correlação significativa entre log de adiponectina plasmática e taxa
de filtração glomerular.
14. Van Schuylenbergh et al. (A-9) usaram medidas fisiológicas e antropométricas como variáveis independentes
para prever o desempenho no triathlon (expresso em minutos). Dez triatletas foram submetidos a extensos
testes fisiológicos em natação, ciclismo e corrida. Dentro de 2 semanas após o último teste de laboratório,
todos os indivíduos competiram no Campeonato Nacional Universitário de Triatlo. O modelo de regressão
final foi
TP ¼ 130 9:2MLSSR 25:9MLSSS þ 1:4BLCR
em que TP ¼ desempenho de triatlo em minutos, MLSSR ¼ da velocidade de corrida em MLSS (m/s),

MLSSS ¼ da velocidade de natação em MLSS e BLCR ¼ concentração de lactato sanguíneo em MLSS de
corrida (mmol/L). MLSS refere-se ao estado estacionário máximo de lactato e é geralmente reconhecido
como um bom marcador de potência aeróbica funcional durante o exercício prolongado. Também difere para
cada atividade física. Para o modelo acima R2 ¼ :98.
15. A pressão inspiratória estática máxima (PImáx) na boca é uma medida simples da força muscular respiratória.
Um estudo de Tomalak et al. (A-10) examinou as correlações entre as variáveis com PImax (sentado
medido), volume expiratório forçado (FEV), pico de fluxo expiratório (PEF) e fluxo inspiratório máximo (PIF)
em 144 meninos e 152 meninas com idades entre 7 e 14 anos. Os pesquisadores descobriram que PImax
estava correlacionado com VEF, PFE e PIF em meninos (p ¼ :001; p ¼ :0055 e p ¼ :002; respectivamente)
e para meninas as correlações também foram significativas (p < :001; p < :001 e p < :001, respectivamente).
16. Di Monaco et al. (A-11) usou regressão múltipla para prever a densidade mineral óssea do colo do fêmur (entre
outras localizações). Entre 124 mulheres caucasianas saudáveis na pós-menopausa, eles descobriram que
peso ð Þ , idade ð Þdensidade
e contagem total ,de
mineral óssea.
linfócitos
Alémðdisso,
Þ p < R2
:001
¼p:40.
< :01 p < :001 foram úteis na previsão da
Para cada um dos conjuntos de dados fornecidos nos Exercícios 17 a 19, faça o seguinte conforme achar
apropriado: (a) Obtenha a equação de regressão múltipla de mínimos quadrados. (b) Calcule o coeficiente
amostral de determinação múltipla. (c) Calcule o coeficiente amostral de correlação múltipla. (d) Calcular
coeficientes simples de determinação e correlação. (e) Calcular coeficientes de correlação parciais. (f)
Construir gráficos. (g) Formule hipóteses relevantes, execute os testes apropriados e encontre os valores
de p. (h) Declare as decisões estatísticas e conclusões clínicas que os resultados de seus testes de hipótese
justificam. (i) Use suas equações de regressão para fazer previsões e estimativas sobre a variável
dependente para os valores selecionados das variáveis independentes. (j) Construir intervalos de confiança
para parâmetros populacionais relevantes. (k) Descreva a(s) população(ões) à(s) qual(is) você acha que
suas inferências são aplicáveis.
17. Pellegrino et al. (A-12) levantou a hipótese de que a broncoconstrição máxima pode ser prevista a partir do
efeito broncomotor da inalação profunda e do grau de sensibilidade das vias aéreas à metacolina (MCh).
Um grupo de participantes consistia em 26 indivíduos saudáveis ou levemente asmáticos (22 homens, 4
mulheres) que apresentavam broncoconstrição limitada à inalação de MCh. A média de idade dos pacientes
foi de 31 anos com desvio padrão de 8. Havia um fumante no grupo. Entre os dados coletados em cada
sujeito estavam as seguintes observações sobre várias variáveis de medição da função pulmonar:
(X2) ð Þ X3 ð Þ X6 (X7) (X8) ð Þ X9 ð Þ X10 (X11) VEF1 ð Þ X12 ð Þ X13
(X1) VEF1, VEF1= ð Þ X4 ð Þ X5 M=P MP PD15FEV1 PD40Vm_ 50 ð PD40Vp_ 50 Max decréscimo Vm_ 50 máx. Vp_ 50 Redução
VEF1 % Pred CVF;% Vm_ 50 Vp_ 50 Razão Inclinação (em mg) Þ Em mg ðmg
Þ Em (%) diminuir %ð Þ máxima %ð Þ
5,22 108,75 83,92 123,96 5,30 3,90 6,00 1,36 0,75 1,62 8,44 8,24 6,34 21,40 55,40 74,40
5,38 78,54 111,04 86,19 3,70 3,10 2,85 0,56 1,10 0,69 7,76 7,00 6,18 15,80 50,80 85,14
3,62 94,26 85,28 104,43 4,10 2,70 3,21 1,52 0,44 1,07 6,92 6,61 5,56 30,40 54,36 83,07
3,94 76,58 117,33 3,00 5,65 5,55 0,63 1,02 0,83 6,79 8,52 6,38 16,40 29,10 58,50
4,48 81,99 93,37 76,61 3,75 4,70 3,20 0,80 0,50 1,00 8,79 9,74 6,68 27,80 46,30 76,70
5,28 104,67 82,63 120,09 3,20 6,30 7,40 0,70 0,89 0,55 8,98 8,97 8,19 32,60 70,80 90,00
3,80 84,84 121,1694 89 10,52 10,60 10,04 15,80 35,30 64,90
3,14 6,18 6,58 6,02 37,60 64,10 87,50
5,26 11,85 11,85 11,85 11,70 29,10 41,20
4,87 5,50 5,50 1,00 0,56 11.85 11.85 11.85 10h30 16h40 29,70
5.35 124,71 84,65 5,60 7,00 0,80 0,40 11.98 11.98 11.29 0,00 18h00 47,20
4.30 95,98 80,37 5,78 4,90 1,18 0,59 6.48 6.19 5.11 17h00 48,20 79,60
3,75 87,82 65,79 2,26 1,65 1,37 0,53 6.25 7.02 5.03 27.10 39,53 81,80
4.41 112.21 69,78 3,19 2,95 5,00 1,08 0,57 0,85 7,66 8.08 5,51 24,70 48,80 85,90
4,66 108,37 78,72 99,05 5,90 4,20 1,50 0,49 2,80 0,63 7,79 9,77 6,10 15,00 35,00 70,30
5,19 73,62 122,38 4,39 3,30 3,40 1,33 0,74 1,30 5,15 5,78 4,72 31,40 61,90 86,70
4,32 75,13 95,97 84,38 2,50 4,00 4,00 0,59 1,00 0,71 6,20 6,34 5,10 28,25 60,30 78,00
4,05 88,25 87,30 105,56 5,30 2,70 3,20 1,96 0,76 1,77 5,64 8,52 5,61 18,20 29,50 46,00
3,23 86,74 102,34 1,80 1,70 1,30 0,85 1,38 0,91 3,47 3,43 2,77 21,60 64,50 86,00
3,99 80,18 65,12 73,08 4,60 3,60 3,20 1,21 0,71 1,77 6,40 5,20 6,17 22,50 63,00 77,80
4,37 88,12 9 5,07 1,80 3,80 2,40 0,76 1,58 0,50 5,05 4,97 5,42 35,30 57,00 78,00
2,67 68,11 30,00 30,00 0,7,00 150 3,97 3,95 4,11 32,40 58,80 82,40
4,75 103,71 6,34 5,29 6,04 18,85 47,50 72,20
3,19 9102,687 5,08 4,85 5,16 36,20 83,40 93,00
3,29 8,21 6,90 10,60 21,60 28,10 66,70
2,87 6,24 5,99 7,50 27,00 46,70 68,30
50 e Vp_ 50 ¼ fluxos expiratórios forçados máximos e parciais a 50% da CVF de controle; Razão M=P ¼ razão de Vm_ 50 para Vp_ 50 no
controle Vm_; MP slope = inclinação da regressão dos decréscimos percentuais50 e Vp_ 50 registrado durante o desafio de inalação de Mch;
de Vm_ PD15FEV1 ¼ dose de MCh que diminuiu o VEF1 em 15 por cento do controle; PD40 Vm50 e 50 ¼ doses de Mch que diminuíram
PD4050 Vp_ Vm_em
e Vp50 cortesia
40% do docontrole,
Dr. Riccardo Pellegrino. % max decr = porcentagem de decremento máximo no platô. Fonte: Dados fornecidos
respectivamente;
18. O objetivo de um estudo de O'Brien et al. (A-13) foi avaliar a função do eixo hipotálamo-hipófise-adrenal
(HPA) (conhecidamente alterada na depressão) em pacientes com doença de Alzheimer (DA) por meio
do teste do hormônio adrenocorticotrófico (ACTH), que avalia a função adrenal por medir a produção
de cortisol pela glândula adrenal em resposta a uma injeção de ACTH. Indivíduos com DA (idade
média de 69,9 anos com desvio padrão de 9,8) foram recrutados a partir de encaminhamentos para
uma clínica de memória hospitalar. Indivíduos de controle normais consistiam em cônjuges de pacientes
e residentes de um albergue para idosos (idade média de 73,8 com desvio padrão de 11,6). Havia oito
homens e oito mulheres no grupo AD e 10 homens e oito mulheres no grupo controle. Entre os dados
coletados estavam as seguintes observações sobre idade (C1), idade de início para indivíduos com
DA (C2), duração da história da doença em meses (C3), pontuação do exame cognitivo (C4), nível de
pico de cortisol (C5) e resposta hormonal total (C6):
Indivíduos com Doença de Alzheimer Controles
C1 C2 C3 C4 C5 C6 C1 C2 C3 C4 C5 C6
73 69 48 75 400,00 44610 70 97 419,00 53175

87 83 48 39 565,00 63855 81 93 470,00 54285
60 54 72 67 307,00 31110 82 93 417,00 47160
62 57 60 64 335,00 36000 57 101 215,00 27120
75 70 48 51 352,00 44760 87 91 244,00 23895
63 60 24 79 426,00 47250 88 88 355,00 33565
81 77 48 51 413,00 51825 87 91 392,00 42810
66 64 24 61 402,00 41745 70 100 354,00 45105
78 73 60 32 518,00 66030 63 103 457,00 48765
72 64 72 61 505,00 49905 87 81 323,00 39360
69 65 48 73 427,00 55350 73 94 386,00 48150
76 73 36 63 409,00 51960 87 91 244,00 25830
46 41 60 73 333,00 33030 58 103 353,00 42060
77 75 18 63 591,00 73125 85 93 335,00 37425
64 61 36 59 559,00 60750 58 99 470,00 55140
72 69 30 47 511,00 54945 67 100 346,00 50745
68 100 262,00 28440
62 93 271,00 23595
¼ Não aplicável.
Fonte: Dados fornecidos por cortesia do Dr. John T. O'Brien.
19. Johnson e outros. (A-14) observam que a capacidade de identificar a fonte da informação lembrada é uma função cognitiva
fundamental. Eles conduziram um experimento para explorar a contribuição relativa de pistas perceptivas e informações
de operações cognitivas para déficits relacionados à idade na discriminação de memórias de diferentes fontes externas
(monitoramento de fonte externa). Os sujeitos do experimento incluíram 96 alunos de graduação e pós-graduação (41
homens e 55 mulheres) com idades entre 18 e 27 anos. Entre os dados coletados estavam as seguintes pontuações de
reconhecimento de desempenho em condições de monitoramento de fonte (C1, C2, C3) e pontuações no Teste de
Reconhecimento Facial de Benton (C4), Escala Wechsler de Inteligência para Adultos—Revisada (WAIS-R), Bloco WAIS-
R Subescala de design (C5), subescala de vocabulário WAIS-R (C6), Teste de fluência verbal de Benton (C7) e Teste de
classificação de cartas de Wisconsin (C8):
C1 C2 C3 C4 C5 C6 C7 C8
0,783 2.63 0,808 25 38 62 67 6

0,909 3.36 0,846 50
0,920 2.14 0,616 23 25 53 47 6
0,727 3.36 0,846 25 40 49 58 6
0,737 2,93 0,731 59
0,600 4,07 0,962 19 50 51 35 6
0,840 3,15 0,885 57
0,850 3,06 0,769 55
0,875 3,72 0,923 24 23 52 35 6
(Contínuo )
C1 C2 C3 C4 C5 C6 C7 C8
0,792 3.15 0,884 50

0,680 4.07 0,962 56
0,731 4.64 1.000 23 30 59 47 3
0,826 1,84 0,616 52
0,609 2,98 0,846 56
0,923 4.64 1.000 53
0,773 3.36 0,846 60
0,714 1.62 0,577 23 43 53 42 6
0,667 3,72 0,923 20 32 59 28 6
0,769 1,40 0,423 51
0,565 3,55 0,885 45
0,824 1,78 0,577 45
0,458 1,90 0,615 21 46 50 47 6
0,840 4,07 0,962 59
0,720 4,07 0,962 53
0,917 3,72 0,923 24 31 43 37 6
0,560 4,07 0,926 62
0,840 4,07 0,962 26 22 50 40 6
0,720 4,07 0,962 52
0,783 1,74 0,577 54
0,696 1.62 0,539 57
0,625 3,72 0,923 22 37 55 40 6
0,737 1.12 0,423 47
0,900 1,92 0,654 22 40 46 42 6
0,565 3,55 0,885 22 43 56 64 6
0,680 4.07 0,962 54
0,760 4.07 0,962 58
0,958 1,90 0,615 24 36 46 43 6
0,652 2,98 0,846 54
0,560 4.07 0,962 56
0,500 1,92 0,654 24 42 45 46 6
0,826 2.63 0,808 60
0,783 2.58 0,808 60
0,783 2.63 0,808 49
0,750 2.14 0,692 22 37 62 58 6
0,913 2.11 0,693 46
0,952 1.49 0,539 26 32 48 36 6
0,800 4,07 0,962 59
0,870 3,55 0,885 48
0,652 1,97 0,654 59
0,640 4,07 0,962 25 36 56 54 6
0,692 4,64 1,000 23 23 58 25 6
0,917 3,72 0,923 55
0,760 4.07 0,962 22 35 52 33 6
0,739 3,55 0,885 24 43 58 43 6
(Contínuo )
C1 C2 C3 C4 C5 C6 C7 C8
0,857 3.20 0,808 59

0,727 3.36 0,846 61
0,833 2,80 0,846 56
0,840 4.07 0,962 21 11 49 58 3
0,478 2.27 0,731 60
0,920 4.07 0,962 24 40 64 50 6
0,731 4.64 1.000 20 40 51 50 6
0,920 4.07 0,962 23 50 61 53 6
0,720 4.07 0,962 57
1.000 2.79 0,807 25 47 56 30 6
0,708 3,72 0,923 24 16 57 42 6
1.000 4,64 1,000 25 48 55 54 6
0,739 3,55 0,885 23 27 57 38 6
0,600 4,20 0,962 22 38 57 33 6
0,962 4,64 1,000 25 37 63 31 6
0,772 2,22 0,731 24 48 51 41 6
0,800 2,92 0,847 24 28 47 45 6
0,923 4,64 1,000 25 45 54 48 6
0,870 3,50 0,885 24 44 54 48 5
0,808 4.64 1.000 24 43 57 58 6

1.000 4.07 0,962 25 30 59 49 6
0,870 3,55 0,885 26 44 61 35 6
0,923 4.64 1.000 52
0,958 2.58 0,808 27 32 52 33 6
0,826 3,50 0,885 21 31 61 44 6
0,962 3,72 0,923 23 31 57 38 6
0,783 3,50 0,885 23 46 60 36 6
0,905 3.20 0,808 23 34 55 37 4
1.000 4.64 1.000 23 33 57 33 6
0,875 3,72 0,923 21 34 55 29 6
0,885 4.07 0,962 52
0,913 2.92 0,846 23 44 57 47 6
0,962 4.07 0,961 24 36 54 43 6
0,682 3.36 0,846 20 41 61 34 1
0,810 2.63 0,769 20 40 57 43 6
0,720 2.79 0,808 25 23 64 43 3
0,875 2,80 0,846 24 43 59 43 2
0,923 3,72 0,924 25 40 58 33 6
0,909 3,36 0,846 24 43 56 41 6
0,920 4,07 0,962 24 50 52 28 6
1,000 3,72 0,923 21 45 64 46 6
0,609 3,50 0,885 22 25 49 35 6
¼ Dados ausentes.
Fonte: Dados fornecidos por cortesia da Dra. Doreen M. De Leonardis.
daniel
1. Winters et ai. (A-15) realizou um estudo envolvendo 248 alunos do ensino médio matriculados em cursos introdutórios
de educação física. Os pesquisadores queriam saber se os construtos da teoria cognitiva social estavam correlacionados
com o exercício físico discricionário de “tempo de lazer”. A principal variável de resultado é o STREN, que é o número
de dias na semana em que um aluno do ensino médio se envolveu em atividade física extenuante (definida
operacionalmente como exercício que resulta em suor, respiração difícil e frequência cardíaca acelerada). Os alunos
do estudo preencheram longos questionários dos quais as seguintes variáveis foram derivadas:
SELFR100 - mede a regulação pessoal do comportamento direcionado a objetivos (valores mais altos indicam
mais objetivos orientados).
SS100 – mede suporte social, encorajamento social e expectativa social que são
fornecidos por amigos e familiares para exercício físico (valores mais altos indicam mais apoio).
SSE100 - mede a capacidade percebida de superar barreiras ao exercício (valores mais altos indicam
habilidade superior).
OEVNORM - mede as expectativas de resultado e suas expectativas associadas para o exercício físico (valores
mais altos indicam vínculos percebidos mais fortes com os resultados desejados do exercício).
Com esses dados (LTEXER), (a)
Calcule a correlação bivariada para cada par de variáveis e interprete o significado de cada uma.
(b) Usando STREN como variável dependente, calcule o coeficiente de correlação múltipla. (c) Usando STREN
como variável dependente, calcule o coeficiente de correlação parcial para STREN e SELFR100 após controlar para
SS100. (d) Usando STREN como variável dependente, calcule o coeficiente de correlação parcial para STREN e
SSE100 após controlar para OEVNORM.
Observe que há muitos valores ausentes neste conjunto de dados.

2. Com dados obtidos de um banco de dados nacional sobre parto, Matulavich et al. (A-16) examinou o número de ciclos
de esteroides prescritos que uma mãe tomou durante a gravidez (ESTEROIDES). O tamanho do bebê foi medido pelo
comprimento (cm), peso (gramas) e circunferência da cabeça (cm).
Calcule a correlação do número de cursos de esteróides com cada uma das três variáveis de resultado. Quais são as
hipóteses para seus testes? Quais são os valores-p? Quais são suas conclusões? (O nome do conjunto de dados é
STERLENGTH.)
3. Consulte os dados sobre fatores de risco cardiovascular (RISKFACT). Os sujeitos são 1000 homens envolvidos em
ocupações sedentárias. Você deseja estudar as relações entre os fatores de risco nesta população. As variáveis são
Y ¼ consumo de oxigênio
X1 ¼ pressão arterial sistólica mm Hg ð Þ
X2 ¼ colesterol total mg ð Þ =dl
X3 ¼ colesterol HDL mg ð Þ =dl
X4 ¼ triglicerídeos mg ð Þ = dl
Selecione uma amostra aleatória simples dessa população e faça uma análise estatística apropriada. Prepare um
relatório narrativo de suas descobertas e compare-as com as de seus colegas. Consulte seu instrutor sobre o tamanho
da amostra.
REFERÊNCIAS 537
4. Consulte os dados de 500 pacientes que procuraram tratamento para alívio de sintomas de doenças
respiratórias (RESPDIS). Uma equipe de pesquisa médica está conduzindo um estudo para determinar
quais fatores podem estar relacionados a doenças respiratórias. A variável dependente Y é uma medida
da gravidade da doença. Um valor maior indica uma condição mais séria. As variáveis independentes
são as seguintes:
X1 ¼ educação (série mais alta concluída)

X2 ¼ medida de aglomeração de alojamentos
X3 ¼ medida da qualidade do ar no local de residência (um número maior indica pior qualidade)
X4 ¼ estado nutricional (um número grande indica um maior nível de nutrição)
X5 ¼ tabagismo 0ð ¼ fumante; 1 ¼ não fumante Þ
Selecione uma amostra aleatória simples de indivíduos desta população e conduza uma análise
estatística que você acha que seria de valor para a equipe de pesquisa. Prepare um relatório narrativo
de seus resultados e conclusões. Use ilustrações gráficas quando apropriado. Compare seus resultados
com os de seus colegas. Consulte seu instrutor sobre o tamanho da amostra que você deve selecionar.
REFERÊNCIAS
1. GEORGE W. SNEDECOR e WILLIAM G. COCHRAN, Statistical Methods, Sixth Edition, Iowa State University Press,
Amas, 1967.
2. ROBERT GD STEEL e JAMES H. TORRIE, Princípios e Procedimentos de Estatística, McGraw-Hill, Nova York, 1960.
3. RL ANDERSON e TA BANCROFT, Statistical Theory in Research, McGraw-Hill, Nova York, 1952.
4. MH KUTNER, CJ NACHTSHEIM, J. NETER e W. LI, Applied Linear Statistical Models, Quinta Edição, McGraw
Hill/Irwin, Nova York, 2005.
A-1. DEBRA A. JANSEN e MARY L. KELLER, “Função cognitiva em mulheres idosas residentes na comunidade”, Journal of Gerontological
Nursing, 29 (2003), 34–43.
A-2. M. NAEIJE, “Fatores cinemáticos e antropométricos locais relacionados à abertura máxima da boca em indivíduos saudáveis
Indivíduos”, Journal of Oral Rehabilitation, 29 (2002), 534–539.
A-3. GWI-RYUNG SON, MAY L. WYKLE e JACLENE A. ZAUSZNIEWSKI, “Cuidadoras de crianças adultas coreanas de adultos mais velhos
with Dementia,” Journal of Gerontological Nursing, 29 (2003), 19–28.
A-4. X. WANG, X. SHEN, X. LI e C. MAULI AGRAWAL, “Mudanças relacionadas à idade na rede de colágeno e resistência do osso,” Bone,
31 (2002), 1–7.
A-5. PETER A. ANTON, RONALD T. MITSUYASU, STEVEN G. DEEKS, DAVID T. SCADDEN, BRIDGET WAGNER, CHRISTINE
HUANG, CATHERINE MACKEN, DOUGLAS D. RICHMAN, CINDY CHRISTOPHERSON, FLAVIA BORELLINI, RICHARD
LAZAR e KRISTEN M. HEGE, “ Múltiplas medidas da carga de HIV no sangue e nos tecidos estão correlacionadas entre si,
mas não com parâmetros clínicos em indivíduos avirêmicos”, AIDS, 17 (2003), 53–63.
A-6. OLGA KWAST-RABBEN, ROLF LIBELIUS e HANNU HEIKKILA, “Somatosensory Evoked Potentials following
Stimulation of Digital Nerves,” Muscle and Nerve, 26 (2002), 533–538.
A-7. MITSUO HASHIMOTO, TAIKI FUKUDA, TETSUYA SHIMIZU, SHOU WATANABE , SATOSHI WATANUKI, YOSHIKATSU ETO
e MITSUYOSHI URASHIMA, “Influence of Climate Factors on Emergency Visits for Childhood Asthma Attack,”
Pediatrics International, 46 (2004), 48–52.
A-8. PETER STENVINKEL, ALICIA MARCHELEWSKA, ROBERTO PECOITS-FILHO, OLOF HEIMBURGER , ZHENGZHONG
€
ZHANG, CATHERINE HOFF, CLIFF HOLMES, JOANAS AXELSSON, SIVONNE ARVIDSSON, MARTIN SCHALLING, PETER
BARANY , BENGT LINKHOLM e LOUISE NORDFORS, “Adiponectina na doença renal: relação com fenótipo e variação
genética na codificação genética da adiponectina,” Kidney International, 65 (2004), 274–281.
A-9. R. VAN SCHUYLENBERGH, B. VANDEN EYNDE e P. HESPEL, "Previsão do desempenho do Sprint Triathlon a partir
de testes de laboratório", European Journal of Applied Physiology, 91 (2004), 94–99.
A-10. WALDEMAR TOMALAK, ANDRZEJ POGORZELSKI e JAROSLAW PRUSAK, "Valores normais para pressões
inspiratórias e expiratórias estáticas máximas em crianças saudáveis", Pneumologia Pediátrica, 34 (2002), 42–46.
A-11. MARCO DI MONACO, FULVIA VALLERO, ROBERTO DI MONACO, FULVIO MAUTINO e ALBERTO CAVANNA,
"Contagem total de linfócitos e densidade mineral óssea femoral em mulheres pós-menopáusicas", Journal of Bone
Mineral Metabolism, 22 (2004), 58–63.
A-12. RICCARDO PELLEGRINO, BENEDETTO VIOLANTE e VITO BRUSASCO, “Maximal Bronchoconstriction in Humans:
Relationship to Deep Inhalation and Airway Sensitivity,” American Journal of Respiratory and Critical Care Medicine,
153 (1996), 115–121.
A-13. JT O'BRIEN, D. AMES, I. SCHWEITZER, M. MASTWYK e P. COLMAN, "Enhanced Adrenal Sensitivity to Adrenocorticotrophic
Hormone (ACTH) Is Evidence of HPA Axis Hyperactivity in Alzheimer's Disease,"
Psychological Medicine, 26 (1996), 7–14.
A-14. MARCIA K. JOHNSON, DOREEN M. DE LEONARDIS, SHAHIN HARSHTROUDI e SUSAN A. FERGUSON, "Aging and
Single Versus Multiple Cues in Source Monitoring", Psychology and Aging, 10 (1995), 507-517.
A-15. ERIC R. WINTERS, RICK L. PETOSA e THOMAS E. CHARLETON, “Using Social Cognitive Theory to Explain Discricionário,
'Leisure-Time' Physical Exercise Among High School Students,” Journal of Adolescent Health, 32 (2003), 436– 442.
A-16. ANGELA MATULAVICH, DONNA MILES-CURRY, BARBARAWARNER, BOBBE GREY e o National Institute of Child and
Desenvolvimento da Saúde. Dados analisados no Centro de Consultoria Estatística da Wright State University.
CAPÍTULO 11
ANÁLISE DE REGRESSÃO:
ALGUMAS TÉCNICAS ADICIONAIS
Este capítulo fornece uma introdução a algumas ferramentas e conceitos adicionais

que são úteis na análise de regressão. A apresentação inclui expansões das ideias
e técnicas básicas de análise de regressão que foram apresentadas nos Capítulos
9 e 10.
TÓPICOS
11.1 INTRODUÇÃO
11.2 VARIÁVEIS INDEPENDENTES QUALITATIVAS
11.3 PROCEDIMENTOS DE SELEÇÃO DE VARIÁVEIS
11.4 REGRESSÃO LOGÍSTICA
11.5 RESUMO
Depois de estudar este capítulo, o aluno 1. entenderá como

incluir variáveis qualitativas em uma análise de regressão. 2. entender como usar procedimentos
automatizados de seleção de variáveis para desenvolver
modelos de regressão.
3. ser capaz de realizar regressão logística para dependências dicotômicas e politômicas
variáveis dentadas.
539
540 CAPÍTULO 11 ANÁLISE DE REGRESSÃO: ALGUMAS TÉCNICAS ADICIONAIS
11.1 INTRODUÇÃO
Os conceitos básicos e a metodologia da análise de regressão linear são abordados nos Capítulos 9 e 10. No
Capítulo 9, discutimos a situação em que o objetivo é obter uma equação que possa ser usada para fazer
previsões e estimativas sobre alguma variável dependente a partir do conhecimento de alguns outra variável
única que chamamos de independente, preditora ou variável explicativa. No Capítulo 10, as ideias e técnicas
aprendidas no Capítulo 9 são expandidas para cobrir a situação em que se acredita que a inclusão de
informações sobre duas ou mais variáveis independentes produzirá uma equação melhor para uso em
previsões e estimativas. A análise de regressão é uma ferramenta estatística complexa e poderosa amplamente
empregada na pesquisa em ciências da saúde. Fazer justiça ao assunto requer mais espaço do que o
disponível em um livro introdutório de estatística.
No entanto, para o benefício daqueles que desejam cobertura adicional de análise de regressão, apresentamos
neste capítulo alguns tópicos adicionais que devem ser úteis para o estudante e praticante de estatística.
Suposições de regressão revisitadas Como aprendemos nos Capítulos 9 e 10, há várias suposições
subjacentes ao uso apropriado de procedimentos de regressão.
Freqüentemente, existem certas medições que influenciam fortemente a forma de uma distribuição ou
impactam a magnitude da variância de uma variável medida. Outras vezes, certas variáveis independentes
que estão sendo usadas para desenvolver um modelo são altamente correlacionadas, levando ao
desenvolvimento de um modelo que pode não ser único ou correto.
Dados não normais Muitas vezes, os dados usados para construir um modelo de regressão não são
normalmente distribuídos. Pode-se desejar explorar a possibilidade de que alguns dos pontos de dados
observados sejam discrepantes ou que afetem desproporcionalmente a distribuição dos dados. Tal investigação
pode ser realizada informalmente construindo um gráfico de dispersão e procurando por observações que não
parecem se encaixar com as outras. Alternativamente, muitos pacotes de computador produzem testes formais
para avaliar potenciais observações periféricas na variável dependente ou nas variáveis independentes. Cabe
sempre ao pesquisador, no entanto, justificar quais observações devem ser removidas do conjunto de dados
antes da análise.
Freqüentemente, pode-se desejar tentar uma transformação dos dados. As transformações

matemáticas são úteis porque não afetam as relações subjacentes entre as variáveis.
Uma vez que os testes de hipótese para os coeficientes de regressão são baseados em estatísticas de
distribuição normal, as transformações de dados às vezes podem normalizar os dados na extensão necessária
para realizar tais testes. Transformações simples, como tirar a raiz quadrada das medidas ou tirar o logaritmo
das medidas, são bastante comuns.
EXEMPLO 11.1.1
Os pesquisadores estavam interessados nas concentrações sanguíneas de delta-9-tetrahidrocanabinol (D-9-

THC), o componente psicotrópico ativo da maconha, de 25 sujeitos de pesquisa.
Esses dados são apresentados na Tabela 11.1.1, assim como esses mesmos dados após o uso de uma
transformação log10.
TABELA 11.1.1 Dados de uma amostra aleatória de 25 sujeitos de pesquisa testados para
D-9-THC, Exemplo 11.1.1
Caso não. Concentração (mg/ml) Log10 Concentração (mg/ml)
1 .30 .52
2 2,75 .44
3 2.27 .36
4 2.37 .37
5 1.12 0,05
6 .60 .22
7 .61 .21
8 0,89 0,05
9 .33 .48
10 0,85 .07
11 2.18 .34
12 3,59 .56
13 .28 .55
14 1,90 .28
15 1,71 .23
16 0,85 .07
17 1.53 .18
18 2.25 .35
19 .88 0,05
20 .49 .31
21 4.35 .64
22 .67 .17
23 2.74 .44
24 .79 .10
25 6,94 .84
Os gráficos box-and-whisker do software SPSS para esses dados são mostrados na Figura 11.1.1. Os
dados brutos são claramente distorcidos e um outlier é identificado (observação 25). Uma transformação
log10 , que geralmente é útil para tais dados distorcidos, remove a magnitude do valor discrepante e resulta
em uma distribuição muito mais simétrica em relação à mediana. Portanto, os dados transformados podem
ser usados no lugar dos dados brutos para construir o modelo de regressão.
Embora os dados simétricos não impliquem necessariamente que os dados sejam normais, eles resultam
em um modelo mais apropriado. Testes formais de normalidade, como mencionado anteriormente, sempre
devem ser realizados antes da análise. &
Variâncias de erro desiguais Quando as variâncias dos termos de erro não são iguais, podemos obter uma
equação satisfatória para o modelo, mas, como a suposição de que as variâncias de erro são iguais é
violada, não seremos capazes de realizar testes de hipótese apropriados no coeficientes do modelo. Assim
como foi o caso para superar o problema de não normalidade, as transformações das variáveis de regressão
podem reduzir o impacto de variâncias de erros desiguais.
FIGURA 11.1.1 Gráficos box-and-whisker dos dados do Exemplo 11.1.1.
Variáveis independentes correlacionadas A multicolinearidade é um problema comum que surge quando se

tenta construir um modelo usando muitas variáveis independentes. A proximidade multicolli ocorre quando há
alto grau de correlação entre as variáveis independentes. Por exemplo, imagine que queremos encontrar uma
equação relacionando altura e peso com a pressão arterial. Uma variável comum derivada da altura e do peso
é chamada de índice de massa corporal (IMC). Se tentarmos encontrar uma equação relacionando altura,
peso e IMC com a pressão arterial, podemos esperar encontrar problemas analíticos porque o IMC, por
definição, está altamente correlacionado com a altura e o peso.
O problema surge matematicamente quando as soluções para os coeficientes de regressão são

derivadas. Uma vez que os dados estão correlacionados, podem não ser encontradas soluções que sejam
únicas para um determinado modelo. A solução menos complexa para a multicolinearidade é calcular as
correlações entre todas as variáveis independentes e reter apenas as variáveis que não são altamente
correlacionadas. Uma regra conservadora para remover a redundância no conjunto de dados é eliminar as
variáveis que estão relacionadas a outras com um coeficiente de correlação significativo acima de 0,7.
EXEMPLO 11.1.2
Um estudo sobre obesidade e síndrome metabólica usou dados coletados de 15 estudantes e incluiu pressão
arterial sistólica (PAS), peso e IMC. Esses dados são apresentados na Tabela 11.1.2.
As correlações para as três variáveis são mostradas na Figura 11.1.2. A correlação muito grande e
significativa entre as variáveis peso e IMC sugere que incluir essas duas variáveis no modelo é inadequado
devido ao alto nível de redundância nas informações fornecidas por essas variáveis. Isso faz sentido lógico,
pois o IMC é uma função do peso. O pesquisador agora se depara com a tarefa de decidir qual das variáveis
reter para a construção do modelo de regressão.
11.2 VARIÁVEIS INDEPENDENTES QUALITATIVAS 543
TABELA 11.1.2 Dados de 8 amostras aleatórias de 15 alunos
Caso não. SBP Peso libras.) IMC
1 126 125 24.41

2 129 130 23.77
3 126 132 20.07
4 123 200 27.12
5 124 321 39.07
6 125 100 20,90
7 127 138 22,96
8 125 138 24.44
9 123 149 23.33
10 119 180 25.82
11 127 184 26.40
12 126 251 31.37
13 122 197 26,72
14 126 107 20.22
15 125 125 23.62
Correlações: PAS, Peso, IMC
SBP Peso
Peso p- 0,289
valor 0,296
IMC 0,213 0,962

valor-p 0,447 0,000
FIGURA 11.1.2 Correlações calculadas no software MINITAB para os dados do Exemplo 11.1.2. &
11.2 VARIÁVEIS INDEPENDENTES QUALITATIVAS
As variáveis independentes consideradas na discussão do Capítulo 10 foram todas quantitativas;

isto é, eles produziram valores numéricos que eram contagens ou medições no sentido usual da
palavra. Por exemplo, algumas das variáveis independentes usadas em nossos exemplos e
exercícios foram idade, nível educacional, porosidade do colágeno e resistência à tração do colágeno.
Freqüentemente, entretanto, é desejável usar uma ou mais variáveis qualitativas como variáveis
independentes no modelo de regressão. Variáveis qualitativas, lembre-se, são aquelas variáveis
cujos “valores” são categorias e que transmitem o conceito de atributo em vez de quantidade ou
quantidade. A variável estado civil, por exemplo, é uma variável qualitativa cujas categorias são
“solteiro”, “casado”, “viúvo” e “divorciado”. Outros exemplos de variáveis qualitativas incluem sexo
(masculino ou feminino), diagnóstico, raça, ocupação e
estado de imunidade a alguma doença. Em certas situações, um investigador pode suspeitar que a inclusão
de uma ou mais variáveis como essas na equação de regressão contribuiria significativamente para a redução
da soma dos quadrados do erro e, assim, forneceria estimativas mais precisas dos parâmetros de interesse.
Suponha, por exemplo, que estejamos estudando a relação entre a variável dependente pressão
arterial sistólica e as variáveis independentes peso e idade. Também podemos querer incluir a variável
qualitativa sexo como uma das variáveis independentes. Ou suponha que desejamos obter informações sobre
a natureza da relação entre a capacidade pulmonar e outras variáveis relevantes. Os candidatos para inclusão
no modelo podem consistir em variáveis quantitativas como altura, peso e idade, bem como variáveis
qualitativas como sexo, área de residência (urbana, suburbana, rural) e condição de fumante (fumante atual,
ex-fumante , nunca fumei).
Variáveis fictícias Para incorporar uma variável independente qualitativa no modelo de regressão múltipla, ela
deve ser quantificada de alguma maneira. Isso pode ser feito através do uso do que é conhecido como
variáveis fictícias.
DEFINIÇÃO
Uma variável dummy é uma variável que assume apenas um número finito de valores
(como 0 ou 1) com a finalidade de identificar as diferentes categorias de uma variável
qualitativa.
O termo “dummy” é usado para indicar o fato de que os valores numéricos (como 0 e 1) assumidos
pela variável não têm significado quantitativo, mas são usados apenas para identificar diferentes categorias
da variável qualitativa em consideração. As variáveis qualitativas às vezes são chamadas de variáveis
indicadoras e, quando há apenas duas categorias, às vezes são chamadas de variáveis dicotômicas.
A seguir estão alguns exemplos de variáveis qualitativas e as variáveis fictícias usadas para quantificá-
las:
Variável Qualitativa Variável fictícia
Sexo (masculino, feminino): 1 para

x1 ¼ :
homem 0 para mulher
Local de residência (urbano, rural, suburbano): 1 para urbano

x1 ¼ :
0 para rural e suburbano
1 para rural
x2 ¼ :
0 para urbano e suburbano
Tabagismo [fumante atual, ex-fumante (não fuma há 5 1 para fumante atual

x1 ¼ :
anos ou menos), ex-fumante (não fuma há mais de 5 anos), 0 caso contrário

nunca fumou]:
1 para ex-fumanteð Þ 5 anos
x2 ¼ :
0 caso contrário
1 para ex-fumanteð Þcaso

> 5 anos
contrário
0
x3 ¼ :
Observe nestes exemplos que quando a variável qualitativa possui k categorias, k 1 variáveis
fictícias devem ser definidas para que todas as categorias sejam devidamente codificadas. Esta regra é
aplicável para qualquer regressão múltipla contendo uma constante de interceptação. A variável sexo, com
duas categorias, pode ser quantificada pelo uso de apenas uma variável dummy, enquanto três variáveis
dummy são necessárias para quantificar a variável tabagismo, que possui quatro categorias.
Os exemplos a seguir ilustram alguns dos usos de variáveis qualitativas na regressão múltipla. No
primeiro exemplo assumimos que não há interação entre as variáveis independentes. Como a suposição
de nenhuma interação não é realista em muitos casos, ilustramos, no segundo exemplo, a análise que é
apropriada quando a interação entre variáveis é contabilizada.
EXEMPLO 11.2.1
Em um estudo de fatores considerados associados ao peso ao nascer, uma amostra aleatória simples de
100 registros de nascimento foi selecionada do Registro de Nascimento de 2001 da Carolina do Norte (A-1).
A Tabela 11.2.1 mostra, para três variáveis, os dados extraídos de cada registro. Existem duas variáveis
independentes: duração da gestação (semanas), que é quantitativa, e tabagismo da mãe (fumante), uma
variável qualitativa. A variável dependente é o peso ao nascer (gramas).
TABELA 11.2.1 Dados de uma amostra aleatória simples de 100 nascimentos do Registro de Nascimentos
da Carolina do Norte, Exemplo 11.2.1
Nº do caso, gramas, semanas, fumo Caso, nº, gramas, semanas, fumo
1 3147 40 0 51 3232 38 0
2 2977 41 0 52 3317 40 0
3 3119 38 0 53 2863 37 0
4 3487 38 0 54 3175 37 0
5 4111 39 0 55 3317 40 0
6 3572 41 0 56 3714 34 0
7 3487 40 0 57 2240 36 0
8 3147 41 0 58 3345 39 0
9 3345 38 1 59 3119 39 0
10 2665 34 0 60 2920 37 0
11 1559 34 0 61 3430 41 0
12 3799 38 0 62 3232 35 0
13 2750 38 0 63 3430 38 0
14 3487 40 0 64 4139 39 0
15 3317 38 0 65 3714 39 0
16 3544 43 1 66 1446 28 1
17 3459 45 0 67 3147 39 1
18 2807 37 0 68 2580 31 0
19 3856 40 0 69 3374 37 0
20 3260 40 0 70 3941 40 0
(Contínuo )
Caso não. Gramas Semanas Caixa de Fumaça Nº Gramas Semanas Fumaça
21 2183 42 1 71 2070 37 0
22 3204 38 0 72 3345 40 0
23 3005 36 0 73 3600 40 0
24 3090 40 1 74 3232 41 0
25 3430 39 0 75 3657 38 1
26 3119 40 0 76 3487 39 0
27 3912 39 0 77 2948 38 0
28 3572 40 0 78 2722 40 0
29 3884 41 0 79 3771 40 0
30 3090 38 0 80 3799 45 0
31 2977 42 0 81 1871 33 0
32 3799 37 0 82 3260 39 0
33 4054 40 0 83 3969 38 0
34 3430 38 1 84 3771 40 0
35 3459 41 0 85 3600 40 0
36 3827 39 0 86 2693 35 1
37 3147 44 1 87 3062 45 0
38 3289 38 0 88 2693 36 0
39 3629 36 0 89 3033 41 0
40 3657 36 0 90 3856 42 0
41 3175 41 1 91 4111 40 0
42 3232 43 1 92 3799 39 0
43 3175 36 0 93 3147 38 0
44 3657 40 1 94 2920 36 0
45 3600 39 0 95 4054 40 0
46 3572 40 0 96 2296 36 0
47 709 25 0 97 3402 38 0
48 624 25 0 98 1871 33 1
49 2778 36 0 99 4167 41 0
50 3572 35 0 100 3402 37 1
Fonte: John P. Holcomb, amostra e codificação dos dados do Registro de Nascimento da Carolina do Norte encontrados em
www.irss.unc. edu/ ncvital/ bfd1down.html.
Solução: Para a análise, quantificamos o status de fumante por meio de uma variável dummy que é codificada
como 1 se a mãe for fumante e 0 se ela não for fumante. Os dados na Tabela 11.2.1 são
plotados como um diagrama de dispersão na Figura 11.2.1. O diagrama de dispersão sugere
que, em geral, períodos mais longos de gestação estão associados a maiores pesos ao
nascer.
Para obter informações adicionais sobre a natureza desses dados, podemos inseri-los
em um computador e empregar um programa apropriado para realizar análises adicionais.
Por exemplo, inserimos as observações y1 ¼ 3147, x11 ¼ 40, x21 ¼ 0, para o primeiro caso;
Y2 ¼ 2977, x12 ¼ 41, x22 ¼ 0 para o segundo caso; e assim por diante.
A Figura 11.2.2 mostra a saída do computador obtida com o uso do programa de regressão
múltipla do MINITAB.
5000
4000
3000
(gramas)
nascer
Peso
ao
2000
1000
0
25 30 35 40 45 50
Duração da gestação (semanas)
FIGURA 11.2.1 Pesos ao nascer e duração da gestação para 100 nascimentos: (~) mães fumantes e ()
mães não fumantes.
A equação de regressão é
gramas 1724 130 x1 294 x2
preditor Coef SE Coef

Semanas 1724,4 558,8 V 3,09 P
constantes 130,05 14,52 8,96 0,003
(x1) fumo (x2) 294,4 135,8 2,17 0,000 0,033
S 484,6 R-Sq 46,4% R-Sq(ajuste) 45,3%
FONTE DF SS MS F
Regressão 2 19689185 9844593 41,92 P 0,000
Erro residual 97 22781681 234863
Total 99 42470867
FONTE x1 DF Seq SS
x2 11 18585166
1104020
FIGURA 11.2.2 Impressão parcial do computador, análise de regressão múltipla do MINITAB.

Exemplo 11.2.1.
Vemos na impressão que a equação de regressão múltipla é þb^ 1x1j þb^
^yj ¼ b^0 2x2j

(11.2.1)
^yj ¼ 1724:4 þ 130:05x1j 294:4x2j
Para observar o efeito nesta equação quando desejamos considerar apenas os

nascimentos de mães fumantes, fazemos x2j ¼ 1. A equação então se torna ^yj ¼ 1724:4 þ
130:05x1j 294:4ð1Þ
(11.2.2)
¼ 2018:8 þ 130:05x1j
que tem uma interceptação y de 2018,8 e uma inclinação de 130. Observe que a
interceptação y para a nova equação é igual
0 a (b^ þ b^1) ¼ [1724,4þ (294,4)] ¼ 2018.
Agora vamos considerar apenas nascimentos de mães não fumantes. Quando
fazemos x2 ¼ 0, nossa equação de regressão se reduz a
^yj ¼ 1724:4 þ 130:05x1j 294ð0Þ

(11.2.3)
¼ 1724:4 þ 130:05x1j
A inclinação dessa equação é a mesma que a inclinação da equação para mães

fumantes, mas as interceptações y são diferentes. A interceptação y para a equação
associada às mães não fumantes é maior do que a das mães fumantes. Esses resultados
mostram que, para essa amostra, os bebês nascidos de
5000
4000
mães
fumantes
3000 mães não

fumantes
(gramas)
nascer
Peso
ao
2000
1000
0
25 30 35 40 45 50
Duração da gestação (semanas)

FIGURA 11.2.3 Pesos ao nascer e duração da gestação para 100 nascimentos e as linhas de regressão
ajustadas: (~) mães fumantes e () mães não fumantes.
as mães que não fumam pesavam, em média, mais do que os filhos de mães fumadoras,
quando se considera a duração da gestação. O valor da diferença, em média, é de 294
gramas. Dito de outra forma, podemos dizer que para esta amostra, os bebês nascidos
de mães que fumam pesaram, em média, 294 gramas a menos do que os bebês
nascidos de mães que não fumam, quando se considera o tempo de gestação. A Figura
11.2.3 mostra o diagrama de dispersão dos dados originais junto com um gráfico das
duas linhas de regressão (Equações 11.2.2 e 11.2.3). &
EXEMPLO 11.2.2
Neste ponto surge uma questão sobre quais inferências podemos fazer sobre a população amostrada
com base nos resultados amostrais obtidos no Exemplo 11.2.1. Em primeiro lugar, queremos saber se
a diferença amostral de 294 gramas é significativa. Em outras palavras, fumar afeta o peso ao nascer?
Podemos responder a essa pergunta por meio do seguinte procedimento de teste de hipóteses.
Solução:
1. Dados. Os dados são dados no Exemplo 11.2.1.

2. Suposições. Presumimos que as suposições subjacentes à análise de regressão
múltipla sejam atendidas.
3. Hipóteses. H0: b2 ¼ 0; HA: b2 6¼ 0. Suponha que sejamos a ¼ 0,05.
4. Estatística de teste. A estatística de teste é t ¼ (b^
2 0)/sb^ 2.
5. Distribuição da estatística de teste. Quando as suposições são atendidas e H0 é
verdadeira, a estatística de teste é distribuída como t de Student com 97 graus de
liberdade.
6. Regra de decisão. Rejeitamos H0 se o t calculado for maior ou igual a 1,9848 ou

menor ou igual a 1,9848 (obtido por interpolação).
7. Cálculo da estatística de teste. O valor calculado da estatística de teste aparece na

Figura 11.2.2 como a razão t para o coeficiente associado à variável que aparece
na Coluna 4 da Tabela 11.2.1. Este coeficiente, é claro, é b^
2. Vemos que o t calculado é 2,17.
8. Decisão estatística. Como 2,17 < 1,9848, rejeitamos H0.

9. Conclusão. Concluímos que, na população amostrada, o fato de as mães fumarem
está associado à redução do peso ao nascer de seus bebês.
10. valor p. Para este teste temos p ¼ .033 da Figura 11.2.2.

&
A Intervalo de confiança para b2 Dado que podemos concluir que, na população amostrada, o tabagismo
das mães tem um efeito sobre o peso ao nascer de seus bebês, podemos agora indagar sobre a
magnitude do efeito. Nosso melhor
a estimativa pontual da diferença média nos pesos ao nascer, quando se leva em conta a duração da gestação, é
de 294 gramas a favor de bebês nascidos de mães que não fumam. Podemos obter uma estimativa de intervalo do
valor médio da diferença usando informações da impressão do computador por meio da seguinte expressão:
b^2
tsb^ 2
Para um intervalo de confiança de 95%, temos
294:4 1:9848 135 ð Þ :8 ð
563:9; 24:9Þ
Portanto, temos 95% de confiança de que a diferença está entre cerca de 564 gramas e 25 gramas.
Vantagens das variáveis fictícias O leitor pode ter presumido corretamente que uma análise alternativa dos dados
do Exemplo 11.2.1 consistiria em ajustar duas equações de regressão separadas: uma para a subamostra de mães
que fumam e outra para a subamostra daquelas que não fumam. Essa abordagem, no entanto, carece de algumas
das vantagens da técnica de variável dummy e é um procedimento menos desejável quando o último procedimento
é válido. Se pudermos justificar a suposição de que as duas linhas de regressão separadas têm a mesma inclinação,
podemos obter uma estimativa melhor dessa inclinação comum por meio do uso de variáveis fictícias, o que envolve
o agrupamento dos dados das duas subamostras. No Exemplo 11.2.1, a estimativa usando uma variável fictícia é
baseada em um tamanho amostral total de 100 observações, enquanto estimativas separadas seriam baseadas em
uma amostra de 85 fumantes e apenas 15 não fumantes. A abordagem de variáveis dummy também produz
inferências mais precisas em relação a outros parâmetros, uma vez que mais graus de liberdade estão disponíveis
para o cálculo do quadrado médio do erro.
Uso de variáveis fictícias: interação presente Agora vamos considerar a situação em que se supõe que a interação
entre as variáveis esteja presente. Suponha, por exemplo, que tenhamos duas variáveis independentes: uma variável
quantitativa X1 e uma variável qualitativa com três níveis de resposta produzindo as duas variáveis fictícias X2 e X3.
O modelo, então, seria
yj ¼ b0 þ b1X1j þ b2X2j þ b3X3j þ b4X1jX2j þ b5X1jX3j þ ej (11.2.4)
em que b4X1jX2j e b5X1jX3j são chamados de termos de interação e representam a interação entre as variáveis
independentes quantitativas e qualitativas. Observe que não há necessidade de incluir no modelo o termo contendo
X2jX3j; será sempre zero porque quando X2 ¼ 1; X3 ¼ 0, e quando X3 ¼ 1; X2 ¼ 0. O modelo da Equação 11.2.4
permite uma inclinação diferente e interceptação Y para cada nível da variável qualitativa.
Suponha que usamos codificação de variável fictícia para quantificar a variável qualitativa da seguinte forma:
1 para nível 1
X2 ¼
0 caso contrário
1 para nível 2
X3 ¼
0 caso contrário
As três equações de regressão de amostra para os três níveis da variável qualitativa, então, são as seguintes:
Nível 1 ð Þ X2 ¼ 1; X3 ¼ 0 ^yj ¼
b^ þb^ 1x1j
0 þb^ 2ð Þþ 1 b^ 3ð Þþ 0 b^ 4x1jð Þþ 1 b^ 5x1jð Þ0 ¼ b^
þb^ 1x1j (11.2.5)
0 þb^ þb^ 4x1j 2¼ b^ þ þ b^ þ þ ^ 4x1j _
0 2 1
Nível 2 ð X2 ¼ 0; X3 ¼ 1 Þ þb^
^yj ¼ b^ 0 1x1j þb^ 2ð Þþ 0 b^ 3ð Þþ 1 b^ 4x1jð Þþ 0 b^ 5x1jð Þ1 þb^

¼ b^ 0 1x1j þb^ þb^ 5x1j (11.2.6)
3 ¼ b^ þb^ þ b^ þb^
0 3 1 5x1j _
Nível 3 ð X2 ¼ 0; X3 ¼ 0 Þ þb^
^yj ¼ b^ 0 1x1j þb^ 2ð Þþ 0 b^ 3ð Þþ 0 b^ 4x1jð Þþ 0 b^ 5x1jð Þ0 þb^

(11.2.7)
¼ b^ 0 1x1j
Vamos ilustrar esses resultados por meio de um exemplo.
EXEMPLO 11.2.3
Uma equipe de pesquisadores de saúde mental deseja comparar três métodos (A, B e C) de tratamento da depressão
grave. Eles também gostariam de estudar a relação entre idade e eficácia do tratamento, bem como a interação (se
houver) entre idade e tratamento.
Cada membro de uma amostra aleatória simples de 36 pacientes, comparável em relação ao diagnóstico e à
gravidade da depressão, foi designado aleatoriamente para receber o tratamento A, B ou C. Os resultados são
mostrados na Tabela 11.2.2. A variável dependente Y é a eficácia do tratamento, a variável independente quantitativa
X1 é a idade do paciente no aniversário mais próximo e a variável independente tipo de tratamento é uma variável
qualitativa que ocorre em três níveis. A seguinte codificação de variável fictícia é usada para quantificar a variável
qualitativa:
1 para tratamento A
X2 ¼ 0 caso contrário
1 para tratamento B
X3 ¼ 0 caso contrário
O diagrama de dispersão para esses dados é mostrado na Figura 11.2.4. A Tabela 11.2.3 mostra os dados
conforme eles foram inseridos em um computador para análise. A Figura 11.2.5 contém a impressão da análise
usando o programa de regressão múltipla do MINITAB.
Solução: Agora vamos examinar a impressão para ver o que ela fornece no que diz respeito à compreensão da
natureza das relações entre as variáveis. A equação dos mínimos quadrados é
^yj ¼ 6:21 þ 1:03x1j þ 41:3x2j þ 22:7x3j :703x1jx2j :510x1jx3j

TABELA 11.2.2 Dados para o Exemplo 11.2.3
Medida de eficácia Era Método de Tratamento
56 21 UMA
41 23 B
40 30 B
28 19 C
55 28 UMA
25 23 C
46 33 B
71 67 C
48 42 B
63 33 UMA
52 33 UMA
62 56 C
50 45 C
45 43 B
58 38 UMA
46 37 C
58 43 B
34 27 C
65 43 UMA
55 45 B
57 48 B
59 47 C
64 48 UMA
61 53 UMA
62 58 B
36 29 C
69 53 UMA
47 29 B
73 58 UMA
64 66 B
60 67 B
62 63 UMA
71 59 C
62 51 C
70 67 UMA
71 63 C
As três equações de regressão para os três tratamentos são as seguintes:
Tratamento A (Equação 11.2.5)
^yj ¼ ð6:21 þ 41:3Þþð1:03 :703Þx1j

¼ 47:51 þ :327x1j
80
75
70
65
60
55
50
tratamento
Eficácia
do
45
40
35
30
25
15 20 25 30 35 40 45 50 55 60 65 70 75 80
Era
FIGURA 11.2.4 Diagrama de dispersão de dados para o Exemplo 11.2.3: () tratamento A, (~) tratamento
B, (&) tratamento C.
Tratamento B (Equação 11.2.6)
^yj ¼ ð6:21 þ 22:7Þþð1:03 :510Þx1j

¼ 28:91 þ :520x1j
Tratamento C (Equação 11.2.7)
^yj ¼ 6:21 þ 1:03x1j
A Figura 11.2.6 contém o diagrama de dispersão dos dados originais juntamente com as
linhas de regressão para os três tratamentos. A inspeção visual da Figura 11.2.6 sugere que os
tratamentos A e B não diferem muito em relação às suas inclinações, mas suas interceptações
em y são consideravelmente diferentes. O gráfico sugere que o tratamento A é melhor do que o
tratamento B para pacientes mais jovens, mas a diferença é menos dramática com pacientes
mais velhos. O tratamento C parece ser decididamente menos desejável do que os tratamentos
A e B para pacientes mais jovens, mas é tão eficaz quanto o tratamento B para pacientes mais
velhos.
Essas impressões subjetivas são compatíveis com a afirmação de que há interação entre
tratamentos e idade.
Procedimentos de Inferência
As relações que vemos na Figura 11.2.6, no entanto, são resultados de amostra. O que podemos concluir sobre
a população da qual a amostra foi extraída?
Para obter uma resposta, vamos olhar para as razões t na impressão do computador na Figura 11.2.5.
Cada um deles é a estatística de teste
0
t ¼b^ i
s
b^ eu
TABELA 11.2.3 Dados do Exemplo 11.2.3 Codificados para Análise de Computador
Y X1 X2 X3 X1X2 X1X3
56 21 1 0 21 0
55 28 1 0 28 0
63 33 1 0 33 0
52 33 1 0 33 0
58 38 1 0 38 0
65 43 1 0 43 0
64 48 1 0 48 0
61 53 1 0 53 0
69 53 1 0 53 0
73 58 1 0 58 0
62 63 1 0 63 0
70 67 1 0 67 0
41 23 0 1 0 23
40 30 0 1 0 30
46 33 0 1 0 33
48 42 0 1 0 42
45 43 0 1 0 43
58 43 0 1 0 43
55 45 0 1 0 45
57 48 0 1 0 48
62 58 0 1 0 58
47 29 0 1 0 29
64 66 0 1 0 66
60 67 0 1 0 67
28 19 0 0 0 0
25 23 0 0 0 0
71 67 0 0 0 0
62 56 0 0 0 0
50 45 0 0 0 0
46 37 0 0 0 0
34 27 0 0 0 0
59 47 0 0 0 0
36 29 0 0 0 0
71 59 0 0 0 0
62 51 0 0 0 0
71 63 0 0 0 0
para testar H0: bi¼ 0. Vemos pela Equação 11.2.5 que a interceptação y da linha de regressão
para o tratamento A é igual0 aþb^
tob^
2. Visto que
t crítico dea2,0423
razão t(para
de 8,12 para testar
a ¼,05), H0: b2¼
podemos 0 éH0
rejeitar maior
que que
b2¼o
0 e concluir que a interceptação y da linha de regressão populacional para o tratamento A é
diferente da interceptação y da linha de regressão populacional para o tratamento C, que tem um
y- interceptação de b0. De forma similar,
A equação de regressão é
y = 6,21 + 1,03 x1 + 41,3 x2 + 22,7 x3 - 0,703 x4 - 0,510 x5
preditor Coef Stdev t-ratio p

Constante 6,211 3,350 1,85 0,074
x1 x2 x3 1,03339 0,07233 14,29 0,000
4x 5x 41,304 5,085 8,12 0,000
22,707 5,091 4,46 0,000
-0,7029 0901,0 -6,45 000,0
-0,5097 4011,0 -4,62 000,0
s = 3,925 R-quadrado = 91,4% R-sq1adj2 = 90,0%
FONTE DF SS EM F p
Regressão 5 4932,85 986,57 64.04 0,000
Erro 30 462,15 15,40
Total 35 5395,00
FONTE x1 FD 1 SEQ SS
x2 x3 x4 x5 1 3424,43
1 803,80
1 1,19
1 375,00
328,42
FIGURA 11.2.5 Impressão de computador, análise de regressão múltipla do MINITAB, Exemplo 11.2.3.
80 Tratamento C
75
Tratamento A
70
65 Tratamento B
60
55
50
tratamento
Eficácia
do
45
40
35
30
25
15 20 25 30 35 40 45 50 55 60 65 70 75 80
Era
FIGURA 11.2.6 Diagrama de dispersão dos dados para o Exemplo 11.2.3 com as linhas de regressão
ajustadas: () tratamento A, (~) tratamento B, (&) tratamento C.
como a proporção de 4,46 para testar H0: b3¼ 0 também é maior que o t crítico de 2,0423, podemos concluir
(no nível de significância de 0,05) que a interceptação y da linha de regressão da população para o tratamento
B também é diferente da interceptação y da linha de regressão da população para o tratamento C. (Veja a
interceptação y da Equação 1l.2.6.)
Agora vamos considerar as inclinações. Vemos pela Equação 11.2.5 que a inclinação da linha de
regressão para o tratamento A é igual a b^1 (a inclinação da linha para o tratamento C) þb^4.
Como a razão t de 6,45 para testar H0: b4 ¼ 0 é menor que o t crítico de 2,0423, podemos
concluir (para a ¼,05) que as inclinações das linhas de regressão da população para os
tratamentos A e C são diferentes. Da mesma forma, como a razão t calculada para testar H0:
b5 ¼ 0 também é menor que 2,0423, concluímos (para a ¼,05) que as linhas de regressão da
população para os tratamentos B e C têm inclinações diferentes (consulte a inclinação da
Equação 11.2. 6). Assim, concluímos que há interação entre idade e tipo de tratamento. Isso
se reflete na falta de paralelismo entre as linhas de regressão na Figura 11.2.6. &
Outra questão de interesse é esta: a inclinação da linha de regressão da população para o tratamento
A é diferente da inclinação da linha de regressão da população para o tratamento B? Responder a essa
pergunta requer técnicas computacionais além do escopo deste texto. O leitor interessado deve consultar
livros dedicados especificamente à análise de regressão.
Na Seção 10.4, o leitor foi avisado de que há problemas envolvidos em fazer inferências múltiplas a
partir dos mesmos dados de amostra. Novamente, estão disponíveis livros sobre análise de regressão que
podem ser consultados para procedimentos a serem seguidos quando múltiplas inferências, como as discutidas
nesta seção, são desejadas.
Discutimos apenas duas situações em que o uso de variáveis fictícias é apropriado. Modelos mais
complexos envolvendo o uso de uma ou mais variáveis independentes qualitativas na presença de duas ou
mais variáveis quantitativas podem ser apropriados em certas circunstâncias. Modelos mais complexos são
discutidos em muitos livros dedicados ao assunto da análise de regressão múltipla.
Neste ponto, pode ser evidente que existem muitas semelhanças entre o uso de um modelo de
regressão linear usando variáveis fictícias e a abordagem básica ANOVA. Em ambos os casos, tenta-se
modelar a relação entre variáveis preditoras e uma variável de resultado.
No caso da regressão linear, geralmente estamos mais interessados na previsão e, na ANOVA, geralmente
estamos mais interessados na comparação de médias. Se o desejo é comparar médias usando regressão,
pode-se desenvolver um modelo para prever a resposta média, digamos mi, em vez de um resultado, yi.
Modelar a resposta média usando regressão com variáveis fictícias é equivalente a ANOVA. Para o aluno
interessado, sugerimos o livro de Bowerman e O'Connell (1), que fornecem um exemplo de uso de ambas as
abordagens para os mesmos dados.
EXERCÍCIOS
Para cada exercício faça o seguinte:
(a) Desenhe um diagrama de dispersão dos dados usando diferentes símbolos para as diferentes variáveis
categóricas. (b) Use codificação de variável fictícia e regressão para analisar os dados. (c) Realize testes de
hipóteses apropriados e construa intervalos de confiança apropriados usando sua escolha de significância e
níveis de confiança.
(d) Encontre o valor de p para cada teste que você realiza.
EXERCÍCIOS 557
11.2.1 Para indivíduos submetidos a transplantes de células-tronco, as células dendríticas (DCs) são células apresentadoras de
antígenos críticas para a geração de respostas tumorais imunológicas. Bolwell et ai. (A-2) estudaram DCs linfóides
em 44 indivíduos submetidos a transplante autólogo de células-tronco. A variável de resultado é a concentração de
células DC2 medida por citometria de fluxo. Uma das variáveis independentes é a idade do sujeito (anos), e a
segunda variável independente é o método de mobilização. Durante a quimioterapia, 11 indivíduos receberam fator
estimulador de colônias de granulócitos (G-CSF) mobilizador (mg/kg/dia) e 33 receberam etoposídeo (2 g=m2). O
mobilizador é uma espécie de célula progenitora do sangue que desencadeia a formação das células DC. Os
resultados foram os seguintes:
G-CSF Etoposídeo
DC Era DC Era DC Era DC Era
6.16 65 3.18 70 4.24 60 4.09 36

6.14 55 2.58 64 4,86 40 2.86 51
5.66 57 1,69 65 4.05 48 2.25 54
8.28 47 2.16 55 5.07 50 0,70 50
2,99 66 3.26 51 4.26 23 0,23 62
8,99 24 1.61 53 11.95 26 1.31 56
4.04 59 6.34 24 1,88 59 1.06 31
6.02 60 2.43 53 6.10 24 3.14 48
10.14 66 2.86 37 0,64 52 1,87 69
27.25 63 7.74 65 2.21 54 8.21 62
8.86 69 11.33 19 6.26 43 1.44 60
Fonte: Dados fornecidos por cortesia de Lisa Rybicki, MS
11.2.2 Segundo Pandey et al. (A-3) carcinoma da vesícula biliar não é infreqüente. Um dos principais fatores de risco para o
câncer de vesícula biliar é a colelitíase, a presença assintomática de cálculos na vesícula biliar. Os pesquisadores
realizaram um estudo caso-controle de 50 indivíduos com câncer de vesícula biliar e 50 indivíduos com colelitíase.
De interesse foi a concentração de produtos de peroxidação lipídica na bile da vesícula biliar, uma condição que pode
dar origem ao câncer de vesícula biliar. O produto da peroxidação lipídica melonaldeído (MDA, mg=mg) foi usado
para medir a peroxidação lipídica. Uma das variáveis independentes consideradas foi a concentração do citocromo
P-450 (CYTO, nmol/mg). Os pesquisadores usaram o estado da doença (câncer da vesícula biliar vs. colelitíase) e a
concentração do citocromo P-450 para prever o MDA. Os seguintes dados foram coletados.
Colelitíase câncer de vesícula
MDA CITO MDA CITO MDA CITO MDA CITO
0,68 12.60 11.62 4,83 1,60 22,74 9,20 8,99

0,16 4,72 2.71 3,25 4,00 4,63 0,69 5,86
0,34 3,08 3,39 7,03 4,50 9,83 10,20 28,32
3,86 5,23 6,10 9,64 0,77 8,03 3,80 4,76
0,98 4,29 1,95 9,02 2,79 9,11 1,90 8,09
3,31 21,46 3,80 7,76 8,78 7,50 2,00 21,05
1,11 10,07 1,72 3,68 2,69 18,05 7,80 20,22
4.46 5.03 9,31 11.56 0,80 3,92 16.10 9,06
1.16 11.60 3,25 10.33 3.43 22,20 0,98 35,07
(Contínuo )
Colelitíase câncer de vesícula
MDA CITO MDA CITO MDA CITO MDA CITO
1.27 9h00 0,62 5.72 2.73 11.68 2,85 29,50

1.38 6.13 2.46 4.01 1.41 19.10 3,50 45.06
3.83 6.06 7.63 6.09 6.08 36,70 4,80 8,99
0,16 6.45 4,60 4.53 5.44 48,30 1,89 48.15
0,56 4,78 12.21 19.01 4.25 4.47 2,90 10.12
1,95 34,76 1.03 9.62 1,76 8.83 0,87 17,98
0,08 15.53 1.25 7.59 8.39 5.49 4.25 37.18
2.17 12.23 2.13 12,33 2,82 3.48 1,43 19,09
0,00 0,93 0,98 5,26 5,03 7,98 6,75 6,05
1,35 3,81 1,53 5,69 7,30 27,04 4,30 17,05
3,22 6,39 3,91 7,72 4,97 16,02 0,59 7,79
1,69 14,15 2,25 7,61 1,11 6,14 5,30 6,78
4,90 5,67 1,67 4,32 13,27 13,31 1,80 16,03
1,33 8,49 5,23 17,79 7,73 10.03 3,50 5,07
0,64 2,27 2,79 15,51 3,69 17.23 4,98 16,60
5.21 12h35 1,43 12h43 9,26 9.29 6,98 19.89
Fonte: Dados fornecidos por cortesia de Manoj Pandey, MD
11.2.3 O objetivo do estudo de Krantz et al. (A-4) foi investigar os efeitos relacionados à dose de metadona em indivíduos com torsades
de pointes, uma taquicardia ventricular polimórfica. No estudo de 17 indivíduos, 10 eram homens (sexo ¼ 0) e sete eram
mulheres (sexo ¼ 1). A variável de resultado é o intervalo QTc, uma medida do risco de arritmia. A outra variável
independente, além do sexo, foi a dose de metadona (mg/dia). As medições dessas variáveis para os 17 indivíduos foram as
seguintes.
Sexo Dose (mg/dia) QTc (mseg)
0 1000 600
0 550 625
0 97 560
1 90 585
85 590
126 500
1 300 700
1 110 570
001 65 540
1 650 785
1 600 765
1 660 611
1 270 600
1 680 625
0 540 650
0 600 635
1 330 522
Fonte: Dados fornecidos por cortesia de Mori J. Krantz, MD

EXERCÍCIOS 559
11.2.4 Consulte o Exercício 9.7.2, que descreve a pesquisa de Reiss et al. (A-5), que coletou amostras de 90 pacientes e mediu
o tempo parcial de tromboplastina (aPTT) usando dois métodos diferentes: o ensaio CoaguChek no ponto de
atendimento e o ensaio laboratorial padrão hospitalar. Os indivíduos também foram classificados por seu status de
medicação: 30 recebendo apenas heparina, 30 recebendo heparina com varfarina e 30 recebendo varfarina e
enoxaparina. Os dados são os seguintes.
heparina Heparina e Varfarina Varfarina e Enoxaparina

aPTT aPTT aPTT aPTT aPTT aPTT
49.3 71,4 18,0 77,0 56,5 46,5

57,9 86,4 31.2 62.2 50,7 34,9
59,0 75,6 58,7 53.2 37.3 28,0
77,3 54,5 75.2 53,0 64,8 52.3
42.3 57,7 18,0 45,7 41.2 37,5
44.3 59,5 82,6 81.1 90.1 47.1
90,0 77.2 29.6 40,9 23.1 27.1
55,4 63.3 82,9 75,4 53.2 40,6
20.3 27.6 58,7 55,7 27.3 37,8
28,7 52,6 64,8 54,0 67,5 50.4
64,3 101.6 37,9 79,4 33,6 34.2
90,4 89,4 81,2 62,5 45,1 34,8
64,3 66,2 18,0 36,5 56,2 44,2
89,8 69,8 38,8 32,8 26,0 28,2
74,7 91,3 95,4 68,9 67,8 46,3
150,0 118,8 53,7 71,3 40,7 41,0
32,4 30,9 128,3 111,1 36,2 35,7
20,9 65,2 60,5 80,5 60,8 47,2
89,5 77,9 150,0 150,0 30.2 39,7
44,7 91,5 38,5 46,5 18,0 31.3
61,0 90,5 58,9 89.1 55,6 53,0
36.4 33.6 112,8 66,7 18,0 27.4
52,9 88,0 26,7 29,5 18,0 35,7
57,5 69,9 49,7 47,8 78,3 62,0
39.1 41,0 85,6 63.3 75,3 36,7
74,8 81,7 68,8 43,5 73.2 85,3
32,5 33.3 18,0 54,0 42,0 38.3
125,7 142,9 92,6 100,5 49.3 39,8
77.1 98,2 46.2 52.4 22.8 42.3
143,8 108.3 60,5 93,7 35,8 36,0
Use a regressão múltipla para prever o aPTT hospitalar a partir do nível CoaguCheck aPTT, bem como a medicação
recebida. O conhecimento da medicação é útil na previsão? Deixe um ¼ :05 para todos
testes.
11.3 PROCEDIMENTOS DE SELEÇÃO DE VARIÁVEIS
Os pesquisadores das ciências da saúde que contemplam o uso da análise de regressão múltipla para
investigar uma questão geralmente descobrem que têm um grande número de variáveis para selecionar as
variáveis independentes a serem empregadas como preditores da variável dependente.
Esses investigadores desejarão incluir em seu modelo tantas variáveis quanto possível para maximizar a
capacidade preditiva do modelo. O investigador deve perceber, no entanto, que adicionar outra variável
independente a um conjunto de variáveis independentes sempre aumenta o coeficiente de determinação R2.
Portanto, variáveis independentes não devem ser adicionadas ao modelo indiscriminadamente, mas apenas
por um bom motivo. Na maioria das situações, por exemplo, algumas variáveis preditoras potenciais são mais
caras do que outras em termos de custos de coleta de dados. O investigador preocupado com os custos,
portanto, não desejará incluir uma variável cara em um modelo, a menos que haja evidência de que ela faz
uma contribuição valiosa para o
capacidade preditiva do modelo.
O investigador que deseja usar a análise de regressão múltipla de forma mais eficaz deve ser capaz
de empregar alguma estratégia para fazer seleções inteligentes entre as possíveis variáveis preditoras
disponíveis. Muitas dessas estratégias estão em uso atualmente, e cada uma tem seus proponentes. As
estratégias variam em termos de complexidade e tédio envolvidos em seu emprego. Infelizmente, as estratégias
nem sempre levam à mesma solução quando aplicadas ao mesmo problema.
Regressão passo a passo Talvez a estratégia mais usada para selecionar variáveis independentes para um
modelo de regressão múltipla seja o procedimento passo a passo. O procedimento consiste em uma série de
etapas. A cada passo do procedimento cada variável então no modelo é avaliada para ver se, de acordo com
os critérios especificados, ela deve permanecer no modelo.
Suponha, por exemplo, que desejamos executar a regressão passo a passo para um modelo contendo
k variáveis preditoras. A medida de critério é calculada para cada variável.
De todas as variáveis que não atendem ao critério de inclusão no modelo, aquela que menos atende ao critério
é retirada do modelo. Se uma variável for removida nesta etapa, a equação de regressão para o modelo menor
é calculada e a medida de critério é calculada para cada variável agora no modelo. Caso alguma dessas
variáveis não satisfaça o critério de inclusão no modelo, aquela que menos atende ao critério é removida. Se
uma variável for removida nesta etapa, a variável que foi removida na primeira etapa é inserida novamente no
modelo e o procedimento de avaliação continua. Esse processo continua até que nenhuma outra variável
possa ser inserida ou removida.
A natureza do procedimento passo a passo é tal que, embora uma variável possa ser excluída do
modelo em uma etapa, ela é avaliada para possível reentrada no modelo nas etapas subsequentes.
O procedimento STEPWISE do MINITAB, por exemplo, usa a estatística F associada como critério de
avaliação para decidir se uma variável deve ser excluída ou adicionada ao modelo. A menos que especificado
de outra forma, o valor de corte é F ¼ 4. A impressão dos resultados STEPWISE contém estatísticas t (a raiz
quadrada de F) em vez de estatísticas F. A cada passo, o MINITAB calcula uma estatística F para cada
variável então no modelo. Se a estatística F para qualquer uma dessas variáveis for menor que o valor de
corte especificado (4 se algum outro valor não for especificado), a variável com o menor F será removida do
modelo. A equação de regressão é reajustada para o modelo reduzido, os resultados são impressos e o
11.3 PROCEDIMENTOS DE SELEÇÃO DE VARIÁVEIS 561
procedimento vai para a próxima etapa. Se nenhuma variável puder ser removida, o procedimento
tentará adicionar uma variável. Uma estatística F é calculada para cada variável que não está no modelo.
Dessas variáveis, adiciona-se aquela com a maior estatística F associada, desde que sua estatística F
seja maior que o valor de corte especificado (4 se algum outro valor não for especificado). A equação de
regressão é reajustada para o novo modelo, os resultados são impressos e o procedimento segue para
a próxima etapa. O procedimento para quando nenhuma variável pode ser adicionada ou excluída.
O exemplo a seguir ilustra o uso do procedimento passo a passo para selecionar
variáveis para um modelo de regressão múltipla.
EXEMPLO. 11.3.1
Um diretor de enfermagem gostaria de usar as características pessoais dos enfermeiros para desenvolver
um modelo de regressão para prever o desempenho no trabalho (JOBPER). As seguintes variáveis
estão disponíveis para escolher as variáveis independentes a serem incluídas no modelo:
X1 ¼ assertividadeðASRVÞ
X2 ¼ entusiasmo ðENTHÞ
X3 ¼ ambição ðAMBÞ
X4 ¼ habilidades de comunicaçãoðCOMMÞ
X5 ¼ habilidades de resolução de problemasðPROBÞ
X6 ¼ iniciativa ðINITÞ
Desejamos usar o procedimento passo a passo para selecionar variáveis independentes daquelas
disponíveis na tabela para construir um modelo de regressão múltipla para prever o desempenho no
trabalho.
Solução: A Tabela 11.3.1 mostra as medições feitas na variável dependente, JOBPER, e cada uma das
seis variáveis independentes para uma amostra de 30 enfermeiros.
TABELA 11.3.1 Medições em Sete Variáveis para Exemplos 11.3.1
Y X1 X2 X3 X4 X5 X6
45 74 29 40 66 93 47
65 65 50 64 68 74 49
73 71 67 79 81 87 33
63 64 44 57 59 85 37
83 79 55 76 76 84 33
45 56 48 54 59 50 42
60 68 41 66 71 69 37
73 76 49 65 75 67 43
74 83 71 77 76 84 33
(Contínuo )
Y X1 X2 X3 X4 X5 X6
69 62 44 57 67 81 43
66 54 52 67 63 68 36
69 61 46 66 84 75 43
71 63 56 67 60 64 35
70 84 82 68 84 78 37
79 78 53 82 84 78 39
83 65 49 82 65 55 38
75 86 63 79 84 80 41
67 61 64 75 60 81 45
67 71 45 67 80 86 48
52 59 67 64 69 79 54
52 71 32 44 48 65 43
66 62 51 72 71 81 43
55 67 51 60 68 81 39
42 65 41 45 55 58 51
65 55 41 58 71 76 35
68 78 65 73 93 77 42
80 76 57 84 85 79 35
50 58 43 55 56 84 40
87 86 70 81 82 75 30
84 83 38 83 69 79 41
Usamos o MINITAB para obter um modelo útil pelo procedimento stepwise.

Observações sobre o desempenho do trabalho variável dependente (JOBPER) e as seis
variáveis independentes candidatas são armazenadas nas Colunas 1 a 7 do MINITAB,
respectivamente. A Figura 11.3.1 mostra o procedimento apropriado do MINITAB e a
impressão dos resultados.
Para obter os resultados da Figura 11.3.1, os valores de F para inserir e F para
remover ambos foram fixados automaticamente em 4. No passo 1 não há variáveis a serem
consideradas para exclusão do modelo. A variável AMB (coluna 4) tem
a maior estatística F associada, que é F ¼ (9,74)2 ¼ 94,8676. Como 94,8676 é maior que 4,
AMB é adicionado ao modelo. No passo 2 a variável INIT (Coluna 7) se qualifica para adição
ao modelo já que seu F associado de (2.2)2 ¼ 4.84 é maior que 4 e é a variável com a maior
estatística F associada. É adicionado ao modelo. Após a etapa 2, nenhuma outra variável
poderia ser adicionada ou excluída e o procedimento foi interrompido. Vemos, então, que o
modelo escolhido pelo procedimento stepwise é um modelo de duas variáveis independentes
com AMB e INIT como variáveis independentes. A equação de regressão estimada é
^y ¼ 31:96 þ :787x3 :45x6 &

11.3 PROCEDIMENTOS DE SELEÇÃO DE VARIÁVEIS 563
Stat Regression Stepwise MTB > Stepwise C1 C2–C7; SUBC> FEnter 4.0;
Digite C1 em Resposta e C2–C7 em Preditores. SUBC> FRemover 4.0.
Regressão passo a passo
F-para-entrar: 4,00 F-para-Remover: 4,00
A resposta é C1 em 6 preditores, com N = 30
Passo 1 2
Constante 7.226 31.955
C4 0,888 0,787
T-Ratio 9,74 8.13
7C 54,0-
T-Ratio -2,20
S 5,90 5.53
R-Sq 77.21 80,68
FIGURA 11.3.1 Procedimento stepwise do MINITAB e saída para os dados da Tabela 11.3.1.
Para alterar o critério para permitir que uma variável entre no modelo de 4 para algum outro
valor K, clique em Opções e digite o valor desejado de K na caixa Enter. A nova estatística F de critério,
então, é K em vez de 4. Para alterar o critério para excluir uma variável do modelo de 4 para algum
outro valor K, clique em Opções e digite o valor desejado de K na caixa Remover. Devemos escolher K
para entrar para ser maior ou igual a K para
retirar.
Embora o procedimento de seleção gradual seja uma técnica comum empregada por
pesquisadores, outros métodos estão disponíveis. A seguir, uma breve discussão sobre duas dessas ferramentas.
O modelo final obtido por cada um desses procedimentos é o mesmo modelo encontrado usando o
procedimento stepwise do Exemplo 11.3.1.
Seleção direta Essa estratégia está intimamente relacionada ao procedimento de regressão passo a
passo. Este método constrói um modelo usando correlações. São retidas as variáveis que atendem aos
critérios de inclusão, como na seleção gradual. A primeira variável inserida no modelo é aquela com
maior correlação com a variável dependente. Se essa variável atender ao critério de inclusão, ela será
mantida. A próxima variável a ser considerada para inclusão é aquela com maior correlação parcial
com a variável dependente. Se atender aos critérios de inclusão, será mantido. Este procedimento
continua até que todas as variáveis independentes tenham
sido considerado. O modelo final contém todas as variáveis independentes que atendem aos critérios de
inclusão.
Eliminação retrógrada Esse procedimento de construção de modelo começa com todas as variáveis do
modelo. Essa estratégia também constrói um modelo usando correlações e um critério de inclusão
predeterminado com base na estatística F. A primeira variável considerada para remoção do modelo é aquela
com o menor coeficiente de correlação parcial. Caso essa variável não atenda ao critério de inclusão, ela é
eliminada do modelo. A próxima variável a ser considerada para eliminação é aquela com a próxima correlação
parcial mais baixa. Será eliminado caso não cumpra o critério de inclusão. Este procedimento continua até que
todas as variáveis tenham sido consideradas para eliminação. O modelo final contém todas as variáveis
independentes que atendem aos critérios de inclusão.
EXERCÍCIOS
11.3.1 Consulte os dados do Exercício 10.3.2 reportado por Son et al. (A-6), que estudou cuidados familiares na Coréia de
idosos com demência. A variável de resultado, sobrecarga do cuidador (BURDEN), foi medida pelo Korean Burden
Inventory (KBI), onde as pontuações variaram de 28 a 140, com pontuações mais altas indicando maior sobrecarga.
Realize uma análise de regressão passo a passo nas seguintes variáveis independentes relatadas pelos
pesquisadores:
CGAGE: idade do cuidador (anos)

CGINCOME: renda do cuidador (moeda Won-coreana)
CGDUR: cuidador-duração do cuidado (mês)
AVD: total de atividades da vida diária onde escores baixos indicam que o idoso realiza atividades
independentemente.
MEM: problemas de memória e comportamento com pontuações mais altas indicando mais problemas.
CG: comprometimento cognitivo com escores mais baixos indicando maior grau de comprometimento cognitivo.
SOCIALSU: pontuação total de suporte social percebido (25–175, valores mais altos indicam mais suporte). Os
dados informados são os seguintes.
CGAGE CGINCOME CGDUR ADL MEM COG SOCIALSU BURDEN
41 200 12 39 4 18 119 28
30 120 36 52 33 9 131 68
41 300 60 89 17 3 141 59
35 350 2 57 31 7 150 91
37 600 48 28 35 19 142 70
42 90 4 34 3 25 148 38
49 300 26 42 16 17 172 46
39 500 16 52 6 26 147 57
49 309 30 88 41 13 98 89
40 250 60 90 24 3 147 48
(Contínuo )
EXERCÍCIOS 565
40 300 36 38 22 13 146 74
70 60 10 83 41 11 97 78
49 450 24 30 9 24 139 43
55 300 18 45 33 14 127 76
27 309 30 47 36 18 132 72
39 250 10 90 17 0 142 61
39 260 12 63 14 16 131 63
44 250 32 34 35 22 141 77
33 200 48 76 33 23 106 85
42 200 12 26 13 18 144 31
52 200 24 68 34 26 119 79
48 300 36 85 28 10 122 92
53 300 12 22 12 16 110 76
40 300 11 82 57 3 121 91
35 200 8 80 51 3 142 78
47 150 60 80 20 18 101 103
33 180 19 81 20 1 117 99
41 200 48 30 7 17 129 73
43 300 36 27 27 27 142 88
25 309 24 72 9 0 137 64
35 250 12 46 15 22 148 52
35 200 6 63 52 13 135 71
45 200 7 45 26 18 144 41
36 300 24 77 57 0 128 85
52 600 60 42 10 19 148 52
41 230 6 60 34 11 141 68
40 200 36 33 14 14 151 57
45 400 96 49 30 15 124 84
48 75 6 89 64 0 105 91
50 200 30 72 31 3 117 83
31 250 30 45 24 19 111 73
33 300 2 73 13 146 57
30 200 30 58 16 3 99 69
36 250 6 33 17 15 115 81
45 500 12 34 13 21 119 71
32 300 60 90 42 134 91
55 200 24 48 7 18 6 23 165 48
50 309 20 47 17 18 101 94
37 250 30 32 13 15 148 57
40 1000 21 63 32 15 132 49
40 300 12 76 50 5 120 88
49 300 18 79 44 11 129 54
37 309 18 48 57 9 133 73
47 250 38 90 33 6 121 87
41 200 60 55 11 20 117 47
33 1000 18 83 24 11 140 60
28 309 12 50 21 25 117 65
(Contínuo )
33 400 120 44 31 18 138 57

34 330 18 79 30 20 163 85
40 200 18 24 5 22 157 28
54 200 12 40 20 17 143 40
32 300 32 35 15 27 125 87
44 280 66 55 9 21 161 80
44 350 40 45 28 17 142 49
42 280 24 46 19 17 135 57
44 500 14 37 4 21 137 32
25 600 24 47 29 133 52
41 250 84 28 23 3 21 131 42
28 1000 30 61 8 7 144 49
24 200 12 35 31 26 136 63
65 450 120 68 65 6 169 89
50 200 12 80 29 10 127 67
40 309 12 43 8 13 110 43
47 1000 12 53 14 18 120 47
44 300 24 60 30 16 115 70
37 309 54 63 22 18 101 99
36 300 12 28 9 27 139 53
55 200 12 35 18 14 153 78
45 2000 12 37 33 17 111 112
45 400 14 82 25 13 131 52
23 200 36 88 16 0 139 68
42 1000 12 52 15 0 132 63
38 200 36 30 16 18 147 49
41 230 36 69 49 12 171 42
25 200 30 52 17 20 145 56
47 200 12 59 38 17 140 46
35 100 12 53 22 21 139 72
59 150 60 65 56 2 133 95
49 300 60 90 12 0 145 57
51 200 48 88 42 6 122 88
54 250 6 66 12 23 133 81
53 30 24 60 21 7 107 104
49 100 36 48 14 13 118 88
44 300 48 82 41 13 95 115
36 200 18 88 24 14 100 66
64 200 48 63 49 5 125 92
51 120 2 79 34 3 116 97
43 200 66 71 38 17 124 69
54 150 96 66 48 13 132 112
29 309 19 81 66 1 152 88
Fonte: Dados fornecidos por cortesia de Gwi-Ryung Son, RN, Ph.D.

EXERCÍCIOS 567
11.3.2 Machiel Naeije (A-7) identifica variáveis úteis na previsão da abertura bucal máxima (MMO, milímetros) para 35 voluntários
saudáveis. As variáveis examinadas foram:
ERA: anos
DOWN_CON: translação condilar descendente, mm
FORW_CON: translação condilar anterior, mm
Sexo: 0 ¼ Feminino, 1 ¼ Macho comprimento
MAN_LENG: mandibular, mm largura
MAN_WIDT: mandibular, mm
Use as seguintes medições relatadas para realizar uma regressão passo a passo.
AGE DOWN_CON FORW_CON GENDER MAN_LENG MAN_WIDT MMO
21h00 4.39 14.18 1 100,86 121,00 52.34

26h00 1,39 20.23 0 93,08 118,29 51,90
30,00 2,42 13h45 1 98,43 130,56 52,80
28h00 .18 19.66 1 102,95 125,34 50,29
21h00 4.10 22.71 1 108.24 125,19 57,79
20h00 4,49 13.94 0 98,34 113,84 49,41
21h00 2.07 19h35 0 95,57 115,41 53.28
19h00 .77 25,65 1 98,86 118,30 59,71
24h00 7,88 18.51 1 98,32 119,20 53.32
18h00 6.06 21.72 0 92,70 111.21 48,53
22h00 9.37 23.21 0 88,89 119.07 51,59
21h00 3,77 23.02 1 104.06 127,34 58,52
20h00 1.10 19h59 0 98,18 111.24 62,93
22h00 2.52 16.64 0 91.01 113,81 57,62
24h00 5,99 17h38 1 96,98 114,94 65,64
22h00 5,28 22.57 0 97,86 111,58 52,85
22h00 1,25 20.89 0 96,89 115,16 64,43
22h00 6,02 20,38 1 98,35 122,52 57,25
19h00 1,59 21,63 0 90,65 118,71 50,82
26h00 6,05 10,59 0 92,99 119,10 40,48
22h00 1,51 20,03 1 108,97 129,00 59,68
24h00 ,41 24,55 0 91,85 100,77 54,35
21h00 6,75 14,67 1 104,30 127,15 47,00
22h00 4,87 17,91 1 93,16 123,10 47,23
22h00 .64 17,60 1 94,18 113,86 41,19
29h00 7.18 15.19 0 89,56 110,56 42,76
25h00 6.57 17h25 1 105,85 140.03 51,88
20h00 1.51 18.01 0 89,29 121,70 42,77
27h00 4.64 19h36 0 92,58 128.01 52.34
26h00 3,58 16.57 1 98,64 129,00 50,45
23h00 6.64 12h47 0 83,70 130,98 43.18
25h00 7.61 18.52 0 88,46 124,97 41,99
22h00 5.39 11.66 1 94,93 129,99 39,45
31h00 5.47 12.85 1 96,81 132,97 38,91
23h00 2,60 19.29 0 93,13 121.03 49.10
Fonte: Dados fornecidos por cortesia de Machiel Naeije, DDS

11.3.3 Um dos objetivos do estudo de Connor et al. (A-8) foi examinar a agressão reativa entre crianças e adolescentes encaminhados
a um centro de tratamento residencial. Os pesquisadores usaram o
Escala de Avaliação Proativa/Reativa, obtida pela apresentação de três declarações aos médicos que examinaram os
assuntos. Os respondentes responderam, usando uma escala de 1 a 5, com 5 indicando que a afirmação quase sempre se
aplicava à criança. Um exemplo de uma declaração de agressão reativa é: “Quando esta criança foi provocada ou
ameaçada, ela fica com raiva facilmente e contra-ataca”. A pontuação reativa foi a resposta média a três declarações desse
tipo. Com essa variável como variável de resultado, os pesquisadores também examinaram o seguinte: AGE (anos),
VERBALIQ (QI verbal), STIM (uso de estimulantes), AGEABUSE (idade em que foi abusado pela primeira vez), CTQ (uma
medida de hiperatividade na qual pontuações mais altas indicam maior hiperatividade), TOTALHOS (hostilidade total
medida por um avaliador, com números mais altos indicando maior hostilidade).
Realize a regressão passo a passo para encontrar as variáveis mais úteis na previsão de agressão reativa na seguinte
amostra de 68 indivíduos.
REACTIVE AGE VERBALIQ STIM AGEABUSE CTQ TOTALHOS
4.0 17 91 0 0 0 8
3.7 12 94 0 1 29 10
2.3 14 105 0 1 12 10
5,0 16 97 0 1 9 11
2.0 15 97 0 2 17 10
2.7 8 91 0 0 6 4
2.0 10 111 0 0 6 6
3.3 12 105 0 0 28 7
2.0 17 101 1 0 12 9
4.3 13 102 1 1 8 11
4.7 15 83 0 0 9 9
4.3 15 66 0 1 5 8
2.0 15 90 0 2 3 8
4,0 13 88 0 28 8
2,7 13 98 0 17 10
2,7 9 135 0 1 30 11
2,7 18 72 0 1 10 9
2,0 13 93 0 002 20 8
3,0 14 94 0 2 10 11
2,7 13 93 0 1 4 8
3.7 16 73 0 0 11 11
2.7 12 74 0 1 10 7
2.3 14 97 0 2 3 11
4.0 13 91 1 1 21 11
4.0 12 88 0 1 14 9
4.3 13 90 0 0 15 2
3.7 14 104 1 1 10 10
3.0 18 82 0 0 1 7
4.3 14 79 1 3 6 7
1,0 16 93 0 0 5 8
4.3 16 99 0 1 21 11
(Contínuo )
11.4 REGRESSÃO LOGÍSTICA 569
REACTIVE AGE VERBALIQ STIM AGEABUSE CTQ TOTALHOS
2.3 14 73 0 2 8 9
3.0 12 112 0 0 15 9
1.3 15 102 0 1 1 5
3.0 16 78 1 1 26 8
2.3 9 95 1 0 23 10
1,0 15 124 0 3 0 11
3.0 17 73 0 1 1 10
3.3 11 105 0 0 23 5
4,0 11 89 0 0 27 8
1,7 9 88 0 1 2 8
2,3 16 96 0 1 5 7
4,7 15 76 1 1 17 9
1,7 16 87 0 2 0 4
1.7 15 90 0 1 10 12
4.0 12 76 0 0 22 10
5,0 12 83 1 1 19 7
4.3 10 88 1 0 10 5
5,0 9 98 1 0 8 9
3.7 12 100 0 0 6 4
3.3 14 80 0 1 3 10
2.3 16 84 0 1 3 9
1,0 17 117 0 2 1 9
1.7 12 145 1 0 0 5
3.7 12 123 0 0 1 3
2.0 16 94 0 2 6 6
3.7 17 70 0 1 11 13
4.3 14 113 0 0 8 8
2.0 12 123 1 0 2 8
3.0 7 107 0 0 11 9
3.7 12 78 1 0 15 11
4.3 14 73 0 1 2 8
2,3 18 91 0 3 10
4,7 12 91 0 0 8 9
3,7 15 111 0 0 6 9
1,3 15 71 0 1 2 10
3,7 7 102 0 0 20 14 9
1,7 9 89 0 0 24 6
Fonte: Dados fornecidos por cortesia de Daniel F. Connor, MD e Lang Lin.
11.4 REGRESSÃO LOGÍSTICA
Até agora, nossa discussão sobre análise de regressão limitou-se àquelas situações em
que a variável dependente é uma variável contínua, como peso, pressão arterial ou níveis
plasmáticos de algum hormônio. Muitas pesquisas no campo das ciências da saúde são
motivado por um desejo de descrever, entender e fazer uso da relação entre variáveis independentes e uma
variável dependente (ou resultado) que é discreta.
Particularmente abundantes são as circunstâncias em que a variável de resultado é dicotômica.
Uma variável dicotômica, lembramos, é uma variável que pode assumir apenas um de dois valores mutuamente
exclusivos. Esses valores geralmente são codificados como Y ¼ 1 para um sucesso e Y ¼ 0 para um
insucesso ou falha. Variáveis dicotômicas incluem aquelas cujos dois valores possíveis são categorias como
morreu–não morreu; curado – não curado; a doença ocorreu – a doença não ocorreu; e fumante-não fumante.
O profissional de ciências da saúde que se dedica à pesquisa ou precisa entender os resultados de pesquisas
realizadas por outros achará vantajoso ter, pelo menos, uma compreensão básica da regressão logística, o
tipo de análise de regressão que geralmente é empregada quando a variável dependente é dicotômica. O
objetivo da presente discussão é fornecer ao leitor esse nível de compreensão. Limitaremos nossa
apresentação ao caso em que há apenas uma variável independente que pode ser contínua ou dicotômica.
O modelo de regressão logística Lembre-se de que no Capítulo 9 nos referimos à análise de regressão
envolvendo apenas duas variáveis como análise de regressão linear simples. O modelo de regressão linear
simples foi expresso pela equação
y ¼ b0 þ b1x þ e (11.4.1)
em que y é um valor observado arbitrário da variável dependente contínua. Quando o valor observado de Y é
myjx, a média de uma subpopulação de valores Y para um determinado valor de X, a quantidade e, a diferença
entre o Y observado e a linha de regressão (ver Figura 9.2.1) é zero, e nós pode escrever a Equação 11.4.1
como
myjx ¼ b0 þ b1x (11.4.2)
que também pode ser escrito como
E yð Þ¼ jx b0 þ b1x (11.4.3)
Geralmente, o lado direito das equações (11.4.1) a (11.4.3) pode assumir qualquer valor entre menos infinito
e mais infinito.
Embora apenas duas variáveis estejam envolvidas, o modelo de regressão linear simples não é
apropriado quando Y é uma variável dicotômica porque o valor esperado (ou média) de Y é a probabilidade
de que Y ¼ 1 e, portanto, está limitado ao intervalo de 0 a 1, inclusive. As equações (11.4.1) a (11.4.3),
portanto, são incompatíveis com a realidade da situação.
,
Se fizermos p ¼ P Yð Þ ¼ 1 então a razão p=ð 1 p pode assumir
º valores entre 0 e mais infinito. Além
disso, o logaritmo natural (ln) de p=ð Þ 1 p pode assumir valores
entre menos infinito e mais infinito, assim como o lado direito das Equações 11.4.1 a (11.4.3). Portanto,
podemos escrever
p
ln ¼ b0 þ b1x (11.4.4)
1p
A Equação 11.4.4 é chamada de modelo de regressão logística e a transformação de myjx (isto é, p)

em ln½ p=ð 1 p é chamada de
º transformação logit. A equação 11.4.4 também pode ser escrita como
þ b1ððÞx
1 þexp
expb0
p¼ (11.4.5)
Þx b0 þ b1
em que exp é o inverso do logaritmo natural.

O modelo de regressão logística é amplamente utilizado em pesquisas em ciências da saúde.
Por exemplo, o modelo é freqüentemente usado por epidemiologistas como um modelo para a
probabilidade (interpretada como o risco) de que um indivíduo adquira uma doença durante um período
de tempo específico durante o qual ele ou ela é exposto a uma condição (chamada de fator de risco).
conhecida ou suspeita de estar associada à doença.
Regressão logística: variável independente dicotômica A situação mais simples em que a regressão
logística é aplicável é aquela em que tanto as variáveis dependentes quanto as independentes são
dicotômicas. Os valores da variável dependente (ou resultado) geralmente indicam se um sujeito
adquiriu ou não uma doença ou se o sujeito morreu ou não. Os valores da variável independente
indicam a situação do sujeito em relação à presença ou ausência de algum fator de risco. Na discussão
que se segue, assumimos que as dicotomias das duas variáveis são codificadas como 0 e 1. Quando
este for o caso, as variáveis podem ser classificadas cruzadas em uma tabela, como a Tabela 11.4.1,
que contém duas linhas e duas colunas . As células da tabela contêm as frequências de ocorrência de
todos os possíveis pares de valores das duas variáveis: (1, 1), (1, 0), (0, 1) e (0, 0).
Um objetivo da análise dos dados que atendem a esses critérios é uma estatística conhecida
como odds ratio. Para entender o conceito de odds ratio, devemos entender o termo odds,
TABELA 11.4.1 Duas variáveis dicotômicas de

classificação cruzada cujos valores são codificados como 1
e0
Independente
Variável (X)
Dependente
Variável (Y)1 0
1 n1;1 n1;0
2 n0;1 n0;0
que é frequentemente usado por quem aposta nos resultados de eventos esportivos ou participa de outros
tipos de jogos de azar. Usando a terminologia de probabilidade, podemos definir probabilidades da seguinte
forma.
DEFINIÇÃO
As probabilidades de sucesso são a razão entre a probabilidade de sucesso e a

probabilidade de falha.
A razão de chances é uma medida de quanto maiores (ou menores) são as chances de indivíduos que
possuem o fator de risco experimentarem um resultado específico. Esta conclusão assume que o resultado é
um evento raro. Por exemplo, quando o desfecho é a contração de uma doença, a interpretação do odds ratio
assume que a doença é rara.
Suponha, por exemplo, que a variável de resultado seja a aquisição ou não de câncer de pele e a
variável independente (ou fator de risco) sejam altos níveis de exposição ao sol. A análise desses dados
coletados em uma amostra de indivíduos pode gerar uma razão de chances de 2, indicando que as chances
de câncer de pele são duas vezes maiores entre indivíduos com altos níveis de exposição ao sol do que entre
indivíduos sem altos níveis de exposição.
Pacotes de software de computador que executam regressão logística frequentemente fornecem como
parte de suas estimativas de saída de b0 e b1 e o valor numérico da razão de chances. Acontece que a razão
de chances é igual a exp(b1).
EXEMPLO 11.4.1
LaMont et al. (A-9) testado para doença arterial coronariana obstrutiva (OCAD) entre 113 homens e 35
mulheres que se queixaram de dor no peito ou possível equivalente ao seu médico de cuidados primários. A
Tabela 11.4.2 mostra a classificação cruzada de OCAD com gênero. Desejamos usar a análise de regressão
logística para determinar o quão maiores são as chances de encontrar OCAD entre os homens do que entre
as mulheres.
Solução: Podemos usar o pacote de software SAS® para analisar esses dados. A variável independente é o
gênero e a variável dependente é o status em relação a ter doença arterial coronariana
obstrutiva (OCAD). O uso do comando SAS® PROC LOGIST produz. como parte da saída
resultante, as estatísticas mostradas na Figura 11.4.1.
TABELA 11.4.2 Casos de Doença Arterial Coronariana Obstrutiva

(DAOC) Classificados por Sexo
Doença machos fêmeas Total
OCAD presente 92 15 107
OCAD não presente 21 20 41
Total 113 35 148
Fonte: Dados fornecidos por cortesia de Matthew J. Budoff, MD

O Procedimento LOGÍSTICO
Análise de Estimativas de Máxima Verossimilhança
Parâmetro DF Estimativa Padrão Wald
Erro Qui-Quadrado ChiSq>Pr
Interceptação 1 -0,2877 1,7649 0,3416 0,7090 0,3997

sexo 1 0,4185 17.7844 <.0001
FIGURA 11.4.1 Saída parcial do uso do comando SAS® PROC LOGISTIC com os dados da
Tabela 11.4.2.
Vemos que a estimativa de a é 0,2877 e a estimativa de b1 é 1,7649. A razão

de chances estimada, então, é ORc ¼ expð1:7649Þ ¼ 5:84. Assim, estimamos que
a chance de encontrar um caso de doença arterial coronariana obstrutiva seja quase
seis vezes maior entre os homens do que entre as mulheres. &
Regressão Logística: Variável Independente Contínua Agora vamos considerar a situação em que
temos uma variável dependente dicotômica e uma variável independente contínua. Vamos assumir
que um computador está disponível para realizar os cálculos. Nossa discussão, conseqüentemente,
se concentrará na avaliação da adequação do modelo como uma representação dos dados
disponíveis, na interpretação dos elementos-chave da impressão do computador e no uso dos
resultados para responder a questões relevantes sobre a relação entre os dois. variáveis.
EXEMPLO 11.4.2
De acordo com Gallagher et al. (A-10), os programas de reabilitação cardíaca oferecem “informações,
suporte e monitoramento para retorno às atividades, gerenciamento de sintomas e modificação de
fatores de risco”. Os pesquisadores realizaram um estudo para identificar entre as mulheres os
fatores associados à participação em tais programas. Os dados na Tabela 11.4.3 são as idades de
185 mulheres que receberam alta de um hospital na Austrália e que preencheram os critérios de
elegibilidade envolvendo alta por infarto do miocárdio, cirurgia de revascularização do miocárdio,
angioplastia ou stent. Desejamos usar esses dados para obter informações sobre a relação entre a
idade (anos) e a participação em um programa de reabilitação cardíaca (ATT ¼ 1, se participou e
ATT ¼ 0, se não). Também desejamos saber se podemos usar os resultados de nossa análise para
prever a probabilidade de participação de uma mulher se soubermos sua idade.
Solução: A variável independente é a variável contínua idade (IDADE), e a variável dependente ou

resposta é o status em relação ao atendimento em um programa de reabilitação
cardíaca. A variável dependente é uma variável dicotômica que pode assumir um de
dois valores: 0 ¼ não compareceu e 1 ¼ compareceu
TABELA 11.4.3 Idades das mulheres que participam e não participam de um

programa de reabilitação cardíaca
não participante participando

(AT ¼ 0) (ATT ¼ 1)
50 73 46 74 74 62
59 75 57 59 50 74
42 71 53 81 55 61
50 69 40 74 66 69
34 78 73 77 49 76
49 69 68 59 55 71
67 74 72 75 73 61
44 86 59 68 41 46
53 49 64 81 64 69
45 63 78 74 46 66
79 63 68 65 65 57
46 72 67 81 50 60
62 64 55 62 61 63
58 72 71 85 64 63
70 79 80 84 59 56
60 75 75 39 73 70
67 70 69 52 73 70
64 73 80 67 65 63
62 66 79 82 67 63
50 75 71 84 60 65
61 73 69 79 69 67
69 71 78 81 61 68
74 72 75 74 79 84
65 69 71 85 66 69
80 76 69 92 68 78
69 60 77 69 61 69
77 79 81 83 63 79
61 78 78 82 70 83
72 62 76 85 68 67
67 73 84 82 59 47
80 64 57
66
Fonte: Dados fornecidos por cortesia de Robyn Gallagher, RN, Ph.D.
participar. Usamos o pacote de software SAS® para analisar os dados. O comando

SAS® é PROC LOGISTIC, mas se quisermos prever atendimento no programa
cardíaco, precisamos usar a opção “descendente” com PROC LOGISTIC. (Quando
desejar prever o resultado marcado como “1” da variável dependente, use a
“opção descendente” no SAS®. Consulte
Padrão Wald
Parâmetro DF Estimativa Erro qui-quadrado Pr > ChiSq
Interceptar 1 1,8744 0,9809 3.6518 0,0560

era 1 0,0379 0,0146 6.7083 0,0096
FIGURA 11.4.2 Impressão SAS® parcial da análise de regressão logística dos dados da Tabela 11.4.3.
SAS®documentation para mais detalhes.) Uma impressão parcial da análise é

mostrada na Figura 11.4.2.
A inclinação de nossa regressão é 0,0379 e a interceptação é 1,8744. A
equação de regressão, então, é
^yi ¼ 1:8744 :0379xi
onde ^yi ¼ ln½^pið1 ^piÞ e ^pi é a probabilidade prevista de frequentar a

reabilitação cardíaca para uma mulher com idade xi.
Teste de H0 que b1 ¼ 0
Chegamos a uma conclusão sobre a adequação do modelo logístico testando o nulo onde
hipótese de que a inclinação da linha de regressão é zero. A estatística de teste é z ¼b^ 1
1=s b^ z é a estatística normal padrão,1 erro b^ (0,0146) conforme mostrado é o padrão dela
é a inclinação da amostra (0,0379) e s b^na Figura
1
11.4.2. A partir desses números, calculamos z ¼ 0,0379/0,0146 ¼ 2,5959, que tem um valor p
bilateral associado de 0,0094. Concluímos, portanto, que o modelo logístico é adequado. O
quadrado de z é qui-quadrado com 1 grau de liberdade, uma estatística que é mostrada na
Figura 11.4.2.
Usando a regressão logística para estimar p

Podemos usar a Equação 11.4.5 e os resultados de nossa análise para estimar p, a probabilidade
de que uma mulher de uma determinada idade (dentro da faixa etária representada pelos dados)
vá a um programa de reabilitação cardíaca . Suponha, por exemplo, que desejemos estimar a
probabilidade de uma mulher de 50 anos participar de um programa de reabilitação. Substituindo
50 e os resultados mostrados na Figura 11.4.2 na Equação 11.4.5 dá
exp½1:8744 ð:0379Þð50Þ
^p ¼ 1 þ exp½1:8744 ð:0379Þð50Þ ¼:49485
O SAS® calcula as probabilidades estimadas para os valores dados de X. Podemos ver as

probabilidades estimadas de frequentar programas de reabilitação cardíaca para a faixa etária
dos sujeitos incluídos no estudo na Figura 11.4.3. Como a inclinação foi negativa, vemos uma
probabilidade decrescente de frequentar um programa de reabilitação cardíaca para idosos
mulheres.
0,65
0,60
0,55
0,50
0,45
Probabilidade
estimada
0,40
0,35
0,30
0,25
0,20
0,15
03 04 05 06 07 08 09 001
FIGURA 11.4.3 Probabilidades estimadas de atendimento para idades dentro do estudo para
o Exemplo 11.4.2. &
Praticantes de Regressão Logística Múltipla geralmente estão interessados nas relações de várias
variáveis independentes com uma variável de resposta. Essas variáveis independentes podem ser
contínuas ou discretas ou uma combinação das duas.
Modelos logísticos múltiplos são construídos expandindo as Equações (11.4.1) para (11.4.4).
Se começarmos com a Equação 11.4.4, a regressão logística múltipla pode ser representada como
p
ln ¼ b0 þ b1x1j þ b2x2j þþ bkxkj (11.4.6)
1p
Usando a transformação logit, agora temos
exp b0 þ b1x1j þ b2x2j þþ bkxkj 1 þ exp

p¼ (11.4.7)
b0 þ b1x1j þ b2x2j þþ bkxkj
EXEMPLO 11.4.3
Considere os dados apresentados no Exercício de Revisão 24. Neste estudo de Fils-Aime et al.
(A-21), os dados foram coletados e classificados quanto ao uso de álcool. Os indivíduos foram
classificados como tendo início precoce (< 25 anos) ou tardio (> 25 anos) de uso excessivo de álcool.
Parâmetro B SE Wald Df Assinar Exp(B)
5-HIAA 0,013 0,006 5.878 1 0,015 0,987
TRIPT 000 000 000 1 0,983 1.000
Constante 2.076 1.049 3.918 1 0,048 7.970
FIGURA 11.4.4 Saída do SPSS para os dados do Exemplo 11.4.3.
Também foram obtidas as concentrações de triptofano (TRYPT) e ácido 5-hidroxiindolacético

(5-HIAA) no líquido cefalorraquidiano (LCR).
Solução: As variáveis independentes são as concentrações de TRYPT e 5-HIAA, e a variável

dependente é a resposta dicotômica para o início do uso excessivo de álcool.
Usamos o software SPSS para analisar os dados. A saída é apresentada na
Figura 11.4.4.
A equação pode ser escrita como
^yi ¼ 2:076 :013x1j þ 0x2j
Observe que o coeficiente para TRYPT é 0 e, portanto, não desempenha um papel no modelo.
Teste de H0 que b1 ¼
0 Os testes de significância dos coeficientes de regressão podem ser obtidos diretamente da
Figura 11.4.4. Observe que tanto a variável constante (interceptação) quanto a variável 5-HIAA
são significativas no modelo (ambas têm valores de p, indicados como “Sig.” na tabela, <0,05);
no entanto, o TRYPT não é significativo e, portanto, não precisa estar no modelo, sugerindo que
não é útil para identificar os participantes do estudo com início precoce ou tardio do alcoolismo.
Como acima, as probabilidades podem ser facilmente obtidas usando a Equação 11.4.7
e substituindo os valores obtidos na análise. &
Avaliando a qualidade do ajuste Uma pergunta natural que surge ao fazer a regressão logística
é: “Quão bom é o meu modelo?” Na regressão linear clássica, discutimos medidas como R2
para determinar quanta variação é explicada pelo modelo, com valores de R2 se aproximando
de 1 como um bom indicador da adequação do modelo com base nos preditores escolhidos
para modelar o resultado. Dada a natureza da variável de resposta na regressão logística, um
coeficiente de determinação não fornece a mesma informação que na regressão linear. Isso
ocorre porque na regressão logística os valores dos parâmetros não são derivados para
minimizar somas de quadrados, mas sim estimativas iterativas; portanto, não há medida
equivalente de R2 na regressão logística. Abaixo, fornecemos uma explicação de algumas
abordagens comumente usadas para avaliar modelos de regressão logística e acompanhamos
essas explicações com dois exemplos ilustrativos.
Muitos autores tentaram desenvolver o que é conhecido como valores “pseudo-R2” que
variam de 0 a 1, com valores mais altos indicando melhor ajuste. Em geral, essas medidas são
baseado em comparações de um modelo derivado com um modelo que contém apenas uma
interceptação. Em outras palavras, são medidas comparativas destinadas a indicar “quão melhor”
um modelo com variáveis preditoras é quando comparado a um modelo sem preditores. Duas
estatísticas pseudo-R2 comumente usadas foram desenvolvidas por Cox e Snell (4) e Nagelkerke
(5). Estes são frequentemente fornecidos em saídas padrão de software estatístico. O valor dessas
medidas é o fato de que elas podem ser úteis para comparar modelos com diferentes variáveis
preditoras, mas fornecem pouco uso relativo para examinar um único modelo. Ambas as abordagens
são baseadas na ideia de usar uma medida de ajuste conhecida como estatística de log-
verossimilhança. A log-verossimilhança para o modelo somente de interceptação é usada para
representar a soma total dos quadrados, enquanto a log-verossimilhança para o modelo com
variáveis preditoras é usada para representar a soma dos quadrados do erro. Os leitores interessados
podem encontrar uma explicação da estatística de log verossimilhança em Hosmer e Lemeshow (2).
Outra abordagem intuitiva é considerar uma tabela de classificação. Usando este método,
desenvolve-se uma tabela de contingência que fornece contagens de frequência do número de
pontos de dados que foram observados como 0 ou 1 nos dados brutos, juntamente com se os dados
brutos foram classificados como 0 ou 1 com base na equação preditiva . Pode-se então estimar
quantos pontos de dados foram classificados corretamente. Como regra geral, classificar corretamente
70% ou mais é considerado evidência de um modelo satisfatório do ponto de vista estatístico. No
entanto, o modelo pode não fornecer capacidade preditiva suficiente para ser útil na prática. Um
problema surge, no entanto, em que a reclassificação dos mesmos dados usados para construir um
modelo com o próprio modelo pode enviesar os resultados. Existem duas maneiras práticas de lidar
com essa questão. Primeiro, pode-se usar parte do conjunto de dados para construir o modelo e a
outra parte do conjunto de dados para desenvolver uma tabela de classificação. Essa estratégia, é
claro, requer uma amostra grande o suficiente para acomodar adequadamente as necessidades de
ambos os procedimentos. Uma segunda abordagem é construir um modelo usando os dados
disponíveis e depois coletar dados adicionais para testar a adequação do modelo usando uma tabela
de classificação. Essa estratégia também tem suas deficiências, pois a coleta de dados adicionais
pode ser demorada e cara.
Uma terceira abordagem que também possui apelo visual intuitivo é desenvolver um gráfico
que mostre a frequência das observações em relação à sua probabilidade prevista. Nesse tipo de
gráfico, espera-se ver uma separação completa dos valores 0 e 1. Quando há classificação incorreta
da variável de resultado, esse tipo de gráfico fornece um meio de determinar onde ocorreu a
classificação incorreta e com que frequência as observações foram classificadas incorretamente.
Finalmente, em uma abordagem comumente usada conhecida como teste de Hosmer e
Lemeshow, desenvolve-se uma tabela de frequências observadas e esperadas e usa-se um teste
qui-quadrado para determinar se há um desvio significativo entre as frequências observadas e
esperadas. Ao leitor interessado, sugerimos o texto de Hosmer e Lemeshow (2).
EXEMPLO 11.4.4
Considere o modelo de regressão logística que foi construído a partir dos dados do programa de
reabilitação cardíaca no Exemplo 11.4.2.
A Figura 11.4.5 mostra a saída padrão do SPSS para este modelo de regressão logística.
Nesta figura, vemos que os valores pseudo-R2 de Cox e Snell e Nagelkerke são fornecidos. Como
ambos são > 0, o modelo com o preditor fornece mais informações do que o modelo somente de
interceptação. Pode-se ver facilmente que apenas 63% dos dados foram corretamente
Resumo do modelo
Cox & Snell R Nagelkerke R
Quadrado Quadrado
0,037 0,051
Tabela de classificação
previsto
Att Percentagem
Observado 0 1 Correto
Att 0 111 10 91,7
1 58 5 7.9
63,0
Porcentagem geral
FIGURA 11.4.5 Saída SPSS parcial para a análise de regressão logística dos dados no Exemplo
11.4.2.
reclassificados, sendo os participantes do programa de reabilitação muito mais mal classificados

do que os que não frequentaram o programa. A distribuição de frequência mostra o grande número
de indivíduos ATT ¼ 1 que foram erroneamente classificados como ATT ¼ 0 com base no modelo. &
EXEMPLO 11.4.5
Considere o modelo de regressão logística que foi construído a partir dos dados do programa de
reabilitação cardíaca no Exemplo 11.4.3.
A Figura 11.4.6 mostra a saída padrão do SPSS para este modelo de regressão logística.
Nesta figura, vemos que os valores pseudo-R2 de Cox e Snell e Nagelkerke são fornecidos e, como
ambos são > 0, o modelo com os preditores fornece mais informações do que o modelo apenas de
interceptação. Pode-se ver facilmente que apenas 69% dos dados foram reclassificados corretamente,
com o modelo reclassificando aqueles com início de uso excessivo de álcool em muito
Resumo do modelo
Cox & Snell R Nagelkerke R
Quadrado Quadrado
0,49 0,069
Tabela de classificação
previsto
Início Percentagem
Observado 0 1 Correto
início 0 2 37 5.1
1 3 87 96,7
69,0
Porcentagem geral
uma. O valor do corte é. 500
FIGURA 11.4.6 Saída parcial do SPSS para a análise de regressão logística dos dados do Exemplo 11.4.3.
taxa mais alta do que aqueles sem tal início. A distribuição de frequência mostra o grande número daqueles
sem início de uso excessivo de álcool previsto pelo modelo para desenvolver início precoce do alcoolismo.
&
Regressão logística politômica Até agora, limitamos nossa discussão a situações nas quais há uma variável
de resposta dicotômica (por exemplo, sucesso ou fracasso). Freqüentemente, temos uma situação em que
várias categorias compõem a resposta. Podemos, por exemplo, ter sujeitos que são classificados como
positivos, negativos e indeterminados para uma determinada doença (resposta padrão politômica). Também
pode haver momentos em que temos uma variável de resposta que é ordenada. Podemos, por exemplo,
classificar nossos sujeitos pelo IMC como abaixo do peso, peso ideal, sobrepeso ou obesos (uma resposta
politomal ordinal). O processo de modelagem é um pouco mais complexo e requer o uso de um programa de
computador. Para os interessados em explorar ainda mais esses valiosos métodos, recomendamos o livro de
Hosmer e Lemeshow (2).
EXERCÍCIOS 581
Leitura adicional Discutimos apenas os conceitos básicos e as aplicações da regressão

logística. A técnica tem aplicação muito mais ampla. A análise de regressão passo a passo
pode ser usada com a regressão logística. Também existem técnicas disponíveis para
construir intervalos de confiança para razões de chances. O leitor que desejar aprender
mais sobre regressão logística pode consultar os livros de Hosmer e Lemeshow (2) e Kleinbaum (3).
EXERCÍCIOS
11.4.1 Em estudo sobre vitimização violenta de mulheres e homens, Porcerelli et al. (A-11) coletou informações de 679
mulheres e 345 homens com idades entre 18 e 64 anos em vários centros de prática familiar na área metropolitana
de Detroit. Os pacientes preencheram um questionário de histórico de saúde que incluía uma pergunta sobre
vitimização. A tabela a seguir mostra os sujeitos da amostra classificados por gênero e se o sujeito se autoidentificou
como sendo “batedo, chutado, socado ou ferido de outra forma por alguém no último ano”. Os sujeitos que
respondem sim a essa pergunta são classificados como “vitimados violentamente”.
Use a análise de regressão logística para encontrar os coeficientes de regressão e a estimativa da razão de chances.
Escreva uma interpretação de seus resultados.
Vitimização Mulheres Homens Total
Sem vitimização 611 308 919

Vitimado violentamente 68 37 105
Total 679 345 1024
Fonte: John H. Porcerelli, Rosemary Cogan, Patricia P. West, Edward A. Rose, Dawn
Lambrecht, Karen E. Wilson, Richard K. Severson e Dunia Karana, “Vitimização violenta de
mulheres e homens: sintomas físicos e psiquiátricos, ” Journal of the American Board of
Family Practice, 16 (2003), 32–39.
11.4.2 Consulte a pesquisa de Gallagher et al. (A-10) discutido no Exemplo 11.4.2. Outra covariável de interesse foi uma
pontuação usando o Índice Hospitalar de Ansiedade e Depressão. Um valor mais alto para essa pontuação indica
um nível mais alto de ansiedade e depressão. Use os dados a seguir para prever se uma mulher no estudo
participou de um programa de reabilitação cardíaca.
Hospital Ansiedade
e Depressão
Pontuações de índice para
Índice Hospitalar de Ansiedade e Depressão participando

Pontuações para mulheres não participantes Mulheres
17 14 19 16 23 25
7 216936
19 13 8 22 24 29
16 15 13 17 13 22
23 14 27 14 23 5 18
21 5 21 414 14 4 26 11
12 15 19 12
9 23 25 20
29 19 15 18
22 24
27 18 19 20 13 18
(Contínuo )
Hospital Ansiedade e
Depressão
Pontuações de índice para
Índice Hospitalar de Ansiedade e Depressão participando

Pontuações para mulheres não participantes Mulheres
14 22 17 21 21 8
25 5 13 17 15 10
19 27 14 17 12 17
23 16 14 10 25 14
6 11 17 13 29 21
8 19 26 10 17 25
15 23 15 20 21 25
30 22 19 3 8 16
18 25 16 18 19 23
10 11 10 9 16 19
29 20 15 10 24 24
8 11 22 17 11
12 28 5 15 26 17
27 12 8 13 12 19
12 19 15 16 19 20
9 18 20 12 13 17
16 13 2 23 31
6 12 11 0
22 7 6 14 17 18
10 12 19 29 18
9 14 14 6 15
11 13 19 20
Fonte: Dados fornecidos por cortesia de Robyn Gallagher, RN, Ph.D.
11.5 RESUMO
Este capítulo foi incluído para benefício daqueles que desejam ampliar sua compreensão da análise de
regressão e sua capacidade de aplicar técnicas a modelos mais complexos do que os abordados nos Capítulos
9 e 10. Neste capítulo, apresentamos alguns tópicos adicionais da análise de regressão . Discutimos a análise
apropriada quando uma ou mais variáveis independentes são dicotômicas. Nesta discussão, o conceito de
codificação de variável fictícia é apresentado. Um segundo tópico que discutimos é como selecionar as
variáveis independentes mais úteis quando temos uma longa lista de candidatos potenciais. A técnica que
ilustramos para esse propósito é a análise de regressão passo a passo. Por fim, apresentamos os conceitos e
procedimentos básicos envolvidos na análise de regressão logística. Cobrimos duas situações: o caso em que
a variável independente é dicotômica e o caso em que a variável independente é contínua.
Uma vez que os cálculos envolvidos na obtenção de resultados úteis a partir de dados apropriados
para análise por meio das técnicas apresentadas neste capítulo são complicados e demorados quando
realizados manualmente, recomenda-se o uso de um computador para a realização dos exercícios.
Fórmula
Nome do número Fórmula
11.4.1- Representações do modelo de y ¼ b0 þ b1x þ e

11.4.3 regressão linear simples myjx ¼ b0 þ b1x
Eð Þ yjx ¼ b0 þ b1x
11.4.4 Modelo de regressão logística simples ln p

1p hi ¼ b0 þ b1x
11.4.5 Representação alternativa do modelo ð exp b0 þ b1

p¼
de regressão logística simples exp b0 þ Þx
b1 ð Þx 1 þ
11.4.6 Representação alternativa do modelo ln p

1p hi ¼ b0 þ b1x1j þ b2x2j þþ bkxkj
de regressão logística múltipla
11.4.7 Representação alternativa do modelo de regressão logística múltipla exp b0 þ b1x1j þ b2x2j þþ
bkxkj p ¼ 1 þ exp b0 þ b1x1j þ b2x2j þþ bkxkj
Símbolo b0 ¼ interceptação de regressão

Chave bi ¼ coeficiente de regressão e
¼ termo de erro do modelo de regressão
Eð Þ yjx ¼ valor esperado de y em x
ln p
1p hi ¼ log it transformação
myjx ¼ média de y em
x xi ¼ valor da variável independente em i
1. O que é uma variável qualitativa?
2. O que é uma variável dummy?
3. Explique e ilustre a técnica de codificação de variáveis fictícias.
4. Por que o conhecimento das técnicas de seleção de variáveis é importante para o pesquisador da área da saúde?
5. O que é regressão passo a passo?
6. Explique o conceito básico envolvido na regressão passo a passo.
7. Quando a regressão logística é usada?
8. Escreva e explique os componentes do modelo de regressão logística.
9. Defina a palavra probabilidades.
10. O que é uma razão de chances?
11. Dê um exemplo em sua área em que a análise de regressão logística seria apropriada quando o
variável independente é dicotômica.
12. Dê um exemplo em sua área em que a análise de regressão logística seria apropriada quando o
variável independente é contínua.
13. Encontre um artigo publicado na área de ciências da saúde em que cada uma das seguintes técnicas seja empregada:
(a) Codificação de variável fictícia
(b) Regressão passo a passo (c)
Regressão logística Escreva um
relatório sobre o artigo no qual você identifica as variáveis envolvidas, o motivo da escolha da técnica e as conclusões que os
autores chegam com base em sua análise.
14. No Exemplo 10.3.1, vimos que o objetivo de um estudo de Jansen e Keller (A-12) era prever a capacidade de direcionar a atenção
(CDA) em idosos. O estudo coletou informações sobre 71 mulheres idosas residentes na comunidade com estado mental
normal. Pontuações CDA mais altas indicam melhor funcionamento atencional. Além das variáveis idade e escolaridade, os
pesquisadores realizaram uma regressão stepwise com duas variáveis adicionais: AIVD, uma medida das atividades da vida
diária (valores mais altos indicam maior número de atividades diárias) e ADS, uma medida das demandas atencionais (maior
valores indicam mais demandas atencionais). Realize a regressão passo a passo com os dados na tabela a seguir e relate seu
modelo final, valores de p e conclusões.
Idade CDA Edyrs IADL ADS Idade CDA Edyrs IADL ADS
4.57 72 20 28 27 3.17 79 12 28 18
3:04 68 12 27 96 1:19 87 12 21 61
1.39 65 13 24 97 0,99 71 14 28 55
3:55 85 14 27 48 2:94 81 16 27 124
2:56 84 13 28 50 2:21 66 16 28 42
4:66 90 15 27 47 0:75 81 16 28 64
2:70 79 12 28 71 5.07 80 13 28 26
0,30 74 10 24 48 5:86 82 12 28 84
4:46 69 12 28 67 5,00 65 13 28 43
6:29 87 15 21 81 0,63 73 16 26 70
4:43 84 12 27 44 2.62 85 16 28 20
0,18 79 12 28 39 1,77 83 17 23 80
1:37 71 12 28 124 3:79 83 27 21
3,26 76 14 29 43 1,44 76 8 28 26
1:12 73 14 29 30 5:77 77 20 12 28 53
0:77 86 12 26 44 5:77 83 12 22 69
3,73 69 17 28 47 4:62 79 14 27 82
5:92 66 11 28 49 2:03 69 12 28 77
5,74 65 16 28 48 2:22 66 14 28 38
2.83 71 14 28 46 0,80 75 12 28 28
2:40 80 18 28 25 0:75 77 16 27 85
0:29 81 11 28 27 4:60 78 12 22 82
4.44 66 14 29 54 2.68 83 20 28 34
3.35 76 17 29 26 3:69 85 10 20 72
3:13 70 12 25 100 4,85 76 18 28 24
2:14 76 12 27 38 0:08 75 14 29 49
9.61 67 12 26 84 0,63 70 16 28 29
7.57 72 20 29 44 5.92 79 16 27 83
(Contínuo )
Idade CDA Edyrs IADL ADS Idade CDA Edyrs IADL ADS
2.21 68 18 28 52 3.63 75 18 28 32
2:30 102 12 26 18 7:07 94 8 24 80
1,73 67 12 27 80 6.39 76 18 28 41
6.03 66 14 28 54 0:08 84 18 27 75
0:02 75 18 26 67 1.07 79 17 27 21
7:65 91 13 21 101 5.31 78 16 28 18
4.17 74 15 28 90 0,30 79 12 28 38
Fonte: Dados fornecidos por cortesia de Debra Jansen, Ph.D., RN
15. Na tabela a seguir estão os valores de débito cardíaco (L/min) e consumo de oxigênio (VO2 ) para uma amostra de adultos (A) e
crianças (C), que participaram de um estudo desenhado para investigar a relação entre essas variáveis. As medições foram
feitas tanto em repouso quanto durante o exercício. Trate o débito cardíaco como a variável dependente e use codificação de
variável fictícia e analise os dados por técnicas de regressão. Explique os resultados. Plote os dados originais e as equações
de regressão ajustadas.
Cardíaco VO2 Era Cardíaco VO2

Saída (L/min) (L/min) Grupo Saída (L/min) (L/min) Grupo de idade
4,0 .21 UMA 4,0 .25 C

7,5 .91 C 6,1 .22 UMA
3,0 .22 C 6,2 .61 C

8,9 .60 UMA 4,9 .45 C
5,1 .59 C 14,0 1.55 UMA
5.8 .50 UMA 12.9 1.11 UMA
9.1 0,99 UMA 11.3 1,45 UMA
3.5 .23 C 5.7 .50 C

7.2 .51 UMA 15,0 1.61 UMA
5.1 .48 C 7.1 .83 C

6.0 .74 C 8,0 .61 UMA
5.7 .70 C 8.1 .82 UMA
14.2 1,60 UMA 9,0 1.15 C

4.1 .30 C 6.1 .39 UMA
16. Uma amostra aleatória simples de indivíduos normais com idade entre 6 e 18 anos forneceu os dados de potássio corporal total
(mEq) e água corporal total (litros) mostrados na tabela a seguir. Seja o potássio total a variável dependente e use codificação
de variável fictícia para quantificar a variável qualitativa.
Analise os dados usando técnicas de regressão. Explique os resultados. Plote os dados originais e as equações de regressão
ajustadas.
Corpo todo Corpo todo Corpo todo Corpo todo

Potássio Água Sexo Potássio Água Sexo
795 13 M 950 12 F
1590 16 F 2400 26 M
1250 15 M 1600 24 F
1680 21 M 2400 30 M
(Contínuo )
Corpo todo Corpo todo Corpo todo Corpo todo

Potássio Água Sexo Potássio Água Sexo
800 10 F 1695 26 F
2100 26 M 1510 21 F
1700 15 F 2000 27 F
1260 16 M 3200 33 M
1370 18 F 1050 14 F
1000 11 F 2600 31 M
1100 14 M 3000 37 M
1500 20 F 1900 25 F
1450 19 M 2200 30 F
1100 14 M
17. Os dados apresentados na tabela a seguir foram coletados como parte de um estudo no qual os participantes eram bebês
prematuros com baixo peso ao nascer em três hospitais diferentes. Use codificação de variável fictícia e técnicas de
regressão múltipla para analisar esses dados. Podemos concluir que as três populações hospitalares amostrais diferem
quanto ao peso médio ao nascer quando se leva em conta a idade gestacional? Podemos concluir que existe interação
entre hospital de nascimento e idade gestacional?
Plote os dados originais e as equações de regressão ajustadas.
Aniversário Gestação Hospital de Aniversário Gestação Hospital de

Peso (kg) Idade (semanas) Nascimento Peso (kg) Idade (semanas) Nascimento
1.4 30 UMA 1,0 29 C

.9 27 B 1.4 33 C
1.2 33 UMA .9 28 UMA
1.1 29 C 1,0 28 C
1.3 35 UMA 1.9 36 B
.8 27 B 1.3 29 B
1,0 32 UMA 1.7 35 C
.7 26 UMA 1,0 30 UMA
1.2 30 C 28 UMA
.8 28 UMA 0,9 31 UMA
1.5 32 B 1,0 31 B
1.3 31 UMA 1,6 33 B
1.4 32 C 1,6 1,7 34 B
1,5 33 B 1.6 35 C
1,0 27 UMA 1.2 28 UMA
1.8 35 B 1,5 30 B
1.4 36 C 1.8 34 B
1.2 34 UMA 1,5 34 C
1.1 28 B 1.2 30 UMA
1.2 30 B 1.2 32 C
18. Consulte o Capítulo 9, Exercício de revisão 18. No estudo citado nesse exercício, Maria Mathias (A-13) investigou a relação
entre as idades (IDADE) dos meninos e a melhora nas medidas de hiperatividade, atitude e comportamento social. No
estudo, os indivíduos foram aleatoriamente designados para dois tratamentos diferentes. O grupo de controle (TREAT
¼ 0) recebeu terapia padrão para hiperatividade, e o grupo de tratamento (TREAT ¼ 1) recebeu terapia padrão mais
pet therapy. os resultados são
mostrado na tabela a seguir. Crie um gráfico de dispersão com idade como variável independente e ATT
(mudança de atitude com números positivos indicando mudança positiva de atitude) como variável dependente.
Use símbolos diferentes para os dois grupos de tratamento diferentes. Use técnicas de regressão múltipla para
determinar se a idade, o tratamento ou a interação são úteis para prever o ATT.
Relate seus resultados.
Sujeito TRATAR IDADE ATT Sujeito TRATAR IDADE ATT
1 19 1:2 2 0,0 3 0:4 4 16 0:4 17 0 10 0,4

1 9 18 0 0,0
1 13 19 0 7 12 1,1
20 0 9 0,2
5 1 9 1,0 21 0 7 0,4
6 1 8 0,8 22 0 6 0,0
7 18 0:6 23 1 11 0,6
8 19 1:2 24 1 11 0,4
9 0 7 0,0 25 1 11 1,0
10 0 12 0,4 26 1 11 0,8
11 0 9 0:8 27 1 11 1.2
12 0 10 1,0 28 1 11 0,2
13 0 12 1.4 29 1 11 0,8
14 0 9 1,0 30 1 8 0,0
15 0 12 0,8 31 1 9 0,4
16 0 9 1,0
Fonte: Dados fornecidos por cortesia de Maria Mathias, MD e do Wright State University Statistical Consulting
Center.
Para cada estudo descrito nos Exercícios 19 a 21, responda o máximo possível das seguintes perguntas: (a)
Qual é a variável dependente? (b) Quais são as variáveis independentes? (c) Quais são as hipóteses nula e
alternativa apropriadas? (d) Quais hipóteses nulas você acha que foram rejeitadas? Porque? (e) Qual é o
objetivo mais relevante, previsão ou estimativa, ou os dois são igualmente relevantes?
Explique sua resposta.

(f) Qual é a população amostrada? (g)
Qual é a população-alvo? (h) Quais
variáveis estão relacionadas a quais outras variáveis? As relações são diretas ou inversas?
(i) Escreva a equação de regressão usando números apropriados para estimativas de parâmetros. (j)
Forneça valores numéricos para quaisquer outras estatísticas que você puder. (k) Identifique cada
variável quanto ao seu caráter quantitativo ou qualitativo. (l) Explique o significado de quaisquer
estatísticas para as quais são dados valores numéricos.
19. Golfinopoulos e Arhonditsis (A-14) usaram um modelo de regressão múltipla em um estudo de trihalometanos
(THMs) na água potável em Atenas, Grécia. Os THMs são motivo de preocupação, pois têm sido relacionados
ao câncer e a resultados reprodutivos. Os pesquisadores acharam o seguinte modelo de regressão útil em
Prevendo THM:
THM ¼ :26chla þ 1:57 pH þ 28:74Br 66:72Br2

43:63S þ 1:13Sp þ 2:62T S :72T CL
As variáveis foram as seguintes: chla ¼ concentração de clorofila, pH ¼ ácido = escala de base, Br ¼ concentração de
brometo, S ¼ variável fictícia para o verão, Sp ¼ variável fictícia para a primavera, T ¼ temperatura e CL ¼ concentração de
cloro. Os pesquisadores relataram R ¼ :52, p < :001.
20. Em um estudo de Takata et al. (A-15), os investigadores avaliaram a relação entre a capacidade de mastigação e o número de
dentes e as medidas de aptidão física em uma amostra de indivíduos com 80 anos ou mais no Japão.
Uma das variáveis de resultado que mediram a aptidão física foi a força dos extensores da perna. Para medir a capacidade
de mastigar alimentos, os indivíduos foram questionados sobre sua capacidade de mastigar 15 alimentos (amendoim, polvo
avinagrado, pão francês, entre outros). A consideração de variáveis como altura, peso corporal, sexo, pressão arterial sistólica,
albumina sérica, concentração de glicose em jejum, dor nas costas, tabagismo, consumo de álcool, estado civil, tratamento
médico regular e exercícios regulares revelou que o número de alimentos mastigáveis foi significativo na predição da força
extensora da perna (b^ ¼ :075; p ¼ :0366). 1
No entanto, na presença das demais variáveis, o número de dentes não foi um preditor significativo (b^
1 ¼ :003; p ¼ :9373).
21. Varela et al. (A-16) examinou 515 pacientes submetidos à ressecção pulmonar para carcinoma broncogênico. A variável de
desfecho foi a ocorrência de morbidade cardiorrespiratória após a cirurgia.
Qualquer um dos seguintes eventos pós-operatórios indicou morbidade: atelectasia pulmonar ou pneumonia, insuficiência
respiratória ou ventilatória na alta, necessidade de ventilação mecânica a qualquer momento após a extubação na sala de
cirurgia, tromboembolismo pulmonar, arritmia, isquemia miocárdica ou infarto e quadro clínico cardíaco insuficiência.
Realizando uma regressão logística stepwise, os pesquisadores descobriram que a idade (p < :001) e o volume expiratório
forçado pós-operatório (p ¼ :003) foram estatisticamente significativos em predizer a ocorrência de morbidade cardiorrespiratória.
Para cada um dos conjuntos de dados fornecidos nos Exercícios 22 a 29, faça o que achar apropriado: (a) Aplique uma ou
mais das técnicas discutidas neste capítulo. (b) Aplique uma ou mais das técnicas discutidas nos capítulos anteriores. (c)
Construir gráficos. (d) Formule hipóteses relevantes, execute os testes apropriados e encontre os valores de p. (e) Declare as
decisões estatísticas e conclusões clínicas que os resultados de seus testes de hipótese
justificar.
(f) Descreva a(s) população(ões) à(s) qual(is) você acha que suas inferências são aplicáveis.
22. Um estudo de Davies et al. (A-17) foi motivado pelo fato de que, em estudos anteriores de respostas contráteis a agonistas b-
adrenoceptores em miócitos únicos de corações humanos falidos e não falidos, eles observaram um declínio relacionado à
idade na resposta máxima ao isoproterenol, em frequências onde a resposta máxima ao alto Ca2+ na mesma célula
permaneceu inalterada. Para o presente estudo, os pesquisadores calcularam a relação isoproterenol/Ca2+ (ISO/CA) a partir
de medições feitas em miócitos de pacientes com idade variando de 7 a 70 anos. Os indivíduos foram classificados como mais
velhos (> 50 anos) e mais jovens. A seguir estão os valores (ISO/CA), idade e fonte de miócitos dos indivíduos no estudo. As
fontes de miócitos foram relatadas como doador e biópsia.
Era ISO/CA Fonte de miócitos
7 1.37 Doador
21 1.39 Doador
28 1.17 Doador
35 0,71 Doador
38 1,14 Doador
50 0,95 Doador
51 0,86 Biópsia
52 0,72 Biópsia
55 0,53 Biópsia
56 0,81 Biópsia
61 0,86 Biópsia
70 0,77 Biópsia
Fonte: Dados fornecidos por cortesia do Dr. Sian E. Harding.
23. Hayton et al. (A-18) investigaram a farmacocinética e a biodisponibilidade do cefetamet e do cefetamet pivoxil em lactentes com
idade entre 3,5 e 17,3 meses que receberam o antibiótico durante e após cirurgia urológica. Entre os dados farmacocinéticos
coletados estavam as seguintes medições do volume de distribuição aparente no estado estacionário (V). Também são
mostrados dados coletados anteriormente em crianças de 3 a 12 anos (A-19) e adultos (A-20). Os pesos (P) dos indivíduos
também são mostrados.
bebês Crianças adultos
W (kg) V (litros) W (kg) V (litros) W (kg) V (litros)
6,2 2,936 13 4,72 61 19,7

7,5 3,616 14 5,23 80 23,7
7,0 1,735 14 5,85 96 20,0
7.1 2.557 15 4.17 75 19.5
7.8 2.883 16 5.01 60 19.6
8.2 2.318 17 5.81 68 21.5
8.3 3.689 17 7.03 72.2 21.9
8.5 4.133 17.5 6.62 87 30.9
8.6 2.989 17 4,98 66,5 20.4
8.8 3.500 17.5 6.45
10,0 4.235 20 7.73
10,0 4.804 23 7.67
10.2 2.833 25 9.82
10.3 4.068 37 14h40
10.6 3.640 28 10,90
10.7 4.067 47 15h40
10.8 8.366 29 9.86
11,0 4.614 37 14h40
12.5 3.168
13.1 4.158
Fonte: Dados fornecidos por cortesia do Dr. Klaus Stoeckel.

24. Segundo Fils-Aime et al. (A-21), pesquisas epidemiológicas constataram que o alcoolismo é o transtorno mental ou de
abuso de substâncias mais comum entre os homens nos Estados Unidos. Fils-Aime e associados investigaram as inter-
relações da idade de início do consumo excessivo de álcool, história familiar de alcoolismo, comorbidade psiquiátrica e
concentrações de metabólitos de monoamina no líquido cefalorraquidiano (LCR) em alcoólatras em abstinência e em
busca de tratamento. Os indivíduos eram principalmente homens brancos classificados como tendo início precoce (25
anos ou menos) ou tardio (mais de 25 anos) de consumo excessivo de álcool. Entre os dados coletados estavam as
seguintes medições das concentrações de triptofano (TRYPT) e ácido 5-hidroxiindolacético (5-HIAA) no LCR (pmol/ml).
Início Início
1 ¼ Antecipado 1 ¼ Antecipado
5-HIAA TRIPT 0 ¼ Atrasado 5-HIAA TRIPT 0 ¼ Atrasado
57 3315 1 102 3181 1

116 2599 0 51 2513 1
81 3334 1 92 2764 1
78 2505 0 104 3098 1
206 3269 0 50 2900 1
64 3543 1 93 4125 1
123 3374 0 146 6081 1
147 2345 1 96 2972 1
102 2855 1 112 3962 0
93 2972 1 23 4894 1
128 3904 0 109 3543 1
69 2564 1 80 2622 1
20 8832 1 111 3012 1
66 4894 0 85 2685 1
90 6017 1 131 3059 0
103 3143 0 58 3946 1
68 3729 0 110 3356 0
81 3150 1 80 3671 1
143 3955 1 42 4155 1
121 4288 1 80 1923 1
149 3404 0 91 3589 1
82 2547 1 102 3839 0

100 3633 1 93 2627 0
117 3309 1 98 3181 0
41 3315 1 78 4428 0
223 3418 0 152 3303 0
96 2295 1 108 5386 1
87 3232 0 102 3282 1
96 3496 1 122 2754 1
34 2656 1 81 4321 1
98 4318 1 81 3386 1
86 3510 0 99 3344 1
118 3613 1 73 3789 1
84 3117 1 163 2131 1
99 3496 1 109 3030 0
114 4612 1 90 4731 1
(Contínuo )
Início 1 Início 1
¼ Precoce ¼ Precoce
5-HIAA TRIPT 0 ¼ Tardio 5-HIAA TRIPT 0 ¼ Tardio
140 3051 1 110 4581

74 3067 1 48 3292 1
45 2782 1 77 4494 0
51 5034 1 67 3453 01
99 2564 1 92 3373 1
54 4335 1 86 3787 0
93 2596 1 101 3842 1
50 2960 1 88 2882 1
118 3916 0 38 2949 1
96 2797 0 75 2248 0
49 3699 1 35 3203 0
133 2394 0 53 3248 1
105 2495 0 77 3455 0
61 2496 1 179 4521 1
197 2123 1 151 3240 1
87 3320 0 57 3905 1
50 3117 1 45 3642 1
109 3308 0 76 5233 0
59 3280 1 46 4150 1
107 3151 1 98 2579 1
85 3955 0 84 3249 1
156 3126 0 119 3381 0
110 2913 0 41 4020 1
81 3786 1 40 4569 1
53 3616 1 149 3781 1
64 3277 1 116 2346 1
57 2656 1 76 3901 1
29 4953 0 96 3822 1
34 4340 1
Fonte: Dados fornecidos por cortesia do Dr. Markku Linnoila.
25. O objetivo do estudo de Abrahamsson et al. (A-22) foi investigar os efeitos antitrombóticos de um inibidor do ativador do
plasminogênio inibidor-1 (PAI-1) em ratos que receberam endotoxina. Os sujeitos experimentais foram ratos machos
Sprague-Dawley pesando entre 300 e 400 gramas. Entre os dados coletados estavam as seguintes medições da atividade
do PAI-1 e da concentração pulmonar de 125I em ratos anestesiados que receberam três drogas:
Plasma PAI-1 125I-Fibrina nos Pulmões (%

Drogas Atividade (U/ml) de Ref. Amostra)
Endotoxina 127 158

175 154
161 118
137 77
219 172
(Contínuo )
Plasma PAI-1 125I-Fibrina nos Pulmões (%

Drogas Atividade (U/ml) de Ref. Amostra)
260 277
203 216
195 169
414 272
244 192
Endotoxina þ PRAP ¼ 1 dose baixa 107 49

103 28
248 187
164 109
176 96
230 126
184 148
276 17
201 97
158 86
Endotoxina þ PRAP ¼ 1 dose alta 132 86

130 24
75 17
140 41
166 114
194 110
121 26
111 53
208 71
211 90
Fonte: Dados fornecidos por cortesia do Dr. Tommy Abrahamsson.
26. Pearse e Sylvester (A-23) conduziram um estudo para determinar as contribuições separadas da isquemia e da perfusão
extracorpórea para a lesão vascular que ocorre em pulmões isolados de carneiro e para determinar a dependência de
oxigênio dessa lesão. Os pulmões foram submetidos apenas à isquemia, apenas à perfusão extracorpórea e tanto à
isquemia quanto à perfusão extracorpórea. Entre os dados coletados estavam as seguintes observações sobre a mudança
na pressão arterial pulmonar (mm Hg) e capacidade de permeabilidade vascular pulmonar avaliada pela estimativa do
coeficiente de reflexão para albumina em pulmões perfundidos com e sem isquemia precedente:
Pulmões Isquêmicos-Perfundidos Pulmões Perfundidos
Pulmonar Reflexão Pulmonar Reflexão
Pressão Coeficiente Pressão Coeficiente
8,0 0,220 34,0 0,693

3.0 0,560 31,0 0,470
10,0 0,550 4.0 0,651
23,0 0,806 48,0 0,999
Pulmões Isquêmicos-Perfundidos Pulmões Perfundidos
Pulmonar Reflexão Pulmonar Reflexão
Pressão Coeficiente Pressão Coeficiente
15,0 0,472 32,0 0,719

43,0 0,759 27,0 0,902
18,0 0,489 25,0 0,736
27,0 0,546 25,0 0,718
13,0 0,548
0,0 0,467
Fonte: Dados fornecidos por cortesia do Dr. David B. Pearse.
27. O objetivo do estudo de Balzamo et al. (A-24) foi investigar, em coelhos anestesiados, os efeitos da ventilação mecânica na
concentração de substância P (SP) medida por radioimunoensaio em nervos e músculos associados à ventilação e que
participam da inervação sensorial do aparelho respiratório e do coração. SP é um neurotransmissor localizado em
neurônios sensoriais primários nos sistemas nervoso central e autônomo. Entre os dados coletados estavam as seguintes
medidas de concentração de SP nos nervos vagos cervicais (X) e gânglios nodosos correspondentes (NG), lados direito
e esquerdo:
SPXright SPNGdireita SPXesquerda SPNGesquerda
0,6500 9.6300 3,3000 1,9300

2,5600 3,7800 0,6200 2.8700
1.1300 7.3900 0,9600 1.3100
1,5500 3.2800 2,7000 5.6400
35,9000 22,0000 4,5000 9.1000
19,0000 22,8000 8,6000 8,0000
13,6000 2,3000 7,0000 8,3000
8,0000 15,8000 4,1000 4,7000
7,4000 1,6000 5,5000 2,5000
3,3000 11,6000 9,7000 8,0000
19,8000 18,0000 13,8000 8,0000
8,5000 6,2000 11,0000 17,2000
5,4000 7,8000 11,9000 5,3000
11.9000 16,9000 8,2000 10,6000
47,7000 35,9000 3,9000 3,3000
14.2000 10.2000 3.2000 1,9000
2,9000 1,6000 2,7000 3,5000
6,6000 3,7000 2,8000 2,5000
3,7000 1,3000
Fonte: Dados fornecidos por cortesia do Dr. Yves Jammes.
28. Scheeringa e Zeanah (A-25) examinaram a presença de transtorno de estresse pós-traumático (TEPT), a gravidade da
sintomatologia pós-traumática e o padrão de expressão de grupos de sintomas em relação a seis variáveis independentes
que podem ser importantes para o desenvolvimento de um transtorno pós-traumático em crianças com menos de 48
meses de idade. Os seguintes dados foram coletados durante o curso do estudo.
Variáveis preditoras Variáveis de resposta

Wit./ Ameaça para
Sexo Idade Aguda/Rept. Especialista em Lesões Cuidador Reexp Numb Arous FrAgg
0 1 0 1 1 1 3 00 1
0 1 0 0 0 1 2 21 1
1 1 0 0 0 1 3 11 1
0 1 0 0 0 1 3 10 4
1 0 1 1 1 0 1 31 1
1 1 0 1 1 0 3 10 1
0 1 0 1 1 0 4 20 1
0 1 0 0 1 0 5 20 4
1 1 0 0 0 1 2 13 2
1 1 1 1 1 0 4 10 0
0 0 1 1 1 0 1 30 1
1 0 1 0 1 0 1 30 2
1 0 1 1 1 0 0 30 0
1 1 0 1 1 0 4 12 1
1 0 0 1 1 1 3 21 3
0 0 1 3 12 1 3 12 2 5 21 1 1 22 2
1 1 0 1
0 1 0 1 1 1
0 1 0 1 1 1
0 1 0 001 001 0 4 40 3 2 12 3
01 0 1 1 1 0
1 0 0 1 1 1 1 12 1
1 1 0 0 0 1 4 11 1
0 1 0 0 0 1 3 21 0
0 1 0 0 0 1 3 12 4
0 1 0 0 0 1 3 12 4
0 1 0 0 1 0 2 20 0
1 1 0 0 0 1 2 03 0
1 1 0 0 0 1 2 01 2
0 1 0 1 0 1 2 31 3
1 1 1 0 1 0 1 21 1
1 1 0 1 1 1 3 20 4
1 1 0 0 0 0 2 42 0
0 1 0 0 0 1 1 10 2
0 0 1 0 0 1 2 32 3
0 0 1 0 0 1 3 14 3
0 0 1 0 0 1 3 12 3
0 0 0 0 1 0 1 10 0
0 0 0 0 4 32 3 4 23 2 1 22 1
0 0 1 1 1
110 0 1 1 1 00
Variáveis preditoras Variáveis de resposta

Wit./ Ameaça para
Sexo Idade Aguda/Rept. Especialista em Lesões Cuidador Reexp Numb Arous FrAgg
Chave: Gênero 0 ¼ macho

1 ¼ fêmea
Era 0 ¼ menor de 18 meses na época do trauma 1 ¼
maior de 18 meses
Aguda/Rept. 0 ¼ trauma foi agudo, golpe único 1 ¼
trauma foi revogado ou crônico 0 ¼
Ferida sujeito não foi ferido no trauma 1 ¼ sujeito foi
fisicamente ferido no trauma 0 ¼ sujeito testemunhou,
Wit./Exper. mas não experimentou diretamente o trauma 1 ¼ sujeito experimentou
diretamente o trauma 0 ¼ cuidador não foi ameaçado no trauma 1 ¼
Ameaça ao cuidador cuidador foi ameaçado no trauma
Reexp ¼ Reexperimentando a contagem de sintomas de cluster

Entorpecido ¼ Entorpecimento da contagem de sintomas do cluster de capacidade de resposta/evitação
Despertar ¼ Contagem de sintomas de cluster de hiperexcitação
FrAgg ¼ Contagem de novos sintomas de cluster de medos/agressão
Fonte: Dados fornecidos por cortesia do Dr. Michael S. Scheeringa.
29. Um dos objetivos do estudo de Mulloy e McNicholas (A-26) foi comparar a ventilação e as trocas gasosas durante o
sono e o exercício na doença pulmonar obstrutiva crônica (DPOC). Os investigadores desejavam também determinar
se os estudos de exercícios poderiam auxiliar na previsão da dessaturação noturna na DPOC. Os indivíduos (13
homens, 6 mulheres) eram pacientes ambulatoriais atendidos em uma clínica respiratória ambulatorial. A média de
idade dos pacientes, todos com DPOC grave e estável, foi de 64,8 anos com desvio padrão de 5,2. Entre os dados
coletados estavam medições nas seguintes variáveis:
Mais baixo Significar Mais baixo Cair

PaO2 PaCO2 VEF1 Ex. Dorme Dorme Dorme
uma uma uma uma
Idade (anos) IMC (mm Hg) (mm Hg) (% previsto) Sao2 Sao2 Sao2 Sao2
67 23,46 52,5 54 22 74 70,6 56 29,6

62 25,31 57,75 49,575 19 82 85,49 76 11,66
68 23.11 72 43,8 41 95 88,72 82 11.1
61 25.15 72 47.4 38 88 91.11 76 18h45
70 24,54 78 40.05 40 88 92,86 92 0,8
71 25,47 63,75 45.375 31 85 88,95 80 13
60 19,49 80,25 42.15 28 91 94,78 90 4
57 21,37 84,75 40.2 20 91 93,72 89 5.8
69 25,78 68,25 43,8 32 85 90,91 79 13
57 22,13 83,25 43.725 20 88 94,39 86 9.5
74 26,74 57,75 51 33 75 89,89 80 14.11
63 19.07 78 44.175 36 81 93,95 82 13
64 19,61 90,75 40,35 27 90 95,07 92 4
73 30,30 69,75 38,85 53 87 90 76 18
(Contínuo )
Mais baixo Significar Mais baixo Cair

Idade PaO2 PaCO2 VEF1 Ex. Dorme Dorme Dorme
uma uma uma uma
(anos) IMC (mm Hg) (mm Hg) (% previsto) Sao2 Sao2 Sao2 Sao2
63 26,12 51,75 46,8 39 67 69,31 46 34,9

62 21,71 72 24,75 41,1 27 88 87,95 72 22
67 84,75 25,98 84,75 40,575 45 87 92,95 90 2,17
57 32,00 51,75 40,05 35 94 93,4 86 8,45
66 53,175 30 83 80,17 71 16
uma
Tratada como variável dependente nas análises dos autores. IMC ¼ índice de massa corporal; Pao2 ¼ tensão arterial de
oxigênio: Paco2 ¼ pressão arterial de dióxido de carbono; VEF1 ¼ volume expiratório forçado em 1 segundo; Sao2 ¼
saturação arterial de oxigênio.
Fonte: Dados fornecidos por cortesia da Dra. Eithne Mulloy.
daniel
1. O objetivo do estudo de Gyurcsik et al. (A-27) foi examinar a utilidade de objetivos relacionados a exercícios aquáticos,
autoeficácia de tarefas e autoeficácia de programação para prever a frequência de exercícios aquáticos por indivíduos com
artrite. Os pesquisadores coletaram dados de 142 participantes dos Programas Aquáticos da Arthritis Foundation. A variável
de resultado foi a porcentagem de sessões atendidas durante um período de 8 semanas (ATTEND). As variáveis preditoras a
seguir são todas valores centralizados.
Assim, para cada participante, a média de todos os participantes é subtraída da pontuação individual. As variáveis são:
GOALDIFF—valores mais altos indicam o estabelecimento de metas de maior participação.
GOALSPEC - valores mais altos indicam maior especificidade de metas relacionadas ao exercício aquático.
INTER—interação de GOALDIFF e GOALSPEC.
TSE - valores mais altos indicam a confiança dos participantes em suas habilidades para assistir às aulas aquáticas.
SSE - valores mais altos indicam a confiança dos participantes em suas habilidades para realizar oito tarefas relacionadas
para agendar o exercício em sua rotina diária por 8 semanas.
MESES—meses de participação em exercícios aquáticos antes do início do estudo.
Com o conjunto de dados AQUATICS, execute uma regressão múltipla para prever ATTEND com cada uma das variáveis
acima. O que é o coeficiente de correlação múltipla? Quais variáveis são significativas na previsão do ATTEND? Quais são
suas conclusões?
2. Rodehorst (A-28) realizou um estudo prospectivo com 212 professores de escolas primárias rurais. A principal variável de
resultado foi a intenção dos professores de lidar com crianças que apresentavam sintomas de asma em suas salas de aula.
Essa variável foi medida com uma questão de item único que utilizou uma escala Likert de sete pontos (INTENT, com possíveis
respostas de 1 ¼ extremamente provável a 7 ¼ extremamente improvável). Rodehorst usou as seguintes variáveis como
variáveis independentes para prever INTENT:
SS ¼ Apoio Social. As pontuações variam de 7 a 49, com pontuações mais altas indicando maior suporte social percebido
para lidar com crianças com asma em um ambiente escolar.
ATT ¼ Atitude. As pontuações variam de 15 a 90, com pontuações mais altas indicando atitudes mais favoráveis
em direção à asma.
REFERÊNCIAS 597
SABER ¼ Conhecimento. As pontuações variam de 0 a 24, com pontuações mais altas indicando maior
conhecimento sobre asma.
CRIANÇA ¼ Número de crianças com asma que o professor teve em sua classe durante toda a sua carreira
docente.
SE ¼ Autoeficácia. As pontuações variam de 12 a 60, com pontuações mais altas indicando maior autoeficácia
para lidar com crianças com asma no ambiente escolar.
YRS ¼Anos de experiência docente.
Com os dados PROFESSORES, use a análise de regressão passo a passo para selecionar as variáveis mais
úteis para incluir em um modelo para prever INTENT.
3. Consulte os dados de perda de peso em 588 pacientes com câncer e 600 controles saudáveis (WGTLOSS). A perda
de peso entre pacientes com câncer é um fenômeno bem conhecido. De interesse para os médicos é o papel
desempenhado no processo por anormalidades metabólicas. Uma investigação sobre as relações entre essas
variáveis produziu dados sobre a renovação de proteínas de corpo inteiro (Y) e a porcentagem de peso corporal
ideal para altura (X). Os participantes eram pacientes com câncer de pulmão e controles saudáveis da mesma
idade. Selecione uma amostra aleatória simples de tamanho 15 de cada grupo e faça o seguinte:
(a) Desenhe um diagrama de dispersão dos dados da amostra usando diferentes símbolos para cada um dos
dois grupos. (b) Use codificação de variável fictícia para analisar esses dados. (c) Trace as duas linhas de
regressão no diagrama de dispersão. Pode-se concluir que as duas populações amostradas diferem em relação
ao turnover proteico médio quando se leva em conta a porcentagem do peso ideal?
Pode-se concluir que existe interação entre estado de saúde e percentual do peso corporal ideal?
Prepare uma interpretação verbal dos resultados de sua análise e compare seus resultados com os de seus
colegas.
REFERÊNCIAS
1. BRUCE L. BOWERMAN e RICHARD T. O'CONNELL, Linear Statistical Models: An Applied Approach, 2ª ed. PWS Kent Publishing, Boston,
1990.
2. DAVID W. HOSMER e STANLEY LEMESHOW, Regressão Logística Aplicada, 2ª Ed. Wiley, Nova York, 2000.
3. DAVID G. KLEINBAUM, Logistic Regression: A Self-Learning Text, Nova York, Springer, 1994.
4. DR COX e EJ SNELL, Análise de Dados Binários, 2ª ed. Chapman e Hall/CRC, Nova York, 1989.
5. NJD NAGELKERKE, “Uma nota sobre uma definição geral do coeficiente de determinação”, Biometrika, 78 (1991),
691–692.
A-1. Centro Estadual da Carolina do Norte para Estatísticas de Saúde e Instituto Howard W. Odum para Pesquisa em Ciências Sociais
na Universidade da Carolina do Norte em Chapel Hill, dados de nascimento definidos para 2001 encontrados em www.irss.unc.edu/
ncvi tal/bfd1down.html. Todas as amostragens e codificações realizadas por John Holcomb não representam as descobertas do Centro
ou Instituto.
A-2. B. BOLWELL, R. SOBECKS, B. POHLMAN, S. ANDRESEN, K. THEIL, S. SERAFINO , L. RYBICKI e M. KALAYCIO, “Etoposide (VP-16)
Plus G-CSF Mobilizes Different Dendritic Cell Subsets than Does G-CSF Alone,” Bone Marrow Transplantation, 31 (2003), 95–98.
A-3. MANOJ PANDEY, LAL B. SHARMA e VIJAY K. SHUKLA, “Cytochrome P-450 Expression and Lipid Peroxidation in
Gallbladder Cancer,” Journal of Surgical Oncology, 82 (2003), 180–183.
A-4. MORI J. KRANTZ, ILANA B. KUTINSKY, ALASTAIR D. ROBERTSON e PHILIP S. MEHLER, "Efeitos relacionados à dose da metadona
no prolongamento do intervalo QT em uma série de pacientes com Torsade de Pointes", Farmacoterapia, 23 (2003), 802 –805.
A-5. ROBERT A. REISS, CURTIS E. HAAS, DEBORAH L. GRIFFIS, BERNADETTE PORTER e MARY ANN TARA, “Monitoramento no local
de atendimento versus monitoramento laboratorial de pacientes que recebem diferentes terapias com anticoagulantes”, Farmacoterapia
22, (2002), 677–685 .
A-6. GWI-RYUNG SON, MAY L. WYKLE e JACLENE A. ZAUSZNIEWSKI, “Cuidadoras de crianças adultas coreanas de adultos mais velhos
with Dementia,” Journal of Gerontological Nursing, 29 (2003), 19–28.
A-7. M. NAEIJE, “Fatores cinemáticos e antropométricos locais relacionados à abertura máxima da boca em indivíduos saudáveis
Indivíduos”, Journal of Oral Rehabilitation, 29 (2002), 534–539.
A-8. DANIEL F. CONNOR, RONALD J. STEINGARD, JENNIFER J. ANDERSON e RICHARD H. MELLONI, “Diferenças de gênero na agressão
reativa e proativa”, Psiquiatria infantil e desenvolvimento humano, 33 (2003), 279–294.
A-9. DANIEL H. LAMONT, MATTHEW J. BUDOFF, DAVID M. SHAVELLE, ROBERT SHAVELLE, BRUCE H. BRUNDAGE e JAMES M.
HAGAR, “Coronary Calcium Scanning Adds Incremental Value to Patients with Positive Stress Tests,”
A-10. ROBYN GALLAGHER, SHARON MCKINLEY e KATHLEEN DRACUP, "Preditores de Atendimento de Mulheres em Programas de
Reabilitação Cardíaca", Progresso em Enfermagem Cardiovascular, 18 (2003), 121–126.
A-11. JOHN H. PORCERELLI, ROSEMARY COGAN, PATRICIA P. WEST, EDWARD A. ROSE, DAWN LAMBRECHT, KAREN E. WILSON,
RICHARD K. SEVERSON e DUNIA KARANA, “Vitimização violenta de mulheres e homens: sintomas físicos e psiquiátricos,” Journal
do Conselho Americano de Prática Familiar, 16 (2003), 32–39.
A-12. DEBRA A. JANSEN e MARY L. KELLER, “Função cognitiva em mulheres idosas que vivem na comunidade”, Journal of Gerontological
Nursing, 29 (2003), 34–43.
A-13. MARIA MATHIAS e o Centro de Consultoria Estatística da Wright State University.
A-14. SPYROS K. GOLFINOPOULOS e GEORGE B. ARHONDITSIS, “Modelos de regressão múltipla: uma metodologia para avaliar as
concentrações de trihalometano na água potável a partir das características da água bruta”, Chemosphere, 47 (2002), 1007–1018.
A-15. Y. TAKATA, T. ANSAI, S. AWANO, T. HAMASAKI, Y. YOSHITAKE, Y. KIMURA, K. SONOKI, M. WAKISAKA, M. FUKUHARA e T.
TAKEHARA, “Relação da Aptidão Física para Mastigar em uma População de 80 anos”, Oral Diseases, 10 (2004), 44–49.
A-16. G. VARELA, N. NOVOA, MF JIMENEZ e G. SANTOS,

, “Aplicabilidade da Modelagem de Risco de Regressão Logística (LR) para
Tomada de Decisão na Ressecção de Câncer de Pulmão,” Interactive Cardiovascular and Thoracic Surgery, 2 (2003), 12–15.
A-17. CH DAVIES, N. FERRARA e SE HARDING, “Alterações da função b-adrenoceptora com a idade do sujeito em
Myocytes from Non-Failing Human Ventricle,” Cardiovascular Research, 31 (1996), 152–156.
A-18. WILLIAM L. HAYTON, JOHANNES KNEER, RONALD GROOT e KLAUS STOECKEL, "Influência da maturação e crescimento na
farmacocinética do cefetamet pivoxil: dosagem racional para bebês", agentes antimicrobianos e quimioterapia, 40 (1996), 567–574.
A-19. WL HAYTON, RA WALSTAD, E. THURMANN -NIELSEN, T. KUFAAS, J. KNEER, RJ AMBROS, HE RUGSTAD, E. MONN, E. BODD e
K. STOECKEL, “Pharmacokinetics of Intravenous Cefetamet and Oral Cefetamet Pivoxil in Children ,” Antimicrobial Agents and
Chemotherapy, 35 (1991), 720–725. Errata, 36 (1992), 2575.
A-20. MP DUCHARME, DJ EDWARDS, PJ MCNAMARA e K. STOECKEL, “Bioavailability of Syrup and Tablet Formulations of Cefetamet
Pivoxil,” Antimicrobial Agents and Chemotherapy, 37 (1993), 2706–2709.
A-21. MARIE-LOURDES FILS-AIME, MICHAEL J. ECKARDT, DAVID T. GEORGE, GERALD L. BROWN, IVAN MEFFORD e MARKKU
LINNOILA, “Early-Onset Alcoholics Have Lower Cerebrospinal Fluid 5- Hydroxyindoleacetic Acid Levels than Late-Onset Alcoholics,”
Archives of General Psychiatry, 53 (1996), 211–216.
A-22. T. ABRAHAMSSON, V. NERME, M. STROMQVIST € , B. A KERBLOM, A. LEGNEHED, K. PETTERSSON e A. WESTIN ERIKSSON,
"Efeito antitrombótico do inibidor PAI-1 em ratos com endotoxina administrada", Trombose e Haemostasis, 75 (1996), 118–126.
A-23. DAVID B. PEARSE e JT SYLVESTER, "Lesão vascular em pulmões isolados de ovelhas: papel da isquemia, perfusão extracorpórea e
oxigênio", American Journal of Respiratory and Critical Care Medicine, 153 (1996), 196–202.
A-24. EMMANUEL BALZAMO, PIERRE JOANNY, JEAN GUILLAUME STEINBERG, CHARLES OLIVER e YVES JAMMES, "A ventilação
mecânica aumenta a concentração da substância P nos nervos vago, simpático e frênico", American Journal of Respiratory and Critical
Care Medicine, 153 (1996), 153 –157.
A-25. MICHAEL S. SCHEERINGA e CHARLES H. ZEANAH, “Expressão de sintomas e variáveis de trauma em crianças menores de
48 meses de idade”, Infant Mental Health Journal, 16 (1995), 259–270.
REFERÊNCIAS 599
A-26. EITHNE MULLOY e WALTER T. MCNICHOLAS, “Ventilação e troca gasosa durante o sono e exercício em casos graves
COPD,” Chest, 109 (1996), 387–394.
A-27. NANCY C. GYURCSIK, PAUL A. ESTABROOKS e MELISSA J. FRAHM-TEMPLAR, “Exercise-Related Goals and Self Efficacy
as Correlates of Aquatic Exercise in Individuals with Arthritis,” Arthritis Care and Research, 49 (2003), 306–313 .
A-28. T. KIM RODEHURST, “Intenção dos professores de escolas primárias rurais de lidar com crianças com sintomas de asma,”
Enfermagem Pediátrica, 29 (2003), 184–194.
CAPÍTULO 12
O QUI QUADRADO
DISTRIBUIÇÃO E ANÁLISE
DE FREQUÊNCIAS
Este capítulo explora técnicas comumente usadas na análise de dados de contagem

ou frequência. Os usos da distribuição qui-quadrado, mencionados brevemente no
Capítulo 6, são discutidos e ilustrados com mais detalhes.
Além disso, técnicas estatísticas frequentemente utilizadas em estudos epidemiológicos
são apresentadas e demonstradas por meio de exemplos.
TÓPICOS
12.1 INTRODUÇÃO
12.2 AS PROPRIEDADES MATEMÁTICAS DA DISTRIBUIÇÃO QUI QUADRADO
12.3 TESTES DE ADEQUAÇÃO DO AJUSTE
12.4 TESTES DE INDEPENDÊNCIA
12.5 TESTES DE HOMOGENEIDADE
12.6 O TESTE EXATO DE FISHER
12.7 RISCO RELATIVO, ODDS RATIO E A ESTATÍSTICA DE MANTEL-HAENSZEL
12.8 RESUMO
Depois de estudar este capítulo, o aluno irá 1. compreender

as propriedades matemáticas da distribuição qui-quadrado. 2. ser capaz de usar a distribuição qui-
quadrado para testes de qualidade de ajuste. 3. ser capaz de construir e usar tabelas de contingência
para testar a independência e homogeneidade.
4. ser capaz de aplicar o teste exato de Fisher para 2 2 tabelas. 5.

entender como calcular e interpretar os conceitos epidemiológicos de risco relativo, odds ratio e a estatística de
Mantel-Haenszel.
600
12.2 AS PROPRIEDADES MATEMÁTICAS DA DISTRIBUIÇÃO QUI-QUADRADO 601
12.1 INTRODUÇÃO
Nos capítulos sobre estimativa e teste de hipóteses, é feita uma breve menção à distribuição qui-
quadrado na construção de intervalos de confiança e no teste de hipóteses relativas a uma variância
populacional. Essa distribuição, que é uma das distribuições mais utilizadas em aplicações estatísticas,
tem muitos outros usos. Algumas das mais comuns são apresentadas neste capítulo junto com uma
descrição mais completa da distribuição em si, que segue na próxima seção.
A distribuição qui-quadrado é a técnica estatística mais freqüentemente empregada para a análise

de dados de contagem ou frequência. Por exemplo, podemos saber, para uma amostra de pacientes
hospitalizados, quantos são do sexo masculino e quantos são do sexo feminino. Para a mesma amostra,
também podemos saber quantos têm cobertura de seguro privado, quantos têm seguro Medicare e
quantos recebem assistência Medicaid. Podemos querer saber, para a população da qual a amostra foi
extraída, se o tipo de cobertura de seguro difere de acordo com o gênero. Para outra amostra de
pacientes, podemos ter frequências para cada categoria diagnóstica representada e para cada área
geográfica representada. Poderíamos querer saber se, na população de onde o mesmo foi retirado,
existe uma relação entre área de residência e diagnóstico. Aprenderemos como usar a análise qui-
quadrado para responder a esses tipos de perguntas.
Existem outras técnicas estatísticas que podem ser usadas para analisar dados de frequência em
um esforço para responder a outros tipos de perguntas. Neste capítulo, também aprenderemos sobre
essas técnicas.
12.2 AS PROPRIEDADES MATEMÁTICAS DA DISTRIBUIÇÃO QUI

QUADRADO
A distribuição qui-quadrada pode ser derivada de distribuições normais. Suponha que de uma variável
aleatória normalmente distribuída Y com média m e variância s2 nós selecionamos aleatoriamente e
independentemente amostras de tamanho n ¼ 1. Cada valor selecionado pode ser transformado na
variável normal padrão z pela fórmula familiar
yi m zi ¼
(12.2.1)
s
2
Cada valor de z pode ser elevado ao quadrado para obter z . Quando investigamos o distrito amostral
2
botão de z , descobrimos que segue uma distribuição qui-quadrado com 1 grau de liberdade.
Isso é,
sim 2
x2ð1Þ ¼
2¼z
s
Agora suponha que selecionamos aleatoriamente e independentemente amostras de tamanho n ¼ 2 da

população normalmente distribuída de valores de Y. Dentro de cada amostra podemos transformar cada
602 CAPÍTULO 12 A DISTRIBUIÇÃO QUI-QUADRADO E A ANÁLISE DE FREQUÊNCIAS
2
valor de y para a variável normal padrão z e quadrado como antes. Se os valores resultantes de z para
cada amostra forem adicionados, podemos designar essa soma por
2 2
y1 m y2 m
x2
¼
º 2 ¼ z1 2 þ z2
ð2Þ s s
uma vez que segue a distribuição qui-quadrado com 2 graus de liberdade, o número de termos quadrados
independentes que são somados.
2
O procedimento pode ser repetido para qualquer tamanho de amostra n. A soma dos valores
z resultantes em cada caso será distribuída como qui-quadrado com n graus de liberdade. Em geral,
então,
2 2 2 þ z þþ z ¼ z
x2 ðnÞ 1 2 n (12.2.2)
segue a distribuição qui-quadrado com n graus de liberdade. A forma matemática da distribuição qui-quadrado
é a seguinte:
1 1
fðuÞ ¼ uðk=2Þ1 eðu=2Þ ; u>0
k 2k=2 1 ! (12.2.3)
2
onde e é o número irracional 2,71828 . e k é o número. de

. graus de liberdade.
A variável u é geralmente designada pela letra grega chi (x) e, portanto, a distribuição é chamada de
distribuição qui-quadrada. Como apontamos no Capítulo 6, a distribuição qui-quadrado foi tabulada na Tabela
F do Apêndice. O uso posterior da tabela é demonstrado conforme a necessidade nas seções seguintes.
A média e a variância da distribuição qui-quadrada são k e 2k, respectivamente. O valor modal da

distribuição é k 2 para valores de k maiores ou iguais a 2 e é zero para k ¼ 1.
As formas das distribuições do qui-quadrado para vários valores de k são mostradas na Figura 6.9.1.
Observamos nesta figura que as formas para k ¼ 1 e k ¼ 2 são bastante diferentes da forma geral da
distribuição para k > 2. Também vemos nesta figura que o qui-quadrado assume valores entre 0 e infinito. Não
pode assumir valores negativos, pois é a soma dos valores que foram elevados ao quadrado. Uma
característica final da distribuição qui-quadrado digna de nota é que a soma de duas ou mais variáveis qui-
quadradas independentes também segue uma distribuição qui-quadrada.
Tipos de testes qui-quadrado Como já foi observado, neste capítulo usamos a distribuição qui-quadrado para
testar hipóteses em que os dados disponíveis para análise estão na forma de frequências. Esses procedimentos
de teste de hipóteses são discutidos nos tópicos de testes de adequação, testes de independência e testes
de homogeneidade. Descobriremos que, de certa forma, todos os testes de qui-quadrado que empregamos
podem ser considerados como testes de qualidade de ajuste, pois eles testam a qualidade de ajuste de
frequências observadas para frequências que se esperaria se os dados foram gerados sob alguma teoria ou
hipótese particular. Nós, no entanto, reservamos a expressão “bondade de ajuste” para uso de uma forma
mais
12.2 AS PROPRIEDADES MATEMÁTICAS DA DISTRIBUIÇÃO QUI-QUADRADO 603
sentido restrito. Usamos para nos referir a uma comparação de uma distribuição de amostra
com alguma distribuição teórica que se supõe que descreva a população da qual a amostra
veio. A justificativa do uso da distribuição nessas situações se deve a Karl Pearson (1), que
mostrou que a distribuição qui-quadrado pode ser usada como teste de concordância entre
observação e hipótese sempre que os dados estiverem na forma de frequências . Um
tratamento extensivo da distribuição qui-quadrado pode ser encontrado no livro de Lancaster
(2). Nikulin e Greenwood (3) oferecem conselhos práticos para a realização de testes qui-quadrado.
Frequências observadas versus esperadas A estatística qui-quadrado é mais apropriada

para uso com variáveis categóricas, como estado civil, cujos valores são as categorias
casado, solteiro, viúvo e divorciado. Os dados quantitativos utilizados no cálculo da estatística
de teste são as frequências associadas a cada categoria de uma ou mais variáveis em
estudo. Existem dois conjuntos de frequências com os quais estamos preocupados,
frequências observadas e frequências esperadas. As frequências observadas são o número
de sujeitos ou objetos em nossa amostra que se enquadram nas diversas categorias da
variável de interesse. Por exemplo, se tivermos uma amostra de 100 pacientes hospitalizados,
podemos observar que 50 são casados, 30 são solteiros, 15 são viúvos e 5 são divorciados.
As frequências esperadas são o número de sujeitos ou objetos em nossa amostra que
esperaríamos observar se alguma hipótese nula sobre a variável fosse verdadeira. Por
exemplo, nossa hipótese nula pode ser que as quatro categorias de estado civil estão
igualmente representadas na população da qual extraímos nossa amostra. Nesse caso,
esperaríamos que nossa amostra contivesse 25 pacientes casados, 25 solteiros, 25 viúvos e 25 divorci
A estatística do teste qui-quadrado A estatística de teste para os testes qui-quadrado que

discutimos neste capítulo é
ðÞ 2
Oi Ei #
(12.2.4)
X2 ¼ X " Ei
Quando a hipótese nula é verdadeira, X2 é distribuído aproximadamente como x2

com kr graus de liberdade. Na determinação dos graus de liberdade, k é igual ao número
de grupos para os quais as frequências observadas e esperadas estão disponíveis, e r é o
número de restrições ou restrições impostas na comparação dada. Uma restrição é imposta
quando forçamos a soma das frequências esperadas a igualar a soma das frequências
observadas, e uma restrição adicional é imposta para cada parâmetro que é estimado a
partir da amostra.
Na Equação 12.2.4, Oi é a frequência observada para a i-ésima categoria da variável de
interesse, e Ei é a frequência esperada (dado que H0 é verdadeira) para a i-ésima categoria.
A quantidade X2 é uma medida da medida em que, em uma dada situação, os pares de
frequências observadas e esperadas concordam. Como veremos, a natureza de X2 é tal que,
quando há concordância próxima entre as frequências observadas e esperadas, ela é pequena, e
quando a concordância é ruim, é grande. Consequentemente, apenas um valor suficientemente
grande de X2 causará a rejeição da hipótese nula.
Se houver concordância perfeita entre as frequências observadas e as
frequências esperadas, dado que H0 é verdadeiro, o termo Oi Ei na Equação 12.2.4 será
igual a zero para cada par de frequências observadas e esperadas. Tal resultado daria um valor
de X2 igual a zero e não poderíamos rejeitar H0.
Quando houver desacordo entre as frequências observadas e as frequências esperadas
dado que H0 é verdadeiro, pelo menos um dos termos Oi Ei na Equação 12.2.4 será um número
diferente de zero. Em geral, quanto pior for a concordância entre o Oi e o Ei, maiores ou mais
frequentes serão esses valores diferentes de zero. Conforme observado anteriormente, se a
concordância entre o Oi e o Ei for suficientemente ruim (resultando em um valor de X2
suficientemente grande ), poderemos rejeitar H0.
Quando há desacordo entre um par de frequências observadas e esperadas, a diferença
pode ser positiva ou negativa, dependendo de qual das duas frequências é a maior. Uma vez que
, dependem
a medida de concordância, X2 é uma soma de quantidades de componentes
da diferença cujas
Oi Ei, magnitudes
diferenças
positivas e negativas devem receber igual peso. Isso é obtido elevando ao quadrado cada
diferença Oi Ei . A divisão das diferenças ao quadrado pela frequência esperada apropriada
converte a quantidade em um termo
2
que é medido em unidades originais. Adicionando essas estatísticas
resumo
de =Ei termos rende X2 ,
uma
individuais ð Þ Oi Ei que refletem a extensão da concordância geral entre as frequências

observadas e esperadas.
2
A Regra de Decisão A quantidade P½ð Oi Ei Þ e as =Ei será pequeno se o observado
frequências esperadas estão próximas e serão grandes se as diferenças forem grandes.
O valor calculado de X2 é comparado com o valor tabulado de x2 com kr graus de liberdade.
A regra de decisão, então, é: Rejeitar H0 se X2 for maior ou igual ao x2 tabulado para o valor
escolhido de a.
Frequências esperadas pequenas Frequentemente em aplicações do teste do qui-quadrado, a

frequência esperada para uma ou mais categorias será pequena, talvez muito menor que 1.
Na literatura, frequentemente se afirma que a aproximação de X2 para x2 não é estritamente
válida quando algumas das frequências esperadas são pequenas. Há desacordo entre os
escritores, no entanto, sobre qual tamanho de frequências esperadas são permitidas antes de
fazer algum ajuste ou abandonar x2 em favor de algum teste alternativo. Alguns escritores,
especialmente os anteriores, sugerem limites inferiores de 10, enquanto outros sugerem que
todas as frequências esperadas não devem ser inferiores a 5. Cochran (4,5) sugere que, para
testes de qualidade de ajuste de distribuições unimodais (como o normal), a frequência mínima
esperada pode ser tão baixa quanto 1. Se, na prática, alguém encontrar uma ou mais frequências
esperadas menores que 1, categorias adjacentes podem ser combinadas para atingir o mínimo
sugerido. A combinação reduz o número de categorias e, portanto, o número de graus de
liberdade. As sugestões de Cochran parecem ter sido amplamente seguidas pelos praticantes nos
últimos anos.
12.3 TESTES DE ADEQUAÇÃO DO AJUSTE
Como apontamos, um teste de qualidade de ajuste é apropriado quando se deseja decidir se uma
distribuição observada de frequências é incompatível com alguma distribuição preconcebida ou
hipotética.
12.3 TESTES DE ADEQUAÇÃO DO AJUSTE 605
Podemos, por exemplo, desejar determinar se uma amostra de valores observados de alguma
variável aleatória é ou não compatível com a hipótese de que foi extraída de uma população de valores
normalmente distribuídos. O procedimento para chegar a uma decisão consiste em colocar os valores em
categorias mutuamente exclusivas ou intervalos de classes e anotar a frequência de ocorrência dos
valores em cada categoria. Em seguida, usamos nosso conhecimento de distribuições normais para
determinar as frequências para cada categoria que se poderia esperar se a amostra viesse de uma
distribuição normal. Se a discrepância é de tal magnitude que pode ter ocorrido devido ao acaso,
concluímos que a amostra pode ter vindo de uma distribuição normal. De maneira semelhante, testes de
qualidade de ajuste podem ser realizados nos casos em que a distribuição hipotética é binomial, de
Poisson ou qualquer outra distribuição. Vamos ilustrar mais detalhadamente com alguns exemplos de
testes de hipóteses de qualidade de ajuste.
EXEMPLO 12.3.1 A Distribuição Normal
Cranor e Christensen (A-1) conduziram um estudo para avaliar os resultados clínicos, econômicos e
humanísticos de curto prazo dos serviços de assistência farmacêutica para pacientes com diabetes em
farmácias comunitárias. Para 47 dos indivíduos do estudo, os níveis de colesterol estão resumidos na
Tabela 12.3.1.
Queremos saber se esses dados fornecem evidências suficientes para indicar que o
amostra não veio de uma população normalmente distribuída. Deixe um ¼ 0,05
Solução:
2. Suposições. Assumimos que a amostra disponível para análise é uma

amostra aleatória simples.
TABELA 12.3.1 Níveis de colesterol descritos no

Exemplo 12.3.1
Colesterol
Nível (mg/dl) Número de Indivíduos
100,0–124,9 1
125,0–149,9 3
150,0–174,9 8
175,0–199,9 18
200,0–224,9 6
225,0–249,9 4
250,0–274,9 4
275,0–299,9 3
Fonte: Dados fornecidos por cortesia de Carole W. Cranor e Dale

B. Christensen, “The Asheville Project: Short-Term Outcomes of
a Community Pharmacy Diabetes Care Program,” Journal of the
American Pharmaceutical Association, 43 (2003), 149–159 .
3. Hipóteses.
H0: Na população da qual a amostra foi extraída, os níveis de colesterol
são normalmente distribuídos.
HA: A população amostrada não é normalmente distribuída.
4. Estatística de teste. A estatística de teste é
k ð 2
X2 ¼ X Oi Ei Þ
i¼1
" Ei #
5. Distribuição da estatística de teste. Se H0 for verdadeiro, a estatística de teste é

distribuída aproximadamente como qui-quadrado com kr graus de liberdade. Os
valores de k e r serão determinados posteriormente.
6. Regra de decisão. Rejeitaremos H0 se o valor calculado de X2 for igual a

ou maior que o valor crítico do qui-quadrado.
7. Cálculo da estatística de teste. Como a média e a variância da distribuição
hipotética não são especificadas, os dados da amostra devem ser
usados para estimá-los. Esses parâmetros, ou suas estimativas, serão
necessários para calcular a frequência que seria esperada em cada
intervalo de classe quando a hipótese nula for verdadeira. A média e o
desvio padrão calculados a partir dos dados agrupados da Tabela 12.3.1 são
x ¼ 198:67
¼ 41:31
Como próximo passo da análise, devemos obter para cada intervalo de

classe a frequência de ocorrência dos valores que esperaríamos quando a
hipótese nula fosse verdadeira, ou seja, se a amostra fosse, de fato, retirada
de uma população normalmente distribuída de valores. Para fazer isso, primeiro
determinamos a frequência relativa esperada de ocorrência de valores para
cada intervalo de classe e depois multiplicamos essas frequências relativas
esperadas pelo número total de valores para obter o número esperado de
valores para cada intervalo.
As frequências relativas esperadas

Será lembrado de nosso estudo da distribuição normal que a frequência relativa de ocorrência
de valores iguais ou menores que algum valor especificado, digamos, x0, da variável aleatória
normalmente distribuída X é equivalente à área sob a curva e ao à esquerda de x0 conforme
representado pela área sombreada na Figura 12.3.1. Obtemos o valor numérico desta área
convertendo x0 em um desvio normal padrão pela fórmula z0 ¼ ðx0 mÞ=s e encontrando o
valor apropriado na Tabela D do Apêndice. Usamos este procedimento para obter as
frequências relativas esperadas correspondentes a cada uma das intervalos de classe na Tabela 12.3.1.
Estimamos m e s com x e s calculados a partir dos dados amostrais agrupados. A primeira
etapa consiste na obtenção de valores de z correspondentes ao limite inferior de cada intervalo
de classe. A área entre dois valores z sucessivos fornecerá a frequência relativa esperada de
ocorrência de valores para o intervalo de classe correspondente.
x0 x
FIGURA 12.3.1 Uma distribuição normal mostrando a frequência relativa de ocorrência de valores menores ou iguais a x0. A
área sombreada representa a frequência relativa de ocorrência de valores iguais ou menores que x0.
Por exemplo, para obter a frequência relativa esperada de ocorrência de valores no

intervalo de 100,0 a 124,9 procedemos da seguinte forma:
100:0 198:67
O valor z correspondente a X ¼ 100:0 isz ¼ ¼ 2:39
41:31
125:0 198:67
O valor z correspondente a X ¼ 125:0 isz ¼ ¼ 1:78
41:31
Na Tabela D do Apêndice, descobrimos que a área à esquerda de 2:39 é 0,0084 e a área à

esquerda de 1:78 é 0,0375. A área entre 1:78 e 2:39 é igual a 0,0375 0,0084 ¼ 0,0291, que é
igual à frequência relativa esperada de ocorrência de níveis de colesterol no intervalo de 100,0 a
124,9. Isso nos diz que, se a hipótese nula for verdadeira, ou seja, se os níveis de colesterol
forem normalmente distribuídos, devemos esperar que 2,91% dos valores em nossa amostra
estejam entre 100,0 e 124,9. Quando multiplicamos nosso tamanho amostral total, 47, por 0,0291,
descobrimos que a frequência esperada para o intervalo é 1,4. Cálculos semelhantes fornecerão
as frequências esperadas para os outros intervalos conforme mostrado na Tabela 12.3.2.
TABELA 12.3.2 Intervalos de classe e frequências esperadas para o Exemplo 12.3.1
z xð =s
Þix
No limite inferior do Relativo Esperado Esperado
Intervalo de classe intervalo Frequência Frequência
< 100 0,0084 .4

1.8
100,0–124,9 2.39 0,0291 1.4
125,0–149,9 1,78 0,0815 3.8
150,0–174,9 1.18 .1653 7.8
175,0–199,9 .57 .2277 10.7
200,0–224,9 .03 .2269 10.7
225,0–249,9 .64 .1536 7.2
250,0–274,9 1.24 0,0753 3.5
275,0–299,9 1,85 0,0251 1.2
1,5
300,0 e superior 2.45 0,0071 .3
608 CAPÍTULO 12 A DISTRIBUIÇÃO QUI QUADRADO E A ANÁLISE DE FREQUÊNCIAS
Comparando frequências observadas e esperadas Estamos
agora interessados em examinar as magnitudes das discrepâncias entre as frequências observadas e as

esperadas, pois notamos que os dois conjuntos de frequências não concordam. Sabemos que, mesmo que
nossa amostra fosse extraída de uma distribuição normal de valores, a variabilidade amostral por si só tornaria
altamente improvável que as frequências observadas e esperadas concordassem perfeitamente. Nós nos
perguntamos, então, se as discrepâncias entre as frequências observadas e esperadas são pequenas o
suficiente para acharmos razoável que elas possam ter ocorrido apenas por acaso, quando a hipótese nula é
verdadeira. Se forem dessa magnitude, não estaremos dispostos a rejeitar a hipótese nula de que a amostra
veio de uma população normalmente distribuída.
Se as discrepâncias forem tão grandes que não pareça razoável que possam ter ocorrido apenas por
acaso quando a hipótese nula é verdadeira, desejaremos rejeitar a hipótese nula. O critério pelo qual julgamos
se as discrepâncias são “grandes” ou “pequenas” é fornecido pela distribuição do qui-quadrado.
2
As frequências observadas e esperadas junto com cada valor de ðOi EiÞ =Ei são
mostrados na Tabela 12.3.3. A primeira entrada na última coluna, por exemplo, é calculada a partir de ð1 1:8Þ
2 2
=1:8 ¼ .356. Os outros valores de ðOi EiÞ =Ei são calculados de forma semelhante
maneiras.
2
Da Tabela 12.3.3 vemos que X2 ¼ P½ðOi EiÞ =Ei ¼ 10:566. Os graus de liberdade
apropriados são 8 (o número de grupos ou intervalos de classe) 3 (para as três restrições: tornar PEi ¼ POi e
estimar m e s a partir dos dados da amostra) ¼ 5.
8. Decisão estatística. Quando comparamos X2 ¼ 10:566 com valores de x2 na Tabela F do

Apêndice, vemos que é menor que x2 ¼ 11:070, de modo0,95
que,
0,05,
no nível
não podemos
de significância
rejeitarde
a
hipótese nula de que a amostra veio de uma população normalmente distribuída.
TABELA 12.3.3 Frequências Observadas e Esperadas e ð Oi Ei Þ

2
=Ei para Exemplo 12.3.1
Observado Esperado
2
Intervalo de classe (Oi) (Ei) ð Oi Ei Þ =Ei
< 100 0 .4
1.8 .356
100,0–124,9 1 1.4
125,0–149,9 3 3.8 .168
150,0–174,9 8 7.8 0,005
175,0–199,9 18 10.7 4.980
200,0–224,9 6 10.7 2.064
225,0–249,9 4 7.2 1.422
250,0–274,9 4 3.5 0,071
275,0–299,9 3 1.2
1,5 1.500
300,0 e 0 .3
superior
Total 47 47 10.566
9. Conclusão. Concluímos que na população amostrada, o colesterol

níveis podem seguir uma distribuição normal.
10. valor p. Desde 11:070 > 10:566 > 9:236, 0,05 < p < 0,10. Em outras palavras, a
probabilidade de obter um valor de X2 tão grande quanto 10,566, quando a hipótese
nula é verdadeira, está entre 0,05 e 0,10. Assim, concluímos que tal evento não é
suficientemente raro para rejeitar a hipótese nula de que os dados vêm de uma
distribuição normal. &
Às vezes, os parâmetros são especificados na hipótese nula. Deve-se notar que se a média e a
variância da população tivessem sido especificadas como parte da hipótese nula no Exemplo 12.3.1, não
teríamos que estimá-los a partir da amostra e nossos graus de liberdade teriam sido 8 1 ¼ 7 .
Alternativas Embora seja frequente encontrar na literatura o uso do qui-quadrado para testar a
normalidade, não é o teste mais apropriado para usar quando a distribuição hipotética é contínua. O teste
de Kolmogorov-Smirnov, descrito no Capítulo 13, foi projetado especialmente para testes de qualidade de
ajuste envolvendo distribuições contínuas.
EXEMPLO 12.3.2 A Distribuição Binomial
Em um estudo desenhado para determinar a aceitação do paciente a um novo analgésico, 100 médicos
cada selecionaram uma amostra de 25 pacientes para participar do estudo. Cada paciente, depois de
experimentar o novo analgésico por um período de tempo especificado, foi questionado se era preferível
ao analgésico usado regularmente no passado.
Os resultados do estudo são apresentados na Tabela 12.3.4.
TABELA 12.3.4 Resultados do Estudo Descrito no Exemplo 12.3.2
Número de
Número de pacientes médicos Número Total de Pacientes
De 25 Preferindo Relatando isso Preferindo Nova Dor
Novo analgésico Número Aliviador pelo médico
0 5 0
1 6 6
2 8 16
3 10 30
4 10 40
5 15 75
6 17 102
7 10 70
8 10 80
9 9 81
10 ou mais 0 0
Total 100 500

Estamos interessados em determinar se esses dados são ou não compatíveis com a hipótese de que foram
extraídos de uma população que segue uma distribuição binomial.
Novamente, empregamos um teste de ajuste qui-quadrado.
Solução: Como o parâmetro binomial, p, não é especificado, ele deve ser estimado a partir dos dados da amostra. Um
total de 500 pacientes dos 2.500 pacientes que participaram do estudo disseram que preferiam o novo
analgésico, de modo que nossa estimativa pontual de p é ^p ¼ 500=2.500 ¼ ,20. As frequências
relativas esperadas podem ser obtidas avaliando a função binomial
x 25x
fðxÞ ¼ 25Cxð.2Þ ð.8Þ
para x ¼ 0; 1; ... ; 25. Por exemplo, para encontrar a probabilidade de que de uma amostra de 25
pacientes nenhum prefira o novo analgésico, quando na população total a verdadeira proporção que
prefere o novo analgésico é 0,2, avaliamos
o 25o
fð0Þ ¼ 25Co ð:2Þ ð:8Þ
Isso pode ser feito mais facilmente consultando a Tabela B do Apêndice, onde vemos que PðX ¼ 0Þ
¼ .0038. A frequência relativa de ocorrência de amostras de tamanho 25 nas quais nenhum paciente
prefere o novo analgésico é 0,0038. Para obter a frequência esperada correspondente, multiplicamos
0,0038 por 100 para obter 0,38.
Cálculos semelhantes fornecem as frequências esperadas restantes, que, juntamente com as
frequências observadas, são mostradas na Tabela 12.3.5. Vemos nesta tabela
TABELA 12.3.5 Cálculos para o Exemplo 12.3.2
Número de
Número de relatórios médicos
Pacientes de 25 Este número Esperado
Preferindo Nova Dor (Observado Relativo Esperado
apaziguador Frequência, Oi) Frequência Frequência Ei
0 5 0,0038 .38
11 2.74
1 6 0,0236 2.36
2 8 0,0708 7.08
3 10 .1358 13.58
4 10 .1867 18.67
5 15 .1960 19h60
6 17 .1633 16.33
7 10 .1109 11.09
8 10 0,0623 6.23
9 9 0,0295 2,95
10 ou mais 0 0,0173 1,73
Total 100 1,0000 100,00

que a primeira frequência esperada é menor que 1, então seguimos a sugestão

de Cochran e combinamos este grupo com o segundo grupo. Quando fazemos
isso, todas as frequências esperadas são maiores que 1.
A partir dos dados, calculamos
2 2 2
ð Þ 11 2:74 ð Þ 8 7:08 ð Þ 0 1:73
¼ 47:624
X2 ¼
2:74 º 7:08
þþ
1:73
Os graus de liberdade apropriados são 10 (o número de grupos restantes

após a combinação dos dois primeiros) menos 2 ou 8. Um grau de liberdade é
perdido porque forçamos o total das frequências esperadas a igualar o total das
frequências observadas, e um grau de liberdade é sacrificado porque estimamos
p a partir dos dados da amostra.
Comparamos nosso X2 calculado com o x2 tabulado com 8 graus de
liberdade e descobrimos que ele é significativo no nível de significância de 0,005;
ou seja, p < 0,005. Rejeitamos a hipótese nula de que os dados vieram de uma
distribuição binomial. &
EXEMPLO 12.3.3 A distribuição de Poisson
O administrador de um hospital deseja testar a hipótese nula de que as admissões de emergência

seguem uma distribuição de Poisson com l ¼ 3. Suponha que, durante um período de 90 dias, o
número de admissões de emergência seja o mostrado na Tabela 12.3.6.
TABELA 12.3.6 Número de admissões de emergência em um hospital durante um período de 90 dias
Emergência Emergência Emergência Emergência

Dia Dia de admissão Dia de admissão Dia de admissão Admissões
1 2 24 5 47 4 70 3
2 3 25 3 48 2 71 5
3 4 26 2 49 2 72 4
4 5 27 4 50 3 73 1
5 3 28 4 51 4 74 1
6 2 29 3 52 2 75 6
7 3 30 5 53 3 76 3
8 0 31 1 54 1 77 3
9 1 32 3 55 2 78 5
10 0 33 2 56 3 79 2
11 1 34 4 57 2 80 1
12 0 35 2 58 5 81 7
13 6 36 5 59 2 82 7
14 4 37 0 60 7 83 1
15 4 38 6 61 8 84 5
16 4 39 4 62 3 85 1
(Contínuo )
Emergência Emergência Emergência Emergência

Dia Dia de admissão Admissões Dia Dia de admissão Admissões
17 3 40 4 63 1 86 4
18 4 41 5 64 3 87 4
19 3 42 1 65 1 88 9
20 3 43 3 66 0 89 2
21 3 44 1 67 3 90 3
22 4 45 2 68 2
23 3 46 3 69 1
Os dados da Tabela 12.3.6 estão resumidos na Tabela 12.3.7.
Solução: Para obter as frequências esperadas, primeiro obtemos as frequências relativas esperadas
avaliando a função de Poisson dada pela Equação 4.4.1 para cada entrada na coluna da
esquerda da Tabela 12.3.7. Por exemplo, a primeira frequência relativa esperada é obtida
avaliando
e330
fð0Þ ¼
0!
Podemos usar a Tabela C do Apêndice para encontrar esta e todas as outras frequências
relativas esperadas de que precisamos. Cada uma das frequências relativas esperadas
TABELA 12.3.7 Resumo dos Dados Apresentados na Tabela

12.3.6
Número de
Número de Dias Este Número de
Admissões de emergência Emergência
em um dia Admissões Ocorridas
0 5
1 14
2 15
3 23
4 16
5 9
6 3
7 3
8 1
9 1
10 ou mais 0
Total 90
TABELA 12.3.8 Frequências e componentes observados e esperados de X2 para o Exemplo 12.3.3
Número de
Número de dias isso Esperado
2
Emergência Número Relativo Esperado Oi Ei
ðÞ
Admissões Ocorreu, Oi Frequência Frequência Ei

0 5 0,050 4,50 0,056
1 14 .149 13.41 0,026
2 15 .224 20.16 1.321
3 23 .224 20.16 .400
4 16 .168 15.12 0,051
5 9 .101 9.09 0,001
6 3 0,050 4,50 .500

7 3 0,022 1,98 0,525
8 1 9 0,008 .72 9
9 1 2 0,003 .27 1.08 0,784

>= >=
10 ou mais 0 >;
0,001 0,09 >;
Total 90 1.000 90,00 3.664
é multiplicado por 90 para obter as frequências esperadas correspondentes.

Esses valores junto com as frequências
2
observadas e esperadas e os
componentes de X2 , ðOi EiÞ =Ei, são exibidos na Tabela 12.3.8, na qual
veja isso
2 2 2
ð
Oi Ei Þ ð 5 4:50 Þ ð 2 1:08 Þ
X2 ¼ X þþ ¼ 3:664
Ei " 4:50 1:08
#¼
Também observamos que as últimas três frequências esperadas são menores que 1, de
modo que devem ser combinadas para evitar que qualquer frequência esperada seja menor que 1.
Isso significa que temos apenas nove categorias efetivas para computar graus
de liberdade. Como o parâmetro, l, foi especificado na hipótese nula, não
perdemos um grau de liberdade por motivos de estimação, de modo que os
graus de liberdade apropriados são 9 1 ¼ 8. Consultando a Tabela F do
Apêndice, descobrimos que o valor crítico O valor de x2 para 8 graus de
liberdade e ¼ 0,05 é 15,507, de modo que não podemos rejeitar a hipótese
nula no nível 0,05, ou qualquer nível razoável de significância (p > 0,10).
Concluímos, portanto, que as admissões de emergência neste hospital podem
seguir uma distribuição de Poisson com l ¼ 3. Pelo menos os dados observados
não lançam dúvidas sobre essa hipótese.
Se o parâmetro l tiver que ser estimado a partir de dados de amostra,
a estimativa é obtida multiplicando cada valor x por sua frequência, somando
esses & produtos e dividindo o total pela soma das frequências.
EXEMPLO 12.3.4 A Distribuição Uniforme
A temporada de gripe no sul de Nevada de 2005 a 2006 ocorreu de dezembro a abril, os meses mais frios do
ano. O Southern Nevada Health District relatou o número de casos de influenza evitáveis por vacinação
mostrados na Tabela 12.3.9. Estamos interessados em saber se o número de casos de gripe no distrito está
distribuído igualmente entre os cinco meses da temporada de gripe. Ou seja, queremos saber se os casos de
gripe seguem uma distribuição uniforme.
Solução:
2. Suposições. Assumimos que os casos notificados de gripe constituem uma amostra

aleatória simples de casos de gripe ocorridos no distrito.
3. Hipóteses.
H0: Os casos de gripe no sul de Nevada são distribuídos uniformemente ao longo dos cinco
meses da temporada de gripe.
HA: Os casos de gripe no sul de Nevada não são distribuídos uniformemente ao longo do
cinco meses da temporada de gripe.
Deixe um ¼ 0,01.
X2 ¼ XðOi EiÞ
Ei
5. Distribuição da estatística de teste. Se H0 for verdadeiro, X2 é distribuído aproximadamente

como x2 com ð5 1Þ ¼ 4 graus de liberdade.
6. Regra de decisão. Rejeitar H0 se o valor calculado de X2 for igual ou maior que 13,277.
TABELA 12.3.9 Casos notificados de gripe evitável por vacinação

no sul de Nevada, dezembro de 2005 a abril de 2006
Número de
Casos Notificados
Mês de Gripe
dezembro de 2005 62
janeiro de 2006 84
fevereiro de 2006 17
março de 2006 16
abril de 2006 21
Total 200
Fonte: http://www.southernnevadahealthdistrict.org/
epidemiology/disease_statistics.htm .
Tabela de Valores Observados e Esperados

90
Esperado
80 Observado
70
60
Valor
50
40
30
20
10
0
Categoria 54321
Teste de qualidade de ajuste qui-quadrado para contagens observadas na variável: C1
Teste Contribuição
Categoria 1 Observado Proporção 2.0 Esperado 04 para Qui-

26 Quadrado 001,21
2 48 2.0 04 004.84
3 71 2.0 04 522.31
4 61 2.0 04 004.41
5 12 2.0 04 520,9
N DF Chi-Sq P-Valor
200 4 97,15 0,000
FIGURA 12.3.2 Saída do MINITAB para o Exemplo 12.3.4.
7. Cálculo da estatística de teste. Se a hipótese nula for verdadeira,

esperaríamos observar 200=5 ¼ 40 casos por mês. A Figura 12.3.2 mostra
a impressão do computador obtida do MINITAB. O gráfico de barras mostra
as frequências observadas e esperadas por mês. A tabela qui-quadrado
fornece as frequências observadas, as frequências esperadas com base
em uma distribuição uniforme e a contribuição individual do qui-quadrado
para cada valor de teste.
8. Decisão estatística. Desde 97,15, o valor calculado de X2 , for maior
que 13,277, rejeitamos, com base nesses dados, a hipótese nula de um
distribuição uniforme de casos de gripe durante a temporada de gripe no sul

de Nevada.
9. Conclusão. Concluímos que a ocorrência de casos de gripe não segue uma distribuição
uniforme.
10. valor p. Na saída do MINITAB, vemos que p ¼ .000 (isto é, < .001).
&
EXEMPLO 12.3.5
Acredita-se que uma certa característica humana seja herdada de acordo com a proporção 1:2:1
para homozigoto dominante, heterozigoto e homozigoto recessivo. Um exame de uma amostra
aleatória simples de 200 indivíduos revelou a seguinte distribuição da característica: dominante,
43; heterozigoto, 125; e recessivo, 32. Queremos saber se esses dados fornecem informações suficientes
evidência para lançar dúvidas sobre a crença sobre a distribuição da característica.
Solução:
1. Dados. Veja a declaração do exemplo.

2. Suposições. Assumimos que os dados atendem aos requisitos para o
aplicação do teste de ajuste qui-quadrado.
3. Hipóteses.
H0: A característica é distribuída de acordo com a proporção 1:2:1 para
homozigoto dominante, heterozigoto e homozigoto recessivo.
HA: A característica não é distribuída de acordo com a proporção 1:2:1.
2
ð Þ OE
X2 ¼ X
E" #
5. Distribuição da estatística de teste. Se H0 for verdadeiro, X2 é distribuído como qui-

quadrado com 2 graus de liberdade.
6. Regra de decisão. Suponha que deixemos a probabilidade de cometer um
erro tipo I ser 0,05. Rejeitar H0 se o valor calculado de X2 for igual ou maior
de 5.991.
7. Cálculo da estatística de teste. Se H0 for verdadeiro, as frequências
esperadas para as três manifestações do traço são 50, 100 e 50 para
dominante, heterozigoto e recessivo, respectivamente. Consequentemente,
2 2
X2 ¼ ð43 50Þ =50 þ ð125 100Þ2=100 þ ð32 50Þ =50 ¼ 13:71
8. Decisão estatística. Como 13:71 > 5:991, rejeitamos H0.

9. Conclusão. Concluímos que o traço não é distribuído de acordo com o
relação 1:2:1.
10. valor p. Como 13:71 > 10:597, o valor de p para o teste é p < 0,005. &
EXERCÍCIOS 617
EXERCÍCIOS
12.3.1 A tabela a seguir mostra a distribuição das determinações de ácido úrico realizadas em 250 pacientes. Teste a qualidade do
ajuste desses dados para uma distribuição normal com m ¼ 5:74 e s ¼ 2:01. Deixe um ¼ 0,01.
Ácido úrico Observado Ácido úrico Observado

Determinação Frequência Determinação Frequência
<1 6 a 6,99 7 45
1 a 1,99 2 1 a 7,99 8 a 30
a 2,99 3 a 5 8,99 9 a 22
3,99 4 a 15 24 9,99 10 10
4,99 5 a 43 ou mais 5
5,99 50
Total 250
12.3.2 Os seguintes dados foram coletados em 300 meninas de oito anos de idade. Teste, no nível de significância de 0,05, a
hipótese nula de que os dados são extraídos de uma população normalmente distribuída. A média amostral e o desvio
padrão calculados a partir de dados agrupados são 127,02 e 5,08.
Altura em Observado Altura em Observado

Centímetros Frequência Centímetros Frequência
114 a 115,9 5 128 a 129,9 43

116 a 117,9 10 130 a 131,9 42
118 a 119,9 14 132 a 133,9 30
120 a 121,9 21 134 a 135,9 11
122 a 123,9 30 136 a 137,9 5
124 a 125,9 40 138 a 139,9 4
126 a 127,9 45
Total 300
12.3.3 A folha de rosto dos registros dos pacientes mantida em um departamento de saúde local contém 10 entradas.
Uma amostra de 100 registros revelou a seguinte distribuição de entradas incorretas:
Número de erros
Entradas de 10 Número de registros
0 8
1 25
2 32
3 24
4 10
5 ou mais 1
Total 100
Teste a qualidade do ajuste desses dados para a distribuição binomial com p ¼ .20. Encontre o valor de p para
este teste.
12.3.4 Em estudo conduzido por Byers et al. (A-2), os pesquisadores testaram um modelo de Poisson para a distribuição
das pontuações das atividades da vida diária (AVD) após um programa de pré-habilitação de 7 meses
projetado para prevenir o declínio funcional entre idosos fisicamente frágeis que vivem na comunidade. AVD
mediu a capacidade dos indivíduos para realizar tarefas essenciais, incluindo andar dentro de casa, tomar
banho, vestir-se da parte superior e inferior do corpo, transferir-se de uma cadeira, ir ao banheiro, alimentar-
se e arrumar-se. O método de pontuação usado neste estudo atribuiu um valor de 0 para nenhuma ajuda
(pessoal) e nenhuma dificuldade, 1 para dificuldade, mas sem ajuda e 2 para ajuda, independentemente da
dificuldade. As pontuações foram somadas para produzir uma pontuação geral variando de 0 a 16 (para oito
tarefas). Houve 181 indivíduos que completaram o estudo. Suponha que usamos o método de pontuação dos
autores para avaliar o status de outro grupo de 181 indivíduos em relação às suas atividades da vida diária.
Suponhamos que os seguintes resultados foram obtidos.
Observado Esperado Observado Esperado

x Frequência X Frequência x Frequência X Frequência
0 74 11.01 7 4 2,95
27 30,82 3 1,03
1 14 43,15 8 2 0,32
2 14 40,27 9 3 0,09
34 11 28,19 10 11 4 0,02
5 7 15,79 12 ou mais 13 0,01
6 5 7,37
Fonte: Dados hipotéticos baseados no procedimento relatado por Amy L. Byers, Heather
Allore, Thomas M. Gill e Peter N. Peduzzi, “Application of Negative Binomial Modeling for
Discrete Outcomes: A Case Study in Aging Research,” Journal of Clinical Epidemiology ,
56 (2003), 559–564.
Teste a hipótese nula de que esses dados foram extraídos de uma distribuição de Poisson com l ¼ 2:8. Deixe
um ¼ 0,01.
12.3.5 A seguir estão os números de um determinado organismo encontrado em 100 amostras de água de
uma lagoa:
Número de Organismos Número de Organismos

por Amostra Frequência por Amostra Frequência
0 154 5
1 305 4 256 1
2
3 207 0
Total 100
Teste a hipótese nula de que esses dados foram extraídos de uma distribuição de Poisson. Determine o valor de p
para este teste.
12.4 TESTES DE INDEPENDÊNCIA 619
12.3.6 Uma equipe de pesquisa realizou uma pesquisa na qual os sujeitos eram fumantes adultos. Pediu-se a cada
sujeito em uma amostra de 200 que indicasse até que ponto concordava com a afirmação: “Gostaria de parar
de fumar”. Os resultados foram os seguintes:
Resposta: Concordo plenamente Aceita Discordo Discordo fortemente

Número
Respondendo: 102 30 60 8
Pode-se concluir com base nesses dados que, na população amostrada, as opiniões não se distribuem
igualmente pelos quatro níveis de concordância? Seja a probabilidade de cometer um erro tipo I de 0,05 e
encontre o valor de p.
12.4 TESTES DE INDEPENDÊNCIA
Outro uso, e talvez o mais frequente, da distribuição qui-quadrado é testar a hipótese nula de
que dois critérios de classificação, quando aplicados ao mesmo conjunto de entidades, são
independentes. Dizemos que dois critérios de classificação são independentes se a distribuição
de um critério é a mesma, independentemente da distribuição do outro critério. Por exemplo,
se o nível socioeconômico e a área de residência dos habitantes de uma determinada cidade
forem independentes, esperaríamos encontrar a mesma proporção de famílias nos grupos
socioeconômico baixo, médio e alto em todas as áreas da cidade.
A Tabela de Contingência A classificação, de acordo com dois critérios, de um conjunto de

entidades, digamos, pessoas, pode ser mostrada por uma tabela na qual as linhas r representam
os vários níveis de um critério de classificação e as colunas c representam os vários níveis de
o segundo critério. Tal tabela é geralmente chamada de tabela de contingência, com dimensão rc.
A classificação segundo dois critérios de uma população finita de entidades é apresentada na
Tabela 12.4.1.
Estaremos interessados em testar a hipótese nula de que na população os dois critérios
de classificação são independentes. Se a hipótese for rejeitada, concluiremos que
TABELA 12.4.1 Classificação de duas vias de uma população

finita de entidades
Segundo
Critério de Primeiro Critério de Nível de Classificação
Classificação
Nível 1 2 3 ... c Total
1 N11 N12 N13 ... N1c N1.

2 N21 N22 N23 ... N2c N2.
3 N31 N32 N33 ... N3c N3.
.. .. .. .. .. .. ..
. . . . . . .
r Nr1 Nr2 Nr3 ... Nrc Nº:
Total N.1 N.2 N.3 ... Nc N

TABELA 12.4.2 Classificação de duas vias de uma amostra de

entidades
Segundo
Critério de Primeiro Critério de Nível de Classificação
Classificação
Nível 1 2 3 ... c Total
1 n11 n12 n13 ... n1c n1.

2 n21 n22 n23 ... n2c n2.
3 n31 n32 n33 ... n3c n3.
.. .. .. .. .. ..
. . . . . .
r nr1 nr2 nr3 ... nrc nº
Total n.1 n.2 n.3 ... nc n
os dois critérios de classificação não são independentes. Uma amostra de tamanho n será
extraída da população de entidades, e a frequência de ocorrência de entidades na amostra
correspondente às células formadas pelas interseções das linhas e colunas da Tabela 12.4.1
junto com os totais marginais serão exibidos em uma tabela como a Tabela 12.4.2.
Cálculo das Frequências Esperadas A frequência esperada, sob a hipótese nula de que os dois
critérios de classificação são independentes, é calculada para cada célula.
Aprendemos no Capítulo 3 (ver Equação 3.4.4) que se dois eventos são independentes, a
probabilidade de sua ocorrência conjunta é igual ao produto de suas probabilidades individuais.
Sob a suposição de independência, por exemplo, calculamos a probabilidade de que um dos n
sujeitos representados na Tabela 12.4.2 seja contado na Linha 1 e na Coluna 1 da tabela (isto é,
na Célula 11) multiplicando a probabilidade de que o assunto será contado na Linha 1 pela
probabilidade de o assunto ser contado na Coluna 1. Na notação da tabela, o cálculo desejado é
n1: n.1
n n
Para obter a frequência esperada para a Célula 11, multiplicamos essa probabilidade pelo número
total de sujeitos, n. Ou seja, a frequência esperada para a Célula 11 é dada por
n1: n.1
ðnÞ
n n
Como o n em um dos denominadores se cancela no numerador n, essa expressão se reduz a
ðn1:Þðn.1Þ
n
Em geral, então, vemos que para obter a frequência esperada para uma determinada célula,
multiplicamos o total da linha em que a célula está localizada pelo total da coluna em que a célula
está localizada e dividimos o produto pelo grande total.
Frequências observadas versus esperadas As frequências esperadas e as frequências observadas

são comparadas. Se a discrepância for suficientemente pequena, a hipótese nula é sustentável.
Se a discrepância for suficientemente grande, a hipótese nula é rejeitada e concluímos que os dois
critérios de classificação não são independentes. A decisão se a discrepância entre as frequências
observadas e esperadas é suficientemente grande para causar a rejeição de H0 será feita com
base no tamanho da quantidade calculada quando usarmos a Equação 12.2.4, onde Oi e Ei referem-
se, respectivamente, a as frequências observadas e esperadas nas células da Tabela 12.4.2. Seria
mais lógico designar as frequências observadas e esperadas nessas células por Oij e Eij, mas para
manter a notação simples e evitar a introdução de outra fórmula, optamos por usar a notação mais
simples. Será útil pensar nas células como sendo numeradas de 1 a k, onde 1 se refere à Célula
11 e k se refere à Célula rc. Pode-se mostrar que X2 , conforme definido dessa maneira, é
distribuído aproximadamente como x2 com ðr 1Þðc 1Þ graus de liberdade quando a hipótese nula
é verdadeira. Se o valor calculado de X2 for igual ou maior que o valor tabulado de x2 para algum
a, a hipótese nula é rejeitada no nível de significância a. O procedimento de teste de hipótese é
ilustrado com o exemplo a seguir.
EXEMPLO 12.4.1
Em 1992, o Serviço de Saúde Pública dos EUA e os Centros de Controle e Prevenção de Doenças
recomendaram que todas as mulheres em idade fértil consumissem 400 mg de ácido fólico
diariamente para reduzir o risco de uma gravidez afetada por um defeito do tubo neural, como
espinha bífida ou anencefalia. Em um estudo de Stepanuk et al. (A-3), 693 gestantes ligaram para
um serviço de informações teratológicas sobre o uso de suplementação com ácido fólico. Os
pesquisadores desejavam determinar se o uso pré-concepcional de ácido fólico e a raça são
independentes. Os dados aparecem na Tabela 12.4.3.
Solução:
2. Suposições. Assumimos que a amostra disponível para análise é equivalente a

uma amostra aleatória simples extraída da população de interesse.
TABELA 12.4.3 Raça da Grávida e Uso de Ácido Fólico
Uso pré-concepcional de ácido fólico
Sim Não Total
Branco 260 299 559

Preto 15 41 56
De outros 7 14 21
Total 282 354 636
Fonte: Kathleen M. Stepanuk, Jorge E. Tolosa, Dawneete Lewis, Victoria Meyers,

Cynthia Royds, Juan Carlos Saogal e Ron Librizzi, “Folic Acid Supplementation Use
Among Women Who Contact a Teratology Information Service,” American Journal of
Obstetrics and Gynecology , 187 (2002), 964–967.
3. Hipóteses.
H0: A raça e o uso pré-concepcional de ácido fólico são independentes.
HA: As duas variáveis não são independentes.
Deixe um ¼ 0,05.
k ðOi EiÞ2
X2 ¼ X
" Ei #
i¼1
5. Distribuição da estatística de teste. Quando H0 é verdadeiro, X2 é

distribuído aproximadamente como x2 com ðr 1Þðc 1Þ¼ð3 1Þð2
1Þ¼ð2Þð1Þ ¼ 2 graus de liberdade.
6. Regra de decisão. Rejeitar H0 se o valor calculado de X2 for igual
ou superior a 5,991.
7. Cálculo da estatística de teste. A frequência esperada para a primeira célula
é ð559 282Þ=636 ¼ 247:86. As outras frequências esperadas são calculadas
de maneira semelhante. As frequências observadas e esperadas são
apresentadas na Tabela 12.4.4. A partir das frequências observadas e
esperadas, podemos calcular
ðOi EiÞ2
X2 ¼ P
" Ei #
ð 260 247:86 Þ 2 ð 299 311:14 Þ 2 ð 14 11:69 2

¼
þ Þ þ ... þ
247:86 311:14 11:69
¼ 0,59461 þ 0,47368 þ ... þ 0,45647 ¼ 9:08960
8. Decisão estatística. Rejeitamos H0 desde 9:08960 > 5:991.

9. Conclusão. Concluímos que H0 é falsa e que existe relação entre
raça e uso pré-concepcional de ácido fólico.
10. valor p. Desde 7:378 < 9:08960 < 9:210, 0,01 < p < 0,025.
TABELA 12.4.4 Frequências observadas e esperadas para o Exemplo

12.4.1
Uso pré-concepcional de ácido fólico
Sim Não Total
Branco 260 (247,86) 299 (311,14) 559

Preto 15 (24,83) 7 41 (31,17) 56
De outros (9,31) 14 (11,69) 21
Total 282 354 636

&
Análise de computador O computador pode ser usado com vantagem no cálculo de X2 para
testes de independência e testes de homogeneidade. A Figura 12.4.1 mostra o procedimento e
a impressão do Exemplo 12.4.1 quando o programa MINITAB para calcular X2 a partir de tabelas
de contingência é usado. Os dados foram inseridos nas Colunas 1 e 2 do MINITAB,
correspondentes às colunas da Tabela 12.4.3.
Podemos usar o SAS® para obter uma análise e impressão dos dados da tabela de
contingência usando a instrução PROC FREQ. A Figura 12.4.2 mostra uma impressão SAS®
parcial refletindo a análise dos dados do Exemplo 12.4.1.
Dados:
C1: 260 15 7
C2: 299 41 14
oB golaiD :x :dnammoc noisseS
Teste qui-quadrado das tabelas estatísticas MTB > QUISQUADRO C1-C3
Digite C1-C2 em Colunas contendo a tabela.

Clique em OK.
Saída:
Teste qui-quadrado: C1, C2
As contagens esperadas são impressas abaixo das contagens observadas
C1 C2 Total
1 260 299 559
247,86 311,14
2 15 41 56
24.83 31.17
3 7 14 21
9.31 11.69
Total 282 354 636
Chi-Sq = 0,595 + 0,474 + 3,892 + 3,100 + 0,574 +

0,457 = 9,091
DF = 2, Valor-P = 0,011
FIGURA 12.4.1 Procedimento do MINITAB e saída para análise qui-quadrado dos dados na Tabela 12.4.3.
O Sistema SAS
O Procedimento FREQ
Tabela de corrida por fólico
corrida fólico
Frequência
Por cento
Porcentagem de linha
Col Percent Não Sim Total

------------------------
Preto 41 15 56
6,45 2,36 8.81
73,21 26,79 5,32
11,58
------------------------
De outros 14 7 21
2,20 1,10 3.30
66,67 33,33 2,48
3,95
------------------------
Branco 299 260 559

47,01 40,88 87,89
53,49 46,51
84,46 92,20
------------------------
Total 354 282 636

55,66 44,34 100,00
Estatísticas para Tabela de corrida por fólico
citsitatS eulaVFD borP

-------------------------------------------------- --------
erauqS-ihC 6010.03190.92
Razão de verossimilhança Qui-quadrado 2 9.4808 0,0087
Mantel—Haenszel Qui-quadrado tneicfifeoC ihP 1 8.9923 0,0027

6911.0
Coeficiente de Contingência 0,1187

Vs'remarC 6911.0
Tamanho da amostra = 636
FIGURA 12.4.2 Impressão SAS® parcial para a análise qui-quadrado dos dados do
Exemplo 12.4.1.
Observe que a impressão SAS® mostra, em cada célula, a porcentagem que a frequência
da célula é de seu total de linha, seu total de coluna e o total geral. Também mostrado, para cada
linha e coluna total, é a porcentagem que o total é do total geral. Além da estatística X2 , o SAS®
fornece o valor de várias outras estatísticas que podem ser calculadas a partir dos dados da tabela
de contingência. Uma delas, a estatística qui-quadrado de Mantel-Haenszel, será discutida em
uma seção posterior deste capítulo.
Frequências esperadas pequenas O problema das frequências esperadas pequenas discutido na

seção anterior pode ser encontrado ao analisar os dados das tabelas de contingência. Embora não
haja consenso sobre como lidar com esse problema, muitos autores seguem atualmente a regra
dada por Cochran (5). Ele sugere que, para tabelas de contingência com mais de 1 grau de
liberdade, uma expectativa mínima de 1 é permitida se não mais do que 20% das células tiverem
frequências esperadas menores que 5.
Para atender a esta regra, linhas adjacentes e/ou colunas adjacentes podem ser combinadas
quando isso for lógico à luz de outras considerações. Se X2 for baseado em menos de 30 graus
de liberdade, frequências esperadas tão pequenas quanto 2 podem ser toleradas. Não tivemos o
problema de pequenas frequências esperadas no Exemplo 12.4.1, pois todas eram maiores que 5.
A Tabela de Contingência 2 2 Às vezes, cada um dos dois critérios de classificação pode ser
dividido em apenas duas categorias ou níveis. Quando os dados são classificados dessa maneira,
o resultado é uma tabela de contingência composta por duas linhas e duas colunas. Essa tabela é
comumente chamada de tabela 2 2. O valor de X2 pode ser calculado calculando primeiro as
frequências celulares esperadas da maneira discutida acima. No caso de uma tabela de
contingência 2 2, no entanto, X2 pode ser calculado pela seguinte fórmula de atalho:
2
nðad bcÞ
X2 ¼ (12.4.1)
ða þ cÞðb þ dÞða þ bÞðc þ dÞ
onde a, b, c e d são as frequências de células observadas conforme mostrado na Tabela 12.4.5.

Quando aplicamos a regra ðr 1Þðc 1Þ para encontrar graus de liberdade a uma tabela 2 2, o
resultado é 1 grau de liberdade. Vamos ilustrar isso com um exemplo.
TABELA 12.4.5 A 2 2 Tabela de Contingência
Primeiro Critério de Classificação

Segundo Critério de
Classificação 1 2 Total
1 aba þ b 2 cdc þ d
Total aþc bþd n

EXEMPLO 12.4.2
De acordo com Silver e Aiello (A-4), as quedas são uma grande preocupação entre os sobreviventes da pólio.
Os pesquisadores queriam determinar o impacto de uma queda nas mudanças de estilo de vida. A Tabela 12.4.6
mostra os resultados de um estudo com 233 sobreviventes da pólio sobre se o medo de cair resultou em
mudanças no estilo de vida.
Solução:
1. Dados. A partir das informações fornecidas, podemos construir o 2 2 contin

tabela de agências exibida como Tabela 12.5.6.
2. Suposições. Assumimos que a amostra é equivalente a uma amostra

aleatória simples.
3. Hipóteses.
H0: O estado de queda e a mudança de estilo de vida devido ao medo de cair são
independentes.
H1: As duas variáveis não são independentes.
Deixe um ¼ 0,05.
k 2
Oi Ei
ðÞ
X2 ¼ X
i¼1 " Ei #
5. Distribuição da estatística de teste. Quando H0 é verdadeiro, X2 é

distribuído aproximadamente como x2 com ðr 1Þðc 1Þ¼ð2 1Þð2
1Þ¼ð1Þð1Þ ¼ 1 grau de liberdade.
6. Regra de decisão. Rejeitar H0 se o valor calculado de X2 for igual
ou superior a 3,841.
2
233½ ð131Þð36Þð52Þð14Þ
X2 ¼ ¼ 31:7391
ð145Þð88Þð183Þð50Þ
8. Decisão estatística. Rejeitamos H0 desde 31:7391 > 3:841.
TABELA 12.4.6 Tabela de Contingência para os Dados do Exemplo 12.4.2
Fez mudanças no estilo de vida por causa do medo de cair
Sim Não Total
Fallers 131 52 183

Não-quedas 14 36 50
Total 145 88 233
Fonte: JK Silver e DD Aiello, “Polio Survivors: Falls and Subsequent Injuries,”

American Journal of Physical Medicine and Rehabilitation, 81 (2002), 567–570.
9. Conclusão. Concluímos que H0 é falsa e que existe relação entre sofrer uma queda e
mudar o estilo de vida por medo de cair. 10. valor p. Desde 31:7391 > 7:879, p <
0,005.
&
Frequências esperadas pequenas Os problemas de como lidar com frequências esperadas pequenas e
tamanhos de amostra totais pequenos podem surgir na análise de tabelas de contingência 2 2 . Cochran (5)
sugere que o teste x2 não deve ser usado se n < 20 ou se 20 < n < 40 e qualquer frequência esperada for
menor que 5. Quando n ¼ 40, uma frequência esperada de célula tão pequena quanto 1 pode ser tolerada.
Correção de Yates As frequências observadas em uma tabela de contingência são discretas e, portanto,
dão origem a uma estatística discreta, X2 que é aproximada pela
, emdistribuição
1934 propôs
x2 ,um
queprocedimento
é contínua. Yates
para (6)
corrigir isso no caso de 2 2 tabelas. A correção, conforme a Equação 12.4.2, consiste em subtrair metade
do número total de observações do valor absoluto da quantidade ad bc antes do quadrado. Isso é,
2
nð jad bcj .5n Þ ða þ
X2corrigido ¼ (12.4.2)
cÞðb þ dÞða þ bÞðc þ dÞ
É geralmente aceito que nenhuma correção é necessária para tabelas de contingência maiores.
Embora a correção de Yates para tabelas 2 2 tenha sido amplamente usada no passado, investigadores
mais recentes questionaram seu uso. Como resultado, alguns médicos não recomendam seu uso.
Podemos, por uma questão de interesse, aplicar a correção ao nosso exemplo atual. Usando a
Equação 12.4.2 e os dados da Tabela 12.4.6, podemos calcular
2
233½ jð131Þð36Þð52Þð14Þj .5ð233Þ X2 ¼
ð145Þð88Þð183Þð50Þ ¼ 29:9118
Como seria de esperar, com uma amostra tão grande, a diferença nos dois resultados não é dramática.
Testes de Independência: Características As características de um teste qui-quadrado de independência

que o distinguem de outros testes qui-quadrado são as seguintes:
1. Uma única amostra é selecionada de uma população de interesse e os sujeitos ou objetos

são classificados de forma cruzada com base nas duas variáveis de interesse.
2. O raciocínio para o cálculo das frequências esperadas das células é baseado na lei da probabilidade,
que afirma que se dois eventos (aqui os dois critérios de classificação) são independentes, a
probabilidade de sua ocorrência conjunta é igual ao produto de suas probabilidades individuais.
3. As hipóteses e conclusões são apresentadas em termos de independência (ou falta de

independência) de duas variáveis.
EXERCÍCIOS
Nos exercícios a seguir, faça o teste no nível de significância indicado e determine o valor de p.
12.4.1 No estudo de Silver e Aiello (A-4) citado no Exemplo 12.4.2, um objetivo secundário era determinar se a frequência de quedas era
independente do uso da cadeira de rodas. A tabela a seguir fornece os dados para quedas e uso de cadeira de rodas entre os
sujeitos do estudo.
Uso de cadeira de rodas
Sim Não
Fallers 62 121
Não-quedas 18 32
Fonte: JK Silver e DD Aiello, “Polio Survivors: Falls and Subsequent

Injuries,” American Journal of Physical Medicine and Rehabilitation,
81 (2002), 567–570.
Esses dados fornecem evidências suficientes para garantir a conclusão de que o uso da cadeira de rodas e as quedas estão
relacionados? Deixe um ¼ 0,05.
12.4.2 A infecção do sítio cirúrgico (ISC) do esterno após cirurgia de revascularização do miocárdio é uma complicação que aumenta a
morbidade do paciente e os custos para os pacientes, pagadores e sistema de saúde. Segal e Anderson (A-5) realizaram um
estudo que examinou dois tipos de preparo pré-operatório da pele antes de realizar uma cirurgia de coração aberto. Estas duas
preparações usaram iodo aquoso e iodo insolúvel com os seguintes resultados.
Comparação de preparações
aquosas e insolúveis
Grupo Preparatório Infetado Não infectado
Iodo aquoso 14 94
Iodo insolúvel 4 97
Fonte: Cynthia G. Segal e Jacqueline J. Anderson, "Preparação Pré-

operatória da Pele de Pacientes Cardíacos", AORN Journal, 76 (2002), 821–827.
Esses dados fornecem evidências suficientes no nível de ¼ 0,05 para justificar a conclusão de que o tipo de preparação da pele
e a infecção estão relacionados?
12.4.3 Os efeitos colaterais dos antiinflamatórios não esteróides (AINEs) incluem problemas envolvendo ulceração péptica, função renal e
doença hepática. Em 1996, o American College of Rheumatology emitiu e divulgou diretrizes recomendando testes basais
(hemograma, painel hepático e testes renais) ao prescrever AINEs. Um estudo foi conduzido por Rothenberg e Holcomb (A-6)
para determinar se os médicos que fazem parte de um banco de dados nacional de registros médicos computadorizados
realizaram os testes iniciais recomendados ao prescrever AINEs. Os pesquisadores classificaram os médicos do estudo em
quatro categorias - aqueles que praticam medicina interna, prática familiar, prática familiar acadêmica e grupos multiespecializados.
Os dados aparecem na tabela a seguir.
EXERCÍCIOS 629
Testes de linha de base realizados
Tipo de prática Sim Não
Medicina Interna 294 921

prática familiar 98 2862
Prática familiar acadêmica 50 3064
Grupos multiespecializados 203 2652
Fonte: Ralph Tothenberg e John P. Holcomb, “Diretrizes para Monitoramento de AINEs:

Quem Ouviu?”, Journal of Clinical Rheumatology, 6 (2000), 258–265.
Os dados acima fornecem evidências suficientes para concluirmos que o tipo de prática e o desempenho dos testes de linha
de base estão relacionados? Use um ¼ .01.
12.4.4 Boles e Johnson (A-7) examinaram as crenças de adolescentes sobre tabagismo e peso.
Os entrevistados caracterizaram seu peso em três categorias: abaixo do peso, acima do peso ou adequado. O status de
fumante foi categorizado de acordo com a resposta à pergunta: “Você fuma atualmente, ou seja, um ou mais cigarros por
dia?” A tabela a seguir mostra os resultados de um estudo por telefone com adolescentes na faixa etária de 12 a 17 anos.
Fumar
Sim Não
Abaixo do peso 17 97
Excesso de peso 25 142
apropriado 96 816
Fonte: Sharon M. Boles e Patrick B. Johnson, “Gender, Weight Concerns, and Adolescent
Smoking,” Journal of Addictive Diseases, 20 (2001), 5–14.
Os dados fornecem evidências suficientes para sugerir que a percepção do peso e o tabagismo estão relacionados em
adolescentes? um ¼ 0,05.
12.4.5 Uma amostra de 500 estudantes universitários participou de um estudo destinado a avaliar o nível de conhecimento dos
estudantes universitários sobre um determinado grupo de doenças comuns. A tabela a seguir mostra os alunos classificados
por grande área de estudo e nível de conhecimento do grupo de doenças:
Conhecimento de Doenças
Maior Bom Pobre Total
Pré-medico 31 91 122
De outros 19 359 378
Total 50 450 500
Esses dados sugerem que existe uma relação entre o conhecimento do grupo de doenças e a área de estudo principal dos
universitários de onde foi extraída a presente amostra?
Deixe um ¼ 0,05.
12.4.6 A tabela a seguir apresenta os resultados de uma pesquisa em que os sujeitos foram uma amostra de 300 adultos residentes em
uma determinada área metropolitana. Cada sujeito foi solicitado a indicar qual das três políticas que eles favoreciam com
relação ao fumo em locais públicos.
Política Favorecida
Não Permitido Fumar em Não
A mais alta educação Restrições ao Designado Fumar em Não

Nível Fumar Apenas Áreas tudo Opinião Total
graduado da faculdade 5 44 23 3 75
Formado no ensino médio 15 100 30 5 150
graduado da escola primária 15 40 10 10 75
Total 35 184 63 18 300
Pode-se concluir com esses dados que, na população amostrada, existe relação entre escolaridade e atitude em relação ao
fumo em locais públicos? Deixe um ¼ 0,05.
12.5 TESTES DE HOMOGENEIDADE

Uma característica dos exemplos e exercícios apresentados na última seção é que, em cada caso,
assumiu-se que a amostra total foi sorteada antes que as entidades fossem classificadas de acordo
com os dois critérios de classificação. Ou seja, o número observado de entidades caindo em cada
célula foi determinado após a coleta da amostra. Como resultado, os totais de linha e coluna são
quantidades aleatórias que não estão sob o controle do investigador. Pensamos na amostra extraída
nessas condições como uma única amostra extraída de uma única população. Ocasionalmente, no
entanto, os totais de linha ou coluna podem estar sob o controle do investigador; isto é, o investigador
pode especificar que amostras independentes sejam retiradas de cada uma das diversas populações.
Neste caso, diz-se que um conjunto de totais marginais é fixo, enquanto o outro conjunto, correspondente
ao critério de classificação aplicado às amostras, é aleatório. O primeiro procedimento, como vimos,
leva a um teste qui-quadrado de independência. A última situação leva a um teste qui-quadrado de
homogeneidade. As duas situações não apenas envolvem diferentes procedimentos de amostragem;
eles levam a diferentes questões e hipóteses nulas. O teste de independência diz respeito à questão:
os dois critérios de classificação são independentes? O teste de homogeneidade está preocupado com
a questão: as amostras são retiradas de populações homogêneas com relação a algum critério de
classificação? No último caso, a hipótese nula afirma que as amostras são retiradas da mesma
população.
Apesar dessas diferenças de conceito e procedimento de amostragem, os dois testes são
matematicamente idênticos, como vemos quando consideramos o exemplo a seguir.
Cálculo das frequências esperadas As categorias de linha ou de coluna podem representar as

diferentes populações das quais as amostras são extraídas.
Se, por exemplo, três populações forem amostradas, elas podem ser designadas como populações 1,
2 e 3, caso em que esses rótulos podem servir como cabeçalhos de linha ou coluna. Se a variável de
interesse tiver três categorias, digamos, A, B e C, esses rótulos podem servir como títulos para linhas
ou colunas, o que não for usado para as populações. Se utilizarmos notação semelhante à adotada
para a Tabela 12.4.2, a tabela de contingência para esta situação, com colunas utilizadas para
representar as populações, é apresentada na Tabela 12.5.1. Antes de calcular nossa estatística de
teste, precisamos das frequências esperadas para cada uma das células da Tabela 12.5.1. Se as populações são realmente
12.5 TESTES DE HOMOGENEIDADE 631
TABELA 12.5.1 Uma tabela de contingência para dados para um teste qui-
quadrado de homogeneidade
População
Categoria variável 1 2 3 Total
UMA
nA1 nA2 nA3 n / D:
B nB1 nB2 nB3 nB:

C nC1 nC2 nC3 nC:
Total n.1 n.2 n.3 n
homogêneo, ou, de forma equivalente, se as amostras forem todas retiradas da mesma

população, com relação às categorias A, B e C, nossa melhor estimativa da proporção na
população combinada que pertence à categoria A é nA:=n. Da mesma forma, se as três
populações forem homogêneas, interpretamos essa probabilidade como aplicável a cada
uma das populações individualmente. Por exemplo, sob a hipótese nula, nA. é a nossa
melhor estimativa da probabilidade de que um sujeito escolhido aleatoriamente da população
combinada pertença à categoria A. Esperaríamos, então, encontrar n.1ðnA:=nÞ daqueles
na amostra da população 1 para pertencer à categoria A , n.2ðnA:=nÞ dos da amostra da
população 2 pertencem à categoria A, e n.3ðnA:=nÞ dos da amostra da população 3 pertencem à cate
Esses cálculos fornecem as frequências esperadas para a primeira linha da Tabela 12.5.1.
Raciocínios e cálculos semelhantes fornecem as frequências esperadas para as outras duas linhas.
Vemos novamente que o procedimento de atalho de multiplicar os totais marginais apropriados
e a divisão pelo total geral produz as frequências esperadas para as células.
A partir dos dados da Tabela 12.5.1, calculamos a seguinte estatística de teste:
k ðÞ 2
Oi Ei
X2 ¼ X " #
i¼1 Ei
EXEMPLO 12.5.1
A narcolepsia é uma doença que envolve distúrbios do ciclo sono-vigília. Membros da

Sociedade Alemã de Enxaqueca e Dor de Cabeça (A-8) estudaram a relação entre
enxaquecas em 96 indivíduos diagnosticados com narcolepsia e 96 controles saudáveis. Os
resultados são apresentados na Tabela 12.5.2. Queremos saber se podemos concluir, com base nesse
TABELA 12.5.2 Frequência de enxaqueca por estado de narcolepsia
Dores de cabeça de enxaqueca relatadas
Sim Não Total
sujeitos narcolépticos 21 75 96
Controles saudáveis 19 77 96
Total 40 152 192
Fonte: The DMG Study Group, “Migraine and Idiopathic Narcolepsy—A Case-Control Study,”
Cephalagia, 23 (2003), 786-789.
que a população com narcolepsia e as populações saudáveis representadas pelas amostras não
são homogêneas em relação à frequência da enxaqueca.
Solução:

2. Suposições. Assumimos que temos uma amostra aleatória simples de
cada uma das duas populações de interesse.
3. Hipóteses.
H0: As duas populações são homogêneas em relação à enxaqueca
frequência.
HA: As duas populações não são homogêneas em relação à enxaqueca
frequência.
Deixe um ¼ 0,05.
2
X2 ¼ X ð h
Oi Ei º =Ei
eu
5. Distribuição da estatística de teste. Se H0 for verdadeiro, X2 é distribuído

aproximadamente como x2 com ð2 1Þð2 1Þ¼ð1Þð1Þ ¼ 1 grau de liberdade.
6. Regra de decisão. Rejeitar H0 se o valor calculado de X2 for igual ou superior a 3,841.
7. Cálculo da estatística de teste. A saída do MINITAB é mostrada na Figura

12.5.1.
Teste qui-quadrado
As contagens esperadas são impressas abaixo das contagens observadas
Filas: Narcolepsia Colunas: Enxaqueca
Não Sim Todos
Não 77 19 96
76,00 20h00 96,00
Sim 75 21 96
76,00 20h00 96,00
Todos 152 40 192

152,00 40,00 192,00
Qui-quadrado = 0,126, DF = 1, valor P = 0,722
FIGURA 12.5.1 Saída do MINITAB para o Exemplo 12.5.1.

12.5 TESTES DE HOMOGENEIDADE 633
8. Decisão estatística. Como 0,126 é menor que o valor crítico de 3,841,

não podemos rejeitar a hipótese nula.
9. Conclusão. Concluímos que as duas populações podem ser homogêneas
com relação à frequência da enxaqueca.
10. valor p. Na saída do MINITAB, vemos que p ¼ .722. &
Pequenas frequências esperadas As regras para pequenas frequências esperadas dadas

na seção anterior são aplicáveis ao realizar um teste de homogeneidade.
Em resumo, o teste qui-quadrado de homogeneidade tem as seguintes características:
1. Duas ou mais populações são identificadas antecipadamente e uma amostra independente é

retirada de cada uma.
2. Sujeitos ou objetos de amostra são colocados em categorias apropriadas da variável de

interesse.
3. O cálculo das frequências celulares esperadas é baseado no raciocínio de que, se as

populações forem homogêneas conforme declarado na hipótese nula, a melhor estimativa
da probabilidade de um sujeito ou objeto cair em uma determinada categoria da variável
de interesse pode ser obtido reunindo os dados da amostra.
4. As hipóteses e conclusões são apresentadas em termos de homogeneidade (em relação
à variável de interesse) das populações.
Teste de Homogeneidade e H0:p1 ¼ p2 O teste qui-quadrado de homogeneidade para o

caso de duas amostras fornece um método alternativo para testar a hipótese nula de que
duas proporções populacionais são iguais. Na Seção 7.6, lembre-se, aprendemos a testar
H0 :p1 ¼ p2 contra HA :p1 6¼ p2 por meio da estatística
ð ^p1 ^ p2Þ ð ^p1 ^p2 Þ0

z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
pð Þ 1 p pðÞ 1 p
º
r n1 n2
onde p é obtido reunindo os dados das duas amostras independentes disponíveis para
análise.
Suponha, por exemplo, que em um teste de H0 :p1 ¼ p2 contra HA :p1 6¼ p2, os dados
amostrais foram os seguintes: n1 ¼ 100; ^p1 ¼ .60; n2 ¼ 120; ^p2 ¼ .40. Quando agrupamos os
dados de amostra, temos
.60 100 ð Þþ .40 120 ð 108

p¼ ¼ ¼ 0,4909
Þ 100 þ 120 220
.60 .40
z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
¼ 2:95469
ð Þ 0,4909 ð Þ 0,5091 ð Þ .4909 ð Þ .5091
º
r 100 120
que é significativo no nível 0,05, pois é maior que o valor crítico de 1,96.
Se quisermos testar a mesma hipótese usando a abordagem do qui-quadrado, nossa tabela

de contingência será
presente característico
Amostra Sim Não Total
1 60 40 100
2 48 72 120
Total 108 112 220
2
220 60 ½ ð Þð Þ 72 ð Þ 40 ð Þ 48
X2 ¼ ð ¼ 8:7302
Þ 108 ð Þ 112 ð Þ 100 ð Þ 120
que é significativo no nível 0,05 porque é maior que o valor crítico de 3,841. Vemos, portanto, que
chegamos à mesma conclusão por ambos os métodos. Isso não é surpreendente porque, conforme
2
explicado na Seção 12.2, x2 ¼ z2. Notamos que 8:7302 ¼ ð Þ 2:95469 e ð Þ1
2.
que 3:841 ¼ ð Þ 1:96
EXERCÍCIOS
Nos exercícios a seguir, faça o teste no nível de significância indicado e determine o valor de p.
12.5.1 Consulte o estudo de Carter et al. [A-9], que investigou o efeito da idade de início do transtorno bipolar no curso da doença.
Uma das variáveis estudadas foi o histórico familiar dos sujeitos. A Tabela 3.4.1 mostra a frequência de história familiar
de transtornos do humor nos dois grupos de interesse: idade de início precoce (18 anos ou menos) e idade de início
tardia (mais de 18 anos).
Histórico familiar de humor

Distúrbios Início de 18ðEÞ Mais tarde > 18ðLÞ Total
Negativo (A) 28 35 63
Transtorno bipolar (B) 19 38 57
Unipolar (C) 41 44 85
Unipolar e bipolar (D) 53 60 113
Total 141 177 318
Fonte: Tasha D. Carter, Emanuela Mundo, Sagar V. Parkh e James L. Kennedy,

“Early Age at Onset as a Risk Factor for Poor Outcome of Bipolar Disorder,” Journal
of Psychiatric Research, 37 (2003), 297– 303.
Podemos concluir com base nesses dados que indivíduos com 18 anos ou menos diferem de indivíduos com mais de 18
anos com relação a histórias familiares de transtornos do humor? Deixe um ¼ 0,05.
EXERCÍCIOS 635
12.5.2 Coughlin et al. (A-10) examinou práticas de triagem de mama e colo do útero de mulheres hispânicas e não hispânicas em
condados que se aproximam da região da fronteira sul dos EUA. O estudo utilizou dados das pesquisas do Sistema de
Vigilância de Fatores de Risco Comportamentais de adultos com 18 anos ou mais, realizadas em 1999 e 2000. A tabela
a seguir mostra o número de observações de mulheres hispânicas e não hispânicas que fizeram mamografia nos últimos
2 anos classificação cruzada por estado civil.
Estado civil hispânico não hispânico Total
Atualmente casado 319 738 1057

Divorciados ou separados 130 329 459
Viúva 88 402 490
Nunca se casou ou vive como 41 95 136
um casal solteiro
Total 578 1564 2142
Fonte: Steven S. Coughlin, Robert J. Uhler, Thomas Richards e Katherine M.

Wilson, “Práticas de triagem de câncer de mama e colo do útero entre mulheres
hispânicas e não hispânicas que residem perto da fronteira entre os Estados
Unidos e o México, 1999–2000,” Família e Community Health, 26, (2003), 130–139.
Queremos saber se podemos concluir com base nesses dados que o estado civil e a etnia (hispânica e não hispânica)
nos condados fronteiriços do sul dos Estados Unidos não são homogêneos.
Deixe um ¼ 0,05.
12.5.3 Swor et al. (A-11) examinou a eficácia do treinamento de ressuscitação cardiopulmonar (RCP) em pessoas com mais de 55
anos de idade. Eles compararam as taxas de retenção de habilidades de indivíduos nessa faixa etária que concluíram um
curso de instrução de RCP tradicional com aqueles que receberam ressuscitação cardiopulmonar somente com
compressão torácica (CC-CPR). Grupos independentes foram testados 3 meses após o treinamento.
Entre os 27 indivíduos que receberam RCP tradicional, 12 foram classificados como competentes. No grupo CC-CPR, 15
de 29 foram classificados como competentes. Esses dados fornecem evidências suficientes para concluirmos que as
duas populações não são homogêneas com relação à classificação de competência 3 meses após o treinamento?
Deixe um ¼ 0,05.
12.5.4 Em um estudo de poluição do ar, uma amostra aleatória de 200 domicílios foi selecionada em cada uma das duas
comunidades. Foi perguntado a um entrevistado em cada domicílio se alguém no domicílio se incomodava ou não com a
poluição do ar. As respostas foram as seguintes:
Algum membro da família

incomodado com a poluição do ar?
Comunidade Sim Não Total
EU 43 157 200
II 81 119 200
Total 124 276 400
Os pesquisadores podem concluir que as duas comunidades diferem em relação à variável de interesse?
Deixe um ¼ 0,05.
12.5.5 Em uma amostra aleatória simples de 250 trabalhadores industriais com câncer, os pesquisadores descobriram que
102 haviam trabalhado em empregos classificados como “alta exposição” com relação a agentes suspeitos de
causar câncer. Do restante, 84 trabalharam em empregos de “exposição moderada” e 64 não tiveram nenhuma
exposição conhecida por causa de seus empregos. Em uma amostra aleatória simples independente de 250
trabalhadores industriais da mesma área que não tinham histórico de câncer, 31 trabalhavam em empregos de “alta
exposição”, 60 trabalhavam em empregos de “exposição moderada” e 159 trabalhavam em empregos sem
exposição conhecida a agentes causadores de câncer. A partir desses dados, parece que as pessoas que trabalham
em empregos que as expõem a agentes suspeitos de causar câncer têm um risco aumentado de contrair câncer? Deixe um ¼ 0,05.
12.6 O TESTE EXATO DE FISHER
Às vezes, temos dados que podem ser resumidos em uma tabela de contingência 2 2, mas esses
dados são derivados de amostras muito pequenas. O teste qui-quadrado não é um método de análise
apropriado se os requisitos mínimos de frequência esperada não forem atendidos. Se, por exemplo, n
for menor que 20 ou se n estiver entre 20 e 40 e uma das frequências esperadas for menor que 5, o
teste qui-quadrado deve ser evitado.
Um teste que pode ser usado quando os requisitos de tamanho do teste qui-quadrado não são
atendidos foi proposto em meados da década de 1930 quase simultaneamente por Fisher (7,8), Irwin
(9) e Yates (10). O teste passou a ser conhecido como teste exato de Fisher. É chamado exato porque,
se desejado, permite calcular a probabilidade exata de obter os resultados observados ou resultados
mais extremos.
Disposição dos dados Quando usamos o teste exato de Fisher, organizamos os dados na forma de
uma tabela de contingência 2 2 como a Tabela 12.6.1. Arranjamos as frequências de forma que A > B
e escolhemos a característica de interesse de forma que a=A > b=B.
Alguns teóricos acreditam que o teste exato de Fisher é apropriado apenas quando ambos os
totais marginais da Tabela 12.6.1 são fixados pelo experimento. Este modelo específico não parece
surgir com muita frequência na prática. Muitos experimentadores, portanto, usam o teste quando
ambos os totais marginais não são fixos.
Suposições A seguir estão as suposições para o teste exato de Fisher.
1. Os dados consistem em observações de amostra A da população 1 e amostra B

observações da população 2.
2. As amostras são aleatórias e independentes.
3. Cada observação pode ser categorizada como um dos dois tipos mutuamente exclusivos.
TABELA 12.6.1 A 2 2 Tabela de Contingência para o Teste Exato de Fisher
Com Sem
Amostra Característica Característica Total
1 uma um um UMA
2 b Bb B
Total aþb AþBab AþB

12.6 TESTE EXATO DE FISHER 637
Hipóteses A seguir estão as hipóteses nulas que podem ser testadas e suas alternativas.
1. (Dois lados)
H0: A proporção com a característica de interesse é a mesma nas duas populações; ou seja,
p1 ¼ p2.
HA: A proporção com a característica de interesse não é a mesma nas duas populações;
p1 6¼ p2.
2. (Unilateral)
H0: A proporção com a característica de interesse na população 1 é menor ou

o mesmo que a proporção na população 2; p1 p2.
HA: A proporção com a característica de interesse é maior na população 1 do que
na população 2; p1 > p2.
Estatística de teste A estatística de teste é b, o número na amostra 2 com a característica de interesse.
Regra de Decisão Finney (11) preparou valores críticos de b para A 15. Latscha (12) estendeu as tabelas de Finney
para acomodar valores de A até 20. Apêndice Tabela J fornece esses valores críticos de b para A entre 3 e 20,
inclusive . Níveis de significância de 0,05, 0,025, 0,01 e 0,005 estão incluídos. As regras de decisão específicas são
as seguintes:
1. Teste bilateral. Entre na Tabela J com A, B e a. Se o valor observado de b for igual ou menor que o inteiro
em uma determinada coluna, rejeite H0 em um nível de significância igual a duas vezes o nível de
significância mostrado no topo dessa coluna. Por exemplo, suponha A ¼ 8, B ¼ 7, a ¼ 7, e o valor
observado de b é 1. Podemos rejeitar a hipótese nula em 2 .05 ð Þ¼ .10, 2 .025 ð Þ¼ .05, e os níveis de
significância 2 .01 ð Þ¼ .02, mas não no nível 2 .005 ð Þ¼ .01.
2. Teste unilateral. Entre na Tabela J com A, B e a. Se o valor observado de b for menor ou igual ao inteiro em
uma determinada coluna, rejeite H0 no nível de significância mostrado no topo dessa coluna. Por exemplo,
suponha que A ¼ 16, B ¼ 8, a ¼ 4 e o valor observado de b seja 3. Podemos rejeitar a hipótese nula nos
níveis de significância de 0,05 e 0,025, mas não nos níveis de 0,01 ou .005 níveis.
Aproximação para amostras grandes Para amostras suficientemente grandes, podemos testar a hipótese nula da
igualdade de duas proporções populacionais usando a aproximação normal. Calcular
ð Þ a=A ð Þ b=B
(12.6.1)
p ^pð 1 Þ ^p ð1=A þ 1=B Þ
Onde
^p ¼ ð Þ
=ðaÞþ Ab þ B (12.6.2)
e compare-o quanto à significância com os valores críticos apropriados da distribuição normal padrão. O uso da
aproximação normal é geralmente considerado satisfatório se a,
b, A a e B b são todos maiores ou iguais a 5. Alternativamente, quando os tamanhos das amostras são
suficientemente grandes, podemos testar a hipótese nula por meio do teste qui-quadrado.
Leitura adicional O teste exato de Fisher tem sido objeto de alguma controvérsia entre os estatísticos.
Alguns acham que a suposição de totais marginais fixos é irreal na maioria das aplicações práticas. A
controvérsia gira em torno de se o teste é apropriado quando ambos os totais marginais não são fixos.
Para uma discussão mais aprofundada deste e de outros pontos, consulte os artigos de Barnard (13–15),
Fisher (16) e Pearson (17).
Sweetland (18) comparou os resultados do uso do teste qui-quadrado com aqueles obtidos usando
o teste exato de Fisher para amostras de tamanho A þ B ¼ 3 a A þ B ¼ 69. Ele encontrou uma
concordância próxima quando A e B eram de tamanhos próximos e o teste foi unilateral.
Carr (19) apresenta uma extensão do teste exato de Fisher para mais de duas amostras de
tamanho igual e dá um exemplo para demonstrar os cálculos. Neave (20) apresenta o teste exato de
Fisher em um novo formato; o teste é tratado como um teste de independência e não de homogeneidade.
Ele preparou extensas tabelas para uso com sua abordagem.
A sensibilidade do teste exato de Fisher para pequenas perturbações em 2 2 tabelas de
contingência é discutida por Dupont (21).
EXEMPLO 12.6.1
O objetivo do estudo de Justesen et al. (A-12) foi avaliar a eficácia a longo prazo de tomar indinavir/
ritonavir duas vezes ao dia em combinação com dois inibidores nucleosídeos da transcriptase reversa
entre indivíduos HIV positivos que foram divididos em dois grupos.
O Grupo 1 consistia em pacientes que não tinham histórico de uso de inibidores de protease (PI Na€ÿve).
O Grupo 2 consistia em pacientes que tinham história prévia de uso de um inibidor de protease (PI
Experiente). A Tabela 12.6.2 mostra se esses indivíduos permaneceram no regime durante as 120
semanas de acompanhamento. Queremos saber se podemos concluir que os pacientes classificados
como grupo 1 têm menor probabilidade do que os indivíduos do grupo 2 de permanecer no regime por
120 semanas.
TABELA 12.6.2 Status do regime em 120 semanas para indivíduos

nativos de IP e com experiência em IP tomando Indinavir/Ritonavir
conforme descrito no Exemplo 12.6.1
Permaneceu
no Regime por
120 Semanas
Total Sim Não
1 (PI Na€ÿve) 9 2 7
2 (Experiência em PA) 12 8 4
Total 21 10 11
Fonte: US Justesen, AM Lervfing, A. Thomsen, JA Lindberg, C. Pedersen e

P. Tauris, “Low-Dose Indinavir in Combination with Low-Dose Ritonavir:
Steady-State Pharmacokinetics and Long-Term Clinical Outcome Follow-Up ,”
HIV Medicine, 4 (2003), 250–254.
12.6 TESTE EXATO DE FISHER 639
TABELA 12.6.3 Dados da Tabela 12.6.2 Reorganizados para Conformidade com o Layout da
Tabela 12.6.1
Permaneceu no regime por 120 semanas
Sim Não Total
2 (PI Experiente) 8¼a 4¼Aa 12 ¼ A

1 (PI Na€ÿve) 2¼b 7¼Bb 9¼B
Total 10 ¼ a þ b 11 ¼ A þ Bab 21 ¼ A þ B
Solução:
1. Dados. Os dados relatados são mostrados na Tabela 12.6.2. A Tabela 12.6.3 mostra os
dados reorganizados de acordo com o layout da Tabela 12.6.1.
A permanência no regime é a característica de interesse.
2. Suposições. Presumimos que as premissas para aplicação do

teste exato de Fisher são atendidos.
3. Hipóteses.
H0: A proporção de indivíduos que permanecem 120 semanas no regime em uma
população de pacientes classificados como grupo 2 é igual ou menor que a
proporção de indivíduos que permanecem no regime 120 semanas em uma
população classificada como grupo 1.
HA: Os pacientes do grupo 2 têm uma taxa maior do que os pacientes do grupo 1 de
permanecer no regime por 120 semanas.
4. Estatística de teste. A estatística de teste é o valor observado de b conforme mostrado em
Tabela 12.6.3.
5. Distribuição da estatística de teste. Determinamos a significância de b consultando a

Tabela J do Apêndice.
6. Regra de decisão. Suponha que deixamos um ¼ 0,05. A regra de decisão, então, é rejeitar
H0 se o valor observado de b for igual ou menor que 1, o valor de b na Tabela J para A
¼ 12, B ¼ 9, a ¼ 8 e a ¼ 0,05.
7. Cálculo da estatística de teste. O valor observado de b, conforme mostrado na Tabela

12.6.3, é 2.
8. Decisão estatística. Como 2 > 1, não rejeitamos H0.
9. Conclusão. Como falhamos em rejeitar H0, concluímos que a hipótese nula pode ser
verdadeira. Ou seja, pode ser verdade que a taxa de permanência no regime por 120
semanas seja a mesma ou menor para o grupo com experiência em IP em comparação
com o grupo sem uso de IP.
10. valor p. Vemos na Tabela J que quando A ¼ 12, B ¼ 9, a ¼ 8, o valor de b ¼ 2 tem uma
probabilidade exata de ocorrer apenas por acaso, quando H0 é verdadeiro, maior que
0,05. &
Pl * Permaneceu Tabulação Cruzada
Contar
Permaneceu
Sim Não Total
Pl Com experiência 8 4 12
Ingénuo 2 7
latoT 9 1101 12
Testes qui-quadrado
Asymp. Assinar Assinatura Assinatura

Valor df (2 lados) exata. (2 lados) exata. (1 lado)
4,073b
Pearson Qui-Square Continuity Correctiona 1 0,044
2,486 Razão de verossimilhança 4,253 eT 1 .115
tcaxE s'rehsiF ts Associação linear aN linear
de 1 0,039
casos válidos 080. 650.
3.879 1 0,049
21
uma. Calculado apenas para uma

tabela 2 2 b. 2 células (50,0%) têm contagem esperada inferior a 5. A contagem mínima esperada é 4,29.
FIGURA 12.6.1 Saída do SPSS para o Exemplo 12.6.1.
Vários programas de software estatístico realizam os cálculos para o teste exato de Fisher. A Figura 12.6.1 mostra os
resultados do Exemplo 12.6.1 calculados pelo SPSS. O valor p exato é fornecido para um teste unilateral e bilateral. Com base
nesses resultados, deixamos de rejeitar H0 (valor de p > 0,05), assim como fizemos com as tabelas estatísticas do Apêndice.
Observe que, além do teste exato de Fisher, vários testes alternativos são fornecidos. O leitor deve estar ciente de que esses
testes alternativos não são apropriados se as suposições subjacentes a eles forem violadas.
EXERCÍCIOS
12.6.1 O objetivo de um estudo de Tahmassebi e Curzon (A-13) foi determinar se a baba em crianças com
paralisia cerebral é devida à hipersalivação. Um dos procedimentos para esse fim foi examinar a
capacidade de tamponamento salivar de crianças com paralisia cerebral e controles. A tabela a seguir
apresenta os resultados.
12.7 RISCO RELATIVO, ODDS RATIO E A ESTATÍSTICA DE MANTEL-HAENSZEL 641
Capacidade de memoria
Grupo Médio Alto
Paralisia cerebral 2 8
Ao controle 3 7
Fonte: JF Tahmassebi e MEJ Curzon, “A causa da baba em crianças

com paralisia cerebral — hipersalivação ou defeito de deglutição?”
Jornal Internacional de Odontopediatria, 13 (2003), 106–111.
Teste para uma diferença significativa entre crianças com paralisia cerebral e controles com relação à capacidade de
tamponamento alta ou baixa. Seja a ¼ 0,05 e encontre o valor de p.
12.6.2 Em um estudo de Xiao e Shi (A-14), os pesquisadores estudaram o efeito do suco de cranberry no tratamento e prevenção da
infecção por Helicobacter pylori em camundongos. A erradicação do Helicobacter pylori resulta na cicatrização de úlceras
pépticas. Os pesquisadores compararam o tratamento com suco de cranberry com “terapia tripla (amoxicilina, subcitrato de
bismuto e metronidazol) em camundongos infectados com Helicobacter pylori. Após 4 semanas, eles examinaram os
camundongos para determinar a frequência de erradicação da bactéria nos dois grupos de tratamento. A tabela a seguir
mostra os resultados.
Número de camundongos com Helicobacter pylori erradicados

Sim Não
terapia tripla 8 2
Suco de oxicoco 2 8
Fonte: Shu Dong Xiao e Tong Shi, “Is Cranberry Juice Effective in the Treatment and
Prevention of Helicobacter Pylori Infection of Mice,” Chinese Journal of Digestive Diseases,
4 (2003), 136–139.
Podemos concluir, com base nesses dados, que a terapia tripla é mais eficaz do que o suco de cranberry na erradicação
da bactéria? Seja a ¼ 0,05 e encontre o valor de p.
12.6.3 No estudo de Shaked et al. (A-15), os pesquisadores estudaram 26 crianças com lesões pancreáticas contundentes.
Essas lesões ocorreram por golpe direto no abdome, guidão de bicicleta, queda de altura ou acidente automobilístico.
Dezenove dos pacientes foram classificados como tendo ferimentos leves e sete foram classificados como tendo ferimentos
graves. A formação de pseudocisto foi suspeitada quando os sinais de deterioração clínica se desenvolveram, como
aumento da dor abdominal, plenitude epigástrica, febre e aumento dos níveis de enzimas pancreáticas. No grupo de lesões
graves, seis das sete crianças desenvolveram pseudocistos, enquanto no grupo de lesões menores, três das 19 crianças
desenvolveram pseudocistos. Isso é evidência suficiente para nos permitir concluir que a proporção de crianças
desenvolvendo pseudocistos é maior no grupo de lesões graves do que no grupo de lesões leves? Deixe um ¼ 0,01.
12.7 RISCO RELATIVO, ODDS RATIO E A ESTATÍSTICA

DE MANTEL-HAENSZEL
No Capítulo 8, aprendemos a usar técnicas de análise de variância para analisar dados que
surgem de experimentos planejados, investigações nas quais pelo menos uma variável é
manipulada de alguma forma. Experimentos planejados, é claro, não são as únicas fontes de dados que sã
de interesse para médicos e outros profissionais das ciências da saúde. Outra importante classe de
investigação científica amplamente utilizada é o estudo observacional.
DEFINIÇÃO
Um estudo observacional é uma investigação científica na qual nem os sujeitos em

estudo nem nenhuma das variáveis de interesse são manipulados de forma alguma.
Um estudo observacional, em outras palavras, pode ser definido simplesmente como uma
investigação que não é um experimento. A forma mais simples de estudo observacional é aquela em
que existem apenas duas variáveis de interesse. Uma das variáveis é chamada de fator de risco, ou
variável independente, e a outra variável é chamada de resultado, ou variável dependente.
DEFINIÇÃO
O termo fator de risco é usado para designar uma variável que se acredita estar
relacionada a alguma variável de resultado. O fator de risco pode ser uma causa
suspeita de algum estado específico da variável de resultado.
Em uma investigação específica, por exemplo, a variável de resultado pode ser o status dos
indivíduos em relação ao câncer e o fator de risco pode ser seu status em relação ao tabagismo. O
modelo é ainda mais simplificado se as variáveis forem categóricas com apenas duas categorias por
variável. Para a variável de resultado, as categorias podem ser câncer presente e câncer ausente.
Com relação ao fator de risco, os indivíduos podem ser categorizados como fumantes e não fumantes.
Quando as variáveis em estudos observacionais são categóricas, os dados a elas pertencentes

podem ser apresentados em uma tabela de contingência, daí a inclusão do tema no presente capítulo.
Limitaremos nossa discussão à situação em que a variável de resultado e o fator de risco são variáveis
dicotômicas.
Tipos de estudos observacionais Existem dois tipos básicos de estudos observacionais: estudos
prospectivos e estudos retrospectivos.
DEFINIÇÃO Um
estudo prospectivo é um estudo observacional no qual duas amostras aleatórias

de indivíduos são selecionadas. Uma amostra consiste em indivíduos que possuem
o fator de risco e a outra amostra consiste em indivíduos que não possuem o fator de
risco. Os sujeitos são acompanhados no futuro (ou seja, são acompanhados
prospectivamente) e é mantido um registro do número de sujeitos em cada amostra que,
em algum momento, são classificáveis em cada uma das categorias da variável de
resultado.
Os dados resultantes de um estudo prospectivo envolvendo duas variáveis dicotômicas podem

ser apresentados em uma tabela de contingência 2 2 que geralmente fornece informações sobre o
número de indivíduos com e sem o fator de risco e o número que o fez e o que não o fez
TABELA 12.7.1 Classificação de uma amostra de indivíduos com relação ao estado da

doença e fator de risco
Estado da doença
Fator de risco Presente Ausente Total em risco
Presente ab a þ b
Ausente cd c þ d
Total aþc bþd n
sucumbir à doença de interesse, bem como as frequências para cada combinação de categorias das
duas variáveis.
DEFINIÇÃO
Um estudo retrospectivo é o inverso de um estudo prospectivo. As amostras são

selecionadas entre aquelas que se enquadram nas categorias da variável de resultado.
O investigador, então, olha para trás (isto é, dá uma olhada retrospectiva) nos sujeitos e
determina quais têm (ou tiveram) e quais não têm (ou não tiveram) o fator de risco.
A partir dos dados de um estudo retrospectivo podemos construir uma tabela de contingência com
frequências semelhantes às possíveis para os dados de um estudo prospectivo.
Em geral, o estudo prospectivo é mais caro de conduzir do que o retrospectivo
estudar. O estudo prospectivo, no entanto, se assemelha mais a um experimento.
Risco Relativo Os dados resultantes de um estudo prospectivo em que a variável dependente e o fator
de risco são dicotômicos podem ser exibidos em uma tabela de contingência 2 2 como a Tabela 12.7.1.
O risco de desenvolvimento da doença entre os sujeitos com o fator de risco é a=ð Þ a þ b .
O risco do desenvolvimento da doença entre os sujeitos sem o
fator de risco é c=ð c þ d . Definimos o risco relativoº da seguinte forma.
DEFINIÇÃO
O risco relativo é a razão entre o risco de desenvolver uma doença entre indivíduos com o
fator de risco e o risco de desenvolver a doença entre indivíduos sem o fator de risco.
Representamos o risco relativo de um estudo prospectivo simbolicamente como
a=ð Þ a þ
b RRc ¼ c=ð c þ d (12.7.1)
Þ onde
b, c a,
e
d são definidos na Tabela 12.7.1, e RRc indica que o risco relativo é calculado a partir de uma amostra a
ser usada como uma estimativa do risco relativo, RR, para a população da qual a amostra foi extraída.
Podemos construir um intervalo de confiança para RR
fffiffiffi
X2 pza=º
ð Þ a %CI ¼ RRc1 (12.7.2)
100 1ð
onde za é o valor z bilateral correspondente ao coeficiente de confiança escolhido e X2 é calculado pela Equação
12.4.1.
Interpretação de RR O valor de RR pode variar entre zero e infinito. Um valor de 1 indica que não há associação entre
o status do fator de risco e o status da variável dependente. Na maioria dos casos, os dois estados possíveis da
variável dependente são doença presente e doença ausente. Interpretamos um RR de 1 como significando que o risco
de adquirir a doença é o mesmo para os indivíduos com o fator de risco e aqueles sem o fator de risco. Um valor de
RR maior que 1 indica que o risco de adquirir a doença é maior entre indivíduos com o fator de risco do que entre
indivíduos sem o fator de risco. Um valor de RR inferior a 1 indica menor risco de adquirir a doença entre indivíduos
com o fator de risco do que entre indivíduos sem o fator de risco. Por exemplo, um fator de risco de 2 é considerado
como significando que os indivíduos com o fator de risco têm duas vezes mais chances de adquirir a doença em
comparação com os indivíduos sem o fator de risco.
Ilustramos o cálculo do risco relativo por meio do exemplo a seguir.
EXEMPLO 12.7.1
Em um estudo prospectivo com gestantes, Magann et al. (A-16) coletou ampla informação sobre o nível de exercício
de trabalhadoras grávidas de baixo risco. Um grupo de 217 mulheres não fez exercícios voluntários ou obrigatórios
durante a gravidez, enquanto um grupo de 238 mulheres se exercitou extensivamente. Uma variável de resultado de
interesse foi o trabalho de parto prematuro.
Os resultados estão resumidos na Tabela 12.7.2.
Queremos estimar o risco relativo de trabalho de parto prematuro quando as mulheres grávidas se exercitam
extensivamente.
Solução: Pela Equação 12.7.1 calculamos
22=238 0,0924
RRc ¼ ¼ ¼ 1:1
18=217 0,0829
TABELA 12.7.2 Sujeitos com e sem fator de risco que se tornaram casos de trabalho de parto prematuro
Fator de risco Casos de Trabalho de parto prematuro Não casos de trabalho de parto prematuro Total
exercício extremo 22 216 238

Não exercitando 18 199 217
Total 40 415 455
Fonte: Everett F. Magann, Sharon F. Evans, Beth Weitz e John Newnham, “Antepartum, Intrapartum, and Neonatal
Significance of Exercise on Healthy Low-Risk Pregnant Working Women,” Obstetrics and Gynecology, 99 (2002), 466–
472.
Razão de Odds e Seção de Risco Relativo
Comum Original Iterado Registrar probabilidades Relativo
Parâmetro Razão de probabilidade Razão de probabilidade Razão de probabilidade Razão Risco
.C %59 reppU .L 0531.2 3862.2 5857.0 2911.2
Estimativa 1.1260 1.1207 1.1207 0,1140 1.1144
.C %59 rewoL .L 3885.0 6065.0 0,5305 0,5896
FIGURA 12.7.1 Saída NCSS para os dados do Exemplo 12.7.1.
Esses dados indicam que o risco de parto prematuro quando uma mulher se exercita pesadamente é 1,1 vezes maior
do que entre as mulheres que não se exercitam.
Calculamos o intervalo de confiança de 95 por cento para RR como segue. De
Equação 12.4.1, calculamos a partir dos dados da Tabela 12.7.2:
2
455 22 ½ ð Þð Þ 199 ð Þ 216 ð Þ 18
X2 ¼ ð ¼ 0,1274
Þ 40 ð Þ 415 ð Þ 238 ð Þ 217
Pela Equação 12.7.2, os limites de confiança inferior e superior são, respectivamente, :1274 p :1274 p 1:111:96=
fffiffiffiffiffiffiff fffiffiffiffiffiffiff
¼ :65 e 1:11þ1:96= ¼ 1:86. Como o intervalo

0,05, que
inclui
o risco
1, concluímos,
populacional
nopode
nívelser
de 1.
significância
Em outras de
palavras, concluímos que, na população,
mulher pode não
grávida se exercita haver um risco aumentado de parto prematuro quando um
extensivamente.
Os dados foram processados pelo NCSS. Os resultados são mostrados na Figura 12.7.1. O cálculo do risco
relativo é mostrado na coluna à direita da saída, juntamente com os limites de confiança de 95%. Devido a erros de
arredondamento, esses valores diferem ligeiramente daqueles fornecidos no exemplo. &
Odds Ratio Quando os dados a serem analisados vêm de um estudo retrospectivo, o risco relativo não é uma medida significativa para
comparar dois grupos. Como vimos, um estudo retrospectivo é baseado em uma amostra de indivíduos com a doença (casos) e uma amostra
separada de indivíduos sem a doença (controles ou não casos). Em seguida, determinamos retrospectivamente a distribuição do fator de
risco entre os casos e controles. Dados os resultados de um estudo retrospectivo envolvendo duas amostras de indivíduos, casos e controles,
podemos exibir os dados em uma tabela 2 2 como a Tabela 12.7.3, na qual os indivíduos são dicotomizados com relação à presença e
ausência do risco fator. Observe que os títulos das colunas na Tabela 12.7.3 diferem daqueles na Tabela 12.7.1 para enfatizar o fato de que
os dados são de um estudo retrospectivo e que os sujeitos foram selecionados porque eram casos ou controles. Quando os dados de um
estudo retrospectivo são exibidos como na Tabela 12.7.3, a razão a=ða þ bÞ, por exemplo, não é uma estimativa do risco de doença para
indivíduos com o fator de risco. A medida apropriada para comparar casos e controles em um estudo retrospectivo é a razão de chances.
Conforme observado no Capítulo 11, para entender o conceito de

TABELA 12.7.3 Sujeitos de um estudo retrospectivo classificados de

acordo com o status relativo a um fator de risco e se são casos ou controles
Amostra
Fator de risco casos Controles Total
Presente a ba þ bc dc þ d
Ausente
Total aþc bþd n
o odds ratio, devemos entender o termo odds, que é frequentemente utilizado por aqueles que fazem apostas
em resultados de eventos esportivos ou participam de outros tipos de jogos de azar.
DEFINIÇÃO
As probabilidades de sucesso são a razão entre a probabilidade de sucesso e a

probabilidade de falha.
Usamos esta definição de probabilidades para definir duas probabilidades que podemos calcular a partir dos dados
exibido como na Tabela 12.7.3:
1. A chance de ser um caso (ter a doença) para ser um controle (não ter a doença) entre indivíduos com o
¼
fator de risco é ½ a=ð Þ a þ b =½ b=ð Þ a þ b 2. A a chance de ser
umum
controle
casoindivíduos
(ter
(nãorisco
a ter
doença)
a
ésem a=b.
doença)
de ½para
o c=ð
fator
entre
ser
Þde
cþ
d =½ d=ð Þ c=d. c þ d
¼
Agora definimos a razão de chances que podemos calcular a partir dos dados de um estudo
retrospectivo. Usamos o símbolo ORc para indicar que a medida é calculada a partir de dados de amostra e
usada como uma estimativa da razão de chances da população, OR.
DEFINIÇÃO
A estimativa da razão de chances da população é
a=b de Anúncios
ORc ¼
(12.7.3)
¼ c=d bc
onde a, b, c e d são definidos na Tabela 12.7.3.
Podemos construir um intervalo de confiança para OU pelo seguinte método:

fffiffiffi
X2
za=p
ð Þ a % CI ¼ ORc1 º
100 1ð (12.7.4)
onde za é o valor z bilateral correspondente ao coeficiente de confiança escolhido e X2 é calculado pela

Equação 12.4.1.
Interpretação da razão de chances No caso de uma doença rara, a razão de chances da população
fornece uma boa aproximação do risco relativo da população. Consequentemente, o odds ratio da
amostra, sendo uma estimativa do odds ratio da população, fornece uma estimativa indireta do
risco relativo da população no caso de uma doença rara.
O odds ratio pode assumir valores entre zero e 1. O valor 1 indica ausência de associação
entre o fator de risco e o estado da doença. Um valor menor que 1 indica chances reduzidas da
doença entre indivíduos com o fator de risco. Um valor maior que 1 indica maior probabilidade de
ter a doença entre indivíduos nos quais o fator de risco está presente.
EXEMPLO 12.7.2
Toschke et ai. (A-17) coletou dados sobre o status de obesidade de crianças de 5 a 6 anos e o
status de tabagismo da mãe durante a gravidez. A Tabela 12.7.4 mostra 3.970 indivíduos
classificados como casos ou não de obesidade e também classificados de acordo com o tabagismo
da mãe durante a gravidez (o fator de risco). Desejamos comparar a probabilidade de obesidade
aos 5-6 anos entre aquelas cujas mães fumaram durante a gravidez com as chances de obesidade
aos 5-6 anos entre aquelas cujas mães não fumaram durante a gravidez.
Solução: O odds ratio é a medida apropriada para responder à questão colocada.

ð Þ 64 ð Þ 3496
ORc ¼ ¼ 9:62 ð Þ 342 ð Þ 68
Vemos que crianças obesas (casos) têm 9,62 vezes mais chances do que crianças
não obesas (não casos) de terem uma mãe que fumou durante a gravidez.
Calculamos o intervalo de confiança de 95 por cento para OR como segue.

Pela Equação 12.4.1 calculamos a partir dos dados da Tabela 12.7.4
2
3970 64 ½ ð Þð Þ 3496 ð Þ 342 ð Þ 68
X2 ¼ ð ¼ 217:6831
Þ 132 ð Þ 3838 ð Þ 406 ð Þ 3564
TABELA 12.7.4 Indivíduos classificados de acordo com o status de obesidade e

tabagismo da mãe durante a gravidez
Estado de Obesidade
Condição de fumante casos não-casos Total

Durante a gravidez
Fumado por toda parte 64 342 406

Nunca fumei 68 3496 3564
Total 132 3838 3970
Fonte: AM Toschke, SM Montgomery, U. Pfeiffer e R. von Kries, “Early Intrauterine Exposure to

Tobacco-Inhaled Products and Obesity,” American Journal of Epidemiology, 158 (2003), 1068–
1074.
Fumar_status * Obsesity_status Tabela cruzada
Contar
Estado de obesidade
casos Total de não casos
Smoking_status Fumou o tempo todo 64 342 406 3496

Nunca fumei 68 3564 07938383
toT la 231
Estimativa de risco
95% de confiança
Intervalo
Valor Mais baixo Superior
Razão de chances para
(fumado durante todo 9.621 6.719 13.775
/Nunca fumei)
Para casos de coorte 8.262 5.966 11.441
Obesity_ status
Para coorte Obesity_ status 0,859 0,823 0,896
Noncases
N de casos válidos 3970
Os limites de confiança inferior e superior para a população OR, respectivamente, são

ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
9:621þ1:96=217:6831 p 217:6831 p 9:6211:96= ¼ 7:12 e ¼ 13:00. Concluímos com 95%
de confiança que a população OR está entre 7,12 e 13,00. Como o intervalo não inclui 1, concluímos que, na
população, crianças obesas (casos) são mais propensas do que crianças não obesas (não casos) a ter uma
mãe que fumou durante a gravidez.
Os dados do Exemplo 12.7.2 foram processados usando SPSS. Os resultados são mostrados na
Figura 12.7.2. O cálculo da razão de chances, juntamente com os limites de confiança de 95%, são mostrados
na linha superior da caixa Estimativa de risco. Esses valores diferem ligeiramente daqueles no exemplo
devido ao erro de arredondamento. &
A estatística de Mantel-Haenszel Freqüentemente, quando estamos estudando a relação entre o status de alguma doença e o
status de algum fator de risco, estamos
ciente de outra variável que pode estar associada à doença, ao fator de risco ou a ambos de
forma que a verdadeira relação entre o estado da doença e o fator de risco seja mascarada. Tal
variável é chamada de variável de confusão. Por exemplo, a experiência pode indicar a
possibilidade de que a relação entre alguma doença e um fator de risco suspeito seja diferente
entre diferentes grupos étnicos. Trataríamos então a filiação étnica como uma variável de
confusão. Quando eles podem ser identificados, é desejável controlar as variáveis de confusão
para que uma medida inequívoca da relação entre o estado da doença e o fator de risco possa
ser calculada. Uma técnica para atingir esse objetivo é o procedimento de Mantel-Haenszel
(22), assim chamado em reconhecimento aos dois homens que o desenvolveram. O
procedimento permite testar a hipótese nula de que não há associação entre o status em relação
à doença e o status do fator de risco. Inicialmente usado apenas com dados de estudos
retrospectivos, o procedimento de Mantel-Haenszel também é apropriado para uso com dados
de estudos prospectivos, conforme discutido por Mantel (23).
Na aplicação do procedimento de Mantel-Haenszel, sujeitos de caso e controle são

atribuídos a estratos correspondentes a diferentes valores da variável de confusão. Os dados
são então analisados dentro de estratos individuais, bem como em todos os estratos. A
discussão a seguir assume que os dados em análise são de um estudo retrospectivo ou
prospectivo com casos e não-casos classificados de acordo com se eles têm ou não o fator de
risco suspeito. A variável de confusão é categórica, com as diferentes categorias definindo os
estratos. Se a variável de confusão for contínua, ela deve ser categorizada. Por exemplo, se a
variável de confusão suspeita for a idade, podemos agrupar os indivíduos em categorias de
idade mutuamente exclusivas. Os dados antes da estratificação podem ser exibidos como
mostrado na Tabela 12.7.3.
A aplicação do procedimento de Mantel-Haenszel consiste nas seguintes etapas.
1. Forme k estratos correspondentes às k categorias da variável de confusão. Mesa

12.7.5 mostra a exibição de dados para o estrato i.
2. Para cada estrato, calcule a frequência esperada ei da célula superior esquerda da Tabela
12.7.5 da seguinte forma:
ððÞÞaiaiþþbici
ei ¼ (12.7.5)
ni
TABELA 12.7.5 Sujeitos no i-ésimo estrato de uma variável de confusão classificados

quanto ao status relativo a um fator de risco e se são casos ou controles
Amostra
Fator de risco casos Controles Total
Presente ai bi ai þ bi
Ausente ci di ci þ di
Total ai þ ci bi þ di ni
3. Para cada cálculo de estrato
ððÞÞaiciþþbidi ððÞÞaibiþþcidi n2 ð Þ 1
vi ¼ (12.7.6)
eu
ni
4. Calcule a estatística de teste de Mantel-Haenszel, x2 do seguinte modo:

MH
k k 2
P ai P ei
i¼1 i¼1
x2MH
¼
k
(12.7.7)
P vi
i¼1
5. Rejeitar a hipótese nula de nenhuma associação entre o estado da doença e o risco suspeito ser
status do fator na população se o valor calculado de x2 for o valor MH igual ou superior a
crítico da estatística de teste, que é o valor qui-quadrado tabulado para 1 grau de liberdade e o
nível de significância escolhido.
Estimador de Mantel-Haenszel da razão de chances comum Quando temos k estratos de dados, cada um
dos quais pode ser exibido em uma tabela como a Tabela 12.7.5, podemos calcular o estimador de Mantel-
Haenszel da razão de chances comum, ORcMH, como segue:
k
PðÞaidi =ni
i¼1
ORcMH ¼ (12.7.8)
k
PðÞ bici=ni
i¼1
Quando usamos o estimador de Mantel-Haenszel dado pela Equação 12.7.4, assumimos que, na
população, o odds ratio é o mesmo para cada estrato.
Ilustramos o uso das estatísticas de Mantel-Haenszel com os exemplos a seguir.
EXEMPLO 12.7.3
Em um estudo de LaMont et al. (A-18), os pesquisadores coletaram dados sobre doença arterial coronariana
obstrutiva (OCAD), hipertensão e idade entre indivíduos identificados por um teste de esforço em esteira
como estando em risco. Na Tabela 12.7.6, as contagens de indivíduos em dois estratos de idade são
apresentadas com hipertensão como fator de risco e a presença de OCAD como variável caso/não caso.
Solução:
2. Suposições. Assumimos que as suposições discutidas anteriormente para o uso válido

da estatística de Mantel-Haenszel são atendidas.
TABELA 12.7.6 Pacientes estratificados por idade e classificados por estado relativo à hipertensão
(o fator de risco) e OCAD (variável de caso/não caso)
Estrato 1 (até 55 anos)
Fator de risco
(Hipertensão) Casos (OCAD) não-casos Total
Presente 21 11 32
Ausente 16 6 22
Total 37 17 54
Estrato 2 (mais de 55)
Fator de risco
(Hipertensão) Casos (OCAD) não-casos Total
Presente 50 14 64
Ausente 18 6 24
Total 68 20 88
Fonte: Dados fornecidos por cortesia de Matthew J. Budoff, MD.
3. Hipóteses.
H0: Não há associação entre a presença de hipertensão e a ocorrência de
OCAD em indivíduos com 55 anos ou menos e em indivíduos com mais
de 55 anos.
HA: Existe uma relação entre as duas variáveis.
k k 2
P ai P ei
i¼1 i¼1
x2MH ¼
k
P vi
i¼1
como dado na Equação 12.7.7.

5. Distribuição da estatística de teste. Qui-quadrado com 1 grau de liberdade.
6. Regra de decisão. Suponha que deixamos um ¼ 0,05. Rejeitar H0 se o valor
calculado da estatística de teste for maior ou igual a 3,841.
7. Cálculo da estatística de teste. Pela Equação 12.7.5 calculamos as seguintes
frequências esperadas:
e1 ¼ ð Þ 21 þ 11
16 ð=54
Þ ¼37
ðÞ=54
32¼
ð 21:93
Þ e2 ¼ ð Þ 50 þ 14 ð Þ 50 þ 18 =88
¼ ð Þ 64 Þ 8 Þ 8 Þ 8 Þ 8 = ¼ 49:45
v1 ¼ ð Þ 32 ð Þ 22 ð Þ 37 ð Þ 17 =ð Þ 2916 ð Þ¼ 54 1
2:87 v2 ¼ ð Þ 64 ð Þ 24 ð Þ 68 ð Þ 20 =ð Þ 7744 3 ¼ 1 8 1
Finalmente, pela Equação 12.7.7 calculamos
2
½50
ð Þð 21
21:93
þ þ 49:45 Þ 2:87 þ 3:10
x2MH ¼ ¼ 0,0242
8. Decisão estatística. Como 0,0242 < 3:841, falhamos em rejeitar H0.

9. Conclusão. Concluímos que pode não haver associação entre hipertensão e a
ocorrência de DAC.
10. valor p. Como 0,0242 < 2:706, o valor de p para este teste é p > 0,10.
Agora ilustramos o cálculo do estimador de Mantel-Haenszel da razão de chances comum.

&
EXEMPLO 12.7.4
Vamos nos referir aos dados da Tabela 12.7.6 e calcular a razão de chances comum.
Solução: A partir dos dados estratificados da Tabela 12.7.6, calculamos o numerador da razão da seguinte
forma:
ð Þþ a1d1=n1 ð Þ¼ a2d2=n2 ½ ð Þ 21 ð Þ6 =54 ½ºð Þ 50 ð Þ6 =88

¼ 5:7424
O denominador da razão é
ð Þþ b1c1=n1 ð Þ¼ b2c2=n2 ½ ð=88

Þ 11þ ð¼Þ6:1229
16 =54 ½ ð Þ 14 ð Þ 18
Agora, pela Equação 12.7.7, calculamos a razão de chances comum:
5:7424
ORcMH ¼ ¼ ,94
6:1229
A partir desses resultados, estimamos que, independentemente da idade, os

pacientes com hipertensão são menos propensos a ter OCAD do que os pacientes sem
hipertensão. &
O cálculo manual das estatísticas do teste de Mantel-Haenszel pode ser uma tarefa complicada.
Felizmente, o pesquisador pode encontrar alívio em um dos vários pacotes de software estatístico
disponíveis. Para ilustrar, os resultados do uso do SPSS para processar os dados do Exemplo 12.7.3 são
mostrados na Figura 12.7.3. Esses resultados diferem daqueles fornecidos no exemplo devido ao erro de
arredondamento.
EXERCÍCIOS 653
Fumar_status * Obsesity_status * Tabela cruzada de estrato
Contar
Estado de obesidade
mutantes latoTsesacnoNsesaC
55 anos ou menos Smoking_status Fumou durante todo o período 21 32 16 22 73 4571

11
Nunca fumei 6
latoT
acima de 55 Smoking_status Fumou o tempo todo 14

50 64 18 24 86 8802
Nunca fumei 6
latoT
Testes de Independência Condicional
Asymp. Assinar
qui-quadrado df (2 lados)
Cochran's 0,025 .875

Mantel-Haenszel 0,002 11 .961
Estimativa da Razão de Odds Comuns de Mantel-Haenszel
etamitsE 839.
064
In(Estimate) )etamitsE(nI for 214.
rorrE .dtS edis-2( .giS .pmysA
Asymp.
)d 678.
95% de confiança Comum Odds Limite inferior Razão de intervalo Limite superior 418
2.102
Em comum) Limite Inferior 0,871
Razão de probabilidade) Limite superior 0,743
EXERCÍCIOS
12.7.1 Davy et al. (A-19) relataram os resultados de um estudo envolvendo a sobrevivência ao câncer cervical. Os
pesquisadores descobriram que entre os indivíduos com menos de 50 anos, 16 dos 371 indivíduos não
sobreviveram por 1 ano após o diagnóstico. Em indivíduos com 50 anos ou mais, 219 de 376 não sobreviveram
por 1 ano após o diagnóstico. Calcule o risco relativo de morte entre indivíduos com 50 anos ou mais. A partir
desses dados, parece que indivíduos mais velhos diagnosticados com câncer cervical são propensos a taxas de
mortalidade mais altas?
12.7.2 O objetivo de um estudo prospectivo de Stenestrand et al. (A-20) foi comparar a taxa de mortalidade após um infarto
agudo do miocárdio (IAM) entre indivíduos que receberam revascularização precoce com a taxa de mortalidade
entre indivíduos que receberam tratamentos conservadores. Entre 2.554 pacientes que receberam revascularização
em até 14 dias após o IAM, 84 morreram no ano seguinte ao IAM. No grupo de tratamento conservador (fator de
risco presente), 1.751 de 19.358 pacientes morreram dentro de um ano de IAM. Calcule o risco relativo de
mortalidade no grupo de tratamento conservador em comparação com o grupo de revascularização em pacientes
com IAM.
12.7.3 Consulte o Exemplo 12.7.2. Toschke et ai. (A-17), que coletou dados sobre o status de obesidade de crianças de 5 a
6 anos e o status de tabagismo da mãe durante a gravidez, também relatou outra variável de resultado: se a
criança nasceu prematura (37 semanas ou menos de gestação ). A tabela a seguir resume os resultados deste
aspecto do estudo. O mesmo fator de risco (fumar durante a gravidez) é considerado, mas um caso agora é
definido como uma mãe que deu à luz prematuramente.
Estado de Nascimento Prematuro
Durante a gravidez casos não-casos Total
Fumado por toda parte 36 370 406

Nunca fumei 168 3396 3564
Total 204 3766 3970
Fonte: AM Toschke, SM Montgomery, U. Pfeiffer e R. von Kries, “Early Intrauterine

Exposure to Tobacco-Inhaled Products and Obesity,” American Journal of Epidemiology,
158 (2003), 1068–1074.
Calcule a razão de chances para determinar se fumar durante a gravidez está relacionado ao parto prematuro.
Use o teste qui-quadrado de independência para determinar se é possível concluir que existe uma associação
entre fumar durante a gravidez e parto prematuro. Deixe um ¼ 0,05.
12.7.4 Sugiyama et al. (A-21) examinou fatores de risco para doenças alérgicas entre escolares de 13 e 14 anos no Japão.
Um fator de risco de interesse foi uma história familiar de comer uma dieta desequilibrada.
A tabela a seguir mostra os casos e não casos de crianças com sintomas de rinite na presença e ausência do fator
de risco.
rinite
História de família casos não-casos Total
dieta desbalanceada 656 1451 2107

Dieta balanceada 677 1662 2339
Total 1333 3113 4446
Fonte: Takako Sugiyama, Kumiya Sugiyama, Masao Toda, Tastuo Yukawa, Sohei Makino
e Takeshi Fukuda, “Risk Factors for Asthma and Allergic Diseases Among 13–14-Year-Old
Schoolchildren in Japan,” Allergology International, 51 (2002), 139–150.
Qual é a razão de chances estimada de ter rinite entre os indivíduos com histórico familiar de uma dieta
desequilibrada em comparação com aqueles que seguem uma dieta balanceada? Calcule o intervalo de confiança
de 95% para a razão de chances.
12.7.5 Segundo Holben et al. (A-22), “A insegurança alimentar implica um acesso limitado ou disponibilidade de alimentos
ou uma capacidade limitada/incerta de adquirir alimentos de maneiras socialmente aceitáveis”. Esses pesquisadores
12.8 RESUMO 655
coletou dados de 297 famílias com uma criança no programa de berçário Head Start em uma área rural de Ohio,
perto de Appalachia. A principal variável de resultado do estudo foi a situação familiar em relação à segurança
alimentar. Os agregados familiares que não tinham segurança alimentar são considerados casos. O fator de
risco de interesse foi a ausência de uma horta a partir da qual uma família pudesse complementar seu suprimento
de alimentos. Na tabela a seguir, os dados são estratificados por situação de trabalho do chefe da família fora de
casa.
Estrato 1 (Empregados Fora de Casa)
Fator de risco casos não-casos Total
Sem jardim 40 37 77
Jardim 13 38 51
Total 53 75 128
Estrato 2 (Não Empregado Fora de Casa)
Fator de risco casos não-casos Total
Sem jardim 75 38 113

Jardim 15 33 48
Total 90 71 161
Fonte: Dados fornecidos por cortesia de David H. Holben, Ph.D. e John P. Holcomb, Jr., Ph.D.
Calcule a razão de chances comum de Mantel-Haenszel com estratificação por status de emprego. Use a
estatística do teste qui-quadrado de Mantel-Haenszel para determinar se podemos concluir que existe uma
associação entre o fator de risco e a insegurança alimentar. Deixe um ¼ 0,05.
12.8 RESUMO
Neste capítulo, alguns usos da versátil distribuição qui-quadrado são discutidos. Testes de
qualidade de ajuste do qui-quadrado aplicados às distribuições normal, binomial e de Poisson
são apresentados. Vemos que o procedimento consiste em computar uma estatística
ðÞ 2
Oi Ei
X2 ¼ X " Ei #
que mede a discrepância entre as frequências observadas (Oi) e esperadas (Ei) de

ocorrência de valores em determinadas categorias discretas. Quando a hipótese nula
apropriada é verdadeira, essa quantidade é distribuída aproximadamente como x2 .
Quando X2 é maior ou igual ao valor tabulado de x2 para algum a, a hipótese nula é
rejeitada no nível de significância a.
Testes de independência e testes de homogeneidade também são discutidos neste capítulo.
Os testes são matematicamente equivalentes, mas conceitualmente diferentes. Novamente, esses
testes testam essencialmente a adequação dos dados observados à expectativa sob hipóteses,
respectivamente, de independência de dois critérios de classificação dos dados e de
homogeneidade de proporções entre dois ou mais grupos.
Além disso, discutimos e ilustramos neste capítulo quatro outras técnicas para analisar dados de frequência que podem
ser apresentados na forma de uma tabela de contingência 2 2: o teste exato de Fisher, a razão de chances, o risco relativo e o
procedimento de Mantel-Haenszel. Por fim, discutimos os conceitos básicos da análise de sobrevivência e ilustramos os
procedimentos computacionais por meio de dois exemplos.
Fórmula
12.2.1 padrão aleatório normal yi m zi
¼
variável s
12.2.2 Distribuição qui-quadrada x2ðÞn ¼ z21þ z2 þþ

2 z2 n
com n graus de liberdade
12.2.3 Função de densidade de 1 1
f uð Þ¼ uð Þ k=2 1 eð Þ u=2
probabilidade qui-quadrado k 2k=2 !
1
2
12.2.4 2
Estatística de teste qui-quadrado Oi Ei Þ
ð
x2 ¼ P
"
Ei #
12.4.1 2
Fórmula de cálculo qui- n ad ð Þ bc
quadrado para a 2 2 x2 ¼ ð Þ a þ c ð Þ b þ d ð Þ a þ
bðÞcþd
tabela de contingência
12.4.2 2
Cálculo qui-quadrado corrigido jn ad ð j bc .5n Þ ð Þ a
de Yates para um 2 2 x2corrigido ¼
þþcdð Þ b þ d ð Þ a þ b ð Þ c
tabela de contingência
12.6.1–12.6.2 Aproximação de amostra grande ð Þ a=A ð Þ b=B

para o qui-quadrado p ^pð 1 Þ ^p ð1=A þ 1=B Þ
Onde
^p ¼ ð Þ
=ðaÞþ Ab þ B a=ð Þ a
12.7.1 Estimativa de risco relativo þb

RRc ¼
c=ð Þ c þ d
ffiffiffi
12.7.2 Intervalo de confiança para a x2 p ð º

100 1ð Þ a %CI ¼ RRc1 za=
estimativa de risco relativo
12.7.3 Estimativa da razão de chances a=b de Anúncios
ORc ¼ ¼
c=d bc
ffiffiffi
12.7.4 Intervalo de confiança para a x2 p ð º

100 1ð Þ a %CI ¼ ORc 1 za=
estimativa da razão de chances
(Contínuo )
12.7.5 Frequência esperada no ððÞÞaiaiþþbici

ei ¼
Estatística de Mantel-Haenszel
ni
12.7.6 Frequência esperada do estrato no ððÞÞaiciþþbidi ððÞÞaibiþþcidi n2 ð 1 Þ
vi ¼
Mantel-Haenszel
eu ni
estatística
12.7.7 Estatística de teste de Mantel-Haenszel

Pk ai Pk ei
¼
i¼1 i¼1
x2MH
Pk vi
i¼1
12.7.8 Estimador de Mantel-Haenszel da

razão de chances comum Pk ð Þ aidi=ni
i¼1
ORcMH ¼
Pk ð Þ bici=ni
i¼1
Tecla de símbolo uma; b; c; d ¼ frequências de células em uma tabela de contingência 2 2

UMA; B ¼ totais de linhas na tabela de contingência 2 2 b ¼
coeficiente de regressão x2 ou X2 ¼ qui-quadrado ei ¼ frequência
esperada na estatística de Mantel–Haenszel
Ei ¼ frequência esperada
Eð Þ yjx ¼ valor esperado de y em xk ¼

graus de liberdade na distribuição qui-quadrado
m ¼ significa
Oi ¼ frequência observada
ORc ¼ estimativa da razão de chances
s ¼ desvio padrão
RRc ¼ estimativa de risco relativo vi
¼ frequência esperada do estrato na estatística de Mantel–Haenszel yi ¼ valor dos dados

no ponto iz ¼ variável normal
1. Explique como a distribuição qui-quadrada pode ser derivada.
2. Quais são a média e a variância da distribuição qui-quadrada?
3. Explique como os graus de liberdade são calculados para os testes de ajuste qui-quadrado.
4. Enuncie a regra de Cochran para pequenas frequências esperadas em testes de qualidade de ajuste.
5. Como ajustar para pequenas frequências esperadas?
6. O que é uma tabela de contingência?
7. Como os graus de liberdade são calculados quando um valor X2 é calculado a partir de uma contingência
tabela?
8. Explique a lógica por trás do método de cálculo das frequências esperadas em um teste de
independência.
9. Explique a diferença entre um teste de independência e um teste de homogeneidade.
10. Explique a lógica por trás do método de cálculo das frequências esperadas em um teste de
homogeneidade.
11. Quando os pesquisadores usam o teste exato de Fisher em vez do teste qui-quadrado?
(a) Estudo observacional (c) (b) Fator de risco

Resultado (e) Estudo (d) Estudo retrospectivo (f)
prospectivo (g) Probabilidades Risco relativo (h) Razão de
(i) Variável de confusão chances
13. Em que condições o teste de Mantel-Haenszel é apropriado?
14. Explique como os pesquisadores interpretam as seguintes medidas:

(a) Risco relativo (b)
Razão de chances
(c) Razão de chances comum de Mantel-Haenszel
15. Em um estudo sobre a vitimização violenta de mulheres e homens, Porcerelli et al. (A-23) coletou informações de 679
mulheres e 345 homens com idades entre 18 e 64 anos em vários centros de prática familiar na área metropolitana de
Detroit. Os pacientes preencheram um questionário de histórico de saúde que incluía uma pergunta sobre vitimização. A
tabela a seguir apresenta os sujeitos da amostra classificados de forma cruzada por gênero e tipo de vitimização violenta
relatada. As categorias de vitimização são definidas como nenhuma vitimização, vitimização do parceiro (e não por outros),
vitimização por uma pessoa que não seja um parceiro (amigo, familiar ou estranho) e aqueles que relataram vitimização
múltipla.
Sexo Sem Vitimização Parceiro Não Parceiro Múltiplo Total
Mulheres 611 34 16 18 679

Homens 308 10 17 10 345
Total 919 44 33 28 1024
Fonte: John H. Porcerelli, Rosemary Cogan, Patricia P. West, Edward A. Rose, Dawn
Lambrecht, Karen E. Wilson, Richard K. Severson e Dunia Karana, “Vitimização violenta
de mulheres e homens: sintomas físicos e psiquiátricos, ” Journal of the American Board
of Family Practice, 16 (2003), 32–39.
Podemos concluir com base nestes dados que o estado de vitimização e o género não são independentes?
Deixe um ¼ 0,05.
16. Consulte o Exercício 15. A tabela a seguir mostra os dados relatados por Porcerelli et al. para 644 mulheres afro-americanas
e caucasianas. Podemos concluir com base nesses dados que, para as mulheres, a raça e o status de vitimização não
são independentes? Deixe um ¼ 0,05.
Sem vitimização Parceiro não parceiro total múltiplo
caucasiano 356 20 3 9 388

Afro-americano 226 11 10 9 256
Total 582 31 13 18 644
Fonte: John H. Porcerelli, Rosemary Cogan, Patricia P. West, Edward A. Rose, Dawn Lambrecht,
Karen E. Wilson, Richard K. Severson e Dunia Karana, “Vitimização violenta de mulheres e homens:
sintomas físicos e psiquiátricos, ” Journal of the American Board of Family Practice, 16 (2003), 32–
39.
17. Uma amostra de 150 portadores crônicos de um certo antígeno e uma amostra de 500 não portadores revelaram a
seguintes distribuições de grupos sanguíneos:
Grupo sanguíneo transportadoras Não portadores Total
0 72 230 302
UMA 54 192 246
B 16 63 79
AB 8 15 23
Total 150 500 650
Pode-se concluir a partir desses dados que as duas populações das quais as amostras foram retiradas diferem com relação
à distribuição dos grupos sanguíneos? Deixe um ¼ 0,05. Qual é o valor de p para o teste?
18. A tabela a seguir mostra 200 homens classificados de acordo com a classe social e o estado da dor de cabeça:
Classe social
Grupo de dor de cabeça UMA B C Total
Sem dor de cabeça (no ano anterior) 6 30 22 58

Dor de cabeça simples 11 35 17 63
Cefaleia unilateral (não enxaqueca) 4 19 14 37
Enxaqueca 5 25 12 42
Total 26 109 65 200
Esses dados fornecem evidências suficientes para indicar que o status da cefaléia e a classe social estão relacionados?
Deixe um ¼ 0,05. Qual é o valor de p para este teste?
19. A seguir, a distribuição de frequência das notas obtidas em um teste de aptidão por 175 candidatos a um centro de treinamento
de fisioterapia ð Þ x ¼ 39:71; s¼ 12:92 .
Pontuação Número de Candidatos Pontuação Número de Candidatos
10–14 3 40–44 28
15–19 8 45–49 20
20–24 13 50–54 18
25–29 17 55–59 12
(Contínuo )
Pontuação Número de Candidatos Pontuação Número de Candidatos
30–34 19 60–64
35–39 25 65–69 84
Total 175
Esses dados fornecem evidências suficientes para indicar que a população de pontuações não é normalmente distribuída?
Deixe um ¼ 0,05. Qual é o valor de p para este teste?
20. Um departamento de saúde local patrocinou um programa de informações sobre doenças venéreas (VD) que estava aberto
a alunos do primeiro e último ano do ensino médio com idades entre 16 e 19 anos. O diretor do programa acreditava que
cada faixa etária estava igualmente interessada em saber mais sobre a DV. Uma vez que cada nível de idade estava
igualmente representado na área atendida, ela sentiu que o interesse igual em VD se refletiria na freqüência ao programa
por faixas etárias iguais. A distribuição etária dos participantes foi a seguinte:
Era Número de atendimento
16 26
17 50
18 44
19 40
Esses dados são incompatíveis com a crença do diretor do programa de que os alunos nas quatro faixas etárias estão
igualmente interessados em DV? Deixe um ¼ 0,05. Qual é o valor de p para este teste?
21. Uma pesquisa com menores de 15 anos residentes no centro de uma grande cidade foi classificada de acordo com a etnia e
o nível de hemoglobina. Os resultados foram os seguintes:
Nível de hemoglobina (g/100 ml)
Grupo étnico 10,0 ou superior 9,0–9,9 < 9:0 Total
UMA 80 100 20 200

B 99 190 96 385
C 70 30 10 110
Total 249 320 126 695
Esses dados fornecem evidências suficientes para indicar, no nível de significância de 0,05, que as duas variáveis estão
relacionadas? Qual é o valor de p para este teste?
22. Uma amostra de casos notificados de caxumba em crianças pré-escolares mostrou a seguinte distribuição por idade:
Anos de idade) Número de casos
Abaixo de 1 6
1 20
2 35
3 41
4 48
Total 150
Teste a hipótese de que os casos ocorrem com frequência igual nas cinco categorias de idade. Deixe um ¼ 0,05.
Qual é o valor de p para este teste?
23. Foi perguntado a cada um de uma amostra de 250 homens de uma população de vítimas de doenças articulares suspeitas qual
dos três sintomas mais o incomodava. A mesma pergunta foi feita a uma amostra de 300 mulheres suspeitas de serem
vítimas de doenças articulares. Os resultados foram os seguintes:
Sintoma mais incômodo Homens Mulheres
Rigidez matinal 111 102

dor noturna 59 73
Inchaço nas articulaçoes 80 125
Total 250 300
Esses dados fornecem evidências suficientes para indicar que as duas populações não são homogêneas com relação aos
principais sintomas? Deixe um ¼ 0,05. Qual é o valor de p para este teste?
Para cada um dos Exercícios 24 a 34, indique se uma hipótese nula de homogeneidade ou uma hipótese nula de
independência é apropriada.
24. Um pesquisador deseja comparar a situação de três comunidades com relação à imunidade contra a poliomielite em crianças
em idade pré-escolar. Uma amostra de crianças pré-escolares foi sorteada em cada uma das três comunidades.
25. Em um estudo sobre a relação entre tabagismo e doenças respiratórias, uma amostra aleatória de adultos foi classificada de
acordo com o consumo de tabaco e a extensão dos sintomas respiratórios.
26. Um médico que deseja saber mais sobre a relação entre tabagismo e defeitos congênitos estuda os registros de saúde de uma
amostra de mães e seus filhos, incluindo natimortos e fetos abortados espontaneamente, sempre que possível.
27. Uma equipe de pesquisa em saúde acredita que a incidência de depressão é maior entre pessoas com hipoglicemia do que
entre pessoas que não sofrem dessa condição.
28. Em uma amostra aleatória simples de 200 pacientes submetidos a terapia em um centro de tratamento de abuso de drogas,
60% pertenciam ao grupo étnico I. O restante pertencia ao grupo étnico II. No grupo étnico I, 60 estavam sendo tratados por
abuso de álcool (A), 25 por abuso de maconha (B) e 20 por abuso de heroína, metadona ilegal ou algum outro opioide (C).
O restante havia abusado de barbitúricos, cocaína, anfetaminas, alucinógenos ou algum outro não opioide além da maconha
(D). No grupo étnico II, a categoria de drogas de abuso e os números envolvidos foram os seguintes:
Að28Þ Bð32Þ Cð13Þ D ðo restanteÞ
Pode-se concluir a partir desses dados que existe uma relação entre grupo étnico e escolha da droga para abuso? Seja a ¼
0,05 e encontre o valor de p.
29. Ceratoses solares são lesões de pele comumente encontradas no couro cabeludo, face, dorso das mãos, antebraços, orelhas,
couro cabeludo e pescoço. Eles são causados pela exposição prolongada ao sol, mas não são cânceres de pele. Chen et ai.
(A-24) estudou 39 indivíduos designados aleatoriamente (com uma proporção de 3 para 1) para o creme de imiquimode e
um creme de controle. O critério de eficácia foi ter 75% ou mais da área da lesão eliminada após 14 semanas de tratamento.
Houve 21 sucessos entre 29 indivíduos tratados com imiquimod e três sucessos entre 10 indivíduos usando o creme de
controle. Os pesquisadores usaram o teste exato de Fisher e obtiveram um valor p de 0,027. Quais são as variáveis
envolvidas? As variáveis são quantitativas ou qualitativas? Quais hipóteses nula e alternativa são apropriadas? Quais são
suas conclusões?
30. Janardhan et al. (A-25) examinou 125 pacientes submetidos a tratamento cirúrgico ou endovascular para aneurismas
intracranianos. Aos 30 dias após o procedimento, 17 indivíduos apresentaram déficits neurológicos transitórios/
persistentes. Os pesquisadores realizaram uma regressão logística e descobriram que o intervalo de confiança de
95% para a razão de chances para o tamanho do aneurisma era de 0,09 a 0,96. O tamanho do aneurisma foi
dicotomizado em menor que 13 mm e maior ou igual a 13 mm. Os tumores maiores indicaram maiores chances de
déficits. Descreva as variáveis se são contínuas, discretas, quantitativas ou qualitativas. Que conclusões podem ser
tiradas das informações fornecidas?
31. Em um estudo sobre cessação do tabagismo de Gold et al. (A-26), 189 indivíduos se auto-selecionaram em três
tratamentos: apenas adesivo de nicotina (NTP), somente Bupropiona SR (B) e adesivo de nicotina com Bupropiona
SR
Houve
ð Þ NTP
15 sujeitos
þB.BNa
. Os
com
categoria
indivíduos
menos50-64
de
foram
50
anos,
anos
agrupados
seis
queescolheram
escolheram
por idadeNTP,
em
NTP,
menos
54
26escolheram
que
deescolheram
50 anos,
B e entre
40Bescolheram
e 50
16 eque
64 escolheram
e 65
NTPanos
þ B.ou
Em
NTP
mais.
na
þ
categoria de idade mais avançada, seis escolheram NTP, 21 escolheram B e cinco escolheram NTP + B. Qual técnica
estatística estudada neste capítulo seria apropriada para analisar esses dados? Descreva as variáveis envolvidas se
são contínuas, discretas, quantitativas ou qualitativas. Quais hipóteses nula e alternativa são apropriadas? Se você
acha que tem informações suficientes, conduza um teste de hipótese completo. Quais são suas conclusões?
32. Kozinszky e Bartai (A-27) examinaram o uso de anticoncepcionais por adolescentes que solicitavam aborto em Szeged,
Hungria. Os indivíduos foram classificados como menores de 20 anos ou com 20 anos ou mais. Das mulheres com
menos de 20 anos, 146 solicitaram o aborto. Do grupo mais velho, 1.054 solicitaram um aborto. Um grupo de controle
consistia em visitantes do centro de planejamento familiar que não solicitaram o aborto ou acompanhantes de
mulheres que solicitaram o aborto. No grupo controle, havia 147 mulheres com menos de 20 anos e 1.053 com 20
anos ou mais. Uma das variáveis de desfecho de interesse foi o conhecimento sobre anticoncepção de emergência.
Os pesquisadores relatam que “a contracepção de emergência foi significativamente [(Mantel-Haenszel) p < 0,001]
menos conhecida entre as adolescentes que pretendiam abortar em comparação com as mulheres mais velhas que
solicitaram aborto artificial ð OU ¼ 0,07 do que o conhecimento relevante de o adolescente controla OU ð Þ ¼ .10 .”
Explique o significado
º das estatísticas relatadas. Quais são suas conclusões com base nas informações dadas?
33. O objetivo do estudo de Crosignani et al. (A-28) foi avaliar o efeito do escape do tráfego rodoviário sobre o risco de
leucemia infantil. Eles estudaram 120 crianças no norte da Itália identificadas por meio de um registro de câncer de
base populacional (casos). Quatro controles por caso, pareados por idade e sexo, foram amostrados de arquivos
populacionais. Os pesquisadores usaram um modelo de difusão de benzeno para estimar a exposição à exaustão do
tráfego. Em comparação com crianças cujas casas não foram expostas às emissões do tráfego rodoviário, a taxa de
leucemia infantil foi significativamente maior para crianças altamente expostas.
Caracterize este estudo quanto a ser observacional, prospectivo ou retrospectivo. Descreva as variáveis se são
contínuas, discretas, quantitativas, qualitativas, um fator de risco ou uma variável de confusão. Explique o significado
dos resultados relatados. Quais são suas conclusões com base nas informações dadas?
34. Gallagher et al. (A-29) realizaram um estudo descritivo para identificar os fatores que influenciam a frequência de
mulheres em programas de reabilitação cardíaca após um evento cardíaco. Uma variável de resultado de interesse
foi a frequência real a tal programa. Os pesquisadores inscreveram mulheres que receberam alta de quatro hospitais
metropolitanos em Sydney, na Austrália. De 183 mulheres, apenas 57 mulheres realmente frequentaram os programas.
Os autores relataram razões de chances e intervalos de confiança nas seguintes variáveis que afetaram
significativamente o resultado: idade ao quadrado (1,72; 1,10–2,70). As mulheres com mais de 70 anos tiveram as
chances mais baixas, enquanto as mulheres com idades entre 55 e 70 anos tiveram as chances mais altas.), controle
percebido (0,92; 0,85 a 1,00), emprego (0,20; 0,07 a 0,58), diagnóstico (6,82, 1,84–25,21, razão de chances foi maior
para mulheres que sofreram cirurgia de revascularização do miocárdio versus infarto do miocárdio) e evento estressante (0,21, 0,06–0,73).
Caracterize este estudo quanto a ser observacional, prospectivo ou retrospectivo. Descreva o
variáveis quanto ao fato de serem contínuas, discretas, quantitativas, qualitativas, um fator de risco ou uma variável
de confusão. Explique o significado das razões de chances relatadas.
Para cada um dos Exercícios 35 a 51, faça quantos dos seguintes você achar apropriado:
(a) Aplique uma ou mais das técnicas discutidas neste capítulo. (b) Aplique
uma ou mais das técnicas discutidas nos capítulos anteriores. (c) Construir gráficos.
(d) Construir intervalos de confiança para parâmetros populacionais. (e) Formule
hipóteses relevantes, execute os testes apropriados e encontre os valores de p. (f)
Declare as decisões estatísticas e conclusões clínicas que os resultados de seus testes de hipótese
justificam. (g) Descreva a(s) população(ões) à(s) qual(is) você acha que suas inferências são aplicáveis. (h)
Declare as suposições necessárias para a validade de suas análises.
35. Em um estudo prospectivo, randomizado e duplo-cego, Stanley et al. (A-30) examinou a eficácia relativa e os efeitos
colaterais da morfina e da petidina, drogas comumente usadas para analgesia controlada pelo paciente (PCA). Os
sujeitos foram 40 mulheres, com idades entre 20 e 65 anos, submetidas à histerectomia abdominal total. Os
pacientes foram alocados aleatoriamente para receber morfina ou petidina por PCA. No final do estudo, os sujeitos
descreveram sua avaliação de náuseas e vômitos, dor e satisfação por meio de uma escala verbal de três pontos.
Os resultados foram os seguintes:
Satisfação
Infeliz/ Moderadamente Feliz/

Medicamento
Miserável Feliz Deleitado Total
Petidina 5 9 6 20
Morfina 9 9 2 20
Total 14 18 8 40
Dor
Insuportável/ Pouco/
Medicamento
Forte Moderado Nenhum Total
Petidina 2 10 8 20
Morfina 2 8 10 20
Total 4 18 18 40
Náusea
Insuportável/ Pouco/
Medicamento
Forte Moderado Nenhum Total
Petidina 5 9 6 20
Morfina 7 8 5 20
Total 12 17 11 40
Fonte: Dados fornecidos por cortesia do Dr. Balraj L. Appadu.

36. Dados de triagem de um programa estadual de prevenção de envenenamento por chumbo entre abril de 1990 e março de
1991 foram examinados por Sargent et al. (A-31) em um esforço para aprender mais sobre os fatores de risco da
comunidade para deficiência de ferro em crianças pequenas. Os sujeitos do estudo tinham idades entre 6 e 59 meses.
Entre 1860 crianças com sobrenomes hispânicos, 338 tinham deficiência de ferro. Quatrocentos e cinquenta e sete de
1.139 com sobrenomes do Sudeste Asiático e 1.034 de 8.814 crianças com outros sobrenomes tinham ferro
deficiência.
37. Para aumentar a compreensão do risco de infecção por HIV entre pacientes com doença mental grave, Horwath et al.
(A-32) conduziu um estudo para identificar preditores de uso de drogas injetáveis entre pacientes que não apresentavam
um transtorno primário por uso de substâncias. Dos 192 pacientes recrutados em hospitais psiquiátricos públicos
ambulatoriais, 123 eram do sexo masculino. Vinte e nove dos homens e nove das mulheres tinham histórico de injeção
de drogas ilícitas.
38. Skinner et al. (A-33) conduziram um ensaio clínico para determinar se o tratamento com melfalano, prednisona e colchicina
(MPC) é superior à colchicina (C) sozinha. Os indivíduos consistiam em 100 pacientes com amiloidose primária.
Cinquenta foram tratados com C e 50 com MPC. Dezoito meses após a admissão da última pessoa e 6 anos após o
início do estudo, 44 dos que receberam C e 36 dos que receberam MPC morreram.
39. O objetivo de um estudo de Miyajima et al. (A-34) foi avaliar as alterações da contaminação por células tumorais na medula
óssea (BM) e no sangue periférico (PB) durante o curso clínico de pacientes com neuroblastoma avançado. Seu
procedimento envolveu a detecção de mRNA de tirosina hidroxilase (TH) para esclarecer a fonte e o tempo apropriados
para a colheita de células-tronco hematopoiéticas para transplante.
Os autores usaram o teste exato de Fisher na análise de seus dados. Se disponível, leia o artigo e decida se você
concorda que o texto exato de Fisher foi a técnica apropriada a ser usada. Se você concordar, duplique o procedimento
e veja se obtém os mesmos resultados. Se você discorda, explique por quê.
40. Cohen et al. (A-35) investigou a relação entre a soropositividade do HIV e a vaginose bacteriana em uma população com
alto risco de aquisição sexual do HIV. Os sujeitos foram 144 profissionais do sexo feminino na Tailândia, das quais 62
eram HIV-positivas e 109 tinham histórico de doenças sexualmente transmissíveis (DST). No grupo HIV negativo, 51
tinham histórico de DST.
41. O objetivo de um estudo de Lipschitz et al. (A-36) foi examinar, usando um questionário, as taxas e características de
abuso infantil e agressões de adultos em uma grande população ambulatorial geral.
Os sujeitos consistiam em 120 pacientes psiquiátricos ambulatoriais (86 mulheres, 34 homens) em tratamento em uma
grande clínica hospitalar em uma área central da cidade. Quarenta e sete mulheres e seis homens relataram incidentes
de abuso sexual na infância.
42. Sujeitos de um estudo de O'Brien et al. (A-37) consistiu em 100 pacientes de baixo risco com gestações bem datadas. Os
investigadores desejavam avaliar a eficácia de um método mais gradual para promover a alteração cervical e o parto.
Metade das pacientes foram aleatoriamente designadas para receber um placebo, e o restante recebeu 2 mg de
prostaglandina E2 intravaginal (PGE2) por 5 dias consecutivos. Um dos bebês nascidos de mães do grupo experimental
e quatro nascidos de mães do grupo controle apresentavam macrossomia.
43. Os propósitos de um estudo de Adra et al. (A-38) avaliaram a influência da via de parto no resultado neonatal em fetos
com gastrosquise e correlacionaram a aparência ultrassonográfica do intestino fetal com o resultado pós-natal imediato.
Entre 27 casos de gastrosquise diagnosticados no pré-natal, a aparência ultrassonográfica do intestino fetal foi normal
em 15. Complicações pós-operatórias foram observadas em dois dos 15 e em sete dos casos em que a aparência
ultrassonográfica não era normal.
44. Liu et al. (A-39) realizou pesquisas domiciliares em áreas do Alabama sob alertas de tornado. Em uma das pesquisas
(levantamento 2) a idade média dos 193 entrevistados foi de 54 anos. Destes, 56,0 por cento eram
mulheres, 88,6 por cento eram brancas e 83,4 por cento tinham ensino médio ou superior. Entre as informações
coletadas estavam dados sobre a atividade de busca por abrigo e a compreensão do termo “alerta de furacão”.
Cento e vinte e oito entrevistados indicaram que geralmente procuram abrigo quando ficam sabendo de um
alerta de tornado. Destes, 118 entenderam o significado do alerta de tornado. Quarenta e seis daqueles que
disseram que não costumam procurar abrigo entenderam o significado do termo.
45. Os propósitos de um estudo de Patel et al. (A-40) foram investigar a incidência de glaucoma agudo de ângulo
fechado secundário à dilatação pupilar e identificar métodos de triagem para detectar ângulos com risco de
oclusão. Dos 5.308 indivíduos estudados, 1.287 tinham 70 anos de idade ou mais. Dezessete dos indivíduos
mais velhos e 21 dos indivíduos mais jovens (40 a 69 anos de idade) foram identificados como tendo ângulos
potencialmente oclusíveis.
46. Voskuyl et al. (A-41) investigou as características (incluindo sexo masculino) de pacientes com artrite reumatoide
(AR) que estão associadas ao desenvolvimento de vasculite reumatoide (RV).
Os indivíduos consistiam em 69 pacientes com diagnóstico de RV e 138 pacientes com AR sem suspeita de
vasculite. Havia 32 homens no grupo RV e 38 entre os pacientes com AR.
47. Harris et al. (A-42) conduziram um estudo para comparar a eficácia da colporrafia anterior e uretropexia
retropúbica realizada para incontinência urinária de esforço genuína. Os sujeitos foram 76 mulheres submetidas
a uma ou outra cirurgia. Os indivíduos em cada grupo eram comparáveis em idade, status social, raça,
paridade e peso. Em 22 dos 41 casos relatados como curados, a cirurgia foi realizada pela equipe de
atendimento. Em 10 das falhas, a cirurgia foi realizada pela equipe de atendimento. Todas as outras cirurgias
foram realizadas por cirurgiões residentes.
48. Kohashi et al. (A-43) realizou um estudo em que os sujeitos eram pacientes com escoliose. Como parte do
estudo, 21 pacientes tratados com coletes foram divididos em dois grupos, grupo Að Þ nA
base
¼ 12
eme certos
nB
grupo
¼ 9fatores
Bð
comÞ
, da escoliose.
de progressão
deformidade progressiva,
Dois pacientes
enquanto
do os
grupo
demais
A e oito
não.do grupo B apresentaram evidência de
49. Em um estudo de pacientes com neoplasia intraepitelial cervical, Burger et al. (A-44) comparou aqueles que
eram positivos para o papilomavírus humano (HPV) e aqueles que eram negativos para o HPV em relação
aos fatores de risco para infecção por HPV. Entre suas descobertas estavam 60 de 91 não fumantes com
infecção por HPV e 44 pacientes com HPV positivo em 50 que fumavam 21 ou mais cigarros por dia.
50. Thomas e outros. (A-45) realizaram um estudo para determinar os correlatos de adesão às consultas de
acompanhamento e preenchimento de receitas após uma visita ao pronto-socorro. Entre 235 entrevistados,
158 mantiveram seus compromissos. Destes, 98 eram do sexo feminino. Dos que faltaram às consultas, 31
eram do sexo masculino.
51. Os sujeitos de um estudo conduzido por O'Keefe e Lavan (A-46) foram 60 pacientes com comprometimento
cognitivo que necessitaram de fluidos parenterais por pelo menos 48 horas. Os pacientes foram aleatoriamente
designados para receber fluidos intravenosos (IV) ou subcutâneos (SC). A média de idade dos 30 pacientes
do grupo SC foi de 81 anos com desvio padrão de 6. Cinquenta e sete por cento eram do sexo feminino. A
idade média do grupo IV foi de 84 anos com desvio padrão de 7. Agitação relacionada à cânula ou gotejamento
foi observada em 11 dos pacientes SC e 24 dos pacientes IV.
daniel
1. Consulte os dados sobre tabagismo, consumo de álcool, pressão arterial e doenças respiratórias entre
1200 adultos (FUMAR). As variáveis são as seguintes:
Sexo AðÞ : 1 ¼ masculino; 0 ¼ fêmea

Condição fumante BðÞ : 0 ¼ não fumante; 1 ¼ fumante
Nível de bebida Cð Þ : 0 ¼ não bebedor
1 ¼ bebedor leve a moderado 2 ¼
bebedor pesado
Sintomas de doença respiratória DðÞ : 1 ¼ presente; 0 ¼ ausente
Estado de hipertensão arterial Eð Þ : 1 ¼ presente; 0 ¼ ausente
Selecione uma amostra aleatória simples de tamanho 100 dessa população e faça uma análise para ver se você pode
concluir que existe uma relação entre o status de fumante e os sintomas de doenças respiratórias.
Seja a ¼ 0,05 e determine o valor de p para seu teste. Compare seus resultados com os de seus colegas.
2. Consulte o Exercício 1. Selecione uma amostra aleatória simples de tamanho 100 da população e faça um teste para ver
se você pode concluir que existe uma relação entre o status de beber e o status de pressão alta na população. Seja a
¼ 0,05 e determine o valor de p. Compare seus resultados com os de seus colegas.
se você pode concluir que existe uma relação entre sexo e tabagismo na população. Seja a ¼ 0,05 e determine o valor
de p. Compare seus resultados com os de seus colegas.
se você pode concluir que existe uma relação entre sexo e nível de consumo de álcool na população. Seja a ¼ 0,05 e
encontre o valor de p. Compare seus resultados com os de seus colegas.
REFERÊNCIAS
1. KARL PEARSON, “Sobre o critério de que um dado sistema de desvios do provável no caso de um sistema
correlacionado de variáveis é tal que pode ser razoavelmente suposto ter surgido de amostragem aleatória,” The
London, Edinburgh and Dublin Philosophical Magazine and Journal of Science, Fifth Series, 50 (1900), 157–175.
Reimpresso em Karl Pearson's Early Statistical Papers, Cambridge University Press, 1948.
2. HO LANCASTER, The Chi-Squared Distribution, Wiley, Nova York, 1969.
3. MIKHAIL S. NIKULIN e PRISCILLA E. GREENWOOD, A Guide to Chi-Squared Testing, Wiley, Nova York, 1996.
4. WILLIAM G. COCHRAN, "O teste x2 de qualidade do ajuste", Annals of Mathematical Statistics, 23 (1952), 315–345.
5. WILLIAM G. COCHRAN, "Alguns métodos para fortalecer os testes x2 comuns ", Biometria, 10 (1954),
417–451.
6. F. YATES, “Tabelas de Contingência Envolvendo Pequenos Números e os Testes x2 ”, Journal of the Royal Statistical
Society, Supplement, 1, 1934 (Série B), 217–235.
7. RA FISHER, Statistical Methods for Research Workers, Quinta Edição, Oliver e Boyd, Edimburgo, 1934.
8. RA FISHER, "A lógica da inferência indutiva", Journal of the Royal Statistical Society Series A, 98 (1935),
39–54.
9. JO IRWIN, “Testes de significância para diferenças entre porcentagens baseadas em números pequenos”, Metron, 12
(1935), 83–94.
10. F. YATES, “Tabelas de contingência envolvendo números pequenos e o teste x2 ”, Journal of the Royal Statistical
Society, Suplemento, 1, (1934), 217–235.
11. DJ FINNEY, “The Fisher-Yates Test of Significance in 2 2 Contingency Tables,” Biometrika, 35 (1948),
145–156.
REFERÊNCIAS 667
12. R. LATSCHA, “Testes de significância em uma tabela de contingência 2 2: extensão da tabela de Finney,” Biometrika,
40 (1955), 74-86.
13. GA BARNARD, “Um novo teste para 2 2 tabelas”, Nature, 156 (1945), 117.
14. GA BARNARD, "Um novo teste para 2 2 tabelas", Nature, 156 (1945), 783-784.
15. GA BARNARD, “Testes de significância para 2 2 tabelas”, Biometrika, 34 (1947), 123–138.
16. RA FISHER, “Um novo teste para 2 2 tabelas”, Nature, 156 (1945), 388.
17. ES PEARSON, “A Escolha de Testes Estatísticos Ilustrados na Interpretação de Dados Classificados em uma Tabela 2 2,”
Biometrika, 34 (1947), 139–167.
18. A. Sweetland, “A Comparison of the Chi-Square Test for 1 df and the Fisher Exact Test,” Rand Corporation,
Santa Mônica, CA, 1972.
19. WENDELL E. CARR, “Fisher's Exact Text Extended to More than Two Samples of Igual Size,” Technometrics, 22
(1980), 269-270.
20. HENRY R. NEAVE, “Uma Nova Visão de um Teste Antigo,” Boletim de Estatísticas Aplicadas, 9 (1982), 165–178.
21. WILLIAM D. DUPONT, “Sensibilidade do Texto Exato de Fisher a Pequenas Perturbações em 2 2 Tabelas de Contingência,”
Estatísticas em Medicina, 5 (1986), 629–635.
22. N. MANTEL e W. HAENSZEL, “Aspectos estatísticos da análise de dados de estudos retrospectivos de doenças,”
Jornal do Instituto Nacional do Câncer, 22 (1959), 719–748.
23. N. MANTEL, “Testes de qui-quadrado com um grau de liberdade: extensões do procedimento de Mantel-Haenszel,”
Journal of the American Statistical Association, 58 (1963), 690–700.
A-1. CAROLE W. CRANOR e DALE B. CHRISTENSEN, "O Projeto Asheville: Resultados de Curto Prazo de um Programa
Comunitário de Cuidados com o Diabetes em Farmácia", Journal of the American Pharmaceutical Association, 43 (2003), 149–159.
A-2. AMY L. BYERS, HEATHER ALLORE, THOMAS M. GILL e PETER N. PEDUZZI, “Application of Negative Binomial Modeling for
Discrete Outcomes: A Case Study in Aging Research,” Journal of Clinical Epidemiology, 56 (2003), 559–564 .
A-3. KATHLEEN M. STEPANUK, JORGE E. TOLOSA , DAWNEETE LEWIS, VICTORIA MEYERS, CYNTHIA ROYDS, JUAN CARLOS
SAOGAL e RON LIBRIZZI, “Uso de suplementação de ácido fólico entre mulheres que contatam um serviço de informações
sobre teratologia,” American Journal of Obstetrics and Gynecology, 187 (2002), 964–967.
A-4. JK SILVER e DD AIELLO, “Polio Survivors: Falls and Subsequent Injuries,” American Journal of Physical Medicine and
Rehabilitation, 81 (2002), 567–570.
A-5. CYNTHIA G. SEGAL e JACQUELINE J. ANDERSON, “Preparação Pré-operatória da Pele de Pacientes Cardíacos”, AORN
Journal, 76 (2002), 821–827.
A-6. RALPH ROTHENBERG e JOHN P. HOLCOMB, “Diretrizes para Monitoramento de AINEs: Quem Ouviu?”, Journal of Clinical
Rheumatology, 6 (2000), 258–265.
A-7. SHARON M. BOLES e PATRICK B. JOHNSON, “Gender, Weight Concerns, and Adolescent Smoking,” Journal of
Addictive Diseases, 20 (2001), 5–14.
A-8. O DMG Study Group, “Migraine and Idiopathic Narcolepsy—A Case-Control Study,” Cephalagia, 23 (2003),
786-789.
A-9. TASHA D. CARTER, EMANUELA MUNDO, SAGARV. PARKH e JAMES L. KENNEDY, "Idade de início precoce como um fator de
risco para resultados ruins do transtorno bipolar", Journal of Psychiatric Research, 37 (2003), 297–303.
A-10. STEVEN S. COUGHLIN, ROBERT J. UHLER, THOMAS RICHARDS e KATHERINE M. WILSON, “Práticas de triagem de câncer de
mama e colo do útero entre mulheres hispânicas e não hispânicas que residem perto da fronteira entre os Estados Unidos e o
México, 1999-2000”, Família e Comunidade Saúde, 26 (2003), 130–139.
A-11. ROBERT SWOR, SCOTT COMPTON, FERN VINING, LYNN OSOSKY FARR, SUE KOKKO, REBECCA PASCUAL e RAYMOND E.
JACKSON, “A Randomized Controlled Trial of Chest Compression Only CPR for Older Adults: A Pilot Study,”
Ressuscitação, 58 (2003), 177–185.
A-12. US JUSTESEN, AM LERVFING, A. THOMSEN, JA LINDBERG, C. PEDERSEN e P. TAURIS, “Low-Dose Indinavir in
Combination with Low-Dose Ritonavir: Steady-State Pharmacokinetics and Long-Term Clinical Outcome Follow-Up,” HIV
Medicine, 4 (2003), 250–254.
A-13. JF TAHMASSEBI e MEJ CURZON, “A causa da baba em crianças com paralisia cerebral — hipersalivação ou defeito de
deglutição?” Jornal Internacional de Odontopediatria, 13 (2003), 106–111.
A-14. SHU DONG XIAO e TONG SHI, “O Suco de Cranberry é Eficaz no Tratamento e Prevenção da Infecção por Helicobacter Pylori em
Camundongos?”, Chinese Journal of Digestive Diseases, 4 (2003), 136–139.
A-15. GAD SHAKED, OLEG KLEINER, ROBERT FINALLY , JACOB MORDECHAI, NITZA NEWMAN e ZAHAVI COHEN, “Management
of Blunt Pancreatic Injuries in Children,” European Journal of Trauma, 29 (2003), 151–155.
A-16. EVERETT F. MAGANN, SHARON F. EVANS, BETH WEITZ e JOHN NEWNHAM, “Antepartum, Intrapartum, and Neonatal
Significance of Exercise on Healthy Low-Risk Pregnant Working Women,” Obstetrics and Gynecology, 99 (2002), 466–472.
A-17. AM TOSCHKE, SM MONTGOMERY, U. PFEIFFER e R.von KRIES, “Early Intrauterine Exposure to Tobacco
Produtos Inalados e Obesidade,” American Journal of Epidemiology, 158 (2003), 1068–1074.
A-18. DANIEL H. LAMONT, MATTHEW J. BUDOFF, DAVID M. SHAVELLE, ROBERT SHAVELLE, BRUCE H. BRUNDAGE e JAMES M.
HAGAR, “Coronary Calcium Scanning Adds Incremental Value to Patients with Positive Stress Tests,”
A-19. MARGARET LJ DAVY, TOM J. DODD, COLIN G. LUKE e DAVID M. RODER, “Câncer cervical: efeito do tipo de célula glandular no
prognóstico, tratamento e sobrevivência”, Obstetrics and Gynecology, 101 (2003), 38–45 .
A-20. U. STENESTRAND e L. WALLENTIN, “Revascularização precoce e sobrevida de 1 ano em sobreviventes de 14 dias de doenças agudas
Infarto do Miocárdio,” Lancet, 359 (2002), 1805–1811.
A-21. TAKAKO SUGIYAMA, KUMIYA SUGIYAMA, MASAO TODA, TASTUO YUKAWA, SOHEI MAKINO e TAKESHI FUKUDA, “Risk
Factors for Asthma and Allergic Diseases Among 13-14-Year-Old Schoolchildren in Japan,” Allergology International, 51 (2002),
139– 150.
A-22. D. HOLBEN, MC MCCLINCY, JP HOLCOMB e KL DEAN, “Status de Segurança Alimentar de Famílias em Appalachian Ohio com
Crianças em Head Start,” Journal of American Dietetic Association, 104 (2004), 238–241.
A-23. JOHN H. PORCERELLI, ROSEMARY COGAN, PATRICIA P. WEST, EDWARD A. ROSE, DAWN LAMBRECHT, KAREN E.
WILSON, RICHARD K. SEVERSON e DUNIA KARANA, “Vitimização violenta de mulheres e homens: sintomas físicos e
psiquiátricos,” Journal do Conselho Americano de Prática Familiar, 16 (2003), 32–39.
A-24. KENG CHEN, LEE MEI YAP, ROBIN MARKS e STEPHEN SHUMACK, “Short-Course Therapy with Imiquimod 5% Cream for Solar
Keratoses: A Randomized Controlled Trial,” Australasian Journal of Dermatology, 44 (2003), 250–255.
A-25. VALLABH JANARDHAN, ROBERT FRIEDLANDER , HOWARD RIINA e PHILIP EDWIN STIEG, “Identificando pacientes em risco
de morbidade pós-procedimento após tratamento de aneurismas intracranianos incidentais: o papel do tamanho e localização do
aneurisma”, Neurosurgical Focus, 13 (2002), 1–8.
A-26. PAUL B. GOLD, ROBERT N. RUBEY e RICHARD T. HARVEY, “Naturalistic, Self-Assignment Comparative Trial of Bupropion SR, a
Nicotine Patch, or Both for Smoking Cessation Treatment in Primary Care,” American Journal on Addictions, 11 ( 2002), 315–331.
A-27. ZOLTAN KOZINSZKY e GYORGY € BARTAI , "Comportamento contraceptivo de adolescentes que solicitam aborto", Jornal Europeu
de Obstetrícia e Ginecologia e Biologia Reprodutiva, 112 (2004), 80–83.
A-28. PAOLO CROSIGNANI, ANDREA TITTARELLI, ALESSANDRO BORGINI, TIZIANA CODAZZI, ADRIANO ROVELLI, EMMA PORRO,
PAOLO CONTIERO, NADIA BIANCHI , GIOVANNA TAGLIABUE, ROSARIA FISSI, FRANCESCO ROSSITTO e FRANCO
BERRINO, “Leucemia infantil e trânsito: um caso baseado na população Control Study,” International Journal of Cancer, 108
(2004), 596–599.
A-29. ROBYN GALLAGHER, SHARON MCKINLEY e KATHLEEN DRACUP, "Preditores de Atendimento de Mulheres em Programas de
Reabilitação Cardíaca", Progresso em Enfermagem Cardiovascular, 18 (2003), 121–126.
A-30. G. STANLEY, B. APPADU, M. MEAD e DJ ROWBOTHAM, “Dose Requirements, Efficacy and Side Effects of Morphine and Petidine
Delivered by Patient-Controlled Analgesia After Gynecological Surgery,” British Journal of Anaesthesia, 76 (1996), 484 –486.
A-31. JAMES D. SARGENT, THERESE A. STUKEL, MADELINE A. DALTON, JEAN L. FREEMAN e MARY JEAN BROWN, “Deficiência
de ferro nas comunidades de Massachusetts: fatores de risco socioeconômicos e demográficos entre crianças,”
American Journal of Public Health, 86 (1996), 544–550.
A-32. EWALD HORWATH, FRANCINE COURNOS , KAREN MCKINNON, JEANNINE R. GUIDO e RICHARD HERMAN, “Injeção de
drogas ilícitas entre pacientes psiquiátricos sem transtorno primário por uso de substâncias”, Serviços Psiquiátricos, 47 (1996),
181–185.
A-33. MARTHA SKINNER, JENNIFER J. ANDERSON, ROBERT SIMMS, RODNEY FALK, MING WANG, CARYN A. LIBBEY, LEE ANNA
JONES e ALAN S. COHEN, “Tratamento de 100 pacientes com amiloidose primária: um estudo randomizado de melfalano,
prednisona e Colchicine Versus Colchicine Only,” American Journal of Medicine, 100 (1996), 290–298.
A-34. YUJI MIYAJIMA, KEIZO HORIBE, MINORU FUKUDA, KIMIKAZU MATSUMOTO, SHIN-ICHIRO NUMATA, HIROSHI MORI e KOJI
KATO, “Detecção Sequencial de Células Tumorais no Sangue Periférico e Medula Óssea de Pacientes com Neuroblastoma de
Estágio IV pela Cadeia de Polimerase de Transcrição Reversa Reação para mRNA da tirosina hidroxilase,”
Câncer, 77 (1996), 1214–1219.
REFERÊNCIAS 669
A-35. CRAIG R. COHEN, ANN DUERR, NIWAT PRUITHITHADA, SUNGWAL RUGPAO, SHARON HILLIER, PATRICIA GARCIA e
KENRAD NELSON, “Bacterial Vaginosis and HIV Seroprevalence Among Female Commercial Sex Workers in Chiang Mai,
Thailand,” AIDS, 9 (1995), 1093 –1097.
A-36. DEBORAH S. LIPSCHITZ, MARGARET L. KAPLAN, JODIE B. SORKENN, GIANNI L. FAEDDA, PETER CHORNEY e GREGORY
M. ASNIS, “Prevalência e características de abuso físico e sexual entre pacientes psiquiátricos ambulatoriais,”
Serviços Psiquiátricos, 47 (1996), 189–191.
A-37. JOHN M. O'BRIEN, BRIAN M. MERCER, NANCY T. CLEARY e BAHA M. SIBAI, "Efficacy of Ambulatorial Induction with
Low-Dose Intravaginal Prostaglandin E2: A Randomized, Double-Blind, Placebo-Controlled Trial," American Jornal de
Obstetrícia e Ginecologia, 173 (1995), 1855–1859.
A-38. ABDALLAH M. ADRA, HELAIN J. LANDY, JAIME NAHMIAS e ORLANDO GOMEZ -MARÿN, “The Fetus with Gastro schisis:
Impact of Route of Delivery and Prenatal Ultrasonography,” American Journal of Obstetrics and Gynecology, 174 (1996), 540–
546.
A-39. SIMIN LIU, LYNN E. QUENEMOEN, JOSEPHINE MALILAY, ERIC NOJI, THOMAS SINKS e JAMES MENDLEIN, “Avaliação de um
sistema de alerta de mau tempo e preparação para desastres, Calhoun Country, Alabama, 1994,” American Journal of Public
Health, 86 ( 1996), 87-89.
A-40. KETAN H. PATEL, JONATHAN C. JAVITT, JAMES M. TIELSCH, DEBRA A. STREET, JOANNE KATZ, HARRY A. QUIGLEY e
ALFRED SOMMER, “Incidence of Acute Angle-Closure Glaucoma After Pharmacologic Midriasis,” American Journal of
Ophthalmology, 120 (1995), 709-717.
A-41. ALEXANDRE E. VOSKUYL, AEILKO H. ZWINDERMAN, MARIE LOUISE WESTEDT, JAN P. VANDENBROUCKE, FERDINAND C.
BREEDVELD e JOHANNA MW HAZES, "Fatores associados ao desenvolvimento de vasculite na artrite reumatóide:
resultados de um estudo de caso-controle", Annals of the Rheumatic Diseases, 55 (1996), 190–192.
A-42. ROBERT L. HARRIS, CHRISTOPHER A. YANCEY, WINFRED L. WISER , JOHN C. MORRISON e G. RODNEY MEEKS,
“Comparison of Anterior Colporrhaphy and Retropubic Urethropexy for Patients with Genuine Stress Urinary Incontinence,”
American Journal of Obstetrics and Gynecology, 173 (1995), 1671-1675.
A-43. YOSHIHIRO KOHASHI, MASAYOSHI OGA e YOICHI SUGIOKA, “Um novo método usando vistas superiores da coluna para prever
a progressão de curvas na escoliose idiopática durante o crescimento”, Spine, 21 (1996), 212–217.
A-44. MPM BURGER, H. HOLLEMA, WJLM PIETERS, FP SCHR€oDER e WGV QUINT , “Evidência Epidemiológica de
Neoplasia Intraepitelial Cervical Sem a Presença de Papilomavírus Humano”, British Journal of Cancer, 73 (1996),
831–836.
A-45. ERIC J. THOMAS, HELEN R. BURSTIN, ANNE C. O'NEIL, E. JOHN ORAV e TROYEN A. BRENNAN, "Patient Noncompliance with
Medical Advice After the Emergency Department Visit", Annals of Emergency Medicine, 27 (1996) , 49–55.
A-46. ST O'KEEFE e JN LAVAN, "Subcutânea Fluidos em Idosos Pacientes Hospitalizados com Comprometimento Cognitivo,"
Gerontologia, 42 (1996), 36–39.
CAPÍTULO 13
NÃO PARAMÉTRICO E
SEM DISTRIBUIÇÃO
ESTATISTICAS
Este capítulo explora uma ampla variedade de técnicas que são úteis quando as
suposições subjacentes aos testes de hipóteses tradicionais são violadas ou
quando se deseja realizar um teste sem fazer suposições sobre a população
amostrada.
TÓPICOS
13.1 INTRODUÇÃO
13.2 BALANÇAS DE MEDIÇÃO
13.3 O TESTE DE SINAL
13.4 TESTE DE SIGNED-RANK DE WILCOXON PARA LOCALIZAÇÃO
13.5 O TESTE DA MEDIANA
13.6 O TESTE DE MANN-WHITNEY
13.7 O TESTE DE AJUSTE DE KOLMOGOROV-SMIRNOV
13.8 A ANÁLISE ÚNICA DE VARIÂNCIA DE KRUSKAL-WALLIS POR CLASSIFICAÇÕES
13.9 A ANÁLISE DE DUAS VIAS DE FRIEDMAN DE VARIÂNCIA POR CLASSIFICAÇÕES
13.10 COEFICIENTE DE CORRELAÇÃO DE POSTOS DE SPEARMAN
13.11 ANÁLISE DE REGRESSÃO NÃO PARAMÉTRICA
13.12 RESUMO
Depois de estudar este capítulo, o aluno irá 1. entender a

transformação de classificação e como os procedimentos não paramétricos podem ser usados para escalas de
medição fracas.
670
2. ser capaz de calcular e interpretar uma ampla variedade de testes não paramétricos
comumente usados na prática. 3. entender quais testes não paramétricos podem ser usados
no lugar dos testes estatísticos paramétricos tradicionais quando várias suposições de teste são
violadas.
13.1 INTRODUÇÃO
A maioria dos procedimentos de inferência estatística que discutimos até este ponto são classificados como
estatísticas paramétricas. Uma exceção é o uso do qui-quadrado - como um teste de qualidade de ajuste e um
teste de independência. Esses usos do qui-quadrado estão sob o título de estatísticas não paramétricas.
A pergunta óbvia agora é: “Qual é a diferença?” Em resposta, recordemos a natureza dos procedimentos
inferenciais que categorizamos como paramétricos. Em cada caso, nosso interesse estava focado em estimar
ou testar uma hipótese sobre um ou mais parâmetros populacionais. Além disso, era fundamental para esses
procedimentos o conhecimento da forma funcional da população da qual foram extraídas as amostras que
serviram de base para a inferência.
Um exemplo de teste estatístico paramétrico é o amplamente utilizado teste t. Os usos mais comuns
desse teste são para testar uma hipótese sobre uma única média populacional ou a diferença entre duas
médias populacionais. Uma das suposições subjacentes ao uso válido deste teste é que a população ou
populações amostradas são pelo menos aproximadamente distribuídas normalmente.
Como veremos, os procedimentos que discutimos neste capítulo não dizem respeito a parâmetros
populacionais ou não dependem do conhecimento da população amostrada. Estritamente falando, apenas os
procedimentos que testam hipóteses que não são declarações sobre parâmetros populacionais são classificados
como não paramétricos, enquanto aqueles que não fazem nenhuma suposição sobre a população amostrada
são chamados de procedimentos livres de distribuição.
Apesar dessa distinção, costuma-se usar os termos não paramétrico e livre de distribuição de forma
intercambiável e discutir os vários procedimentos de ambos os tipos sob o título estatísticas não paramétricas.
Seguiremos esta convenção.
A discussão acima implica nas seguintes quatro vantagens das estatísticas não paramétricas.
1. Eles permitem o teste de hipóteses que não são declarações sobre valores de parâmetros populacionais.
Alguns dos testes qui-quadrado de qualidade de ajuste e os testes de independência são exemplos de
testes que possuem essa vantagem.
2. Testes não paramétricos podem ser usados quando a forma da população amostrada é
desconhecido.
3. Os procedimentos não paramétricos tendem a ser computacionalmente mais fáceis e, conseqüentemente,

mais rapidamente aplicados do que os procedimentos paramétricos. Esta pode ser uma característica
desejável em certos casos, mas quando o tempo não é escasso, merece uma baixa prioridade como
critério para a escolha de um teste não paramétrico. De fato, a maioria dos pacotes de software
estatístico agora inclui uma ampla variedade de opções de análise não paramétrica, tornando
desnecessárias as considerações sobre a velocidade de computação.
4. Podem ser aplicados procedimentos não paramétricos quando os dados em análise consistirem apenas
em ordenações ou classificações. Ou seja, os dados não podem ser baseados em uma
672 CAPÍTULO 13 ESTATÍSTICAS NÃO PARAMÉTRICAS E SEM DISTRIBUIÇÃO
escala de medição forte o suficiente para permitir as operações aritméticas necessárias para a realização
de procedimentos paramétricos. O assunto das escalas de medição é discutido com mais detalhes na
próxima seção.
Embora as estatísticas não paramétricas tenham várias vantagens, suas desvantagens também devem
ser reconhecidas.
1. A utilização de procedimentos não paramétricos com dados que podem ser tratados com um procedimento
paramétrico resulta em desperdício de dados.
2. A aplicação de alguns dos testes não paramétricos pode ser trabalhosa para grandes
amostras.
13.2 BALANÇAS DE MEDIÇÃO
Como foi apontado na seção anterior, uma das vantagens dos procedimentos estatísticos não paramétricos é
que eles podem ser usados com dados baseados em uma escala de medição fraca. Para compreender
plenamente o significado desta afirmação, é necessário conhecer e compreender o significado de medição e as
várias escalas de medição mais frequentemente utilizadas. Neste ponto, o leitor pode querer consultar a
discussão sobre escalas de medição no Capítulo 1.
Muitas autoridades são de opinião que diferentes testes estatísticos requerem diferentes escalas de
medição. Embora essa ideia pareça ser seguida na prática, existem pontos de vista alternativos.
Dados baseados em classificações, como será discutido neste capítulo, são comumente encontrados em
estatísticas. Podemos, por exemplo, simplesmente observar a ordem em que uma amostra de sujeitos completa
um evento em vez do tempo real gasto para completá-lo. Mais frequentemente, no entanto, usamos uma
transformação de classificação nos dados, substituindo, antes da análise, os dados originais por suas
classificações. Embora geralmente percamos algumas informações ao empregar esse procedimento (por
exemplo, a capacidade de calcular a média e a variância), a escala de medição transformada permite o cálculo
da maioria dos procedimentos estatísticos não paramétricos. Na verdade, a maioria dos procedimentos não
paramétricos comumente usados, incluindo a maioria dos apresentados neste capítulo, pode ser obtida aplicando-
se primeiro a transformação de classificação e, em seguida, usando-se o procedimento paramétrico padrão nos
dados transformados em vez dos dados originais. Por exemplo, se quisermos determinar se duas amostras
independentes diferem, podemos empregar o teste t de amostras independentes se os dados forem
aproximadamente normalmente distribuídos. Se não pudermos assumir distribuições normais, podemos, como
veremos nas seções a seguir, empregar um teste não paramétrico apropriado. Em vez desses procedimentos,
poderíamos primeiro aplicar a transformação de classificação nos dados e, em seguida, usar o teste t de
amostras independentes nas classificações. Isso fornecerá um teste equivalente ao teste não paramétrico e é
uma ferramenta útil a ser empregada se um teste não paramétrico desejado não estiver disponível em seu
pacote de software estatístico disponível.
Os leitores também devem ter em mente que outras transformações (por exemplo, obter o logaritmo dos
dados originais) podem normalizar suficientemente os dados de forma que procedimentos paramétricos padrão
possam ser usados nos dados transformados em vez de usar métodos não paramétricos.
13.3 O TESTE DE SINAL 673
13.3 O TESTE DE SINAL

O familiar teste t não é estritamente válido para testar (1) a hipótese nula de que a média de uma
população é igual a algum valor específico ou (2) a hipótese nula de que a média de uma população de
diferenças entre pares de medidas é igual a zero a menos que as populações relevantes sejam pelo
menos aproximadamente distribuídas normalmente. O caso 2 será reconhecido como uma situação que
foi analisada pelo teste de comparações pareadas no Capítulo 7. Quando as suposições de normalidade
não podem ser feitas ou quando os dados disponíveis são classificações em vez de medições em uma
escala de intervalo ou razão, o investigador pode desejar um procedimento opcional. Embora o teste t
seja bastante insensível a violações da suposição de normalidade, há momentos em que um teste
alternativo é desejável.
Um teste não paramétrico frequentemente usado que não depende das suposições do teste t é o
teste do sinal. Este teste se concentra na mediana em vez da média como uma medida de tendência
central ou localização. A mediana e a média serão iguais em distribuições simétricas. A única suposição
subjacente ao teste é que a distribuição da variável de interesse é contínua. Essa suposição exclui o uso
de dados nominais.
O teste de sinal recebe esse nome pelo fato de que mais e menos, em vez de valores numéricos,
fornecem os dados brutos usados nos cálculos. Ilustramos o uso do teste do sinal, primeiro no caso de
uma única amostra e depois com um exemplo envolvendo amostras pareadas.
EXEMPLO 13.3.1
Os pesquisadores desejavam saber se a instrução em cuidados pessoais e aparência melhoraria a

aparência de meninas com retardo mental. Em uma escola para deficientes mentais, 10 meninas
selecionadas aleatoriamente receberam instrução especial sobre cuidados pessoais e cuidados pessoais.
Duas semanas após a conclusão do curso de instrução, as meninas foram entrevistadas por uma
enfermeira e uma assistente social que atribuiu a cada menina uma pontuação com base em sua
aparência geral. Os investigadores acreditavam que as pontuações atingiram o nível de uma escala
ordinal. Eles sentiram que, embora uma pontuação de, digamos, 8 representasse uma aparência melhor
do que uma pontuação de 6, eles não estavam dispostos a dizer que a diferença entre as pontuações de
6 e 8 era igual à diferença entre, digamos, as pontuações de 8 e 10; ou que a diferença entre as
pontuações de 6 e 8 representou duas vezes mais melhora do que a diferença entre as pontuações de 5
e 6. As pontuações são apresentadas na Tabela 13.3.1. Queremos saber se podemos concluir que a
pontuação mediana da população da qual supomos que esta amostra foi extraída é diferente de 5.
TABELA 13.3.1 Pontuações de aparência

geral de 10 meninas mentalmente retardadas
Garota Pontuação Garota Pontuação
1 4 66
2 5 710
3 8 87
4 8 96
5 9 10 6
Solução:

2. Suposições. Assumimos que as medições são feitas em uma variável contínua.
3. Hipóteses.
H0 : A mediana da população é 5:
HA : A mediana da população não é 5:
Deixe um ¼ :05.
4. Estatística de teste. A estatística de teste para o teste de sinal é o número observado

de sinais positivos ou o número observado de sinais negativos. A natureza da hipótese
alternativa determina qual dessas estatísticas de teste é apropriada. Em um
determinado teste, qualquer uma das seguintes hipóteses alternativas é possível:
HA : Pð Þ þ > ð Þ alternativa unilateral

HA : Pð Þ þ < ð Þ alternativa unilateral
HA : Pð Þ 6¼ 1ð Þ alternativa bilateral
Se a hipótese alternativa for
HA : PðÞþ > PðÞ
um número suficientemente pequeno de sinais negativos causa a rejeição de H0. A

estatística de teste é o número de sinais de menos. Da mesma forma, se a hipótese
alternativa for
HA : Pð Þ þ < Pð Þ
um número suficientemente pequeno de sinais positivos causa a rejeição de H0. A

estatística de teste é o número de sinais de adição. Se a hipótese alternativa for
HA : PðÞþ 6¼ PðÞ
um número suficientemente pequeno de sinais positivos ou um número suficientemente

pequeno de sinais negativos causa a rejeição da hipótese nula. Podemos tomar como
estatística de teste o sinal que ocorre com menos frequência.
5. Distribuição da estatística de teste. Como primeiro passo para determinar a natureza da

estatística de teste, vamos examinar os dados da Tabela 13.3.1 para determinar quais
pontuações estão acima e quais estão abaixo da mediana hipotética de 5. Se
atribuirmos um sinal de mais às pontuações que encontram-se acima da mediana
hipotética e um sinal de menos para aqueles que ficam abaixo, temos os resultados
Se a hipótese nula fosse verdadeira, ou seja, se a mediana fosse, de fato, 5,

esperaríamos que os números de pontuações acima e abaixo de 5 fossem
TABELA 13.3.2 Pontuações acima de ð Þ þ e abaixo de ð Þ da mediana hipotética com base nos dados do Exemplo
13.3.1
Garota 1 2 3 4 5 6 7 8 9 10
Pontuação relativa 0 þþþþþþþþ

à mediana
hipotética
Aproximadamente igual. Essa linha de raciocínio sugere uma forma alternativa

pela qual poderíamos ter formulado a hipótese nula, a saber, que a probabilidade
de um sinal positivo é igual à probabilidade de um sinal negativo, e essas
probabilidades são iguais a 0,5. Colocada simbolicamente, a hipótese seria
H0 : PðÞ¼þ PðÞ¼ :5
Em outras palavras, esperaríamos aproximadamente o mesmo número de sinais

positivos e negativos na Tabela 13.3.2 quando H0 for verdadeira. Uma olhada na
Tabela 13.3.2 revela uma preponderância de vantagens; especificamente,
observamos oito mais, um menos e um zero, que foram atribuídos à pontuação
que caiu exatamente na mediana. O procedimento usual para lidar com zeros é
eliminá-los da análise e reduzir n, o tamanho da amostra, de acordo. Se seguirmos
esse procedimento, nosso problema se reduz a um que consiste em nove
observações, das quais oito são mais e uma é menos.
Como o número de mais e menos não é o mesmo, nos perguntamos se a
distribuição de sinais é suficientemente desproporcional para lançar dúvidas sobre
nossa hipótese. Dito de outra forma, nos perguntamos se esse pequeno número
de menos poderia ter surgido apenas por acaso quando a hipótese nula é
verdadeira, ou se o número é tão pequeno que algo diferente do acaso (ou seja,
uma falsa hipótese nula) é responsável para os resultados.
Com base no que aprendemos no Capítulo 4, parece razoável concluir que

as observações da Tabela 13.3.2 constituem um conjunto de n variáveis aleatórias
independentes da população de Bernoulli com parâmetro p. Se considerarmos k ¼
a estatística de teste, a distribuição amostral de k é a distribuição de probabilidade
binomial com parâmetro p ¼ :5 se a hipótese nula for verdadeira.
6. Regra de decisão. A regra de decisão depende da hipótese alternativa.

Para HA : Pð Þ þ > Pð Þ , rejeite H0 se, quando H0 for verdadeiro, a
probabilidade de observar k ou menos sinais de menos for menor ou igual a a.
Para HA : Pð Þ þ < Pð Þ , rejeite H0 se a probabilidade de observar, quando
H0 for verdadeira, k ou menos sinais de mais for igual ou menor que a.
Para HA : Pð Þ þ 6¼ Pð Þ , rejeite H0 se (dado que H0 é verdadeiro) a
probabilidade de obter um valor de k tão extremo ou mais extremo do que
realmente foi calculado é igual ou menor que a=2.
Para este exemplo, a regra de decisão é: Rejeitar H0 se o valor p para a

estatística de teste calculada for menor ou igual a 0,05.
7. Cálculo da estatística de teste. Podemos determinar a probabilidade de observar x ou menos

sinais de menos quando dada uma amostra de tamanho n e parâmetro p avaliando a
seguinte expressão:
P kð Þ¼ xjn; p Xx nCkpk qnk

(13.3.1)
k¼0
Para o nosso exemplo, calcularíamos
0 90 1 91 ¼ :00195 þ :01758 ¼ :0195

9C0ðÞ :5 ð Þ :5 þ 9C1ð Þ :5 ð Þ :5
8. Decisão estatística. No Apêndice Tabela B encontramos
P kð Þ¼ 1j9; :5 :0195
Com um teste bilateral, um número suficientemente pequeno de menos ou um

número suficientemente pequeno de mais causaria a rejeição da hipótese nula. Como,
em nosso exemplo, há menos pontos negativos, concentramos nossa atenção nos pontos
negativos em vez dos pontos positivos. Ao definir um igual a 0,05, estamos dizendo que
se o número de menos for tão pequeno que a probabilidade de observar esses poucos ou
menos for menor que 0,025 (metade de a), rejeitaremos a hipótese nula. A probabilidade
que calculamos, 0,0195, é menor que 0,025. Portanto, rejeitamos a hipótese nula.
9. Conclusão. Concluímos que a pontuação mediana não é 5.
10. valor p. O valor p para este teste é 2ð Þ¼ :0195 :0390.

&
Teste do sinal: dados emparelhados Quando os dados a serem analisados consistem em observações em pares
combinados e as suposições subjacentes ao teste t não são atendidas, ou a escala de medição é fraca, o teste
do sinal pode ser empregado para testar a hipótese nula de que a diferença mediana é 0. Uma forma alternativa
de afirmar a hipótese nula é
P Xð Þ¼ i > Yi P Xð Þ¼ i < Yi :5
Uma das pontuações combinadas, digamos, Yi, é subtraída da outra pontuação, Xi. Se Yi for menor que
Xi, o sinal da diferença é þ, e se Yi for maior que Xi, o sinal da diferença é Se a diferença mediana for 0,
esperaríamos que um
. a subtração par escolhido
é realizada. aleatoriamente
Podemos enunciar ativesse a mesma
hipótese probabilidade
nula, então, como de produza þ como a quando
H0 : PðÞ¼þ PðÞ¼ :5
Em uma amostra aleatória de pares combinados, esperaríamos que o número de þ's e 's fosse aproximadamente
igual. Se houver mais þ's ou mais 's do que podem ser explicados apenas pelo acaso quando a hipótese nula for
verdadeira, teremos alguma dúvida sobre a verdade de nossa hipótese nula. Por meio do teste de sinal, podemos
decidir quantos de um sinal constituem mais do que podem ser explicados apenas pelo acaso.
EXEMPLO 13.3.2
Uma equipe de pesquisa odontológica desejava saber se ensinar as pessoas a escovar os dentes seria
benéfico. Doze pares de pacientes atendidos em uma clínica odontológica foram obtidos combinando
cuidadosamente fatores como idade, sexo, inteligência e escores iniciais de higiene bucal. Um membro de
cada dupla recebeu instruções sobre como escovar os dentes e outros assuntos de higiene bucal. Seis
meses depois, todos os 24 indivíduos foram examinados e receberam uma pontuação de higiene oral por
um higienista dental que desconhecia quais indivíduos haviam recebido as instruções. Uma pontuação baixa
indica um alto nível de higiene oral. Os resultados são apresentados na Tabela 13.3.3.
Solução:
2. Suposições. Assumimos que a população de diferenças entre

pares de pontuações é uma variável contínua.
3. Hipóteses. Se a instrução produzisse um efeito benéfico, esse fato seria refletido nas
pontuações atribuídas aos integrantes de cada dupla. Se tomarmos as diferenças
Xi Yi, esperaríamos observar mais 's do que þ's se a instrução tivesse sido benéfica,
pois uma pontuação baixa indica um nível mais alto de higiene bucal. Se, de fato, a
instrução for benéfica, a mediana da população hipotética de todas essas diferenças
seria menor que 0, ou seja, negativa. Se, por outro lado, a instrução não surtir efeito,
a mediana dessa população seria zero. As hipóteses nula e alternativa, então, são:
TABELA 13.3.3 Pontuações de Higiene Oral de 12 Indivíduos que

Receberam Instrução de Higiene Oral (Xi) e 12 Indivíduos que Não
Receberam Instrução (Yi)
Pontuação
Número do par Instruído (Xi) Não instruído (Yi)
1 1,5 2.0
2 2.0 2.0
3 3.5 4.0
4 3.0 2.5
5 3.5 4.0
6 2.5 3.0
7 2.0 3.5
8 1,5 3.0
9 1,5 2.5
10 2.0 2.5
11 3.0 2.5
12 2.0 2.5
TABELA 13.3.4 Sinais de diferenças ðXi YiÞ nas pontuações de higiene oral de 12 indivíduos
instruídos ð Þ Xi e 12 indivíduos correspondentes não instruídos ð Þ Yi
Par 1 2 3 4 5 6 7 8 9 10 11 12
0 º
Sinal de diferenças
de pontuação
º
H0: A mediana das diferenças é zero ½ Pð Þ¼ þ Pð Þ .

HA: A mediana das diferenças é negativa ½ Pð Þ þ < Pð Þ .
Seja a 0,05.
4. Estatística de teste. A estatística de teste é o número de sinais de adição.
5. Distribuição da estatística de teste. A distribuição amostral de k é a distribuição binomial com

parâmetros n e 0,5 se H0 for verdadeiro.
6. Regra de decisão. Rejeitar H0 se P kð :5 Þ 7. Cálculo

2 11 jda
; :05.
estatística de teste. Como será visto, o procedimento aqui é idêntico ao procedimento de

amostra única, uma vez que as diferenças de pontuação foram obtidas para cada par.
Realizar as subtrações e observar os sinais produz os resultados mostrados na Tabela
13.3.4.
A natureza da hipótese indica um teste unilateral de modo que todo a ¼ :05 esteja
associado à região de rejeição, que consiste em todos os valores de k (onde k é igual ao
número de sinais þ) para os quais a probabilidade de obter que muitos ou menos positivos
devidos apenas ao acaso quando H0 é verdadeiro é igual ou menor que 0,05. Vemos na
Tabela 13.3.4 que o experimento rendeu um zero, dois positivos e nove negativos. Quando
eliminamos o zero, o tamanho efetivo da amostra é n ¼ 11 com dois positivos e nove
negativos. Em outras palavras, uma vez que um número “pequeno” de sinais positivos
causará a rejeição da hipótese nula, o valor de nossa estatística de teste é k ¼ 2.
8. Decisão estatística. Queremos saber a probabilidade de obter não mais do que dois positivos
em 11 tentativas quando a hipótese nula é verdadeira. Como vimos, a resposta é obtida
avaliando a expressão binomial apropriada. Neste exemplo encontramos
2
k 11k
P kð 2j11; :5 X Þ¼ 11CkðÞ :5 ð Þ :5
k¼0
Consultando a Tabela B do Apêndice, descobrimos que essa probabilidade é de 0,0327.

Como 0,0327 é menor que 0,05, devemos rejeitar H0.
9. Conclusão. Concluímos que a diferença mediana é negativa. Ou seja, concluímos que a

instrução foi benéfica.

&
Teste do Sinal com Tabelas “Maiores que” Conforme demonstrado, o teste do sinal pode ser utilizado com uma
única amostra ou com duas amostras em que cada membro da
uma amostra é combinada com um membro da outra amostra para formar uma amostra de pares
combinados. Também vimos que a hipótese alternativa pode levar a um teste unilateral ou bilateral. Em
qualquer um dos casos, nos concentramos no sinal que ocorre com menos frequência e calculamos a
probabilidade de obter aquele pouco ou menos desse sinal.
Usamos o sinal de ocorrência menos frequente como nossa estatística de teste porque as
probabilidades binomiais na Tabela B do Apêndice são probabilidades “menor ou igual a”. Usando o
sinal de ocorrência menos frequente, podemos obter a probabilidade de que precisamos diretamente da
Tabela B, sem precisar fazer nenhuma subtração. Se as probabilidades na Tabela B fossem
probabilidades “maiores que ou iguais a”, que são frequentemente encontradas em tabelas de
distribuição binomial, usaríamos o sinal de ocorrência mais frequente como nossa estatística de teste
para aproveitar a conveniência de obter o probabilidade desejada diretamente da tabela sem ter que
fazer nenhuma subtração. De fato, poderíamos, em nossos exemplos atuais, usar o sinal de ocorrência
mais frequente como nossa estatística de teste, mas como a Tabela B contém probabilidades “menor
ou igual a” teríamos que realizar uma operação de subtração para obter a probabilidade desejada. Como
ilustração, considere o último exemplo. Se usarmos como nossa estatística de teste o sinal que ocorre
com mais frequência, ele é 9, o número de menos. A probabilidade desejada, então, é a probabilidade
de nove ou mais menos, quando n ¼ 11 ep ¼ :5. Ou seja, queremos
P kð ¼ 9 j 11; :5 ª
No entanto, como a Tabela B contém probabilidades “menores ou iguais a”, devemos obter essa
probabilidade por subtração. Isso é,
P kð 9j 11; :5 Þ¼ 1 P kð ¼ 8 j 11; :5 ª
1:9673 ¼:0327
que é o resultado obtido anteriormente.
Tamanho da amostra Vimos no Capítulo 5 que quando o tamanho da amostra é grande e quando p está
próximo de 0,5, a distribuição binomial pode ser aproximada pela distribuição normal. A regra prática
usada foi que a aproximação normal é apropriada quando np e nq são maiores que 5. Quando p ¼ :5,
como foi hipotetizado em nossos dois exemplos, uma amostra de tamanho 12 satisfaria a regra prática.
Seguindo essa diretriz, pode-se usar a aproximação normal quando o teste do sinal é usado para testar
a hipótese nula de que a mediana ou diferença mediana é 0 e n é igual ou maior que 12. Como o
procedimento envolve aproximar uma distribuição contínua por uma distribuição discreta distribuição, a
correção de continuidade de 0,5 é geralmente usada. A estatística de teste então é
ð Þ k :5 :5n
z¼ ffiffiffi
(13.3.2)
:5 np
que é comparado com o valor de z da distribuição normal padrão correspondente ao nível de significância
escolhido. Na Equação 13.3.2, k þ :5 é usado quando k < n=2 e k :5 é usado quando kn=2.
Dados:
C1: 4 5 8 8 9 6 10 7 6 6
Sinal de 1 amostra não paramétrico estatístico MTB > STest 5 C1;

SUBC> Alternativa 0.
Digite C1 em Variáveis. Escolha Mediana de teste e digite 5 na
caixa de texto. Clique em OK.
Saída:
Teste de Sinal para Mediana: C1
Teste de sinal da mediana 5,00 contra NE 5,000

N ABAIXO IGUAL ACIMA DA MEDIANA DO VALOR P
C1 10 1 1 8 0,0391 6,500
Análise de computador Muitos pacotes de software de estatística realizarão o teste de sinal.

Por exemplo, se usarmos o MINITAB para realizar o teste do Exemplo 13.3.1 no qual os dados são
armazenados na Coluna 1, o procedimento e a saída seriam os mostrados na Figura 13.3.1.
EXERCÍCIOS
13.3.1 Uma amostra aleatória de 15 estudantes de enfermagem foi submetida a um teste para medir seu nível de autoritarismo com
os seguintes resultados:
Aluna autoritarismo Aluna autoritarismo

Número Pontuação Número Pontuação
1 75 9 82
2 90 10 104
3 85 11 88
4 110 12 124
5 115 13 110
6 95 14 76
7 132 15 98
8 74
Teste no nível de significância de 0,05, a hipótese nula de que a pontuação mediana para a população amostrada é 100.
Determine o valor de p.
13.4 O TESTE DE SIGNED-RANK DE WILCOXON PARA A LOCALIZAÇÃO 681
13.3.2 Determinar os efeitos do suco de toranja na farmacocinética da digoxina oral (uma droga frequentemente prescrita para
problemas cardíacos) foi o objetivo de um estudo de Parker et al. (A-1). Sete voluntários saudáveis não fumantes
participaram do estudo. Os indivíduos tomaram digoxina com água por 2 semanas, sem digoxina por 2 semanas e
digoxina com suco de toranja por 2 semanas. O pico médio da concentração plasmática de digoxina (Cmax) quando os
indivíduos tomaram digoxina com água é dado na primeira coluna da tabela a seguir. A segunda coluna dá a
concentração de Cmax quando os indivíduos tomaram digoxina com suco de toranja. Podemos concluir com base
nesses dados que a concentração de Cmax é maior quando a digoxina é tomada com suco de toranja? Deixe um ¼ :5.
Cmax
Sujeito H2O GFJ
1 2.34 3.03
2 2.46 3.46
3 1,87 1,97
4 3.09 3.81
5,59 3,07
56 4,05 2,62
7 6,21 3.44
de Robert B. Parker, Pharm.D.
13.3.3 Uma amostra de 15 pacientes com asma participou de um experimento para estudar o efeito de um novo tratamento na
função pulmonar. Entre as várias medidas registradas estavam as de volume expiratório forçado (litros) em 1 segundo
(VEF1) antes e após a aplicação do tratamento.
Os resultados foram os seguintes:
Assunto antes Depois de Assunto antes Depois de
1 1,69 1,69 9 2.58 2.44

2 2.77 2.22 10 1,84 4.17
3 1,00 3,07 11 1,89 2,42
4 1,66 3,35 12 1,91 2,94
5 3,00 3,00 13 1,75 3,04
6 ,85 2,74 14 2,46 4,62
7 1,42 3,61 15 2,35 4,42
8 2,82 5,14
Com base nesses dados, pode-se concluir que o tratamento é eficaz em aumentar o nível de VEF1? Seja a ¼ :05 e
encontre o valor de p.
13.4 TESTE DE SIGNED-RANK DE WILCOXON PARA

LOCALIZAÇÃO
Às vezes, desejamos testar uma hipótese nula sobre a média de uma população, mas, por alguma
razão, nem z nem t são uma estatística de teste apropriada. Se tivermos uma pequena
de uma
amostra
Þpopulação
n < 30
ð
conhecida por ter uma distribuição grosseiramente não normal e o teorema do limite central não for
aplicável, a estatística z será descartada. A estatística t não é apropriada
porque a população amostrada não se aproxima suficientemente de uma distribuição normal.

Quando confrontados com tal situação, geralmente procuramos um procedimento estatístico não paramétrico
apropriado. Como vimos, o teste do sinal pode ser usado quando nossos dados consistem em uma única
amostra ou quando temos dados pareados. Se, no entanto, os dados para análise forem medidos em pelo
menos uma escala de intervalo, o teste de sinal pode ser indesejável porque não faria uso total das
informações contidas nos dados. Um procedimento mais apropriado pode ser o teste de postos sinalizados
de Wilcoxon (1), que utiliza as magnitudes das diferenças entre as medições e um parâmetro de localização
hipotético, em vez de apenas os sinais das diferenças.
Suposições O teste Wilcoxon para localização é baseado nas seguintes suposições

sobre os dados.
1. A amostra é aleatória.
2. A variável é contínua.
3. A população é distribuída simetricamente em torno de sua média m.

4. A escala de medição é de pelo menos um intervalo.
Hipóteses A seguir estão as hipóteses nulas (juntamente com suas alternativas) que podem ser testadas
sobre alguma média populacional desconhecida m0.
(a) H0 : m ¼ m0 (b) H0 : m m0 (c) H0 : m m0

HA : m 6¼ m0 HA : m < m0 HA : m > m0
Quando usamos o procedimento de Wilcoxon, realizamos os seguintes cálculos.
1. Subtraia a média hipotética m0 de cada observação xi, para obter
di ¼ xi m0
Se qualquer xi for igual à média, de modo que di ¼ 0, elimine esse di dos cálculos e reduza n de
acordo.
2. Ordene os di utilizáveis do menor para o maior sem considerar o sinal de di.

Ou seja, considere apenas o valor absoluto do di, designado di jj, ao ordená-los. Se dois ou mais di jj
forem iguais, atribua a cada valor empatado
empatados
a média
ocupam.
das posições
Se, porde
exemplo,
classificação
os trêsque
menores
os valores
di jj
forem todos iguais, coloque-os nas posições de classificação 1, 2 e 3, mas atribua a cada uma uma
classificação de ð Þ 1 þ 2 þ 3 = 3 ¼ 2.
3. Atribua a cada classificação o sinal do di que produz essa classificação.
4. Encontre Tþ, a soma dos postos com sinais positivos, e T, a soma dos postos com
sinais negativos.
A estatística de teste A estatística de teste de Wilcoxon é T + ou T, dependendo da natureza da hipótese

alternativa. Se a hipótese nula for verdadeira, ou seja, se a média real da população for igual à média
hipotética, e se as hipóteses forem atendidas, a probabilidade de se observar uma diferença positiva di ¼ xi
m0 de uma determinada magnitude é igual a
13.4 O TESTE DE SIGNED-RANK DE WILCOXON PARA A LOCALIZAÇÃO 683
a probabilidade de observar uma diferença negativa da mesma magnitude. Então, em amostragem

repetida, quando a hipótese nula é verdadeira e as suposições são atendidas, o valor esperado de Tþ
é igual ao valor esperado de T. Não esperamos que Tþ e T calculados de uma determinada amostra
sejam iguais. Entretanto, quando H0 for verdadeira, não esperamos uma grande diferença em seus
valores. Conseqüentemente, um valor suficientemente pequeno de Tþ ou um valor suficientemente
pequeno de T causará a rejeição de H0. Þ, ou um valor suficientemente pequeno de Tþ ou um valor
nos fará rejeitar H0 : m ¼ m0 . A estatística de teste, então,
ð é Tsuficientemente
+ ou T, o que forpequeno
menor. Para
de T
simplificar a notação, chamamos o menor dos dois T.
Quando H0 : m m0 é verdadeiro, esperamos que nossa amostra produza um grande valor de Tþ.
Portanto, quando a hipótese alternativa unilateral afirma que a média real da população é Þ, um valor
a média hipotética m < m0 rejeição de H0,
ð e Tþ ésuficientemente
a estatística de teste.
pequeno de Tþ causará menos que
Quando H0 : m m0 é verdadeiro, esperamos que nossa amostra produza um grande valor de T.

Portanto, para a alternativa unilateral HA : m > m0, um valor suficientemente pequeno de T causará
rejeição de H0 e T é a estatística de teste.
Valores Críticos Os valores críticos da estatística de teste de Wilcoxon são fornecidos na Tabela K do
Apêndice. Os níveis exatos de probabilidade (P) são dados com quatro casas decimais para todos os
totais de classificação possíveis (T) que produzem um nível de probabilidade diferente na quarta casa
decimal de 0,0001 até 0,5000. Os totais de classificação (T) são tabulados para todos os tamanhos de
amostra de n ¼ 5 a n ¼ 30. A seguir estão as regras de decisão para as três possíveis hipóteses
alternativas:
(a) HA : m 6¼ m0. Rejeitar H0 no nível de significância a se o T calculado for menor ou igual ao T

tabulado para n e pré-selecionado a=2. Alternativamente, podemos entrar na Tabela K com n e
nosso valor calculado de T para ver se o P tabulado associado ao T calculado é menor ou igual
ao nosso nível declarado de significância. Se assim for, podemos rejeitar H0.
(b) HA : m < m0. Rejeitar H0 no nível de significância a se Tþ for menor ou igual ao T tabelado para
n e a pré-selecionado. (c) HA : m > m0. Rejeitar H0 no nível de significância a se T for menor
ou igual ao T tabulado para n e a pré-selecionado.
EXEMPLO 13.4.1
O débito cardíaco (litros/minuto) foi medido por termodiluição em uma amostra aleatória simples de 15
pacientes cirúrgicos postais em decúbito lateral esquerdo. Os resultados foram os seguintes:
4,91 4,10 6,74 7,27 7,42 7,50 6,56 4,64

5,98 3,14 3,23 5,80 6,17 5,39 5,77
Queremos saber se podemos concluir com base nesses dados que a média da população é diferente
de 5,05.
Solução:
1. Dados. Veja declaração de exemplo.
2. Suposições. Assumimos que os requisitos para a aplicação de

o teste de postos sinalizados de Wilcoxon são atendidos.
3. Hipóteses.
H0 : m ¼ 5:05
HA : m 6¼ 5:05
Deixe um ¼ 0:05.
4. Estatística de teste. A estatística de teste será Tþ ou T, o que for menor.

Chamaremos a estatística de teste de T.
5. Distribuição da estatística de teste. Os valores críticos da estatística de teste são

dados na Tabela K do Apêndice.
6. Regra de decisão. Rejeitaremos H0 se o valor calculado de T for menor ou igual a 25, o valor
crítico para n ¼ 15 e a=2 ¼ :0240, o valor mais próximo de 0,0250 na Tabela K.
7. Cálculo da estatística de teste. O cálculo da estatística de teste é

mostrado na Tabela 13.4.1.
8. Decisão estatística. Como 34 é maior que 25, não podemos

rejeitar H0.
9. Conclusão. Concluímos que a média da população pode ser 5,05. 10. valor p. Da Tabela
K vemos que p ¼ 2ð Þ¼ :0757 :1514.
TABELA 13.4.1 Cálculo da Estatística de Teste para o Exemplo 13.4.1
Cardíaco
Saída di ¼ xi 5:05 Classificação de di jj Classificação Assinada de di jj
4,91 :14 1 1
4.10 :95 7 7
6.74 þ1:69 10 þ10
7.27 þ2:22 13 þ13
7.42 þ2:37 14 þ14
7,50 þ2:45 15 þ15
6.56 þ1:51 9 þ9
4.64 :41 3 3
5,98 þ:93 6 þ6
3.14 1:91 12 12
3.23 1:82 11 11
5,80 þ:75 5 þ5
6.17 þ1:12 8 þ8
5.39 þ:34 2 þ2
5.77 þ:72 4 þ4
Tþ ¼ 86; T ¼ 34; T ¼ 34
&
EXERCÍCIOS 685
Stat Nonparametrics 1-Sample Wilcoxon MTB > WTEST 5,05 C1;

SUBC> Alternativa 0.
Digite C1 em Variáveis. Escolha a mediana de teste. Digite 5.05 na
caixa de texto. Clique em OK.
Saída:
Teste de Classificação Sinalizada de Wilcoxon: C1
TESTE DE MEDIANA 5.050 VERSUS MEDIANA NE 5.050
N PARA WILCOXON ESTIMADO

N TEST ESTATÍSTICA P-VALOR MEDIANA
C1 15 15 86,0 0,148 5.747
Teste de postos sinalizados de pares pareados de Wilcoxon O teste de Wilcoxon pode ser usado
com dados pareados em circunstâncias nas quais não é apropriado usar o teste t de comparações
pareadas descrito no Capítulo 7. Nesses casos, obtenha cada um dos valores n di , o diferença
entre cada um dos n pares de medições. Se deixarmos mD ¼ da média de uma população de tais
diferenças, podemos seguir o procedimento descrito acima para testar qualquer uma das seguintes
hipóteses nulas: H0 : mD ¼ 0, H0 : mD 0 e H0 : mD 0.
Análise de computador Muitos pacotes de software de estatística executarão o teste de postos

sinalizados de Wil Coxon. Se, por exemplo, os dados do Exemplo 13.4.1 forem armazenados na
Coluna 1, poderíamos usar o MINITAB para realizar o teste mostrado na Figura 13.4.1.
EXERCÍCIOS
13.4.1 Dezesseis animais de laboratório foram alimentados com uma dieta especial desde o nascimento até 12 semanas de idade. O peso deles
ganhos (em gramas) foram os seguintes:
63 68 79 65 64 63 65 64 76 74 66 66 67 73 69 76
Podemos concluir a partir desses dados que a dieta resulta em um ganho de peso médio inferior a 70 gramas?
Seja a ¼ :05 e encontre o valor de p.
13.4.2 Cantores amadores e profissionais foram objeto do estudo de Grape et al. (A-2). Os pesquisadores investigaram os
possíveis efeitos benéficos do canto no bem-estar durante uma única aula de canto.
Uma das variáveis de interesse foi a alteração do cortisol em decorrência da aula de sinais. Use os dados da tabela
a seguir para determinar se, em geral, o cortisol (nmol/L) aumenta após uma aula de canto.
Deixe um ¼ :05. Encontre o valor p.
Assunto 12345678
Antes de 214 362 202 158 403 219 307 331

Depois de 232 276 224 412 562 203 340 313
Fonte: Dados fornecidos por cortesia de Christina Grape, MPH, enfermeira licenciada.
13.4.3 Em um estudo de Zuckerman e Heneghan (A-3), os estresses hemodinâmicos foram medidos em indivíduos
submetidos à colecistectomia laparoscópica. Uma variável de desfecho de interesse foi o volume diastólico final
ventricular (LVEDV) medido em mililitros. Uma parte dos dados aparece na tabela a seguir.
A linha de base refere-se a uma medição realizada 5 minutos após a indução da anestesia, e o termo “5 minutos”
refere-se a uma medição realizada 5 minutos após a linha de base.
DVEDV (ml)
Sujeito Linha de base 5 minutos
1 51,7 49.3
2 79,0 72,0
3 78,7 87,3
4 80.3 88,3
5 72,0 103.3
6 85,0 94,0
7 69,7 94,7
8 71.3 46.3
9 55,7 71,7
10 56.3 72.3
cortesia de RS Zuckerman, MD.
Podemos concluir, com base nesses dados, que entre os indivíduos submetidos à colecistectomia laparoscópica,
os níveis médios de LVEDV mudam? Deixe um ¼ :01.
13.5 O TESTE DA MEDIANA

Um procedimento não paramétrico que pode ser usado para testar a hipótese nula de que duas amostras
independentes foram extraídas de populações com medianas iguais é o teste da mediana. O teste, atribuído
principalmente a Mood (2) e Westenberg (3), também é discutido por Brown e Mood (4).
Ilustramos o procedimento por meio de um exemplo.
EXEMPLO 13.5.1
Estudantes do ensino fundamental masculino urbano e rural diferem em relação ao seu nível de saúde mental?
Solução:
1. Dados. Membros de uma amostra aleatória de 12 alunos do sexo masculino de uma escola
secundária rural e uma amostra aleatória independente de 16 alunos do sexo masculino
13.5 O TESTE DA MEDIANA 687
TABELA 13.5.1 Nível de pontuação de saúde mental de meninos do

segundo grau
Escola
Urbano Rural Urbano Rural
35 29 25 50
26 50 27 37
27 43 45 34
21 22 46 31
27 42 33
38 47 26
23 42 46
25 32 41
alunos de uma escola secundária urbana receberam um teste para medir seu nível de
saúde mental. Os resultados são apresentados na Tabela 13.5.1.
Para determinar se podemos concluir que existe uma diferença, realizamos um teste
de hipótese que faz uso do teste da mediana. Suponha que escolhemos um nível de
significância de 0,05.
2. Suposições. As suposições subjacentes ao teste são (a) as amostras são selecionadas de

forma independente e aleatória de suas respectivas populações; (b) as populações são da
mesma forma, diferindo apenas na localização; e (c) a variável de interesse é contínua. O
nível de medição deve ser, no mínimo, ordinal. As duas amostras não precisam ter o
mesmo tamanho.
3. Hipóteses.
H0 : MU ¼ MR
HA : MU 6¼ MR
MU é a pontuação mediana da população amostrada de estudantes urbanos, e MR é a

pontuação mediana da população amostrada de estudantes rurais.
Deixe um ¼ :05.
4. Estatística de teste. Como será mostrado na discussão a seguir, a estatística de teste é X2

conforme calculado, por exemplo, pela Equação 12.4.1 para uma tabela de contingência 2
2.
5. Distribuição da estatística de teste. Quando H0 é verdadeiro e as suposições são atendidas,

X2 é distribuído aproximadamente como x2 com 1 grau de liberdade.
6. Regra de decisão. Rejeitar H0 se o valor calculado de X2 for 3:841 (já que

a ¼ :05).
7. Cálculo da estatística de teste. A primeira etapa no cálculo da estatística de teste é calcular

a mediana comum das duas amostras combinadas. Isso é feito organizando as observações
em ordem crescente
TABELA 13.5.2 Nível de pontuação de saúde mental de meninos do ensino

fundamental
Urbano Rural Total
Número de pontuações acima da mediana 6 8 14

Número de pontuações abaixo da mediana 10 4 14
Total 16 12 28
e, como o número total de observações é par, obter a média dos dois números
do meio. Para o nosso exemplo, a mediana é ð Þ 33 þ 34 =2 ¼ 33:5.
Agora determinamos para cada grupo o número de observações acima e

abaixo da mediana comum. As frequências resultantes são arranjadas em uma
tabela 2 2. Para o presente exemplo construímos a Tabela 13.5.2.
Se as duas amostras forem, de fato, de populações com a mesma mediana,

esperaríamos que cerca de metade das pontuações em cada amostra estivesse
acima da mediana combinada e cerca de metade abaixo. Se as condições
relativas ao tamanho da amostra e às frequências esperadas para uma tabela de
contingência 2 2 conforme discutido no Capítulo 12 forem atendidas, o teste qui-
quadrado com 1 grau de liberdade pode ser usado para testar a hipótese nula de
medianas populacionais iguais. Para nossos exemplos temos, pela Fórmula 12.4.1,
2
28 6 ½ ð Þð Þ 4 ð Þ8 ð Þ 10
X2 ¼ ð ¼ 2:33
Þ 16 ð Þ 12 ð Þ 14 ð Þ 14
8. Decisão estatística. Como 2:33 < 3:841, o valor crítico de x2 com ¼ :05 e 1 grau
de liberdade, não podemos rejeitar a hipótese nula com base nesses dados.
9. Conclusão. Concluímos que as duas amostras podem ter sido extraídas

de populações com medianas iguais.
10. valor p. Como 2:33 < 2:706, temos p > :10.
&
Manipulando valores iguais à mediana Às vezes, um ou mais valores observados serão exatamente
iguais à mediana comum e, portanto, não cairão nem acima nem abaixo dela. Notamos que se n1 þ
n2 for ímpar, pelo menos um valor sempre será exatamente igual à mediana. Isso levanta a questão
do que fazer com observações desse tipo. Uma solução é eliminá-los da análise se n1 þ n2 for
grande e houver apenas alguns valores que caem na mediana combinada. Ou podemos dicotomizar
as pontuações entre as que excedem a mediana e as que não excedem, caso em que as observações
que igualam a mediana serão contadas na segunda categoria.
Extensão do Teste da Mediana O teste da mediana se estende logicamente ao caso em que se

deseja testar a hipótese nula de que k 3 amostras são de populações com medianas iguais. Para
este teste, uma tabela de contingência de 2 k pode ser construída usando o
EXERCÍCIOS 689
Teste de mediana de humor não paramétrico estatístico MTB > Humor C1 C2.
Digite C1 em Resposta e C2 em Fator. Clique em OK.
Saída:
Teste de mediana de humor: C1 versus C2
Teste mediano de humor de C1
Qui-quadrado 2,33 df 1p 0,127
ICs individuais de 95,0%

C2 N< N> Mediana Q3 Q1 -------- --------- --------- --------
1 10 6 27,0 15,0 (- -------------------) (---------------------- ----------)
2 4 8 39,5 14.8
-------- --------- --------- --------
30,0 36,0 42,0

Mediana geral 33,5
Um IC de 95,0% para mediana (1) - mediana (2): (17,1,3,1)
frequências que ficam acima e abaixo da mediana calculada a partir de amostras combinadas. Se
as condições quanto ao tamanho da amostra e às frequências esperadas forem atendidas, X2 pode
ser calculado e comparado com o x2 crítico com k 1 graus de liberdade.
Análise de computador Os cálculos de teste mediano podem ser realizados usando o MINITAB.
Para ilustrar o uso dos dados do Exemplo 13.5.1, primeiro armazenamos as medições na Coluna 1
do MINITAB. Na Coluna 2 do MINITAB, armazenamos códigos que identificam as observações se
são para um sujeito urbano (1) ou rural (2). O procedimento e a saída do MINITAB são mostrados
na Figura 13.5.1.
EXERCÍCIOS
13.5.1 Quinze prontuários de pacientes de cada um dos dois hospitais foram revisados e receberam uma pontuação projetada para
medir o nível de cuidado. As pontuações foram as seguintes:
Hospital A: 99, 85, 73, 98, 83, 88, 99, 80, 74, 91, 80, 94, 94, 98, 80 78, 74,
Hospital B: 69, 79, 57, 78, 79, 68, 59, 91, 89 , 55, 60, 55, 79
Você concluiria, no nível de significância de 0,05, que as duas medianas populacionais são diferentes?
Determine o valor p.
13.5.2 Os seguintes valores de albumina sérica foram obtidos de 17 indivíduos normais e 13 hospitalizados:
Albumina Sérica (g/100 ml) Albumina Sérica (g/100 ml)
assuntos normais Sujeitos Hospitalizados assuntos normais Sujeitos Hospitalizados
2,4 3,0 1,5 3,1 3,4 4,0 3.8 1,5

3,5 3,2 3,1 2.0 1,3 4,5 3,5 5,0 3.5
3,5 3.4 1,5 3,6
4,0 3,8 4,2 1,7 1,8 2.9
3,9 2,0 2,0
Você concluiria no nível de significância de 0,05 que as medianas das duas populações amostradas são
diferentes? Determine o valor p.
13.6 O TESTE DE MANN-WHITNEY
O teste da mediana discutido na seção anterior não faz pleno uso de todas as informações presentes nas duas
amostras quando a variável de interesse é medida pelo menos em uma escala ordinal. Reduzir o conteúdo de
informação de uma observação apenas para saber se ela fica ou não acima ou abaixo da mediana comum é
um desperdício de informação. Se, para testar a hipótese desejada, existe um procedimento que faz uso de
mais informações inerentes aos dados, esse procedimento deve ser usado, se possível. Um procedimento não
paramétrico que muitas vezes pode ser usado em vez do teste da mediana é o teste de Mann-Whitney (5), às
vezes chamado de teste de Mann-Whitney-Wilcoxon. Como esse teste é baseado nas classificações das
observações, ele utiliza mais informações do que o teste da mediana.
Suposições As suposições subjacentes ao teste de Mann-Whitney são as seguintes:
1. As duas amostras, de tamanho n e m, respectivamente, disponíveis para análise foram retiradas de

forma independente e aleatória de suas respectivas populações.
2. A escala de medição é pelo menos ordinal.
3. A variável de interesse é contínua.
4. Se as populações diferem de alguma forma, elas diferem apenas em relação às suas medianas.
Hipóteses Quando essas suposições são atendidas, podemos testar a hipótese nula de que as duas populações
têm medianas iguais contra qualquer uma das três alternativas possíveis: (1) as populações não têm medianas
iguais (teste bilateral), (2) a mediana de a população 1 é maior que a mediana da população 2 (teste unilateral),
ou (3) a mediana da população 1 é menor que a mediana da população 2 (teste unilateral). Se as duas
populações forem simétricas, de modo que dentro de cada população a média e a mediana sejam iguais, as
conclusões a que chegamos com relação às duas medianas populacionais também se aplicarão às duas
médias populacionais. O exemplo a seguir ilustra o uso do teste de Mann-Whitney.
13.6 O TESTE DE MANN-WHITNEY 691
EXEMPLO 13.6.1
Um pesquisador projetou um experimento para avaliar os efeitos da inalação prolongada de óxido de

cádmio. Quinze animais de laboratório serviram como sujeitos experimentais, enquanto 10 animais
semelhantes serviram como controles. A variável de interesse foi o nível de hemoglobina após o
experimento. Os resultados são apresentados na Tabela 13.6.1. Queremos saber se podemos concluir que
a inalação prolongada de óxido de cádmio reduz o nível de hemoglobina.
Solução:
2. Suposições. Assumimos que as suposições de Mann-Whitney

teste são cumpridos.
3. Hipóteses. As hipóteses nula e alternativa são as seguintes:
H0 : MX MEU
HA : MX < MEU
onde MX é a mediana de uma população de animais expostos ao óxido de cádmio e

MY é a mediana de uma população de animais não expostos à substância. Suponha
que deixamos um ¼ :05.
4. Estatística de teste. Para calcular a estatística de teste, combinamos as duas amostras
e classificamos todas as observações da menor para a maior, mantendo o controle
da amostra à qual cada observação pertence. As observações empatadas recebem
uma classificação igual à média das posições de classificação para as quais estão
empatadas. Os resultados desta etapa são apresentados na Tabela 13.6.2.
TABELA 13.6.1 Determinações de hemoglobina (gramas) para

25 animais de laboratório
Animais Expostos (X) Animais não expostos (Y)
14.4 17.4
14.2 16.2
13.8 17.1
16.5 17.5
14.1 15,0
16.6 16,0
15.9 16.9
15.6 15,0
14.1 16.3
15.3 16.8
15.7
16.7
13.7
15.3
14,0
TABELA 13.6.2 Dados originais e classificações, Exemplo

13.6.1
x Classificação Y Classificação
13.7 1
13.8 2
14,0 3
14.1 4.5
14.1 4.5
14.2 6
14.4 7
15,0 8.5
15,0 8.5
15.3 10.5
15.3 10.5
15.6 12
15.7 13
15.9 14
16,0 15
16.2 16
16.3 17
16.5 18
16.6 19
16.7 20
16.8 21
16.9 22
17.1 23
17.4 24
17.5 25
_____
Total 145
A estatística de teste é
n nð Þ þ 1
T¼S (13.6.1)
2
onde n é o número de observações da amostra X e S é a soma das classificações

atribuídas às observações da amostra da população de valores X. A escolha de quais
valores de amostra rotulamos de X é arbitrária.
5. Distribuição da estatística de teste. Os valores críticos da distribuição da estatística de teste
são dados na Tabela L do Apêndice para vários níveis de a.
6. Regra de decisão. Se a mediana da população X for, de fato, menor que a mediana da

população Y, conforme especificado na hipótese alternativa, esperaríamos (para tamanhos
de amostra iguais) a soma dos postos atribuídos
para que as observações da população X sejam menores que a soma das

classificações atribuídas às observações da população Y. A estatística de teste é
baseada neste raciocínio de forma que um valor suficientemente pequeno de T
causará a rejeição de H0 : MX MY . Em geral, para testes
unilaterais do tipo ilustrado aqui, a regra de decisão é:
Rejeitar H0 : MX ¼ MY se o T calculado for menor que wa, onde wa é o valor crítico de T

obtido entrando na Tabela L do Apêndice com n, o número de X observações; m, o número
de Y observações; e a, o nível de significância escolhido.
Se usarmos o procedimento de Mann-Whitney para testar
H0 : MX MEU
contra
HA : MX > MEU
Valores suficientemente grandes de T causarão rejeição de modo que a regra de decisão

seja:
Rejeitar H0 : MX MY se T calculado for maior que w1a, onde

w1a ¼ nm wa.
Para a situação de teste bilateral com
H0 : MX ¼ MEU
HA : MX 6¼ MEU
valores calculados de T que são suficientemente grandes ou suficientemente pequenos

causarão a rejeição de H0. A regra de decisão para este caso, então, é:
Rejeitar H0 : MX ¼ MY se o valor calculado de T for menor que wa=2 ou maior

que w1ð Þ a=2 onde wa=2 é o valor crítico de T para n, m e a=2 dado na Tabela
do Apêndice L, e w1ð Þ a=2 ¼ nm wa=2.
Para este exemplo, a regra de decisão é:
Rejeitar H0 se o valor calculado de T for menor que 45, o valor crítico da estatística de teste
para n ¼ 15; m ¼ 10 e ¼ :05 encontrados na Tabela L.
As regiões de rejeição para cada conjunto de hipóteses são mostradas na Figura 13.6.1.
7. Cálculo da estatística de teste. Para o nosso presente exemplo temos, como

mostrado na Tabela 13.6.2, S ¼ 145, de modo que
15 15 ð Þ þ 1
T ¼ 145 ¼ 25 2
FIGURA 13.6.1 Regiões de rejeição do teste de Mann-Whitney para três conjuntos de hipóteses.
8. Decisão estatística. Quando entramos na Tabela L com n ¼ 15; m ¼ 10 e a ¼ :05, descobrimos

que o valor crítico de wa é 45. Como 25 < 45, rejeitamos H0.
9. Conclusão. Concluímos que MX é menor que MY. Isso leva à conclusão de que a inalação
prolongada de óxido de cádmio reduz o nível de hemoglobina. 10. valor p. Como 22 < 25 <
30, temos para este teste :005 > p > :001. &
Aproximação para amostras grandes Quando n ou m é maior que 20, não podemos usar a Tabela L do Apêndice
para obter valores críticos para o teste de Mann-Whitney. Quando este for o caso, podemos calcular
T mn = 2 p
z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
(13.6.2)
nm nð Þ þ m þ 1j =12
e compare o resultado, para significância, com valores críticos da distribuição normal padrão.
A estatística de Mann-Whitney e a estatística de Wilcoxon Como foi observado no início desta seção, o teste de
Mann-Whitney é algumas vezes referido como o teste de Mann-Whitney.
Estatística Não Paramétrica Mann-Whitney MTB > Mann-Whitney 95,0 C1 C2;
SUBC > Alternativa 1.

Digite C1 na Primeira Amostra e C2 na Segunda Amostra.
Em Alternativa , escolha menos que.
Clique em OK.
Saída:
Teste de Mann-Whitney e IC: C1, C2
C1 N 15 Mediana 15.300
C2 N 10 Mediana 16.550
A estimativa pontual para ETA1 ETA2 é 1.300
95,1 CI percentual para ETA1 ETA2 é (2,300, 0,600)
C 145,0
Teste de ETA1 ETA2 x ETA1 ETA2 é significativo em 0,0030
O teste é significativo em 0,0030 (ajustado para empates)
Classificações
y N Classificação média Soma da classificação
x 1,000000 15 9,67 146,00

2,000000 10 18,00 180,00
Total 25
Estatística de testeb
UyentihW-nnaM 000,52
W noxocliW 000,541
Z 2,775
eliat-2( .giS .pmysA )d Exact 600.
Sig. [2*(Sig. de 1 cauda)] 0,004a
uma. Não corrigido para empates

b. Variável de agrupamento: y

Teste de Mann-Whitney-Wilcoxon. De fato, muitos pacotes de computador fornecem o valor de teste

tanto do teste de Mann-Whitney (U) quanto do teste de Wilcoxon (W). Esses dois testes são testes
algebricamente equivalentes e estão relacionados pela seguinte igualdade quando não há empates
nos dados:
m mð 2n þ 1 Þ
UþW¼ (13.6.3)
2
Análise de computador Muitos pacotes de software estatístico executam o teste de Mann-Whitney.

Com os dados de duas amostras armazenados nas Colunas 1 e 2, por exemplo, o MINITAB realizará
um teste unilateral ou bilateral. O procedimento e a saída do MINITAB para o Exemplo 13.6.1 são
mostrados na Figura 13.6.2.
A saída do SPSS para o Exemplo 13.6.1 é mostrada na Figura 13.6.3. Como vemos, esta saída
fornece o teste de Mann-Whitney, o teste de Wilcoxon e a aproximação z de grande amostra.
EXERCÍCIOS
13.6.1 Cranor e Christensen (A-4) estudaram diabéticos segurados por dois empregadores. Os indivíduos do grupo 1 foram
empregados pela cidade de Asheville, Carolina do Norte, e os indivíduos do grupo 2 foram empregados pelo Mission–
St. Joseph's Health System. No início do estudo, os pesquisadores realizaram o teste de Mann-Whitney para determinar
se existia uma diferença significativa de peso entre os dois grupos de estudo. Os dados são exibidos na tabela a seguir.
Peso (libras)
Grupo 1 Grupo 2
252 215 240 185 195 220

240 190 302 310 210 295
205 270 312 212 190 202
200 159 126 238 172 268
170 204 268 184 190 220
170 215 215 136 140 311
320 254 183 200 280 164
148 164 287 270 264 206
214 288 210 200 270 170
270 138 225 212 210 190
265 240 258 182 192
203 217 221 225 126
Fonte: Dados fornecidos por cortesia de Carole W. Carnor, Ph.D.
Podemos concluir, com base nesses dados, que os pacientes dos dois grupos diferem significativamente com relação
ao peso? Deixe um ¼ :05.
13.6.2 Um dos objetivos do estudo de Liu et al. (A-5) foi determinar os efeitos de MRZ 2/579 (um antagonista do receptor
mostrado para fornecer atividade neuroprotetora in vivo e in vitro) em
EXERCÍCIOS 697
em ratos Sprague-Dawley. No estudo, 10 ratos receberam MRZ 2/579 e nove ratos receberam soro fisiológico regular. Antes do
tratamento, os pesquisadores estudaram os níveis de gases no sangue nos dois grupos de ratos. A tabela a seguir mostra os
níveis de pO2 para os dois grupos.
Salina (mmHg) MRZ 2/579 (mmHg)
112,5 133,3
106,3 106,4
99,5 113,1
98,3 117,2
103,4 126,4
109,4 98,1
108,9 113,4
107,4 116,8
116,5
Fonte: Dados fornecidos por cortesia de Ludmila Belayev, MD
Podemos concluir, com base nesses dados, que, em geral, os indivíduos em solução salina têm, em média, níveis de pO2 mais
baixos na linha de base? Deixe um ¼ :01.
13.6.3 O objetivo de um estudo realizado por pesquisadores da Cleveland (Ohio) Clinic (A-6) foi determinar se o uso de Flomax® reduzia
os efeitos colaterais urinários comumente experimentados por pacientes após tratamento com braquiterapia (implante
permanente de semente radioativa) para câncer de próstata. A tabela a seguir mostra as pontuações do índice de sintomas da
American Urological Association (AUA) para dois grupos de indivíduos após 8 semanas de tratamento. Quanto maior o índice
AUA, mais grave é a obstrução e irritação urinária.
Índice AUA (Flomax®) Índice AUA (Placebo)
5 11 6 12
5 11 6 12
1 6 11 1 6 13
122 6 11 122 6 14
2 7 12 2 6 17
2 7 12 3 7 18
3 7 13 3 8 19
3 7 14 3 8 20
3 8 16 3 9 23
4 8 16 4 9 23
4 8 18 4 10
4 8 21 4 10
4 9 31 5 11
4 9 5 11
4 10 5 12
Fonte: Dados fornecidos por cortesia de Chandana Reddy, MS
Podemos concluir, com base nesses dados, que a mediana do índice AUA no grupo Flomax® difere significativamente da
mediana do índice AUA do grupo placebo? Deixe um ¼ :05.
13.7 O TESTE DE AJUSTE DE

KOLMOGOROV-SMIRNOV
Quando se deseja saber o quão bem a distribuição dos dados da amostra está de acordo com alguma
distribuição teórica, um teste conhecido como teste de qualidade de ajuste de Kolmogorov-Smirnov oferece
uma alternativa ao teste de qualidade de ajuste qui-quadrado discutido no Capítulo 12 O teste recebe o nome
de A. Kolmogorov e NV Smirnov, dois matemáticos russos que introduziram dois testes intimamente
relacionados na década de 1930.
O trabalho de Kolmogorov (6) está preocupado com o caso de uma amostra como discutido aqui.
O trabalho de Smirnov (7) trata do caso envolvendo duas amostras em que o interesse se concentra em
testar a hipótese de que as distribuições das populações biparentais são idênticas. O teste para a primeira
situação é freqüentemente chamado de teste de uma amostra de Kolmogorov-Smirnov. O teste para o caso
de duas amostras, comumente chamado de teste de duas amostras de Kolmogorov-Smirnov, não será
discutido aqui.
A estatística de teste Ao usar o teste de qualidade de ajuste de Kolmogorov–Smirnov, é feita uma comparação
entre alguma função de distribuição cumulativa teórica, FT(x), e uma função de distribuição cumulativa
amostral, FS(x). A amostra é uma amostra aleatória de uma população com função de distribuição cumulativa
desconhecida F(x). Será lembrado (Seção 4.2) que uma função de distribuição cumulativa dá a probabilidade
de que X seja igual ou menor que um valor particular, x. Ou seja, por meio da função de distribuição cumulativa
amostral, FS(x), podemos estimar P Xð Þ x .
Se houver uma concordância próxima entre as distribuições
cumulativas teórica e amostral, a hipótese de que a amostra foi extraída da população com a função de
distribuição cumulativa especificada, FT(x), é suportada. Se, no entanto, houver uma discrepância entre as
funções de distribuição cumulativas teóricas e observadas, grande demais para ser atribuída apenas ao
acaso, quando H0 for verdadeira, a hipótese será rejeitada.
A diferença entre a função de distribuição cumulativa teórica, FT(x), e a função de distribuição

cumulativa de amostra, FS(x), é medida pela estatística D, que é a maior distância vertical entre FS(x) e FT(x).
Quando um teste bilateral é apropriado, isto é, quando as hipóteses são
H0 : F xð Þ¼ FT ð Þx para todo x de 1 a þ1
HA : F xð Þ 6¼ FT ð Þx por pelo menos um x
a estatística de teste é
D ¼ sup jj FSð Þ x FT ð Þx (13.7.1)

x
que se lê, “D é igual ao supremo (maior), sobre todos os x, do valor absoluto da diferença FSð Þ X menos FT
ð Þ X .”
A hipótese nula é rejeitada no nível de significância a se o valor calculado de D exceder o valor
mostrado na Tabela M do Apêndice para 1 a (bilateral) e o tamanho da amostra n.
13.7 TESTE DE AJUSTE DE KOLMOGOROV-SMIRNOV 699
Suposições As suposições subjacentes ao teste de Kolmogorov-Smirnov incluem o seguinte:
1. A amostra é uma amostra aleatória.
2. A distribuição hipotética FT ð Þx é contínua.
Quando os valores de D são baseados em uma distribuição teórica discreta, o teste é conservador. Quando
o teste é usado com dados discretos, então, o investigador deve ter em mente que a verdadeira probabilidade de
cometer um erro tipo I é no máximo igual a a, o nível de significância declarado. O teste também é conservador se
um ou mais parâmetros tiverem que ser estimados a partir de dados de amostra.
EXEMPLO 13.7.1
As determinações de glicose no sangue em jejum feitas em 36 homens adultos não obesos, aparentemente
saudáveis, são mostradas na Tabela 13.7.1. Queremos saber se podemos concluir que esses dados não são de
uma população normalmente distribuída com média de 80 e desvio padrão de 6.
Solução:
2. Suposições. A amostra disponível é uma amostra aleatória simples de uma distribuição

populacional contínua.
3. Hipóteses. As hipóteses apropriadas são
H0 : F xð Þ¼ FT ð Þx para todo x de 1 a þ1
HA : F xð Þ 6¼ FT ð Þx por pelo menos um x
Deixe um ¼ :05.

5. Distribuição da estatística de teste. Valores críticos da estatística de teste para
os valores selecionados de a são fornecidos na Tabela M do Apêndice.
6. Regra de decisão. Rejeitar H0 se o valor calculado de D exceder 0,221, o valor crítico de D

para n ¼ 36 e a ¼ :05.
7. Cálculo da estatística de teste. Nosso primeiro passo é calcular os valores de FSð Þx

como mostrado na Tabela 13.7.2.
TABELA 13.7.1 Valores de glicose no sangue em jejum

(mg/100 ml) para 36 homens adultos não obesos,
aparentemente saudáveis
75 92 80 80 84 72
84 77 81 77 75 81
80 92 72 77 78 76
77 86 77 92 80 78
68 78 92 68 80 81
87 76 80 87 77 86
TABELA 13.7.2 Valores de FSð Þ x para o Exemplo

13.7.1
cumulativo
x frequência Frequência FSð Þ x
68 2 2 0,0556
72 2 4 .1111
75 2 6 .1667
76 2 8 .2222
77 6 14 .3889
78 3 17 0,4722
80 6 23 .6389
81 3 26 0,7222
84 2 28 0,7778
86 2 30 0,8333
87 2 32 0,8889
92 4 36 1,0000
36
Cada valor de FSð Þx é obtido dividindo a frequência cumulativa

correspondente pelo tamanho da amostra. Por exemplo, o primeiro valor
de FSð Þ¼ x 2=36 ¼ :0556.
Obtemos valores de FT ð Þx convertendo primeiro cada valor
observado de x em um valor da variável normal padrão, z. Na Tabela D
do Apêndice, encontramos a área entre 1 e z. A partir dessas áreas
podemos calcular os valores de FT ð Þx O .procedimento, que é semelhante
ao usado para obter frequências relativas esperadas no teste qui-quadrado
de ajuste, é resumido na Tabela 13.7.3.
TABELA 13.7.3 Passos no Cálculo de F T ð Þ x para o

Exemplo 13.7.1
x z ¼ ð Þ x 80 =6 F TðÞx
68 2:00 0,0228
72 1:33 0,0918
75 :83 .2033
76 :67 .2514
77 :50 .3085
78 :33 .3707
80 0,00 0,5000
81 .17 0,5675
84 .67 0,7486
86 1,00 0,8413
87 1.17 0,8790
92 2,00 0,9772
13.7 TESTE DE AJUSTE DE KOLMOGOROV–SMIRNOV 701
1,00
0,90
.80
.70
.60
Frequência
cumulativa
relativa
.50
.40
.30
.20
.10
68 70 72 74 76 78 80 82 84 86 88 90 92 94
FIGURA 13.7.1 FSð Þ x e F T ð Þ x para o Exemplo 13.7.1.
A estatística de teste D pode ser calculada algebricamente, ou pode

ser determinada graficamente medindo a maior distância vertical entre as
curvas de FSð Þx e FT ð Þx em um gráfico. Os gráficos das duas
distribuições são mostrados na Figura 13.7.1.
O exame dos gráficos de FSð Þx e FT ð Þx revela que D :16 ¼ ð Þ :72
:56 . Agora vamos
Tabelacalcular
13.7.4.
valores
o valor
de jde
FSð
D algebricamente.
Þ x FT ð Þx são Os
apresentados
possíveis na
j
Esta tabela mostra que o valor exato de D é 0,1547.
8. Decisão estatística. A referência à Tabela M revela que um D calculado de

0,1547 não é significativo em nenhum nível razoável. Portanto, não estamos
dispostos a rejeitar H0.
9. Conclusão. A amostra pode ter vindo da distribuição especificada. 10. valor
p. Como temos um teste bilateral, e como :1547 < :174, temos p > :20.
TABELA 13.7.4 Cálculo de j Fs ð Þ x F T ð Þ xj para o Exemplo

13.7.1
x Fs ð Þ x F TðÞx j Fs ð Þ x F TðÞ xj
68 0,0556 0,0228 0,0328

72 .1111 0,0918 0,0193
75 .1667 .2033 0,0366
76 .2222 .2514 0,0292
77 .3889 .3085 0,0804
78 0,4722 .3707 .1015
80 .6389 0,5000 .1389
81 0,7222 0,5675 .1547
84 0,7778 0,7486 0,0292
86 0,8333 0,8413 0,0080
87 0,8889 0,8790 .0099
92 1,0000 0,9772 0,0228
&
FIGURA 13.7.2 Saída StatXact para o Exemplo 13.7.1
O StatXact é frequentemente usado para análises estatísticas não paramétricas. Este

programa de software específico possui um módulo não paramétrico que contém quase todos os
testes não paramétricos comumente usados e muitos procedimentos menos comuns, mas também
úteis. A análise de computador usando StatXact para os dados do Exemplo 13.7.1 é mostrada na Figura 13.7.2.
Observe que ele fornece a estatística de teste de D ¼ 0:156 e o valor p bilateral exato de 0,3447.
A Precaução O leitor deve estar ciente de que, ao determinar o valor de D, nem sempre é suficiente
calcular e escolher entre os possíveis valores de Fj j Sð Þ x FT ð Þx .
A maior distância vertical entre FSð Þx e FT ð Þx pode não ocorrer em um valor observado, x, mas
em algum outro valor de X. Tal situação é ilustrada na Figura 13.7.3. Vemos que, se forem
considerados apenas
horizontais,
os valores
calcularemos
de j FSð Þincorretamente
j x FT ð Þx nas extremidades
D como jj :2 :4esquerdas
¼ :2. Pode-se
das barras
ver,
examinando o gráfico, no entanto, que a maior
no ponto
distância
extremidade
correspondente
verticaldireita
entrea xda
FSð
¼barra
:4,
Þxeehorizontal
oFT
valor
ð Þx
correto
ocorre
originada
denaD
é jj :5 :2 ¼ :3.
Pode-se determinar o valor correto de D algebricamente calculando, além das diferenças jj

FSð Þ x FT ð Þx , j as diferenças FSð
número
Þ xi1 FT
de ðvalores
Þ xi j para
diferentes
todos de
os valores
x e FSðde
Þ x0
r þ¼
1,0.
onde
i ¼ 1;
r ¼2;o...
;
O valor correto da estatística de teste será então
D ¼ máximo 1ir f máximo FSð Þ xi FT ð Þ xi jj; FSð Þ xi1 FT ð Þ xi jg

½j
(13.7.2)
EXERCÍCIOS 703
1,0
.9
.8
.7
.6
Frequência
cumulativa
relativa
.5
.4
.3
.2
.1
.2 .4 .5 .8 1,0
FIGURA 13.7.3 Gráfico de dados fictícios mostrando o cálculo correto de D.
Vantagens e Desvantagens A seguir estão alguns pontos importantes de comparação entre os testes de
qualidade de ajuste de Kolmogorov-Smirnov e qui-quadrado.
1. O teste de Kolmogorov-Smirnov não requer que as observações sejam agrupadas como é o caso do
teste qui-quadrado. A consequência dessa diferença é que o teste de Kolmogorov-Smirnov faz uso
de todas as informações presentes em um conjunto de dados.
2. O teste de Kolmogorov–Smirnov pode ser usado com amostras de qualquer tamanho. Deve-se
lembrar que certos tamanhos mínimos de amostra são necessários para o uso do teste do qui-quadrado.
3. Como foi observado, o teste de Kolmogorov-Smirnov não é aplicável quando os parâmetros devem
ser estimados a partir da amostra. O teste qui-quadrado pode ser utilizado nessas situações
reduzindo os graus de liberdade em 1 para cada parâmetro estimado.
4. O problema da suposição de uma distribuição teórica contínua já foi
sido mencionado.
EXERCÍCIOS
13.7.1 Os pesos na autópsia dos cérebros de 25 adultos que sofrem de uma determinada doença foram os seguintes:
Peso do cérebro (gramas)
859 1073 1041 1166 1117

962 1051 1064 1141 1202
973 1001 1016 1168 1255
904 1012 1002 1146 1233
920 1039 1086 1140 1348
Pode-se concluir a partir desses dados que a população amostrada não é normalmente distribuída com uma média de
1050 e um desvio padrão de 50? Determine o valor de p para este teste.
13.7.2 Os QIs de uma amostra de 30 adolescentes presos por abuso de drogas em uma determinada jurisdição metropolitana foram
do seguinte modo:
QI
95 100 91 106 109 110

98 104 97 100 107 119
92 106 103 106 105 112
101 91 105 102 101 110
101 95 102 104 107 118
Esses dados fornecem evidências suficientes de que a população amostrada de pontuações de QI não é normalmente
distribuída com uma média de 105 e um desvio padrão de 10? Determine o valor p.
13.7.3 Para uma amostra de indivíduos aparentemente normais que serviram como controles em um experimento, o seguinte
as leituras da pressão arterial sistólica foram registradas no início do experimento:
162 177 151 167 130 154 179

146 147 157 141 157 153 157
134 143
141 137 151 161
Pode-se concluir com base nesses dados que a população de pressões sanguíneas da qual a amostra foi extraída não é
normalmente distribuída com m ¼ 150 e s ¼ 12? Determine o valor p.
13.8 A ANÁLISE ÚNICA DE VARIÂNCIA DE KRUSKAL-WALLIS POR

CLASSIFICAÇÕES
No Capítulo 8, discutimos como a análise de variância unidirecional pode ser usada para testar a hipótese nula de que várias
médias populacionais são iguais. Quando os pressupostos subjacentes a essa técnica não são atendidos, ou seja, quando as
populações das quais as amostras são extraídas não são normalmente distribuídas com variâncias iguais, ou quando os dados
para análise consistem apenas em classificações, uma alternativa não paramétrica à análise unidirecional de variância pode ser
usado para testar a hipótese de parâmetros de localização iguais. Conforme apontado na Seção 13.5, o teste da mediana pode
ser estendido para acomodar a situação envolvendo mais de duas amostras. Uma deficiência desse teste, no entanto, é o fato
de usar apenas uma pequena quantidade das informações disponíveis. O teste usa apenas informações sobre se as observações
estão ou não acima ou abaixo de um único número, a mediana das amostras combinadas. O teste não usa diretamente medições
de quantidade conhecida. Vários análogos não paramétricos para análise de variância estão disponíveis que usam mais
informações levando em conta a magnitude de
13.8 A ANÁLISE ÚNICA DE VARIÂNCIA DE KRUSKAL-WALLIS POR NÍVEIS 705
cada observação em relação à magnitude de todas as outras observações. Talvez o mais conhecido
desses procedimentos seja a análise de variância unidirecional de Kruskal-Wallis por níveis (8).
O procedimento de Kruskal-Wallis A aplicação do teste envolve os seguintes passos.
1. O n1; n2; ... ; nk observações das k amostras são combinadas em uma única série de
tamanho n e organizadas em ordem de magnitude do menor para o maior.
As observações são então substituídas por níveis de 1, que é atribuído à menor observação, até n,
que é atribuído à maior observação. Quando duas ou mais observações têm o mesmo valor, cada
observação recebe a média das classificações para as quais está empatada.
2. As classificações atribuídas às observações em cada um dos k grupos são adicionadas separadamente para fornecer
k somas de classificação.
3. A estatística de teste
k R2j
12
H¼ 3ð Þ n þ 1 (13.8.1)
Xn
nð Þ þ 1 j¼1 nj
é computado. Na Equação 13.8.1,
k ¼ o número de amostras nj ¼ o
número de observações na jésima amostra n ¼ o número de
observações em todas as amostras combinadas
Rj ¼ da soma dos postos na j-ésima amostra
4. Quando houver três amostras e cinco ou menos observações em cada amostra, a significância do H
calculado é determinada consultando a Tabela N do Apêndice.
Quando há mais de cinco observações em uma ou mais das amostras, H é comparado com valores
tabulados de x2 com k 1 graus de liberdade.
EXEMPLO 13.8.1
Em um estudo de efeitos pulmonares em cobaias, Lacroix et al. (A-7) expôs cobaias sensibilizadas com
ovalbumina (OA) ao ar normal, benzaldeído ou acetaldeído.
No final da exposição, as cobaias foram anestesiadas e as respostas alérgicas foram avaliadas na lavagem
broncoalveolar (BAL). Uma das variáveis de resultado examinadas foi a contagem de células eosinófilas,
um tipo de glóbulo branco que pode aumentar com alergias. A Tabela 13.8.1 fornece a contagem de
células eosinófilas 106 para os três tratamentos
grupos.
Podemos concluir que as três populações representadas pelas três amostras diferem em relação à
contagem de células de eosinófilos? Podemos concluir se pudermos rejeitar a hipótese nula de que as três
populações não diferem na contagem de células de eosinófilos.
TABELA 13.8.1 Contagem de eosinófilos para

cobaias sensibilizadas com ovalbumina
Contagem de Células Eosinófilas ð106Þ
Ar benzaldeído acetaldeído
12.22 3,68 54,36

28.44 4.05 27.87
28.13 6.47 66,81
38,69 21.12 46,27
54,91 3.33 30.19
Fonte: Dados fornecidos por cortesia de G. Lacroix.
Solução:
2. Suposições. As amostras são amostras aleatórias independentes de suas respectivas

populações. A escala de medição empregada é pelo menos ordinal. As distribuições dos
valores nas populações amostradas são idênticas, exceto pela possibilidade de uma ou
mais populações serem compostas por valores que tendem a ser maiores que os das
outras populações.
3. Hipóteses.
H0: Os centros populacionais são todos iguais.
HA: Pelo menos uma das populações tende a exibir valores maiores
do que pelo menos uma das outras populações.
Deixe um ¼ :01.
5. Distribuição da estatística de teste. Os valores críticos de H para vários tamanhos de amostra

e níveis a são fornecidos na Tabela N do Apêndice.
6. Regra de decisão. A hipótese nula será rejeitada se o valor computado de H for tão grande
que a probabilidade de obter um valor tão grande ou maior quando H0 for verdadeiro for
igual ou menor que o nível de significância escolhido, a.
7. Cálculo da estatística de teste. Quando as três amostras são combinadas em uma única
série e classificadas, a tabela de classificações mostrada na Tabela 13.8.2 pode ser
construída.
A hipótese nula implica que as observações nas três amostras constituem uma única
amostra de tamanho 15 de uma única população.
Se isso for verdade, esperaríamos que as classificações fossem bem distribuídas entre os
três grupos. Consequentemente, esperaríamos que a soma total das classificações fosse
dividida entre os três grupos proporcionalmente ao tamanho do grupo.
13.8 A ANÁLISE ÚNICA DE VARIÂNCIA DE KRUSKAL-WALLIS POR NÍVEIS 707
TABELA 13.8.2 Os dados da Tabela 13.8.1

substituídos por classificações
52 13
93 7
84 15
11 6 12
14 1 10
R1 ¼ 47 R2 ¼ 16 R3 ¼ 57
Os desvios dessas condições são refletidos na magnitude das

estatísticas de teste H.
A partir dos dados da Tabela 13.8.2 e da Equação 13.8.1, obtemos
12 2 2 2
ð Þ 47 ð Þ 16 ð Þ 57
H¼
15 16 ð Þ "
5 º 5 º 5
3 15 ð Þ¼ þ 1 9:14
#
8. Decisão estatística. A Tabela N mostra que quando os nj são 5, 5 e 5, a

probabilidade de obter um valor de H ¼ 9:14 é menor que 0,009. A
hipótese nula pode ser rejeitada no nível de significância de 0,01.
9. Conclusão. Concluímos que existe uma diferença na contagem média
de células eosinófilas entre as três populações.
10. valor p. Para este teste, p < :009. &
Empates Quando ocorrem empates entre as observações, podemos ajustar o valor de H

dividindo-o por
1 PT
(13.8.2)
n3 n
3 onde T ¼ t t. A letra t é usada para designar o número de observações empatadas em um grupo de

valores empatados. Em nosso exemplo não há grupos de valores empatados, mas, em geral, pode
haver vários grupos de valores empatados resultando em vários valores de T.
O efeito do ajuste para empates é geralmente insignificante. Observe também que o
efeito do ajuste é aumentar H, de modo que se o H não ajustado for significativo no nível
escolhido, não há necessidade de aplicar o ajuste.
Mais de três amostras/amostras grandes Agora vamos ilustrar o

procedimento quando há mais de três amostras e pelo menos uma das nj
é maior que 5.
TABELA 13.8.3 Valor Líquido Contábil dos Equipamentos por Leito por Tipo de Hospital
Tipo Hospitalar
A BCDE
$ 1735 (11) $ 5260 (35) $ 2790 (20) $ 3475 (26) $ 6090 (40)
1520(2) 4455(28) 2400(12) 3115(22) 6000(38)
1476(1) 4480(29) 2655(16) 3050(21) 5894(37)
1688(7) 4325(27) 2500(13) 3125(23) 5705(36)
1702(10) 5075(32) 2755(19) 3275(24) 6050(39)
2667(17) 5225(34) 2592(14) 3300(25) 6150(41)
1575(4) 4613(30) 2601(15) 2730(18) 5110(33)
1602(5) 4887(31) 1648(6)
1530(3) 1700(9)
1698(8)
R1 ¼ 68 R2 ¼ 246 R3 ¼ 124 R4 ¼ 159 R5 ¼ 264
EXEMPLO 13.8.2
A Tabela 13.8.3 mostra o valor contábil líquido do capital do equipamento por leito para uma
amostra de hospitais de cada um dos cinco tipos de hospitais. Queremos determinar, por meio do
teste de Kruskal-Wallis, se podemos concluir que o valor contábil líquido médio do capital do
equipamento por leito difere entre os cinco tipos de hospitais. As classificações dos 41 valores,
junto com a soma das classificações para cada amostra, são mostradas na tabela.
Solução: Das somas dos postos calculamos
12 ðÞ
2
ð Þ 246
2
ð Þ 124
2
ð Þ 159
2
ð Þ 264
2
H¼ þ8 þ9 þ7 þ7 # 3 41 ð Þ þ 1
41 41 ð Þ þ 1 68 10
"
¼ 36:39
A referência à Tabela F do Apêndice com k 1 ¼ 4 graus de liberdade

indica que a probabilidade de obter um valor de H tão grande ou maior
que 36,39, devido apenas ao acaso, quando não há diferença entre as
populações, é menor que . 005. Concluímos, então, que existe diferença
entre as cinco populações com relação ao valor médio da variável de
interesse. &
Análise de computador O pacote de software MINITAB calcula a estatística do teste

Kruskal-Wallis e fornece informações adicionais. Após inserirmos as contagens de
eosinófilos na Tabela 13.8.1 na Coluna 1 e os códigos de grupo na Coluna 2, o
procedimento e saída do MINITAB são mostrados na Figura 13.8.1.
EXERCÍCIOS 709
Dados:
C1: 12,22 28,44 28,13 38,69 54,91 3,68 4,05 6,47 21,12 3,33 54,36 27,87 66,81 46,27 30,19
C2: 1 1 1112222233333
Estatística Não Paramétrica Kruskal–Wallis Tipo C1 em MTB > Kruskal–Wallis C1 C2.

Resposta e C2 em Fator. Clique em OK.
Saída:
Teste de Kruskal-Wallis: C1 versus C2
Teste de Kruskal-Wallis em C1
C2 N Classificação Média Média Z

1 5 28.440 9.4 0,86
2 5 4.050 3.2 -2,94
3 5 46.270 11.4 2.08
51llarevO 0,8
H = 9,14 DF = 2 P = 0,010
FIGURA 13.8.1 Procedimento e saída do MINITAB, teste de Kruskal-Wallis de dados de contagem de eosinófilos
na Tabela 13.8.1.
EXERCÍCIOS
Para os exercícios a seguir, faça o teste no nível de significância indicado e determine o valor de p.
13.8.1 Em um estudo de indivíduos saudáveis agrupados por idade (jovens: 19–50 anos, idosos: 65–75 anos e
longevos: 85–102 anos), Herrmann et al. (A-8) mediram seus níveis de vitamina B-12 (ng/L). Todos os
idosos residiam em casa e eram capazes de realizar atividades normais do dia-a-dia. A tabela a seguir
mostra os níveis de vitamina B-12 para 50 indivíduos no grupo jovem, 92 idosos e 90 indivíduos no grupo
longevo.
Jovem (19–50 anos) Sênior (65-75 anos) Longevidade (85–102 anos)
230 241 319 371 566 170 148 149 631 198
477 442 190 460 290 542 1941 409 305 321
561 491 461 440 271 282 128 229 393 2772
347 279 163 520 308 194 145 183 282 428
566 334 377 256 440 445 174 193 273 259
260 247 190 335 238 921 495 161 157 111
(Contínuo)
Jovem (19–50 anos) Sênior (65-75 anos) Longevidade (85–102 anos)
300 314 375 137 525 1192 460 400 1270 262
230 254 229 452 298 748 548 348 252 161
215 419 193 437 153 187 198 175 262 1113
260 335 294 236 323 350 165 540 381 409
349 455 740 432 205 1365 226 293 162 378
315 297 194 411 248 232 557 196 340 203
257 456 780 268 371 509 166 632 370 221
536 668 245 703 668 357 218 438 483 917
582 240 258 282 197 201 186 368 222 244
293 320 419 290 260 177 346 262 277
569 562 372 286 198 872 239 190 226
325 360 413 143 336 240 241 203
275 357 685 310 421 136 195 369
172 609 136 352 712 359 220 162
2000 740 441 262 461 715 164 95
240 430 423 404 631 252 279 178
235 645 617 380 1247 414 297 530
284 395 985 322 1033 372 474 334
883 302 170 340 285 236 375 521
Fonte: Dados fornecidos por cortesia de W. Herrmann e H. Schorr.
Podemos concluir, com base nesses dados, que as populações representadas por essas amostras diferem com relação
aos níveis de vitamina B-12? Deixe um ¼ :01.
13.8.2 As seguintes são despesas ambulatoriais ð Þ $ 100 feitos a pacientes para um determinado procedimento cirúrgico
por amostras de hospitais localizados em três áreas diferentes do país:
Área
EU II III
US$ US$ US$

80,75 78,15 58,63 72,70 84,21 101,76
85,40 64,20 107,74
71,94 62,50 115,30
82.05 63,24 126,15
Podemos concluir no nível de significância de 0,05 que as três áreas diferem com relação às cobranças?
13.8.3 Um estudo de crianças pequenas por Flexer et al. (A-9) publicado no Hearing Journal examina a eficácia de um campo
sonoro FM ao ensinar fonética para crianças. No estudo, crianças de uma sala sem treino de consciência fonológica ou
fonêmica (controle) foram comparadas a uma turma com consciência fonológica e fonêmica (APP) e a uma turma que
utilizou treino de consciência fonológica e fonêmica e campo sonoro FM (APP/ FM). Um total de 53 alunos de três salas
de pré-escola separadas participaram deste estudo. Os alunos receberam uma medida de consciência fonêmica na pré-
escola e depois no final do primeiro semestre do jardim de infância. As pontuações de melhoria estão listadas na tabela
a seguir, conforme medidas pelo Teste Yopp-Singer de Segmentação Fonêmica.
EXERCÍCIOS 711
Melhoria (Controle) Melhoria PPA Melhoria PPA/FM
0 1 2 119
1 1 320
0 2 3 15 7 21
1 2 18 9 21
4 19 5 20 97 5 9 13 18 0 11 22
36 17 22
17 15
17 17
8 18 17
9 18 19
18 20 19 22
0 19
Fonte: Dados fornecidos por cortesia de John P. Holcomb, Jr., Ph.D.
Teste para uma diferença significativa entre os três grupos. Deixe um ¼ :05.
13.8.4 Consulte o Exemplo 13.8.1. Outra variável de interesse para Lacroix et al. (A-7) foi o número de células alveolares
em três grupos de indivíduos expostos ao ar, benzaldeído ou acetaldeído. A tabela a seguir fornece as
informações para seis cobaias em cada um dos três grupos de tratamento.
Número de células alveolares ð106 Þ
0,55 0,81 0,65

0,48 0,56 13,69
7,8 1,11 17,11
8,72 0,74 7.43
0,65 0,77 5.48
1.51 0,83 0,99
0,55 0,81 0,65 cortesia de G. Lacroix.
Podemos concluir, com base nesses dados, que o número de células alveolares em cobaias sensibilizadas
com ovoalbumina difere com o tipo de exposição? Deixe um ¼ :05.
13.8.5 A tabela a seguir mostra os níveis de resíduos de pesticidas (ppb) em amostras de sangue de quatro populações
de seres humanos. Use o teste de Kruskal-Wallis para testar no nível de significância de 0,05 a hipótese nula
de que não há diferença entre as populações com relação ao nível médio de resíduo de pesticida.
População População
UMA B C D UMA CD B
10 4 15 7 44 11 9 4
37 35 5 11 12 7 11 5
12 32 10 10 15 32 9 2
(Contínuo)
População População
UMA B C D UMA CD B
31 19 12 8 42 17 14 6
11 33 6 2 23 8 15 3
9 18 6 5
13.8.6 A atividade hepática da g-glutamil transpeptidase (GGTP) foi medida em 22 pacientes submetidos a
biópsia hepática percutânea. Os resultados foram os seguintes:
Sujeito Diagnóstico Nível de GGTP hepático
fígado normal 27,7

12 Cirrose biliar primária 45,9
doença hepática alcoólica 85,3
5 fígado normal 25,8
6 hepatite persistente 39,6
7 hepatite crônica ativa 41,8
8 doença hepática alcoólica 64.1
9 hepatite persistente 41.1
11 doença hepática alcoólica 71,5
13 fígado normal 38.1
14 Cirrose biliar primária 40.4
16 doença hepática alcoólica 74,4
17 doença hepática alcoólica 78.2
19 hepatite crônica ativa 46.3
20 fígado normal 39,6
Podemos concluir a partir desses dados de amostra que o nível médio de GGTP da população difere entre os cinco
grupos de diagnóstico? Seja a ¼ :05 e encontre o valor de p.
13.9 A ANÁLISE DE DUAS VIAS DE FRIEDMAN DE VARIÂNCIA POR

CLASSIFICAÇÕES
Assim como podemos ocasionalmente precisar de um análogo não paramétrico para a análise de
variância paramétrica unidirecional, também podemos achar necessário analisar os dados em uma
classificação de duas vias por métodos não paramétricos análogos à análise de variância de duas vias. .
Essa necessidade pode surgir porque as suposições necessárias para a análise paramétrica de
variância não são atendidas, porque a escala de medição empregada é fraca ou porque os resultados
13.9 A ANÁLISE DE DUAS VIAS DE FRIEDMAN DE VARIÂNCIA POR NÍVEIS 713
são necessários com pressa. Um teste freqüentemente empregado nessas circunstâncias é a análise bidirecional
de Friedman de variância por níveis (9,10). Este teste é apropriado sempre que os dados são medidos em, pelo
menos, uma escala ordinal e podem ser significativamente organizados em uma classificação de duas vias, como
é dado para o experimento de blocos aleatórios discutido no Capítulo 8. O exemplo a seguir ilustra este
procedimento.
EXEMPLO 13.9.1
Um fisioterapeuta realizou um estudo para comparar três modelos de estimuladores elétricos de baixa voltagem.
Nove outros fisioterapeutas foram solicitados a classificar os estimuladores em ordem de preferência. Uma
classificação de 1 indica a primeira preferência. Os resultados são apresentados na Tabela 13.9.1. Queremos
saber se podemos concluir que os modelos não são preferidos igualmente.
Solução:
2. Suposições. As observações que aparecem em um determinado bloco são independentes

das observações que aparecem em cada um dos outros blocos e, dentro de cada bloco, a
medição em pelo menos uma escala ordinal é alcançada.
3. Hipótese. Em geral, as hipóteses são:

H0: Todos os tratamentos têm efeitos idênticos.
HA: Pelo menos um tratamento tende a produzir observações maiores do que
pelo menos um dos outros tratamentos.
Para o nosso presente exemplo, enunciamos as hipóteses da seguinte forma:

H0: Os três modelos são igualmente preferidos.
HA: Os três modelos não são igualmente preferidos.
Deixe um ¼ :05.
TABELA 13.9.1 Classificações dos fisioterapeutas de três

modelos de estimuladores elétricos de baixa voltagem
Modelo
Terapeuta UMA B C
1 231
2 231
3 231
4 132
5 321
6 123
7 231
8 132
9 132
RJ 15 25 14
4. Estatística de teste. Por meio do teste de Friedman poderemos determinar se é razoável supor que
as colunas de postos foram extraídas da mesma população. Se a hipótese nula for verdadeira,
esperaríamos que a distribuição observada de classificações dentro de qualquer coluna fosse o

resultado de fatores aleatórios e, portanto, esperaríamos que os números 1, 2 e 3 ocorressem
com aproximadamente a mesma frequência em cada coluna. Se, por outro lado, a hipótese nula
for falsa (isto é, os modelos não são igualmente preferidos), esperaríamos uma preponderância
de classificações relativamente altas (ou baixas) em pelo menos uma coluna. Essa condição se
refletiria nas somas dos postos. O teste de Friedman nos dirá se as somas observadas dos postos
são ou não tão discrepantes que não é provável que sejam resultado do acaso quando H0 é
verdadeira.
Como os dados já consistem em classificações dentro de blocos (linhas), nosso primeiro

passo é somar as classificações dentro de cada coluna (tratamento). Essas somas são os Rj
mostrados na Tabela 13.9.1. Uma estatística de teste, denotada por Friedman como x2
r, é calculado da seguinte forma:
12 k
2
x2r ¼
X nk RJ 3n kð Þ þ 1 (13.9.1)
kð Þ þ 1
j¼1
onde n ¼ o número de linhas (blocos) e k ¼ o número de colunas (tratamentos).
5. Distribuição da estatística de teste. Valores críticos para vários valores de n e k são fornecidos na
Tabela O do Apêndice.
6. Regra de decisão. Rejeite H0 se a probabilidade de obter (quando H0 for verdadeiro) um valor de

x2 tão grande ou maior do
r
que realmente computado for menor ou igual a a.
7. Cálculo da estatística de teste. Usando os dados da Tabela 13.9.1 e das Equações 13.9.1, calculamos
12
2 2 2
x2r ¼
ð Þ 15 þ ð Þ 25 þ ð Þ 14 3 9ð Þð Þ¼ 3 þ 1 8:222
9 3ð Þð Þ 3 þ 1 h eu
8. Decisão estatística. Quando consultamos a Tabela Oa do Apêndice, descobrimos que a probabilidade

de obter um valor de x2 tão grande quanto 8,222 devido
r éapenas
verdadeira,
ao acaso,
é de 0,016.
quandoPodemos,
a hipótese nula
portanto, rejeitar a hipótese nula.
9. Conclusão. Concluímos que os três modelos de sistemas elétricos de baixa tensão

estimulador não são igualmente preferidos.

&
Empates Quando os dados originais consistem em medições em um intervalo ou uma escala de proporção em vez de
classificações, as medições recebem classificações com base em suas magnitudes relativas dentro dos blocos. Se
ocorrerem empates, cada valor recebe a média das classificações para as quais está empatado.
13.9 A ANÁLISE DE DUAS VIAS DE FRIEDMAN DE VARIÂNCIA POR NÍVEIS 715
Amostras Grandes Quando os valores de k e/ou n excedem os dados na Tabela O, o valor crítico de x2 é obtido
consultando a tabela x2r (Tabela F) com os a e k 1 graus de liberdade escolhidos.
EXEMPLO 13.9.2
A Tabela 13.9.2 mostra as respostas, em porcentagem de diminuição do fluxo salivar, de 16 animais experimentais
seguindo diferentes níveis de dosagem de atropina. As classificações (entre parênteses) e a soma das classificações
também são fornecidas na tabela. Queremos ver se podemos concluir que os diferentes níveis de dose produzem
respostas diferentes. Ou seja, desejamos testar a hipótese nula de nenhuma diferença na resposta entre os quatro
níveis de dose.
Solução: A partir dos dados, calculamos

12
2 2 2 2
x2r ¼ ðÞ þ ð Þ 36:5 þ ð Þ 44 þ ð Þ 59:5 3 16 ð Þð Þ¼ 4 þ 1 30:32
20 16 4ð Þð Þ 4 þ 1
A referência à Tabela F indica que com k 1 ¼ 3 graus de liberdade, a probabilidade de

obter um valor de x2 tão grande quanto 30,32 devido
r
menor
apenas
que ao
0,005.
acaso
Rejeitamos
é, quandoa H0
hipótese
é verdadeira,
nula e
concluímos que os diferentes níveis de dose produzem respostas diferentes.
TABELA 13.9.2 Redução percentual no fluxo salivar de animais experimentais

após diferentes níveis de dosagem de atropina
Nível de Dose
Animal Número A B C D
1 29(1) 48(2) 75(3) 100(4)

2 72(2) 30(1) 100(3.5) 100(3.5)
3 70(1) 100(4) 86(2) 96(3)
4 54(2) 35(1) 90(3) 99(4)
5 5(1) 43(3) 32(2) 81(4)
6 17(1) 40(2) 76(3) 81(4)
7 74(1) 100(3) 100(3) 100(3)
8 6(1) 34(2) 60(3) 81(4)
9 16(1) 39(2) 73(3) 79(4)
10 52(2) 34(1) 88(3) 96(4)
11 8(1) 42(3) 31(2) 79(4)
12 29(1) 47(2) 72(3) 99(4)
13 71(1) 100(3,5) 97(2) 100(3,5)
14 7(1) 33(2) 58(3) 79(4)
15 68(1) 99(4) 84(2) 93(3)
16 70(2) 30(1) 99(3.5) 99(3.5)
RJ 20 36,5 44 59,5
&
Estatística Não Paramétrica Friedman BTT > FRIEDMAN C3 C1 C2
Digite C3 em Resposta, C1 em Tratamento e C2 em Blocos. Clique

em OK.
Saída:
Teste de Friedman: C3 versus C1 bloqueado por C2
S 8,22 df 2p 0,017
Husa. Soma de
C1 N Mediana CLASSIFICAÇÕES
1 9 2,0000 15,0
2 9 2.6667 25,0
3 9 1.3333 14,0
grande mediana 2,0000
Análise de computador Muitos pacotes de software estatístico, incluindo o MINITAB, realizarão o teste
de Friedman. Para usar o MINITAB, formamos três colunas de dados. Podemos, por exemplo,
configurar as colunas para que a Coluna 1 contenha números que indiquem o tratamento a que
pertencem as observações, a Coluna 2 contenha números que indiquem os blocos a que pertencem
as observações e a Coluna 3 contenha as observações. Se fizermos isso para o Exemplo 13.9.1, o
procedimento e a saída do MINITAB serão mostrados na Figura 13.9.1.
EXERCÍCIOS
Para os exercícios a seguir, execute o teste no nível de significância indicado e determine o valor de p.
13.9.1 A tabela a seguir mostra as notas de nove estudantes de enfermagem selecionadas aleatoriamente em exames finais
em três áreas disciplinares:
Área da matéria
Aluna
Número Fundamentos Fisiologia Anatomia
1 98 95 77
2 95 71 79
(Contínuo)
EXERCÍCIOS 717
Área da matéria
Aluna
Número Fundamentos Fisiologia Anatomia
3 76 80 91
4 95 81 84
5 83 77 80
6 99 70 93
7 82 80 87
8 75 72 81
9 88 81 83
Teste a hipótese nula de que os estudantes de enfermagem que constituem a população da qual a amostra acima foi extraída
têm um desempenho igualmente bom em todas as três áreas disciplinares contra a hipótese alternativa de que eles têm um
desempenho melhor em pelo menos uma área. Deixe um ¼ :05.
13.9.2 Quinze estudantes de fisioterapia selecionados aleatoriamente receberam as seguintes instruções: “Suponha que você
vai se casar com uma pessoa com uma das seguintes deficiências (as deficiências foram listadas e designadas pelas
letras A a J). Classifique essas desvantagens de 1 a 10 de acordo com sua primeira, segunda, terceira (e assim por
diante) escolha de uma desvantagem para seu cônjuge. Os resultados são mostrados na tabela a seguir.
Handicap
Nº Aluno ABCDE FGHI J
1 1 5 9 8 2 4 6 7 10
2 1 34 5 7 8 2 6 9 10
2 7 8 9 1 34 6 5 10
34 1 34 7 8 9 2 3 6 5 10
5 1 4 7 8 10 2 3 6 5 9
6 2 3 7 9 8 1 4 5 6 10
7 2 4 6 9 8 1 3 7 5 10
8 1 5 7 9 10 2 3 4 6 8
9 1 4 5 7 8 2 3 6 9 10
10 2 3 6 8 9 1 4 7 5 10
11 2 4 5 8 9 1 3 7 6 10
12 2 3 6 8 10 1 4 5 7 9
13 3 2 6 9 8 1 4 7 5 10
14 2 5 7 8 9 1 3 4 6 10
15 2 3 6 7 8 1 5 4 9 10
Teste a hipótese nula de não preferência por handicaps contra a alternativa de que alguns handicaps são preferidos
em detrimento de outros. Deixe um ¼ :05.
13.9.3 Dez indivíduos com asma induzida por exercício participaram de um experimento para comparar o efeito protetor de um
medicamento administrado em quatro doses. A solução salina foi usada como controle. A variável de interesse foi a
alteração do VEF1 após a administração do medicamento ou solução salina. Os resultados foram os seguintes:
Nível de Dose do Medicamento (mg/ml)
Sujeito Salina 2 10 20 40
1 :68 :32 :14 :21 :32

2 1:55 :56 :31 :21 :16
3 1:41 :28 :11 :08 :83
4 :76 :56 :24 :41 :08
5 :48 :25 :17 :04 :18
6 3:12 1:99 1:22 :55 :75
7 1:16 :88 :87 :54 :84
8 1:15 :31 :18 :07 :09
9 :78 :24 :39 :11 :51
10 2:12 :35 :28 þ:11 :41
Pode-se concluir com base nesses dados que diferentes níveis de dosagem têm efeitos diferentes?
Seja a ¼ :05 e encontre o valor de p.
13.10 COEFICIENTE DE CORRELAÇÃO DE POSTOS

DE SPEARMAN
Várias medidas não paramétricas de correlação estão disponíveis para o pesquisador. Dentre eles,
um procedimento frequentemente utilizado e atrativo pela simplicidade dos cálculos envolvidos deve-
se a Spearman (11). A medida de correlação calculada por este método é chamada de coeficiente de
correlação de postos de Spearman e é designada por rs. Este procedimento faz uso dos dois conjuntos
de postos que podem ser atribuídos aos valores amostrais de X e Y, as variáveis independentes e
contínuas de uma distribuição bivariada.
Hipóteses As hipóteses normalmente testadas e suas alternativas são as seguintes:
(a) H0: X e Y são mutuamente independentes.

HA: X e Y não são mutuamente independentes.
(b) H0: X e Y são mutuamente independentes.
HA: Há uma tendência de grandes valores de X e grandes valores de Y serem pareados
junto. (c)
H0: X e Y são mutuamente independentes.
HA: Há uma tendência de grandes valores de X serem pareados com pequenos valores de Y.
As hipóteses especificadas em (a) levam a um teste bilateral e são usadas quando se deseja
detectar qualquer afastamento da independência. Os testes unilaterais indicados por (b) e (c) são
usados, respectivamente, quando os investigadores desejam saber se podem concluir que as variáveis
estão direta ou inversamente correlacionadas.
O Procedimento O procedimento de teste de hipóteses envolve os seguintes passos.
1. Classifique os valores de X de 1 a n (número de pares de valores de X e Y na amostra).

Classifique os valores de Y de 1 a n.
13.10 O COEFICIENTE DE CORRELAÇÃO DE CLASSIFICAÇÃO DE SPEARMAN 719
2. Calcule di para cada par de observações subtraindo o posto de Yi do

posto de Xi.
3. Eleve ao quadrado cada di e calcule Pd2 eu , a soma dos valores ao quadrado.

4. Calcule
6 Pd2 2 eu
rs ¼ 1 (13.10.1)
nð Þ1 n
5. Se n estiver entre 4 e 30, compare o valor calculado de rs com os valores críticos, r s,

da Tabela P do Apêndice. Para o teste bilateral, H0 é rejeitada no nível de significância a se rs for
oucoluna
maior que r na interseçãos da menor que rs , onde r
s
encabeçado a=2 e a linha correspondente a n. Para o teste unilateral com HA especificando
correlação direta, H0 é rejeitada no nível de significância a se rs for maior que r para a e n. A hipótese
s nula
é rejeitada no nível de significância a no outro teste unilateral se rs for menor que r
para a e n.
s
6. Se n for maior que 30, pode-se calcular

z ¼ rs n 1 p (13.10.2)
e use a Tabela D do Apêndice para obter valores críticos.

7. Observações empatadas apresentam um problema. O uso da Tabela P é estritamente válido apenas
quando os dados não contêm nenhum empate (a menos que algum procedimento aleatório para
desempate seja empregado). Na prática, no entanto, a tabela é freqüentemente usada depois que
algum outro método para lidar com empates foi empregado. Se o número de empates for grande, a
seguinte correção para empates pode ser empregada:
3t t
T¼ (13.10.3)
12
onde t ¼ o número de observações que estão empatadas para alguma classificação particular.
Quando esse fator de correção é usado, rs é calculado a partir
Px2 þ Py2 Pd2 eu
rs ¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
(13.10.4)
2 Px2 Py2 p
em vez da Equação 13.10.1.
Na Equação 13.10.4,
n3 n
Px2 ¼ XTx
12
n3 n
Py2 ¼ XTy
12
Tx ¼ da soma dos valores de T para os vários postos empatados em X

Ty ¼ da soma dos valores de T para as várias classificações empatadas em Y
A maioria das autoridades concorda que, a menos que o número de empates seja excessivo, a correção faz
pouca diferença no valor de rs. Quando o número de laços é pequeno, podemos seguir o
procedimento usual de atribuir às observações empatadas a média dos postos para os quais elas estão
empatadas e prossiga com os passos 2 a 6.
EXEMPLO 13.10.1
Em um estudo sobre a relação entre a idade e o EEG, foram coletados dados de 20 indivíduos com idades
entre 20 e 60 anos. A Tabela 13.10.1 mostra a idade e um determinado valor de saída de EEG para cada
um dos 20 indivíduos. O investigador deseja saber se pode ser concluído que esta saída particular de
EEG está inversamente correlacionada com a idade.
Solução:
2. Suposições. Assumimos que a amostra disponível para análise é uma amostra

aleatória simples e que tanto X quanto Ya são medidos pelo menos na escala ordinal.
3. Hipóteses.
H0: Esta saída de EEG e idade são mutuamente independentes.
HA: Há uma tendência para que essa saída de EEG diminua com a idade.
Suponha que deixamos um ¼ :05.
TABELA 13.10.1 Idade e valor de saída de EEG para

20 indivíduos
Sujeito Saída EEG

Número Idade (X) Valor (S)
1 20 98
2 21 75
3 22 95
4 24 100
5 27 99
6 30 65
7 31 64
8 33 70
9 35 85
10 38 74
11 40 68
12 42 66
13 44 71
14 46 62
15 48 69
16 51 54
17 53 63
18 55 52
19 58 67
20 60 55
4. Estatística de teste. Veja a Equação 13.10.1.

5. Distribuição da estatística de teste. Os valores críticos da estatística de teste são
dados no Apêndice Tabela P.
6. Regra de decisão. Para o presente teste, rejeitaremos H0 se o valor calculado de
rs for menor que :3789.
7. Cálculo da estatística de teste. Quando os valores X e Y são classificados, somos
têm os resultados mostrados na Tabela 13.10.2. O di, e Pd2 mostrados
eu , eu
d2 na mesma tabela.
A substituição dos dados da Tabela 13.10.2 na Equação 13.10.1 fornece
6 2340 ð Þ
rs ¼ 1 ¼ :76
2
20½ð Þ 1
20 8. Decisão estatística. Como nosso rs calculado ¼ :76 é menor que o, rejeitamos

crítico r s, a hipótese nula.
9. Conclusão. Concluímos que as duas variáveis estão inversamente relacionadas.

10. valor p. Como :76 < 0:6586, temos para este teste p < :001.
TABELA 13.10.2 Classificações para Dados do Exemplo 13.10.1
Sujeito
Número Classificação (X) Classificação (Y)
di d2 eu
1 118 17 289
2 215 13 169
3 317 14 196
4 420 16 256
5 519 14 196
6 67 1 1
7 7 6 11
8 812 4 16
9 916 7 49
10 10 14 4 16
11 11 10 1 1
12 12 8 4 16
13 13 13 0 0
14 14 4 10 100
15 15 11 4 16
16 16 2 14 196
17 17 5 12 144
18 18 1 17 289
19 19 9 10 100
20 20 3 17 289
Pd2 ¼ 2340
eu
&
Vamos agora ilustrar o procedimento para uma amostra com n > 30 e algumas observações empatadas.
EXEMPLO 13.10.2
Na Tabela 13.10.3 são mostradas as idades e concentrações (ppm) de um determinado mineral no tecido de 35
indivíduos nos quais foram realizadas autópsias como parte de um grande projeto de pesquisa.
As fileiras, di, d2 eu , e Pd2 são mostrados na Tabela 13.10.4. Vamos testar, no nível 0,05 de
eu
significância, a hipótese nula de que X e Y são mutuamente independentes contra a alternativa bilateral de que
eles não são mutuamente independentes.
Solução: A partir dos dados da Tabela 13.10.4 calculamos
6 1788 ð Þ :5
rs ¼ 1 ¼ :75
2
35 ð Þ 35 1
Para testar a significância de rs , calculamos
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
35 1 p ¼ 4:37 z ¼ :75
TABELA 13.10.3 Idade e concentração de minerais (ppm) em tecidos de 35 indivíduos
Mineral Mineral
Sujeito Era Concentração Sujeito Era Concentração
Número (X) (Y) Número (X) (Y)
1 82 169,62 19 50 4,48
2 85 48,94 20 71 46,93
3 83 41.16 21 54 30.91
4 64 63,95 22 62 34.27
5 82 21.09 23 47 41,44
6 53 5.40 24 66 109,88
7 26 6.33 25 34 2,78
8 47 4.26 26 46 4.17
9 37 3.62 27 27 6.57
10 49 4,82 28 54 61,73
11 65 108.22 29 72 47,59
12 40 10.20 30 41 10.46
13 32 2.69 31 35 3.06
14 50 6.16 32 75 49,57
15 62 23.87 33 50 5,55
16 33 2,70 34 76 50,23
17 36 3.15 35 28 6.81
18 53 60,59
TABELA 13.10.4 Classificações para Dados do Exemplo 13.10.2
Sujeito Classificação Classificação Sujeito Classificação Classificação
Número (X) (Y) di d2 eu Número (X) (Y) di d2 eu
1 32,5 35 2:5 6.25 19 17 9 8 64,00

2 35 27 8 64,00 20 28 25 3 9h00
3 34 23 11 121,00 21 21.5 21 .5 .25
4 25 32 7 49,00 22 23,5 22 1,5 2.25
5 32,5 19 13,5 182,25 23 13.5 24 10:5 110,25
6 19.5 11 8.5 72,25 24 27 34 7 49,00
7 114 13 169,00 25 6 3 3 9h00
8 13.5 8 5.5 30.25 26 12 7 5 25h00
9 9 6 3 9h00 27 2 15 13 169,00
10 15 10 5 25h00 28 21.5 31 9:5 90,25
11 26 33 7 49,00 29 29 26 3 9h00
12 10 17 7 49,00 30 11 18 7 49,00
13 4 1 3 9h00 31 7 4 3 9h00
14 17 13 4 16h00 32 30 28 2 4,00
15 23,5 20 3.5 12h25 33 17 12 5 25h00
16 5 2 3 9h00 34 31 29 2 4,00
17 8 5 3 9h00 35 3 16 13 169,00
18 19.5 30 10:5 110,25
Pd2 eu ¼ 1788:5
Como 4,37 é maior que z ¼ 3:89; p < 2ð Þ¼ :0001 :0002, e rejeitamos H0 e

concluímos que as duas variáveis em estudo não são mutuamente independentes.
Para fins comparativos, vamos corrigir os empates usando a Equação 13.10.3

e, em seguida, calcular pela Equação 13.10.4 .
Nos rankings de X tivemos seis grupos de empates que foram desfeitos
atribuindo-se os valores 13,5, 17, 19,5, 21,5, 23,5 e 32,5. Em cinco dos grupos, duas
observações empataram e, em um grupo, três observações empataram. Portanto,
calculamos cinco valores de
23 2 6
Tx ¼ ¼ ¼ :5
12 12
e um valor de
33 3 24
Tx ¼ ¼ ¼2
12 12
A partir desses cálculos, temos PTx ¼ 5ð Þþ :5 2 ¼ 4:5, de modo que
352 35
4:5 ¼ 3565:5
Xx2 ¼ 12
Correlação estatística básica estatística MTB > CORRELAÇÃO C3 C4
Digite C3–C4 em Variáveis. Clique em OK.
Saída:
Correlações (Pearson)
Correlação de (X) Posto e (Y) Posto -0,759
FIGURA 13.10.1 Procedimento do MINITAB e saída para calcular o coeficiente de correlação de postos
de Spearman, Exemplo 13.10.1.
Como não ocorreram empates no ranking Y, temos PTy ¼ 0 e 353 35
0 ¼ 3570:0
Xy2 ¼ 12
Da Tabela 13.10.4 temos Pd2 ¼ 1788:5. A partir desses dados, podemos agora calcular pela eu
Equação 13.10.4
3565:5 þ 3570:0 1788:5 ¼ :75 rs

¼
2 p ð Þ 3565:5 ð Þ 3570
Vemos que neste caso a correção dos empates não faz diferença no valor de rs.
&
Análise de computador Podemos usar o MINITAB, bem como muitos outros pacotes de software estatístico, para
calcular o coeficiente de correlação de Spearman. Para usar o MINITAB, devemos primeiro fazer com que o
MINITAB classifique as observações e armazene as classificações em colunas separadas, uma para as
classificações X e outra para as classificações Y. Se classificarmos os valores de X e Y do Exemplo 13.10.1 e
armazená-los nas Colunas 3 e 4, podemos obter o coeficiente de correlação de postos de Spearman com o
procedimento mostrado na Figura 13.10.1. Outros pacotes de software como SAS® e SPSS, por exemplo,
classificam automaticamente as medições antes de calcular o coeficiente, eliminando assim uma etapa extra no
procedimento.
EXERCÍCIOS
Para os exercícios a seguir, execute o teste no nível de significância indicado e determine o valor de p.
13.10.1 A tabela a seguir mostra 15 áreas geográficas selecionadas aleatoriamente classificadas por densidade populacional e taxa de
mortalidade ajustada por idade. Podemos concluir no nível de significância de 0,05 que a densidade populacional e a taxa
de mortalidade ajustada por idade não são mutuamente independentes?
EXERCÍCIOS 725
Classificar por Classificar por
População Ajustado por idade População Ajustado por idade

Área Densidade (X) Taxa de mortalidade (Y) Área Densidade (X) Taxa de mortalidade (Y)
1 8 10 9 6 8
2 2 14 10 14 5
3 12 4117 6
4 4 15 12 1 2
5 9 11 13 13 9
6 3 114 15 3
7 10 12 15 11 13
85 7
13.10.2 A tabela a seguir mostra 10 comunidades classificadas por dentes cariados, perdidos ou obturados (DMF) por
100 crianças e concentração de flúor em ppm no abastecimento público de água:
Classificar por Classificar por
DMF Dentes Fluoreto DMF Dentes Fluoreto

por 100 Concentração por 100 Concentração
Comunidade Crianças (X) (Y) Comunidade Crianças (X) (Y)
1 8 1 64 7
2 9 3 71 10
3 7 4 85 6
4 3 9 96 5
5 2810 10 2
Esses dados fornecem evidências suficientes para indicar que o número de dentes DMF por 100 crianças tende
a diminuir à medida que a concentração de flúor aumenta? Deixe um ¼ :05.
13.10.3 O objetivo do estudo de Nozawa et al. (A-10) foi avaliar o resultado do reparo cirúrgico do defeito da
pars interarticularis por fixação segmentar com fio em adultos jovens com espondilólise lombar. Os
autores citam a literatura indicando que a fixação segmentar com fio tem sido bem-sucedida no
tratamento de não atletas com espondilólise e apontam que não havia informações sobre os resultados
desse tipo de cirurgia em atletas. Em um estudo retrospectivo de indivíduos submetidos à cirurgia
entre 1993 e 2000, os autores encontraram 20 indivíduos submetidos à cirurgia. A tabela a seguir
mostra a idade (anos) na cirurgia e a duração (meses) do acompanhamento desses pacientes.
Duração do Acompanhamento Era Duração do Acompanhamento Era

(Meses) (Anos) (Meses) (Anos)
103 37 38 27
68 27 36 31
62 12 34 24
60 18 30 23
60 18 19 14
(Contínuo)
Duração do Acompanhamento Era Duração do Acompanhamento Era

(Meses) (Anos) (Meses) (Anos)
54 28 19 23
49 25 19 18
44 20 19 29
42 18 17 24
41 30 16 27
Fonte: Satoshi Nozawa, Katsuji Shimizu, Kei Miyamoto e Mizuo Tanaka, “Repair of Pars Interarticularis
Defect by Segmental Wire Fixation in Young Athletes with Spondylolysis,” American Journal of Sports
Medicine, 31 (2003), pp.
Podemos concluir, com base nesses dados, que em uma população de sujeitos semelhantes existe uma associação entre
idade e tempo de seguimento? Deixe um ¼ :05.
13.10.4 Consulte o Exercício 13.10.3. Nozawa et ai. (A-10) também calculou a pontuação da Associação Ortopédica Japonesa para medir
a dor nas costas (JOA). Os resultados para os 20 indivíduos juntamente com a duração do acompanhamento são mostrados
na tabela a seguir. Quanto maior o número, menor o grau de dor.
Duração do Acompanhamento Duração do Acompanhamento

(Meses) JOA (Meses) JOA
103 21 38 13
68 14 36 24
62 26 34 21
60 24 30 22
60 13 19 25
54 24 19 23
49 22 19 20
44 23 19 21
42 18 17 25
41 24 16 21
Fonte: Satoshi Nozawa, Katsuji Shimizu, Kei Miyamoto e Mizuo Tanaka,

“Repair of Pars Interarticularis Defect by Segmental Wire Fixation in Young
Athletes with Spondylolysis,” American Journal of Sports Medicine, 31 (2003),
pp.
Podemos concluir com esses dados que, em geral, existe uma relação entre o tempo de seguimento e o escore JOA no
momento da operação? Deixe um ¼ :05.
13.10.5 Butz e outros. (A-11) estudaram o uso de ventilação não invasiva com pressão positiva em pacientes com esclerose lateral
amiotrófica. Eles avaliaram o benefício do procedimento nos sintomas, qualidade de vida e sobrevida dos pacientes. Duas
variáveis de interesse são PaCO2, pressão parcial de dióxido de carbono arterial, e PaO2, pressão parcial de oxigênio arterial.
A tabela a seguir mostra, para 30 indivíduos, os valores dessas variáveis (mm Hg) obtidos a partir de análises basais de
gases sanguíneos arteriais.
PaCO2 PaO2 PaCO2 PaO2 PaCO2 PaO2
40 101 54,5 80 34,5 86,5

47 69 54 72 40.1 74,7
(Contínuo)
13.11 ANÁLISE DE REGRESSÃO NÃO PARAMÉTRICA 727
PaCO2 PaO2 PaCO2 PaO2 PaCO2 PaO2
34 132 43 105 33 113 94

42 65 44,3 59,9 69,2 62,6 60,4
54 72 53,9 66,7 54,1 52,5
48 76 41,8 76,9
53,6 67,2 33 67 45,7 65,3
56,9 70,9 43.1 77,5 40,6 80.3
58 73 52.4 65,1 56,6 53.2
45 66 37,9 71 59 71,9
Fonte: M. Butz, KH Wollinsky, U. Widemuth-Catrinescu, A.

Sperfeld, S. Winter, HH Mehrkens, AC Ludolph e H.
Schreiber, “Efeitos longitudinais da ventilação de pressão positiva
não invasiva em pacientes com esclerose lateral amiotrófica”,
Ameri can Journal of Medical Rehabilitation, 82 (2003) 597–604.
Com base nestes dados podemos concluir que existe uma associação entre os valores de PaCO2 e PaO2 ? Deixe
um ¼ :05.
13.10.6 Dezessete pacientes com história de insuficiência cardíaca congestiva participaram de um estudo para avaliar os efeitos
do exercício em várias funções corporais. Durante um período de exercício, os seguintes dados foram coletados
sobre a alteração percentual na norepinefrina plasmática (Y) e a alteração percentual no consumo de oxigênio (X):
Assunto XY Assunto XY
1 500 525 475 10 50 60

2 130 390 325 11 175 105
325 190 325 12 130 148
34 90 13 76 75
5 14 200 250
6 205 295 15 174 102
7 200 180 16 201 151
8 75 74 17 125 130
9 230 420
Com base nestes dados pode-se concluir que existe uma associação entre as duas variáveis? Deixe um ¼ :05.
13.11 ANÁLISE DE REGRESSÃO

NÃO PARAMÉTRICA
Quando as suposições subjacentes à análise de regressão linear simples, conforme discutido no

Capítulo 9, não são atendidas, podemos empregar procedimentos não paramétricos. Nesta seção,
apresentamos estimadores de inclinação e interceptação que são alternativas fáceis de calcular aos
estimadores de mínimos quadrados descritos no Capítulo 9.
Theil's Slope Estimator Theil (12) propõe um método para obter uma estimativa pontual do coeficiente de
inclinação b. Assumimos que os dados estão em conformidade com o modelo de regressão clássico
yi ¼ b0 þ b1x1 þ ei; i ¼ 1; ... ; n
onde xi são constantes conhecidas, b0 e b1 são parâmetros desconhecidos e Yi é um valor observado

da variável aleatória contínua Y em xi. Para cada valor de xi, assumimos uma subpopulação de valores
de Y, e os ei são mutuamente independentes. Os xi são todos distintos (sem empates), e tomamos x1 <
x2 < < xn.
Os dados consistem em n pares de observações amostrais, x1; y1 ð Þ; x2; y2 ð Þ; ... ; xn; yn ð
Þ, onde o i-ésimo par representa as medições feitas na i-ésima unidade de associação.
Para obter o estimador de Theil de b1 , primeiro formamos todas as inclinações amostrais
possíveis Sij ¼ yj yi = xj xi , onde
por ib^
< j. Haverá valores N ¼ nC2 de Sij. O estimador de b1 que designamos
1 é a mediana dos valores de Sij . Isso é,
b^ 1 ¼ mediano Sij (13.11.1)
O exemplo a seguir ilustra o cálculo de b^ 1.
EXEMPLO 13.11.1
Na Tabela 13.11.1 estão os níveis plasmáticos de testosterona (ng/ml) (Y) e os níveis seminais de ácido
cítrico (mg/ml) em uma amostra de oito homens adultos. Desejamos calcular a estimativa do coeficiente
de inclinação da regressão populacional pelo método de Theil.
Solução: Os valores ordenados N ¼ 8C2 ¼ 28 de Sij são mostrados na Tabela 13.11.2.

Se considerarmos i ¼ 1 e j ¼ 2, os indicadores do primeiro e segundo valores de
Y e X na Tabela 13.11.1, podemos calcular S12 da seguinte forma:
S12 ¼ ð =ð
Þ 175
Þ¼230
278 421 :3846
Quando todas as inclinações são calculadas de maneira semelhante e ordenadas como

na Tabela 13.11.2, :3846 termina como o décimo valor na ordem
variedade.
A mediana dos valores Sij é 0,4878. Conseqüentemente, nossa estimativa do

coeficiente de inclinação populacional
1 b^ ¼ :4878.
TABELA 13.11.1 Testosterona plasmática e níveis seminais de ácido cítrico em homens adultos
Testosterona: 230 175 315 290 275 150 360 425

Ácido Cítrico: 421 278 618 482 465 105 550 750
13.11 ANÁLISE DE REGRESSÃO NÃO PARAMÉTRICA 729
TABELA 13.11.2 Valores Ordenados de Sij para o Exemplo

13.11.1
:6618 .5037
.1445 0,5263
.1838 .5297
.2532 .5348
.2614 .5637
.3216 0,5927
.3250 0,6801
.3472 0,8333
.3714 0,8824
.3846 .9836
.4118 1,0000
0,4264 1,0078
.4315 1,0227
.4719 1.0294
&
Um estimador do coeficiente de interceptação Dietz (13) recomenda dois estimadores de

interceptação. O primeiro, designado b^ b^ 1xi emMque
é ob^
é assume quedos
a mediana
estimador de os ntermos
Theil. termosdeyierro
0 1; são
É recomendado
simétricos1 em tornoode
quando 0. Se o pesquisador
pesquisador está disposto
não está disposto a a assumir uma distribuição simétrica de
termos de erro, Dietz recomenda o estimador b^ que é 0 2; M b^ 1xi termos. Ilustramos a mediana
das médias n nð Þ þ 1 =2 pairwise do cálculo yi de cada um no exemplo a seguir.
EXEMPLO 13.11.2
Consulte o Exemplo 13.11.1. Vamos calcular a^1; M e a^2;M dos dados sobre os níveis de
testosterona e ácido cítrico.
Solução: Os termos ordenados yi :4878xi são: 13,5396, 24,6362, 39,3916, 48,1730, 54,8804,
59,1500, 91,7100 e 98,7810. A mediana, 51,5267, é o estimador b^
0 1; M.
As 8 8ð Þ þ 1 =2 ¼ 36 médias ordenadas aos pares de yi :4878xi são
13.5396 49.2708 75,43

19.0879 51.5267 76.8307
24.6362 52.6248 78.9655
26.4656 53.6615 91,71
30.8563 54.8804 95.2455
32.0139 56.1603 98.781
34.21 57.0152
36.3448 58.1731
(Contínuo)
36.4046 59,15
39.3916 61.7086
39.7583 65.5508
41.8931 69.0863
43.7823 69.9415
47.136 73.2952
48.173 73.477
A mediana dessas médias, 53,1432, é o estimador a^2; M. A equação de

estimativa, então, é yi ¼ 53:1432 þ :4878xi se estivermos dispostos a assumir
que a distribuição dos termos de erro é simétrica em torno de 0. Se não
estivermos dispostos a assumir a simetria, a equação de estimativa é yi ¼
51:5267 þ :4878xi. &
EXERCÍCIOS
13.11.1 A seguir estão as frequências cardíacas (FC: batimentos/minuto) e os valores de consumo de oxigênio (VO2: cal/kg/24 h)
para nove lactentes com insuficiência cardíaca congestiva crônica:
HR(X): 163 164 156 151 152 167 165 153 155
VO2(Y): 53,9 57,4 41,0 40,0 42,0 64,4 59.1 49,9 43.2
Calcular b ^ 1; b^0 1;M; e b^ 0 2;M
13.11.2 A seguir estão os pesos corporais (gramas) e área de superfície total (cm2 ) de nove laboratórios
animais:
Peso corporal (X): 660,2 706,0 924,0 936,0 992,1 888,9 999,4 890,3 841,2
Área de superfície (Y): 781,7 888,7 1038,1 1040,0 1120,0 1071,5 1134,5 965,3 925,0
Calcule o estimador de inclinação e dois estimadores de interceptação.
13.12 RESUMO
Este capítulo trata de testes estatísticos não paramétricos. Estes testes podem ser utilizados
quando os pressupostos subjacentes aos testes paramétricos não se concretizam ou quando
os dados a analisar são medidos numa escala demasiado fraca para os procedimentos
aritméticos necessários aos testes paramétricos.
Nove testes não paramétricos são descritos e ilustrados. Com exceção do teste de
qualidade de ajuste de Kolmogorov-Smirnov, cada teste fornece uma alternativa não paramétrica
para um teste paramétrico bem conhecido. Há uma série de outros testes não paramétricos
disponíveis. O leitor interessado deve consultar os vários livros dedicados a métodos não
paramétricos, incluindo os de Gibbons (14) e Pett (15).
Fórmula
13.3.1 Estatística de teste de sinal

Pkxn; p ¼ Xx nCk pk qnk
k¼0
13.3.2 Aproximação de ð0:5n

Þþ k þ 0:5 n
z¼ ffiffiffi
; se k < 2
grande amostra do 0:5 np
teste de sinal
ð0:5n
Þ k 0:5 np n
z¼ ffiffiffi
; se k
2
13.6.1 Estatística do teste de n nð Þ þ 1

T¼S
Mann-Whitney 2
13.6.2 Aproximação de Tmn=2

Z¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
grande amostra do þ m þ 1 =12º

p nm nð
Teste de Mann-Whitney
13.6.3 Equivalência do Mann– m mð 2n þ 1 Þ

UþW¼
Estatísticas de duas amostras 2
de Whitney e Wilcoxon
13.7.1–13.7.2 Estatística de teste de D ¼ sup j Fsð Þ x FT ð Þx j

x
Kolmogorov-Smirnov
¼ máx . f ½j
max Fsð Þ xi FT ð Þ xi j; jFsð Þ xi1
1ir
FT ð Þjg xi1
13.8.1 Teste de Kruskal-Wallis 12 R2

j
estatística H¼ xk 3ð Þ n þ 1
n nð Þ þ 1 j¼1 nj
13.8.2 Teste de Kruskal-Wallis PT

1
ajuste estatístico para n3 n
empates
13.9.2 estatística de teste de Friedman 12 2

x2r ¼
xk RJ 3n kð Þ þ 1
nk kð Þ þ 1 j¼1
13.10.1 Estatística de teste de correlação de 6 Pd2 n eu
classificação de Spearman rs ¼ 1
2
nð Þ 1
13.10.2 Aproximação de z ¼ rs n 1 p
grande amostra do
Correlação de classificação de Spearman
13.10.3–13.10.4 Correção de empate 3t t

T¼
observações no 12
Correlação de classificação de Spearman
com
Px2 þ Py2 Pd2 eu
rs ¼ ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff
2 Px2 Py2 p
13.11.1 Theil's
b^ ¼ mediana Sf gi
estimador de b
Tecla de símbolo b^ ¼ estimador de Theil de b x2

ou X2 ¼ qui-quadrado
D ¼ Estatística do teste de Kolmogorov Smirnov
Fið Þ¼ x função de distribuição de i
H ¼ teste estatístico de Friedman
k ¼ estatística de teste de sinal e o número de colunas no teste de Friedman m ¼ tamanho
da amostra da menor de duas amostras n ¼ tamanho da amostra da maior de duas
amostras p ¼ probabilidade de sucesso q ¼ 1 p ¼ probabilidade de falha
R ¼ classificação
rs ¼ Coeficiente de correlação de postos de Spearman

S ¼ soma dos postos
Sij ¼ inclinação entre os pontos i e j sup

¼ ðmaiorÞ t supremo ¼ número de
observações empatadas
T ¼ correção para observações empatadas x
e y ¼ valor dos dados para variáveis x e y
U ¼ estatística do teste de MannWhitney
W ¼ estatística do teste de
Wilcoxon z ¼ variável normal
1. Definir estatísticas não paramétricas.
2. O que significa o termo testes estatísticos livres de distribuição?
3. Quais são algumas das vantagens de usar testes estatísticos não paramétricos?
4. Quais são algumas das desvantagens dos testes não paramétricos?

5. Descreva uma situação em sua área de interesse em que cada um dos testes a seguir pode ser usado.
Use dados reais ou realistas e teste uma hipótese apropriada usando cada teste. (a) O teste do sinal (b)
O teste da mediana (c) O teste de Wilcoxon (d) O teste de Mann-Whitney (e) O teste de qualidade de
ajuste de Kolmogorov-Smirnov (f) A análise unidirecional de Kruskal-Wallis de variância por postos (g)
A análise bidirecional de Friedman da variância por postos (h) O coeficiente de correlação de postos de
Spearman (i) Análise de regressão não paramétrica
6. A seguir estão as faixas etárias (X) de 20 pacientes cirúrgicos e a dose (Y) de um agente analgésico necessária para bloquear um
segmento espinhal.
Classificação de Classificação da Dose Classificação de Classificação da Dose
Idade em Requerimento Idade em Requerimento

Anos (X) (Y) Anos (X) (Y)
1 11 13
1 7 12
2 2 13 5 11
34 4 14 16
6 15 20
56 8 16 18
7 3 17 19
8 15 18 17
9 9 19 10
10 12 20 14
Computadores e teste (bilateral) para significância. Deixe um ¼ :05. Determine o valor de p para este teste.
7. Otani e Kishi (A-12) estudaram sete indivíduos com edema macular diabético. Eles mediram a espessura foveal ð Þ mm em sete olhos
antes e depois da cirurgia de vitrectomia unilateral. Os resultados são mostrados na tabela a seguir:
Sujeito Espessura foveal pré-operatória ðmmÞ Espessura foveal pós-operatória ðmmÞ
1 690 200
2 840 280
3 470 230
4 690 200
5 730 560
6 500 210
7 440 200
Fonte: Dados fornecidos por cortesia de Tomohiro Otani, MD
Use o teste de posto sinalizado de Wilcoxon para determinar se deve-se concluir que a cirurgia é
eficaz na redução da espessura da fóvea. Deixe um ¼ :05. Qual é o valor p?
8. Os sujeitos de um estudo de J. Jose e SR Ell (A-13) foram 303 voluntários saudáveis que autoavaliaram seu próprio estado de
fluxo nasal indicando se sua via aérea nasal estava (1) totalmente limpa, (2) não muito limpa , (3) muito bloqueado ou (4)
totalmente bloqueado. Após a autoavaliação, um medidor In Check foi usado para medir a taxa de pico de fluxo nasal
inspiratório (PINFR, L/min). Os dados de 175 indivíduos em três das categorias de autoavaliação são exibidos na tabela a
seguir. Os autores realizaram um teste de Kruskal-Wallis para determinar se esses dados fornecem evidências suficientes
para indicar uma diferença nos centros populacionais de PINFR entre esses três grupos de resposta. Deixe um ¼ :01. Qual é
o valor da estatística de teste para este teste?
Taxa de pico de fluxo nasal inspiratório (L/min)
Totalmente Limpo Não muito claro Parcialmente bloqueado
180 105 150 120 160 190 130 100

150 150 110 95 200 95 110 100
200 240 130 140 70 130 110 100
130 120 100 135 75 240 130 105
200 90 170 100 150 180 125 95
120 135 80 130 80 140 100 85
150 110 125 180 130 150 230 50
150 155 115 155 160 130 110 105
160 105 140 130 180 90 270 200
150 140 140 140 90 115 180
110 200 95 120 180 130 130
190 170 110 290 140 210 125
150 150 160 170 230 190 90
120 120 90 280 220 135 210
180 170 135 150 130 130 140
140 200 110 185 180 210 125
130 160 130 150 140 90 210
230 180 170 150 140 125 120
200 170 130 170 120 140 115
140 160 115 210 140 160 100
150 150 145 140 150 230 130
170 100 130 140 190 100 130
180 100 170 160 210 120 110
160 180 160 120 130 120 150
200 130 90 230 190 150 110
90 200 110 100 220 110 90
130 120 130 190 160 150 120
140 145 130 90 105 130 115
200 130 120 100 120 150 140
220 100 130 125 140 130 130
200 130 180 180 130 145 160
120 160 140 200 115 160 110
310 125 175 160 115 120 165
160 100 185 170 100 220 120
115 140 190 85 150 145 150
(Contínuo)
Taxa de pico de fluxo nasal inspiratório (L/min)
Totalmente Limpo Não muito claro Parcialmente bloqueado
170 185 130 150 130 150 170

130 180 160 280 130 120 110
220 115 160 140 170 155 120
250 260 130 100 130 100 85
160 160 135 140 145 140
130 170 130 90
130 115 120 190
150 150 190 130
160 130 170
Fonte: Dados fornecidos por cortesia de J. Jose, MS, FRCS.
9. Dez indivíduos com asma brônquica participaram de um experimento para avaliar a eficácia relativa de três drogas. A tabela a
seguir mostra a alteração nos valores de VEF1 (volume expirado forçado em 1 segundo) (expresso em litros) 2 horas após a
administração do medicamento:
Medicamento Medicamento
Assunto ABC Assunto AB C
1 0,00 .13 .26 6 .03 .18 .25

2 .04 .17 .23 7 0,05 .21 .32
3 .02 .20 .21 8 .02 .23 .38
4 .02 .27 .19 9 0,00 .24 .30
5 .04 .11 .36 10 .12 .08 .30
Esses dados são suficientes para indicar uma diferença na eficácia do medicamento? Deixe um ¼ :05. Qual é o valor de p para
este teste?
10. Uma faceta do currículo de enfermagem da Wright State University exige que os alunos usem matemática para realizar cálculos
de dosagem apropriados. Em um estudo de Wendy Gantt (A-14), alunos de graduação em enfermagem receberam um teste
padronizado de matemática para determinar sua aptidão matemática (escala: 0–100). Os alunos foram divididos em dois
grupos: idade universitária tradicional (18–24 anos, 26 observações) e não tradicional (25þ, oito observações). As pontuações
no teste de matemática aparecem na tabela a seguir:
Pontuações tradicionais dos alunos Pontuações não tradicionais dos alunos
70 88 77
57 6 68 72
85 79 14 88 54
55 82 92 87
87 45 85 85
(Contínuo)
Pontuações tradicionais dos alunos Pontuações não tradicionais dos alunos
84 57 56 62
56 91 31 77
68 76 80 86
94 60
Fonte: Dados fornecidos por cortesia de Wendy Gantt e do Wright State University
Esses dados fornecem evidências suficientes para indicar uma diferença nas medianas populacionais? Deixe um ¼ :05.
Qual é o valor de p para este teste? Use o teste da mediana e o teste de Mann-Whitney e compare os resultados.
11. A seguir estão os valores de PaCO2 (mm Hg) em 16 pacientes com doença broncopulmonar:
39, 40, 45, 48, 49, 56, 60, 75, 42, 48, 32, 37, 32, 33, 33, 36
Use o teste de Kolmogorov-Smirnov para testar a hipótese nula de que os valores de PaCO2 na população amostrada
são normalmente distribuídos com m ¼ 44 e s ¼ 12.
12. A tabela a seguir mostra a ingestão calórica (cal/dia/kg) e o consumo de oxigênio VO2 (ml/min/kg)
em 10 bebês:
Caloria Caloria
Entrada (X) VO2(Y) Entrada (X) VO2(Y)
50 7,0 100 10.8

70 8,0 150 12,0
90 10.5 110 10,0
120 11,0 75 9.5
40 9,0 160 11.9
Teste a hipótese nula de que as duas variáveis são mutuamente independentes contra a alternativa de que estão
diretamente relacionadas. Deixe um ¼ 0:5. Qual é o valor de p para este teste?
13. Mary White (A-15) pesquisou médicos para medir suas opiniões sobre a importância da ética na prática médica. A
ferramenta de medição utilizou uma escala de 1 a 5 em que um valor mais alto indicava maior opinião sobre a
importância da ética. As idades e pontuações dos sujeitos do estudo são mostradas na tabela a seguir. Pode-se concluir
com base nesses resultados que a idade e o escore ético estão diretamente relacionados? Deixe a probabilidade de
cometer um erro tipo I ser 0,05. Qual é o valor p?
Ética da Idade Ética da Idade Ética da Idade
25 4,00 26 4,50 26 4,50

34 4,00 29 4,75 27 5,00
30 4.25 30 4.25 22 3,75
31 3,50 26 4,50 22 4.25
25 4,75 30 4.25 24 4,50
(Contínuo)
Ética da Idade Ética da Idade Ética da Idade
25 3,75 25 3,75 22 4,25

25 4,75 24 4,75 24 3,75
29 4,50 24 4,00 38 4,50
29 4,50 25 4,50 22 4,50
26 3,75 25 4,00 22 4,50
25 3.25 26 4,75 25 4,00
29 4,50 34 3.25 23 3,75
27 3,75 23 4,50 22 4.25
29 4.25 26 3.25 23 4,00
25 3,75 23 5,00 22 4.25
25 4,50 24 4.25 25 3,50
25 4,00 45 3.25 26 4.25
26 4.25 23 3,75 25 4.25
26 4,00 25 3,75 27 4,75
24 4,00 25 3,75 23 3,75
25 4,00 23 3,75 22 4,00
22 3,75 23 4,75 26 4,75
26 4,50 26 4,00 22 4.25 Fonte: Dados fornecidos por cortesia de Mary
23 4,00 White, Ph.D. e o Centro de Consultoria Estatística
da Wright State University.
14. Dominic Sprott (A-16) realizou um experimento com coelhos em que a variável de resultado foi a infiltração gordurosa na
massa do ombro (PFI, medida como uma porcentagem). No início do estudo, 15 coelhos tiveram um músculo do
ombro escolhido aleatoriamente destacado. O ombro foi então recolocado. Seis semanas depois, cinco coelhos
escolhidos aleatoriamente foram sacrificados e as diferenças no PFI entre o ombro recolocado e o ombro não
descolado foram registradas (grupo A). Seis meses depois, os 10 coelhos restantes foram sacrificados e novamente
as diferenças no PFI entre o ombro recolocado e o ombro não descolado foram registradas (grupo B).
Diferença percentual de infiltração gordurosa

(Não separado-Reconectado)
grupo A Grupo B
2,55 1.04 1.38

0,9 3.29 0,75
0,2 0,99 0,36
0:29 1,79 0,74
1.11 0:85 0,3 Fonte: Dados fornecidos por cortesia de Dominic Sprott, MD e do
Wright State University Statistical Consulting Center.
Podemos concluir, no nível de significância de 0,05, que os tratamentos têm um efeito diferencial no PFI entre os dois
músculos do ombro? Qual é o valor de p para o teste?
Em cada um dos Exercícios 15 a 29, faça um ou mais dos seguintes procedimentos que julgar apropriados: (a) Aplique
uma ou mais das técnicas discutidas neste capítulo. (b) Aplique uma ou mais das técnicas discutidas nos capítulos
anteriores.
(c) Formule hipóteses relevantes, execute os testes apropriados e encontre os valores de p. (d)
Declare as decisões estatísticas e conclusões clínicas que os resultados de seus testes de hipótese justificam. (e)
Descreva a(s) população(ões) à(s) qual(is) você acha que suas inferências são aplicáveis. (f) Declare as suposições
necessárias para a validade de suas análises.
15. O objetivo do estudo de Damm et al. (A-17) foi investigar a sensibilidade à insulina e a secreção de insulina em mulheres
com diabetes gestacional (DMG) anterior. Os indivíduos eram 12 mulheres tolerantes à glicose com peso normal
(idade média de 36,6 anos; desvio padrão de 4,16) com diabetes gestacional anterior e 11 controles (idade média de
35 anos; desvio padrão de 3,3). Entre os dados coletados estavam os seguintes valores de insulina plasmática em
jejum (mmol/L). Use o teste de Mann-Whitney para determinar se você pode concluir com base nesses dados que as
duas populações representadas diferem com relação ao nível médio de insulina plasmática em jejum.
Controles Controles anteriores do GDM GDM anterior
46,25 30,00 40,00 31,25

40,00 41,25 30,00 56,25
31,25 56,25 51,25 61,25
38,75 45,00 32,50 50,00
41,25 46,25 43,75 53,75
38,75 46,25 62,50
Fonte: Dados fornecidos por cortesia do Dr. Peter Damm.
16. Gutin et al. (A-18) comparou três medidas de composição corporal, incluindo a absorciometria de raios X de dupla
energia (DXA). Os sujeitos eram crianças aparentemente saudáveis (21 meninos e 22 meninas) com idades entre 9
e 11 anos. Entre os dados coletados estavam as seguintes medições dos compartimentos da composição corporal
por DXA. Os investigadores estavam interessados na correlação entre todos os pares possíveis dessas variáveis.
Osso sem gordura

sem gordura Mineral Suave
percentual de gordura Massa gorda Massa Contente Tecido
11h35 3.8314 29.9440 1.19745 28.7465

22,90 6.4398 21.6805 0,79250 20.8880
12h70 4.0072 27.6290 0,95620 26.6728
42,20 24.0329 32.9164 1,45740 31.4590
24,85 9.4303 28.5009 1.32505 27.1758
26.25 9.4292 26.4344 1.17412 25.2603
23,80 8.4171 26.9938 1.11230 25.8815
37,40 20.2313 33.8573 1,40790 32.4494
14h00 3.9892 24.4939 0,95505 23.5388
19h35 7.2981 30.3707 1,45545 28.9153
29.35 11.1863 26.8933 1.17775 25.7156
(Contínuo)
Osso sem gordura

sem gordura Mineral Suave
percentual de gordura Massa gorda Massa Contente Tecido
18,05 5,8449 26.5341 1,13820 25.3959

13,95 4,6777 28.9144 1,23730 27.6771
32,85 13.2474 27.0849 1.17515 25.9097
11h40 3.7912 29.5245 1,42780 28.0967
9,60 3.2831 30.8228 1.14840 29.6744
20,90 7.2277 27.3302 1.24890 26.0813
44,70 25.7246 31.8461 1,51800 30.3281
17.10 5.1219 24.8233 0,84985 23.9734
16h50 5.0749 25.7040 1,09240 24.6116
14h35 5.0341 30.0228 1,40080 28.6220
15h45 4.8695 26.6403 1,07285 25.5674
28.15 10.6715 27.2746 1.24320 26.0314
18h35 5.3847 23.9875 0,94965 23.0379
15.10 5.6724 31.9637 1,32300 30.6407
37,75 25.8342 42.6004 1,88340 40.7170
39.05 19.6950 30.7579 1,50540 29.2525
22.25 7.2755 25.4560 0,88025 24.5757
15,50 4.4964 24.4888 0,96500 23.5238
14,10 4.3088 26.2401 1,17000 25.0701
26,65 11.3263 31.2088 1,48685 29.7219
20,25 8.0265 31.5657 1,50715 30.0586
23,55 10.1197 32.8385 1,34090 31.4976
46,65 24.7954 28.3651 1,22575 27.1394
30,55 10.0462 22.8647 1,01055 21.8541
26,80 9.5499 26.0645 1,05615 25.0083
28.10 9.4096 24.1042 0,97540 23.1288
24.55 14.5113 44.6181 2,17690 42.4412
17.85 6.6987 30.8043 1.23525 29.5690
20,90 6.5967 24.9693 0,97875 23.9905
33,00 12.3689 25.1049 0,96725 24.1377
44,00 26.1997 33.3471 1,42985 31.9172
19h00 5.0785 21.6926 0,78090 20.9117
Fonte: Dados fornecidos por cortesia do Dr. Mark Litaker.
17. A preocupação de um estudo de Crim et al. (A-19) foi o papel potencial da análise por citometria de fluxo do fluido de
lavagem broncoalveolar (BALF) no diagnóstico de rejeição pulmonar aguda. Os pesquisadores observam que estudos
anteriores sugeriram uma associação de rejeição pulmonar aguda com aumento de linfócitos CD8+ e aumento da
expressão do antígeno de linfócitos humanos (HLA)-DR e do receptor de interleucina-2 (IL-2R). Os indivíduos
consistiam em receptores de transplante de pulmão (LT) que não apresentavam evidência histológica de rejeição ou
infecção, voluntários humanos normais (NORM), voluntários de receptores de transplante de coração (HT) saudáveis
e receptores de transplante de pulmão que apresentavam rejeição pulmonar aguda (AR). Entre os dados coletados
estavam as seguintes porcentagens de linfócitos BALF CD8þ que também expressam IL-2R observadas nos quatro
grupos de indivíduos.
Norma HT LT AR
0 0 1 6 12
2 0 0 60 5 89
1 5
0 4 0 16 7
0 6 0 24 2 5 56 18 3
2 0 14 2 22 10 10 3
3 0 8 00 0 80
0 4
0 8 2
1 8
7 31
2 41
5 40
1 18 0
0 4
cortesia da Dra. Courtney Crim.
18. Ichinose et al. (A-20) estudaram o envolvimento de taquicininas endógenas no estreitamento das vias
aéreas induzidas por exercícios em pacientes com asma por meio de um antagonista seletivo do receptor
1 da neuroquinina, FK-888. Nove indivíduos (oito homens, uma mulher) com idades entre 18 e 43 anos
com queda de pelo menos 40% na condutância específica das vias aéreas participaram do estudo. A
seguir estão os dados de consumo de oxigênio (ml/min) para os indivíduos em repouso e durante o
exercício durante o tratamento com placebo e FK-888:
Placebo FK-888
Exercício em repouso Exercício em repouso
303 2578 255 2406

288 2452 348 2214
285 2768 383 3134
280 2356 328 2536
295 2112 321 1942
270 2716 234 2652
274 2614 387 2824
185 1524 198 1448
364 2538 312 2454 cortesia do Dr. Kunio Shirato.
19. O fator transformador de crescimento a (TGFa), de acordo com Tomiya e Fujiwara (A-21), é acusado de
desempenhar um papel na progressão maligna, bem como no crescimento celular normal de maneira
autócrina, e seus níveis séricos têm aumentado durante esta progressão. Os presentes investigadores
desenvolveram um ensaio imunossorvente ligado a enzima (ELISA) para medir os níveis séricos de
TGFa no diagnóstico de carcinoma hepatocelular (CHC) complicando a cirrose. Em um estudo no qual
avaliaram a significância dos níveis séricos de TGFa para fins de diagnóstico, eles coletaram os seguintes
medições nos testes de função hepática, TGFa (pg/ml) e a-fetoproteína sérica (AFP) (ng/ml) de pacientes com CHC:
TGFa AFP TGFa AFP TGFa AFP TGFa AFP
32,0 12866 44,0 23077 100,0 479 15,0 921

65,9 9 75,0 371 12,0 47 34,0 118
25,0 124,3 36,0 291 32,0 177 100,0 6,2
30,0 9 65,0 700 98,0 26,0 19
22,0 610 44,0 40 20,0 9 53,0 594 10
40,0 238 56,0 9538 20,0 1063 21 140,0 292
52,0 153 34,0 19 9,0 206 24,0 11
28,0 23 28 300,0 11 58,0 32 20,0
11,0 39,0 42246 39,0 628 35,0 37
45,0 240 82,0 12571 52,0 35
29,0 66 85,0 20 50,0 742
45,0 83 24,0 29 95,0 10
21,0 4 40,0 310 18,0 291
38,0 214 9,0 19
Fonte: Dados fornecidos por cortesia do Dr. Kenji Fujiwara.
20. O objetivo do estudo de Sakhaee et al. (A-22) foi verificar o conteúdo corporal de alumínio (A1) de forma não invasiva usando o
incremento de Al sérico e urinário após a administração intravenosa de deferoxamina (DFO) em pacientes com cálculos renais
e mulheres com osteoporose submetidas a tratamento prolongado com citrato de potássio (K3Cit ) ou dicitrato tricálcico
(Ca3Cit2), respectivamente. Os indivíduos consistiam em 10 pacientes com nefrolitíase de cálcio e cinco pacientes com
osteoporose que foram mantidos com citrato de potássio ou citrato de cálcio por 2 a 8 anos, respectivamente, mais 16
voluntários normais sem histórico de uso regular de antiácido contendo alumínio. Entre os dados coletados estavam as
seguintes medições de excreção urinária de alumínio de 24 horas ð Þ mg=dia antes (PRÉ) e após (PÓS) infusão de 2 horas
de DFO.
Grupo PRÉ PÓS Grupo PRÉ PÓS
Ao controle 41.04 135,00 Ao controle 9.39 12h32

Ao controle 70,00 95,20 Ao controle 10.72 13.42
Ao controle 42,60 74,00 Ao controle 16.48 17h40
Ao controle 15.48 42.24 Ao controle 10.20 14h20
Ao controle 26,90 104,30 Ao controle 11h40 20.32
Ao controle 16.32 66,90 Ao controle 8.16 12.80
Ao controle 12.80 10.68 Ao controle 14,80 62,00
Ao controle 68,88 46,48 Paciente 15,20 27,15
Ao controle 25,50 73,80 Paciente 8,70 38,72
Paciente 0,00 14,16 Paciente 5,52 7,84
(Contínuo)
Grupo PRÉ PÓS Grupo PRÉ PÓS

Paciente 42,75 86,25
Fonte: Dados fornecidos por cortesia do Dr. Khashayar Sakhaee.
21. O objetivo do estudo de Dubuis et al. (A-23) foi determinar se o déficit neuropsicológico de crianças com a forma
grave de hipotireoidismo congênito pode ser evitado pelo início precoce da terapia e doses mais altas de
levotiroxina. Os indivíduos consistiam em 10 bebês (idades de 3 a 24 dias) com hipotireoidismo congênito grave e
35 bebês (idades de 2 a 10 dias) com hipotireoidismo congênito moderado. Entre os dados coletados estavam as
seguintes medições nos níveis plasmáticos de T4 (nmol/L) na triagem:
Casos severos Casos moderados
T4 T4 T4
Sexo (nmol/L) Sexo (nmol/L) Sexo (nmol/L)
M 16 F 20 F 62
M 57 F 34 M 50
M 40 F 188 F 40
F 50 F 69 F 116
F 57 F 162 F 80
F 38 F 148 F 97
F 51 F 108 F 51
F 38 F 54 F 84
M F 96 F 51
F 60 M 94 76 F
M 122 M 158
M 43 F
F 40 M 47 29
F M 143 83
F M 128 62
F M 112
M 111
¼ Dados ausentes.
F 84
M 55
do Dr. Guy Van Vliet.
22. Kuna et al. (A-24) conduziu um estudo sobre quimiocinas na rinite alérgica sazonal.
Os indivíduos incluíram 18 indivíduos atópicos com rinite alérgica sazonal causada por pólen de ambrósia.
Entre os dados coletados sobre esses indivíduos estavam as seguintes medidas de proteína catiônica eosinófila
(ECP) e histamina:
PCE (ng/ml) Histamina (ng/ml) ECP (ng/ml) Histamina (ng/ml)
511,0 31,2 25,3 5,6

388,0 106,0 31,1 62,7
14.1 37,0 325,0 138,0
314,0 90,0 437,0 116,0
(Contínuo)
ECP (ng/ml) Histamina (ng/ml) ECP (ng/ml) Histamina (ng/ml)
74,1 29,0 277,0 70,6

8,8 87,0 602,0 184,0
144,0 45,0 33,0 8,6
56,0 151,8 661,0 264,0
205,0 86,0 162,0 92,0
Fonte: Dados fornecidos por cortesia do Dr. Allen P. Kaplan.
23. O objetivo de um estudo de Kim et al. (A-25) foi investigar as mudanças seriadas nos níveis de lipoproteína Lp(a) com a perda de
hormônios sexuais femininos pela menopausa cirúrgica e com terapia de reposição de estrogênio nas mesmas mulheres. Os
sujeitos foram 44 mulheres na pré-menopausa submetidas a histerectomia abdominal trans (TAH). Trinta e uma das mulheres
tiveram TAH e ooforectomia salpingo unilateral (USO), e 13 tiveram TAH e salpingo-ooforectomia bilateral (BSO). As mulheres
tinham idades entre 30 e 53 anos. Os indivíduos do grupo BSO receberam 0,625 mg de estrogênio equino conjugado
diariamente 2 meses após a operação. A seguir, os níveis de colesterol total dos indivíduos antes (TC0), 2 meses após (TC2)
e 4 meses após (TC4) o procedimento cirúrgico e a terapia de reposição hormonal.
USO USO
Sujeito TC0 TC2 TC4 Sujeito TC0 TC2 TC4
202 203 196 25 134 131 135

1 204 183 203 26 163 190 185
2 206 199 192 27 196 183 192
34 166 180 176 28 181 194 208
150 171 154 29 160 162 181
56 137 134 129 30 188 200 181
7 164 168 171 31 172 188 189
8 207 249 223
9 126 121 140 BSO
10 131 141 167
Sujeito TC0 TC2 TC4
11 133 159 149
12 142 152 140 32 224 218 239
13 225 193 180 33 202 196 231
14 158 182 179 34 181 182 208
15 184 177 182 35 191 230 208
16 223 244 234 36 248 284 279
17 154 178 187 37 224 228 199
18 176 137 162 38 229 318 272
19 205 253 288 39 147 199 194
20 167 156 136 40 248 258 302
21 164 176 191 41 160 218 229
22 177 168 185 42 175 187 166
23 140 175 167 43 262 260 247
24 167 186 195 44 189 199 181
Fonte: Dados fornecidos por cortesia do Dr. Chee Jeong Kim.

24. Velthuis et al. (A-26) realizaram um estudo para avaliar se a combinação de revestimento de heparina passivamente
imobilizado e heparização padrão pode reduzir a ativação do complemento em pacientes submetidos a intervenção
cirúrgica cardíaca. Os pesquisadores observam que os circuitos extracorpóreos revestidos com heparina reduzem a
ativação do complemento durante as operações cardíacas, mas há pouca informação in vivo disponível sobre a redução
da ativação das vias clássica e alternativa. A ativação do complemento inicia uma resposta inflamatória sistêmica
durante e após operações cardíacas e está associada a eventos fisiopatológicos como depressão cardíaca pós-
operatória, extravasamento capilar pulmonar e hemólise. Os sujeitos foram 20 pacientes submetidos a enxerto eletivo
de circulação extracorpórea (CEC) alocados aleatoriamente para serem tratados com circuitos extracorpóreos revestidos
com heparina (H) ou circuitos não revestidos (U). Entre os dados coletados estavam as seguintes concentrações
plasmáticas do complexo terminal do complemento (SC5b-9) na linha de base, 10 minutos após o início da CEC, ao
término da CEC e após a administração de sulfato de protamina:
Paciente Tratamento Linha de base 10 min CPB Terminar CPB Protamina
1 você 0,37 0,81 1,88 2.12

2 você 0,48 0,73 3.28 3.31
3 você 0,48 0,42 2,94 1.46
4 H 0,37 0,44 1.28 3.82
5 H 0,38 0,31 0,50 0,68
6 você 0,38 0,43 1.39 5.04
7 H 0,46 0,57 1.03 1.29
8 H 0,32 0,35 0,75 1.10
9 você 0,41 0,94 1,57 2.53
10 você 0,37 0,38 2.07 1,69
11 H 0,48 0,33 1.12 1.04
12 H 0,39 0,39 1,69 1.62
13 você 0,27 0,41 1.28 2,26
14 H 0,51 0,27 1.17 1,05
15 H 0,97 0,75 1,82 1,31
16 você 0,53 1,57 4,49 2,15
17 você 0,41 0,47 1,60 1,87
18 você 0,46 0,65 1,49 1,24
19 H 0,75 0,78 1,49 1,57
20 H 0,64 0,52 2,11 2,44
Fonte: Dados fornecidos por cortesia do Dr. Henk te Velthuis.
25. Heijdra et al. (A-27) afirmam que muitos pacientes com doença pulmonar obstrutiva crônica (DPOC) grave apresentam
baixa saturação arterial de oxigênio durante a noite. Esses pesquisadores conduziram um estudo para determinar se
existe uma relação causal entre a disfunção muscular respiratória e a saturação noturna. Os indivíduos eram 20 (cinco
mulheres, 15 homens) pacientes com DPOC aleatoriamente designados para receber treinamento muscular inspiratório
de fluxo-alvo (TF-IMT) a 60 por cento de sua pressão inspiratória máxima na boca (PImax) ou TF-IMT simulado a 10
por cento de PI máx. Entre os dados coletados estavam os seguintes tempos de resistência (Tempo, s) para cada
sujeito no início do treinamento e 10 semanas depois:
Horário(s) TF-IMT Horário(s) TF-IMT

60% PImáx 10% PImáx
Semana 0 Semana 10 Semana 0 Semana 10
330 544 430 476

400 590 400 320
720 624 900 650
249 330 420 330
144 369 679 486
440 789 522 369
440 459 116 110
289 529 450 474
819 1099 570 700
540 930 199 259
Fonte: Dados fornecidos por cortesia da Dra. Yvonne F. Heijdra.
26. Os três objetivos de um estudo de Wolkin et al. (A-28) foram determinar (a) os efeitos do tratamento crônico com haloperidol no
metabolismo cerebral em pacientes esquizofrênicos, (b) a relação entre sintomas negativos e alterações regionais induzidas
por haloperidol na utilização de glicose cerebral e (c) a relação entre alteração metabólica e efeito antipsicótico clínico. Os
sujeitos foram 18 pacientes internados em hospitais de veteranos do sexo masculino (10 negros, cinco brancos e três
hispânicos) com descompensação aguda ou crônica de esquizofrenia. A idade dos indivíduos variou de 26 a 44 anos e a
duração da doença variou de 7 a 27 anos. Entre os dados coletados estavam as seguintes pontuações de pré-tratamento no
subteste de substituição de símbolo de dígito do WAIS-R (DSY1RW) e mudança induzida por haloperidol no córtex pré-frontal
dorsolateral esquerdo absoluto (DLLA3V1) e córtex pré-frontal dorsolateral direito absoluto (DLRA3V1) medido em unidades
de mmol de glicose/100 g de tecido/min:
DSY1RW DLLA3V1 DLRA3V1 DSY1RW DLLA3V1 DLRA3V1
47 7:97 17:17 18 4:91 9:58

16 8:08 9:59 0 1:71 .40
31 10:15 11:58 29 4:62 4:57
34 5:46 2:16 17 9.48 11.31
22 17:12 12:95 38 6:59 6:47
70 12:12 13:01 64 12:19 13:61
59 9:70 12:61 52 15:13 11:81
41 9:02 7:48 50 10:82 9:45
0 4,67 7.26 62 4:92 1:87
Fonte: Dados fornecidos por cortesia do Dr. Adam Wolkin.
27. O objetivo do estudo de Maltais et al. (A-29) foi comparar e correlacionar o aumento do ácido lático arterial (La) durante o exercício
e a capacidade oxidativa do músculo esquelético em pacientes com doença pulmonar obstrutiva crônica (DPOC) e controles
(C). Havia nove sujeitos em cada grupo. A média de idade dos pacientes foi de 62 anos com desvio padrão de 5. Os controles
tiveram média de idade de 54 anos com desvio padrão de 3. Entre os dados coletados estavam os
seguintes valores para a atividade de fosfofrutoquinase (PFK), hexoquinase (HK) e lactato desidrogenase (LDH) para
os dois grupos:
PFK Hong Kong LDH
C DPOC C DPOC C DPOC
106,8 49.3 2.0 2.3 241,5 124.3

19.6 107.1 3.2 1.4 216,8 269,6
27.3 62,9 2.5 1,0 105,6 247,8
51.6 53.2 2.6 3.6 133,9 200,7
73.2 105,7 2.4 1.3 336,4 540,5
89,6 61.3 2.4 2.9 131.1 431.1
47,7 28.2 3.5 2.2 241,4 65,3
113,5 68,5 2.2 1,5 297.1 204.7
46,4 40,8 2.4 1.6 156,6 137,6
Fonte: Dados fornecidos por cortesia do Dr. François Maltais.

S
28. Torre e cols. (A-30) realizaram um estudo para determinar os níveis séricos de nitrito em pacientes pediátricos com
infecção pelo vírus da imunodeficiência humana tipo 1 (HIV-1). Os sujeitos incluíram 10 crianças saudáveis (seis
meninos e quatro meninas) com idade média de 9,7 anos e desvio padrão de 3,3. O restante dos participantes foram
21 crianças nascidas de mães infectadas pelo HIV-1. Destes, sete (três meninos e quatro meninas) foram afetados
pela AIDS. Eles tinham idade média de 6 anos com desvio padrão de 2,8. As 14 crianças restantes (sete meninos e
sete meninas) tornaram-se soronegativas para HIV-1 durante o primeiro ano de vida. A média de idade foi de 3,3
anos com desvio padrão de 2,3 anos. Entre os dados coletados estavam os seguintes níveis séricos de nitrito ð Þ
mmol=L :
Controles Crianças soronegativizadas n Pacientes HIV-1-positivos

n ¼ 10 ¼ 14 n¼7
0,301 0,335 0,503

0,167 0,986 0,268
0,201 0,846 0,335
0,234 1,006 0,946
0,268 2,234 0,846
0,268 1.006 0,268
0,201 0,803 0,268
0,234 0,301
0,268 0,936
0,301 0,268
0,134
0,335
0,167
0,234
Fonte: Dados fornecidos por cortesia do Dr. Donato Torre.
29. Seghaye et al. (A-31) analisaram a influência da aprotinina em baixa dose na ativação do complemento, estimulação de
leucócitos, produção de citocinas e resposta de fase aguda em crianças submetidas a
REFERÊNCIAS 747
operações cardíacas. O critério de inclusão para o estudo foi um defeito cardíaco congênito não cianótico que requer um
procedimento cirúrgico primário relativamente simples associado a um baixo risco pós-operatório.
Entre os dados coletados estavam as seguintes medidas de interleucina-6 (IL-6) e proteína C-reativa (PCR) obtidas 4 e 24
horas após a cirurgia, respectivamente:
IL-6 PCR IL-6 PCR IL-6 PCR
122 32 467 53 215 50

203 39 421 29 415 41
458 63 421 44 66 12
78 7 227 24 58 14
239 62 265 31 213 9
165 22 97 12
Fonte: Dados fornecidos por cortesia da Dra. Marie-Christine Seghaye.
college/daniel
1. O Projeto de Lei 2071 da Assembléia do Estado da Califórnia (AB 2071) determina que os pacientes em clínicas de
metadona sejam submetidos a um mínimo de 50 minutos de aconselhamento por mês. Evan Kletter (A-32) coletou
dados de 168 indivíduos que estavam continuamente ativos em tratamento por meio dos centros de Pesquisa e
Tratamento de Dependências de Bay Area (BAART) por 1 ano antes e 2 anos após a implementação do AB 2071.
Antes do AB 2071, os conselheiros do centro BAART passaram duas sessões de pelo menos 15 minutos por sessão
por mês com cada cliente. Os sujeitos do estudo também foram identificados como usuários de cocaína. As
observações em KLETTER são as porcentagens de reprovação em um teste de drogas de cocaína para cada um dos
sujeitos pré e pós-AB 2071. Por exemplo, um pré-valor de 60 implica que o paciente falhou em um teste de cocaína
60% das vezes antes de adoção da AB 2071.
O Dr. Kletter realizou um teste de soma de classificação de Wilcoxon para determinar se a porcentagem de testes com
falha diminuiu significativamente após a aprovação do AB 2071. Use os dados para determinar a que conclusão ele foi
capaz de chegar. Relate a estatística de teste e o valor de p.
REFERÊNCIAS
1. FRANK WILCOXON, “Comparações individuais por métodos de classificação”, Biometrics, 1 (1945), 80–83.
2. AM MOOD, Introdução à Teoria das Estatísticas, McGraw-Hill, Nova York, 1950.
3. J. WESTENBERG, "Teste de significância para mediana e intervalo interquartil em amostras de populações contínuas de
qualquer forma", Proceedings Koninklijke Nederlandse Akademie Van Wetenschappen, 51 (1948), 252–261.
4. GW BROWN e AM MOOD, “On Median Tests for Linear Hypotheses,” Proceedings of the Second Berkeley Symposium
on Mathematical Statistics and Probability, University of California Press, Berkeley, 1951, 159–166.
5. HB MANN e DR WHITNEY, “Em um teste para saber se uma das duas variáveis aleatórias é estocasticamente maior que
a outra”, Annals of Mathematical Statistics, 18 (1947), 50–60.
6. AN KOLMOGOROV, “Sulla Determinazione Empirial di una Legge di Distribuizione,” Giornale dell' Institute
Italiano degli Altuari, 4 (1933), 83–91.
7. NV SMIRNOV, "Estimativa de desvio entre funções de distribuição empírica em duas amostras independentes"
(em russo), Bulletin Moscow University, 2 (1939), 3–16.
8. WH KRUSKAL e WA WALLIS, “Use of Ranks in One-Criterion Analysis of Variance,” Journal of the

American Statistical Association, 47 (1952), 583-621; errata, ibid., 48 (1953), 907-911.
9. M. FRIEDMAN, “O uso de classificações para evitar a suposição de normalidade implícita na análise de variância,”
Jornal da Associação Estatística Americana, 32 (1937), 675–701.
10. M. FRIEDMAN, “Uma comparação de testes alternativos de significância para o problema de m classificações”, Annals of
Estatísticas matemáticas, II (1940), 86–92.
11. C. SPEARMAN, "A prova e medição da associação entre duas coisas", American Journal of Psychology, 15 (1904), 72-101.
12. H. THEIL, “Um método de classificação invariante de análise de regressão linear e polinomial. III,” Koninklijke Nederlandse
Akademie Van Wetenschappen, Proceedings, Series A, 53 (1950), 1397–1412.
13. E. JACQUELIN DIETZ, “Teaching Regression in a Nonparametric Statistic Course,” American Statistician, 43
(1989), 35-40.
14. JEAN D. GIBBONS, Nonparametric Methods for Quantitative Analysis, Terceira Edição, American Sciences Press,
Siracusa, NY, 1996.
15. MARJORIE A. PETT, Estatísticas não paramétricas para pesquisa em saúde, Sage Publications, Thousand Oaks, CA,
1997.
A-1. ROBERT B. PARKER, RYAN YATES, JUDITH E. SOBERMAN e CASEY LAIZURE, “Effects of Grapefruit Juice on Intestial
P-glicoproteína: Avaliação usando digoxina em humanos,” Pharmacotherapy, 23 (2003), 979–987.
A-2. CHRISTINA GRAPE, MARIA SANDGREN, LARS-OLAF HANSSON, MATS ERICSON e T€oRES THEORELL, “Cantar promove
o bem-estar?: um estudo empírico de cantores profissionais e amadores durante uma aula de canto,”
Ciência Fisiológica e Comportamental Integrativa, 38 (2003), 65–74.
A-3. RS ZUCKERMAN e S. HENEGHAN, “A duração da depressão hemodinâmica durante a cirurgia laparoscópica
Colecistectomia,” Endoscopia Cirúrgica, 16 (2002), 1233–1236.
A-4. CAROLE W. CRANOR e DALE B. CHRISTENSEN, "O Projeto Asheville: Resultados de Curto Prazo de um Programa
Comunitário de Cuidados com o Diabetes em Farmácia", Journal of the American Pharmaceutical Association, 43 (2003),
149–159.
A-5. YITAO LIU, LUDMILA BELAYEV, WEIZHAO ZHAO, RAUL BUSTO e MYRON D. GINSBURG, “MRZ 2(579, um novo antagonista
N-metil-D-aspartato não competitivo, reduz o volume do infarto e o inchaço cerebral e melhora o déficit neurológico após
isquemia cerebral focal em ratos,” Brain Research, 862 (2000), 111–119.
A-6. MOHAMED A. ELSHAIKH, JAMES C. ULCHAKER, CHANDANA A. REDDY, KENNETH ANGERMEIER, ERIC A. KLEIN e JAY P.
CIEZKI, “Tamsulosina Profilática (Flomax®) em Pacientes Submetidos à Braquiterapia Prostate125I para Carcinoma de
Próstata. Relatório Final de um Estudo Randomizado Duplo-Cego Controlado por Placebo,” International Journal of Radiation
Oncology, Biology, Physics, (no prelo).
A-7. G. LACROIX, S. TISSOT, F. ROGERIEUX, R. BEAULIEU, L. CORNU, C. GILLET, F. ROBIDEL, JP LEFEVRE, e FY BOIS,
"Diminuição da resposta alérgica pulmonar induzida por ovalbumina por exposição ao benzaldeído, mas não ao acetaldeído
em um modelo de cobaia", Journal of Toxicology and Environmental Health, Parte A, 65 (2002), 995–1012.
A-8. W. HERRMANN, H. SCHORR, JP KNAPP, A. MU€ LLER, G. STEIN e J. GEISEL, “Papel da medição de homocisteína,
cistationina e ácido metilmalônico para o diagnóstico de deficiência de vitaminas em indivíduos de alta idade”, European
Journal de Investigação Clínica, 30 (2000), 1083–1089.
A-9. CAROL FLEXER, KATE KEMP BILEY, ALYSSA HINKLEY , CHERYL HARKEMA e JOHN. HOLCOMB, “Usando Sound-Field to
Teach Phonemic Awareness to Pre-schoolers,” Hearing Journal, 55 (3) (2002), 38–44.
A-10. SATOSHI NOZAWA, KATSUJI SHIMIZU, KEI MIYAMOTO e MIZUO TANAKA, “Repair of Pars Interarticularis Defect by Segmental
Wire Fixation in Young Athletes with Spondylolysis,” American Journal of Sports Medicine, 31 (2003), 359–364.
A-11. M. BUTZ, KH WOLLINSKY, U. WIDEMUTH-CATRINESCU, A. SPERFELD, S. WINTER, HH MEHRKENS, AC LUDOLPH,

e H. SCHREIBER, “Efeitos longitudinais da ventilação com pressão positiva não invasiva em pacientes com esclerose
lateral amiotrófica”, American Journal of Medical Rehabilitation, 82 (2003), 597–604.
A-12. TOMOHIRO OTANI e SHOJI KISHI, “Um estudo controlado de vitrectomia para edema macular diabético”, American Journal of
Ophthalmology, 134 (2002), 214–219.
A-13. J. JOSE e SR ELL, “A Associação de Patência Nasal Subjetiva com Fluxo Nasal Inspiratório Máximo em uma Grande População
Saudável,” Clinical Otolaryngology, 28 (2003), 352–354.
REFERÊNCIAS 749
A-14. WENDY GANTT e Centro de Consultoria Estatística da Wright State University (2002).
A-15. MARY WHITE e o Centro de Consultoria Estatística da Wright State University (2001).
A-16. DOMINIC SPROTT e Centro de Consultoria Estatística da Wright State University (2003).
A-17. PETER DAMM, HENRIK VESTERGAARD, CLAUS KU€ HL, e OLUF PEDERSEN, “Impaired Insulin-Stimulated Non oxidative Glucose
Metabolism in Glucose-Tolerant Women with Previous Gestational Diabetes,” American Journal of Obstetrics and Gynecology, 174
(1996), 722–729 .
A-18. BERNARD GUTIN, MARK LITAKER, SYED ISLAM, TINA MANOS, CLAYTON SMITH e FRANK TREIBER, “Medição da composição
corporal em crianças de 9 a 11 anos de idade por absorciometria de raios X de dupla energia, medições de espessura de dobras
cutâneas e análise de bioimpedância, ” American Journal of Clinical Nutrition, 63 (1996), 287–292.
A-19. COURTNEY CRIM, CESAR A. KELLER, CHERIE H. DUNPHY, HORACIO M. MALUF e JILL A. OHAR, “Flow Cytometric Analysis of Lung
Lymphocytes in Lung Transplant Recipients,” American Journal of Respiratory and Critical Care Medicine, 153 (1996) , 1041–1046.
A-20. MASAKAZU ICHINOSE, MOTOHIKO MIURA, HIDEYUKI YAMAUCHI, NATSUKO KAGEYAMA, MASAFUMI TOMAKI, TATSUYA OYAKE,
YUZURU OHUCHI, WATARU HIDA, HIROSHI MIKI, GEN TAMURA e KUNIO SHIRATO, “Um antagonista de 1 receptor de neuroquinina
melhora o estreitamento das vias aéreas induzido por exercícios em pacientes asmáticos ,” American Journal of Respiratory and Critical
Care Medicine, 153 (1996), 936–941.
A-21. TOMOAKI TOMIYA e KENJI FUJIWARA , "Fator de Crescimento Transformador Soro a Nível como Marcador de Carcinoma Hepatocelular
Complicando Cirrose", Câncer, 77 (1996), 1056–1060.
A-22. KHASHAYAR SAKHAEE, LISA RUML, PAULETTE PADALINO, SHARON HAYNES e CHARLES YC PAK, “The Lack of Influence of Long-
Term Potassium Citrate and Calcium Citrate Treatment in Total Body Aluminium Burden in Patients with Functioning Kidneys,” Journal
of the American College of Nutrição, 15 (1996), 102–106.
A-23. JEAN-MICHEL DUBUIS, JACQUELINE GLORIEUX, FAISCA RICHER , CHERI L. DEAL, JEAN H. DUSSAULT e GUYVan VLIET, “Outcome
of Severe Congenital Hypothyroidism: Closing the Developmental Gap with Early High Dose Levothyroxine Treatment,” Journal of
Clinical Endocrinology and Metabolism , 81 (1996), 222–227.
A-24. PIOTR KUNA, MARK LAZAROVICH e ALLEN P. KAPLAN, “Chemokines in Seasonal Allergic Rhinitis,” Journal of
Allergy and Clinical Immunology, 97 (1996), 104–112.
A-25. CHEE JEONG KIM, WANG SEONG RYU, JU WON KWAK, CHONG TAIK PARK e UN HO RYOO, “Mudanças em Lp(a)
Lipoprotein and Lipid Levels After Cessation of Female Sex Hormone Production and Estrogen Replacement Therapy,” Archives
of Internal Medicine, 156 (1996), 500–504.
A-26. HENK TE VELTHUIS, PIET GM JANSEN, C. ERIK HACK, LEON EIJSMAN e CHARLES RH WILDEVUUR, “Inibição específica do
complemento com circuitos extracorpóreos revestidos com heparina”, Annals of Thoracic Surgery, 61 (1996), 1153–1157.
A-27. YVONNE F. HEIJDRA, PN RICHARD DEKHUIJZEN, CEES LAvan HERWAARDEN e HANS TH. M. FOLGERING, "A saturação noturna
melhora com o treinamento muscular inspiratório de fluxo-alvo em pacientes com DPOC", American Journal of Respiratory and Critical
Care Medicine, 153 (1996), 260–265.
A-28. ADAM WOLKIN, MICHAEL SANFILIPO, ERICA DUNCAN, BURTON ANGRIST, ALFRED P. WOLF, THOMAS B. COOPER, JONATHAN
D. BRODIE, EUGENE LASKA e JOHN P. ROSTROSEN, “Mudança atenuada na utilização de glicose cerebral após tratamento com
haloperidol em pacientes esquizofrênicos com Sintomas negativos proeminentes,” American Journal of Psychiatry, 153 (1996), 346–354.
A-29. FRANCOIS MALTAIS, ANDREE -ANNE SIMARD, CLERMONT SIMARD, JEAN JOBIN , PIERRE DESGAGNES , e PIERRE LEBLANC,
S
“Capacidade Oxidativa do Músculo Esquelético e Cinética do Ácido Lático Durante o Exercício em Indivíduos Normais e em
Pacientes com DPOC,” American Journal of Respiratory and Critical Care Medicine, 153 (1996), 288–293.
A-30. DONATO TORRE, GIULIO FERRARIO, FILIPPO SPERANZA, ROBERTO MARTEGANI e CLAUDIA ZEROLI, “Níveis aumentados de nitrito
no soro de crianças infectadas com o vírus da imunodeficiência humana tipo 1,” Doenças infecciosas clínicas, 22 (1996), 650–653.
A-31. MARIE-CHRISTINE SEGHAYE, JEAN DUCHATEAU, RALPH G. GRABITZ, KARSTEN JABLONKA, TOBIAS WENZL, CHRISTIANE
MARCUS, BRUNO J. MESSMER e GOETZ von BERNUTH, “Influence of Low Dose Aprotinin on the Inflammatory Reaction Due to
Cardiopulmonary Bypass in Children, ” Annals of Thoracic Surgery, 61 (1996), 1205–1211.
A-32. EVAN KLETTER, “Aconselhamento como uma intervenção para o paciente de manutenção com metadona dependente de cocaína,”
Journal of Psychoactive Drugs, 35 (2003), 271–277.
CAPÍTULO 14
ANÁLISE DE SOBREVIVÊNCIA
Este capítulo fornece uma introdução à análise de dados provenientes de estudos em que o tempo
para a ocorrência de um evento é o desfecho de interesse.
Esses tipos de estudos têm sido historicamente usados para monitorar o tempo de sobrevida de
pacientes que enfrentam a possibilidade de morrer durante o estudo, daí o uso da descrição dessas
técnicas como “análise de sobrevida”. No entanto, neste capítulo aprenderemos técnicas que podem
ser usadas no contexto de qualquer resultado em que o tempo até a ocorrência de um evento seja
de interesse. Estaremos empregando técnicas semelhantes àquelas que aprendemos nos capítulos
anteriores, incluindo os métodos para analisar dados de frequência, os métodos para desenvolver
modelos lineares para fazer previsões e tópicos em estatística não paramétrica.
TÓPICOS
14.1 INTRODUÇÃO
14.2 DADOS DE TEMPO ATÉ O EVENTO E CENSURA
14.3 O PROCEDIMENTO KAPLAN-MEIER
14.4 COMPARAÇÃO DE CURVAS DE SOBREVIVÊNCIA
14.5 REGRESSÃO DE COX: O MODELO DE RISCOS PROPORCIONAIS
14.6 RESUMO
Depois de estudar este capítulo, o aluno irá 1. entender

os dados de tempo até o evento e como as observações censuradas podem ser tratadas
estatisticamente.
2. ser capaz de desenvolver e usar curvas de sobrevivência para tirar conclusões. 3. ser
capaz de comparar estatisticamente as curvas de sobrevivência. 4. entender como
desenvolver modelos projetados para lidar com dados de tempo até o evento.
14.1 INTRODUÇÃO
Em muitos estudos, o desfecho de interesse está relacionado ao momento da ocorrência de um

evento. Em um ambiente clínico, pode-se estar interessado em medir quanto tempo uma doença crônica
750
14.2 DADOS DE HORA DO EVENTO E CENSURA 751
paciente sobrevive após receber um determinado tratamento. Em outro cenário, pode-se estar interessado
em determinar qual dos três medicamentos, comparado a um placebo, fornece alívio dos sintomas mais
rapidamente.
Imagine que uma clínica de reabilitação cardíaca esteja interessada em determinar se a inscrição
em um programa tradicional de educação em saúde ou em um programa que oferece planejamento
alimentar e nutricional junto com a educação do paciente é mais eficaz na prevenção da ocorrência de
um segundo infarto do miocárdio após um primeiro ataque cardíaco . O estudo pode começar quando o
primeiro paciente, após seu primeiro ataque cardíaco, for designado aleatoriamente para um programa
de tratamento, com pacientes adicionais inscritos ao longo do tempo. Por outro lado, o estudo poderia
começar com uma coorte de indivíduos, cada um dos quais teve seu primeiro ataque cardíaco, que são
designados aleatoriamente para um programa de tratamento. Em ambos os casos, existem potencialmente
três resultados que podem ocorrer com cada paciente, sendo o evento de interesse um segundo ataque
cardíaco. Estes são (1) o paciente tem um segundo ataque cardíaco; (2) o paciente abandona o estudo -
tornando-se assim uma perda de acompanhamento - o que pode ocorrer por vários motivos, incluindo
morte ou mudança geográfica, por exemplo; ou (3) o evento de interesse não ocorrer ao paciente durante
o período do estudo. Esses três eventos mutuamente exclusivos são a base para estudos de análise de
sobrevivência.
Embora a grande maioria das pesquisas publicadas usando os métodos de análise de
sobrevivência seja de natureza clínica, deve-se mencionar que também existem muitos usos não clínicos
para a análise de sobrevivência. Com o advento de programas estatísticos baseados em computador
para ajudar em cálculos complexos, o uso de metodologias de análise de sobrevivência aumentou
comprovadamente entre muitas disciplinas. Por exemplo, engenheiros podem querer saber o tempo que
leva para uma bateria perder sua carga, um cientista de controle de qualidade em uma fábrica pode
querer entender em que ponto as máquinas precisam ser recalibradas, ou um ecologista pode querer
estimar quanto quanto tempo a carcaça média permanece em uma área de estudo antes de ser eliminada.
14.2 DADOS DE TEMPO ATÉ O EVENTO E CENSURA
Os dados de medição para estudos de análise de sobrevivência utilizam o tempo que leva para que um
evento de interesse bem definido ocorra. Para cada sujeito inscrito em um estudo, o pesquisador registra
a quantidade de tempo (que pode ser meses, dias, anos ou qualquer medida de tempo) decorrido entre
o ponto em que cada sujeito entrou no estudo até que ele ou ela experimente um dos os três eventos
possíveis que acabamos de apresentar - o evento ocorre, o evento não ocorre ou o assunto é perdido
para acompanhamento. A quantidade total de tempo entre a inscrição inicial no estudo e a ocorrência de
um dos três resultados é conhecida como tempo de sobrevivência do sujeito da pesquisa, ou tempo até
o evento. Portanto, as informações coletadas sobre cada assunto são frequentemente chamadas de
dados de sobrevivência ou dados de tempo até o evento. Além dos dados de sobrevivência, covariáveis,
como idade, sexo, tipo de medicamento e dieta, por exemplo, também podem ser reunidas para o
desenvolvimento de modelos complexos.
DEFINIÇÃO
Dados de sobrevivência, ou dados de tempo até o evento, são medidas de tempo

decorrido entre a inscrição inicial em um estudo e a disposição final do sujeito do estudo.
Este tempo decorrido pode ser representado pelo momento do diagnóstico inicial ou
pode ser representado pelo momento em que alguém
752 CAPÍTULO 14 ANÁLISE DE SOBREVIVÊNCIA
UMA
Paciente
1º de 1 de julho 1º de janeiro 1º de janeiro 31 de dezembro
janeiro de 2002 de 2002 de 2003 de 2004 de 2004
FIGURA 14.2.1 Pacientes entrando em um estudo em momentos diferentes com tempos de sobrevida conhecidos
() e censurados ().
entra no estudo. Sobrevivência neste contexto significa simplesmente que um evento

não ocorreu, não necessariamente, que o ponto final de interesse envolveu um exame
de “vida” e “morte”.
Suponha que consideremos pacientes que entraram no estudo de ataque cardíaco descrito na
Introdução. Para fins ilustrativos, suponha que examinamos o destino de três pacientes que participaram
do estudo (Figura 14.2.1).
O paciente A entrou no estudo em 1º de janeiro de 2002 e teve um infarto do miocárdio em 31 de
dezembro de 2003. O tempo de sobrevida do paciente A é, portanto, de 24 meses. O paciente B entrou
no estudo em 1º de julho de 2002 e saiu do estado 6 meses depois, em 31 de dezembro de 2002. O
tempo de sobrevivência do paciente B no estudo é de 6 meses. Finalmente, o paciente C entrou no
estudo em 1º de agosto de 2002 e permaneceu no estudo até seu término em 31 de dezembro de 2004.
O tempo de sobrevida do paciente C é de 29 meses. Temos, portanto, informações de sobrevida desses
três pacientes que podem ser úteis para análise; no entanto, notamos que os tempos de sobrevida dos
pacientes B e C não são conhecidos com exatidão. Ou seja, o paciente B fornece um exemplo de paciente
perdido no acompanhamento e o paciente C fornece um exemplo de paciente que concluiu o estudo sem
vivenciar o evento de interesse. Os pacientes B e C têm tempos de sobrevivência que são chamados de
tempos de sobrevivência censurados e, portanto, esses tempos de sobrevivência são referidos como dados censurados.
DEFINIÇÃO
Os dados censurados são representados por medições para as quais temos algumas
informações sobre o tempo de sobrevivência, mas o tempo exato de sobrevivência não é
conhecido.
Dados censurados podem ocorrer de várias maneiras. Em dados censurados individualmente, um

número fixo de indivíduos entra em um estudo ao mesmo tempo. Uma vez no estudo, alguns dos sujeitos
não experimentarão o evento. Sabe-se que seu tempo de sobrevivência é um pouco maior do que a
duração do estudo. Isso é conhecido como censura tipo I. Também pode ser que, por razões éticas ou de
pesquisa, o estudo seja encerrado depois que uma certa proporção dos sujeitos experimenta a condição
de interesse, com a proporção restante não tendo experimentado o evento quando o estudo é encerrado.
Isso é chamado de censura tipo II. Deve-se notar que esses conceitos não estão relacionados aos
conceitos de erro Tipo I e erro Tipo II introduzidos no Capítulo 7. Outro tipo de censura
Isso pode ocorrer é conhecido como dados progressivamente censurados nos quais o período de estudo é
fixo, mas os sujeitos podem entrar no experimento em momentos diferentes. Os pacientes podem então
experimentar ou não o evento de interesse, com aqueles que não vivenciam o evento tendo tempos de
sobrevivência desconhecidos. Isso é chamado de censura tipo III. Os dados para os quais os endpoints
exatos não são conhecidos, seja porque o sujeito abandonou o estudo, foi retirado do estudo ou sobreviveu
além do término do estudo, são chamados de dados censurados à direita porque os tempos de
sobrevivência se estendem além da cauda direita do estudo. distribuição dos tempos de sobrevivência. Por
outro lado, poderíamos ter dados para os quais os pontos iniciais exatos não são conhecidos. Isso pode
surgir, por exemplo, se um sujeito com a condição entrar no estudo, mas não se sabe exatamente quando
a condição se desenvolveu no paciente. Esses dados são conhecidos como dados censurados à esquerda
porque seus tempos de sobrevida são truncados no lado esquerdo da distribuição da distribuição do tempo
de sobrevida, fazendo com que a diferença de tempo entre o diagnóstico e a entrada no estudo seja
desconhecida. Claramente, os detalhes que envolvem os dados censurados são complexos e requerem
uma análise muito mais detalhada do que a abordada neste texto introdutório. Aos interessados em
aprofundar a leitura, sugerimos os livros de Kleinbaum e Klein (1), Lee (2) e Hosmer e Lemeshow (3).
Geralmente, para fins de análise, uma variável dicotômica ou indicadora é usada para distinguir os
tempos de sobrevivência daqueles sujeitos que vivenciam o evento de interesse e daqueles que não
vivenciam devido a um dos mecanismos de censura descritos acima. Normalmente, essa variável é
chamada de variável de status, com um zero indicando que um evento não ocorreu e, portanto, o tempo de
sobrevivência é censurado e um 1 indicando que o evento de interesse ocorreu.
Em estudos onde diferentes tratamentos estão sendo investigados, estamos interessados em três
itens de informação para cada sujeito: (1) Qual tratamento foi dado ao paciente? (2) Por quanto tempo o
paciente foi observado? (3) O paciente experimentou o evento de interesse durante o estudo ou o tempo
de sobrevida foi censurado por algum motivo? Em estudos que não se preocupam em comparar diferentes
condições de tratamento, apenas os dois últimos itens de dados são relevantes. Além disso, podemos estar
interessados em diferentes covariáveis associadas aos pacientes (por exemplo, idade, sexo, nível de renda)
para desenvolver modelos mais complexos e, portanto, podemos desenvolver questões com base nessas
covariáveis de interesse.
Com essas três informações em mãos, juntamente com quaisquer covariáveis de interesse,
podemos, em estudos como o exemplo do infarto do miocárdio mencionado na Seção 14.1, estimar o
tempo médio de sobrevida do grupo de pacientes que recebeu um tratamento em comparação com outro.
A comparação de diferentes medianas de tratamento permite responder à seguinte questão: Com base nas
informações do nosso estudo, qual tratamento concluímos que retarda por mais tempo, em média, a
ocorrência de um segundo infarto? Os dados coletados em estudos de acompanhamento, como os
descritos, também podem ser usados para responder a outra questão de considerável interesse para o
clínico: qual é a probabilidade estimada de que um paciente sobreviva por um período de tempo
especificado? Ou, Existe uma diferença na sobrevivência de homens e mulheres que sofreram ataques
cardíacos? Para o estudo do infarto do miocárdio, o clínico pode perguntar: “Qual é a probabilidade de um
paciente que recebeu o tratamento A sobreviver mais de 2 anos?” Os métodos empregados para responder
a esses tipos de perguntas são conhecidos como métodos de análise de sobrevivência.
Funções de distribuição estatística Antes de apresentar os métodos de análise de sobrevivência, é

importante considerar as distribuições de dados comumente encontradas em tais análises. Os dados de
tempo até o evento são distribuídos temporalmente, de modo que os eventos ocorram em algum ponto ou
dentro de algum intervalo de tempo. Esses eventos são considerados um
variável aleatória tendo alguma probabilidade de ocorrência em cada período de tempo para cada
sujeito no estudo.
Já encontramos duas representações úteis de distribuições de probabilidade no Capítulo 4.
Elas foram a função de distribuição cumulativa e a função de distribuição de probabilidade. Se
deixarmos o tempo do evento ser representado por T, então a função de distribuição cumulativa de T
é representada por FðtÞ, tal que
FðtÞ ¼ PðT tÞ (14.2.1)
Ou seja, a função de distribuição cumulativa representa a probabilidade de que o tempo de um

evento seja menor ou igual a algum tempo de medição especificado, t. Como você se lembra do
Capítulo 4, FðtÞ é uma função crescente que vai de um valor de zero (supõe-se teoricamente que
nenhum evento ocorreu no início do estudo) até um valor de 1 (supõe-se teoricamente que todos os
eventos ocorreram na conclusão do estudo). No contexto da análise de sobrevivência, uma função
intimamente relacionada que é mais comumente usada do que FðtÞ é uma função que vai de um
valor de 1 (presume-se que todos os indivíduos no início do estudo “sobreviveram” a esse ponto) para
um valor de zero (supõe-se teoricamente que nenhum dos sujeitos “sobreviveu” quando o estudo
termina, embora alguns sujeitos possam ser censurados). Convenientemente, isso é conhecido como
distribuição de sobrevivência, SðtÞ, e é matematicamente relacionado à função de distribuição
cumulativa por
SðtÞ ¼ 1 FðtÞ (14.2.2)
Ambas as distribuições são ilustradas na Figura 14.2.2. É na curva de sobrevivência que geralmente
estamos mais interessados, e comparações de várias curvas de sobrevivência fornecem um meio
estatístico para comparar coisas como sobrevivência individual e diferenças na sobrevivência entre
diferentes tratamentos.
0,9
0,8
0,7
0,6
Probabilidade
0,5
F(t)
0,4
0,3 S(t)
0,2
0,1
0
0 2 4 6 8 10 12 14 16 18 20
Tempo
FIGURA 14.2.2 Ilustração da função de distribuição cumulativa, F(t), e da distribuição de sobrevivência,

S(t).
A função de distribuição de probabilidade, conforme definida no Capítulo 4, é representada pelo

conjunto de probabilidades que especificam os valores possíveis de uma variável aleatória. No contexto
da análise de sobrevivência, esta função de densidade representa a probabilidade de um evento ocorrer
em um intervalo de tempo definido. Podemos perguntar, por exemplo, qual é a probabilidade de sobreviver
2 meses? Embora a compreensão completa das complexidades dessa distribuição de probabilidade exija
conhecimento de cálculo, podemos ilustrar seu significado conceitualmente lembrando um conceito de
nossa discussão sobre a distribuição normal no Capítulo 4.
Quando calculamos probabilidades para a distribuição normal, estávamos interessados em calcular a área
sob uma curva limitada por dois valores. Da mesma forma, na análise de sobrevivência, estamos
interessados em calcular a probabilidade de um evento limitado por um intervalo de tempo, digamos Dt, e
então encontrar nossa probabilidade conforme o intervalo se torna muito pequeno, ou seja, como Dt ! 0.
Portanto, a função de distribuição de probabilidade, fðtÞ, é definida por
Pðt T < t þ DtÞ fðtÞ ¼

; como Dt! 0 (14.2.3)
Dt
Ou seja, o conjunto de probabilidades de eventos que ocorrem em um intervalo de tempo infinitesimalmente

pequeno define a função de probabilidade. Também é possível encontrar essa função examinando o que
acontece durante uma mudança em FðtÞ, digamos DFðtÞ, ou uma mudança em S(t), digamos DSðtÞ, em um
determinado intervalo de tempo. Isso é
DFðtÞ DSðtÞ
fðtÞ ¼
¼
(14.2.4)
Dt Dt
Finalmente, uma função frequentemente encontrada na análise de sobrevivência é a função de

risco, hðtÞ. Esta função é usada para definir a probabilidade instantânea de um evento ocorrer dado que
o sujeito sobreviveu até um determinado tempo, t. Esta função é definida como
Pðt T < t þ DtjT tÞ hðtÞ ¼

; asDt! 0 (14.2.5)
Dt
Observe que esta função é baseada em uma probabilidade condicional, em que estamos interessados
em calcular a probabilidade de um evento ocorrer dado que o sujeito já sobreviveu a um tempo definido.
A condição de já ter sobrevivido a um determinado tempo significa que a probabilidade de sobreviver no
futuro é influenciada por já ter sobrevivido a períodos de tempo anteriores. Essa ideia pode ser muito
importante em alguns casos, onde sobreviver aos estágios iniciais de uma doença pode diminuir
drasticamente o potencial de um evento ocorrer em um futuro próximo. Como exemplo, considere o
câncer em que a não recorrência, ou remissão, por um período de 5 anos geralmente aumenta a
sobrevida. Esta função também pode ser expressa em termos de duas funções previamente definidas.
Esta expressão é
fðtÞ
hðtÞ ¼ (14.2.6)
SðtÞ
Como a função de risco pode exceder 1, ela não é verdadeiramente uma probabilidade, embora seja
baseada na probabilidade condicional de ocorrência de um evento. A função de risco é frequentemente
definida na análise de sobrevivência por uma distribuição conhecida, como lognormal, exponencial ou Weibull
distribuição. Excelentes descrições dos vários modelos usados para representar as funções de risco são
fornecidas por Allison (4) e Kleinbaum e Klein (1).
14.3 O PROCEDIMENTO KAPLAN-MEIER

Agora vamos mostrar como podemos usar os dados geralmente coletados em estudos de acompanhamento do
tipo que discutimos para estimar a probabilidade de sobreviver por um período de tempo especificado. O método
que usamos foi introduzido por Kaplan e Meier (5) e por isso é chamado de procedimento de Kaplan–Meier.
Como o procedimento envolve a multiplicação sucessiva de probabilidades individuais estimadas, às vezes é
chamado de método do limite do produto para estimar as probabilidades de sobrevivência.
Como veremos, os cálculos incluem as computações de proporções de indivíduos em uma amostra que
sobrevivem por vários períodos de tempo. Usamos essas proporções amostrais como estimativas das
probabilidades de sobrevivência que esperaríamos observar na população representada por nossa amostra.
Em termos matemáticos, nos referimos ao processo como a estimativa de uma função de sobrevivência.
Distribuições de frequência e distribuições de probabilidade podem ser construídas a partir dos tempos de
sobrevivência observados, e essas distribuições observadas podem mostrar evidências de seguir alguma
distribuição teórica de forma funcional conhecida. Quando a forma da distribuição amostrada é desconhecida,
recomenda-se que a estimação de uma função de sobrevivência seja realizada por meio de uma técnica não
paramétrica, da qual o procedimento de Kaplan–Meier é uma delas. Técnicas não paramétricas são definidas e
discutidas em detalhes no Capítulo 13.
Cálculos para o procedimento de Kaplan-Meier Vamos
n ¼ o número de indivíduos cujos tempos de sobrevivência estão disponíveis
p1 ¼ a proporção de indivíduos sobreviventes pelo menos no primeiro período de tempo

(dia, mês, ano, etc.)
p2 ¼ a proporção de indivíduos que sobreviveram ao segundo período de tempo

após terem sobrevivido ao primeiro período de tempo p3 ¼ a proporção de
indivíduos que sobreviveram ao terceiro período de tempo após terem sobrevivido

ao segundo período de tempo
.
.
.
pk ¼ a proporção de indivíduos que sobreviveram ao k-ésimo período de

tempo depois de terem sobrevivido ao ð Þ k 1º período de tempo
Usamos essas proporções, que podemos renomear como ^p1; ^p2; ^p3; ... ; ^pk como estimativas da
probabilidade de que um sujeito da população representada pela amostra sobreviverá aos períodos de tempo
..
1, 2, 3, . , k, respectivamente.
Para qualquer período de tempo, t, onde 1 t k, estimamos a probabilidade de sobreviver ao
tth período de tempo, pt, como segue:
número de indivíduos que sobrevivem pelo menosðt Þ 1 períodos de tempo que também sobrevivem ao t-ésimo
período ^pt ¼ número de indivíduos vivos no final do período de tempo ð t 1 Þ
(14.3.1)
14.3 O PROCEDIMENTO KAPLAN-MEIER 757
A probabilidade de sobreviver ao tempo t, SðtÞ, é estimada por
^S tðÞ¼ ^p1 ^p2 ^pt (14.3.2)
Ilustramos o uso do procedimento de Kaplan–Meier com o seguinte exemplo.
EXEMPLO 14.3.1
Para avaliar resultados e identificar preditores de sobrevida, Martini et al. (A-1) revisaram sua
experiência total com tumores malignos primários do esterno. Eles classificaram os pacientes
como tendo tumores de baixo grau (25 pacientes) ou de alto grau (14 pacientes). O evento
(status), o tempo até o evento (meses) e o grau do tumor para cada paciente são mostrados na Tabela 14.3
Desejamos comparar a experiência de sobrevida de 5 anos desses dois grupos por meio do
procedimento de Kaplan-Meier.
Solução: A disposição dos dados e os cálculos necessários são apresentados na Tabela 14.3.2.
As entradas para a tabela são obtidas da seguinte forma.
TABELA 14.3.1 Dados de Sobrevivência, Indivíduos com Tumores Malignos do Esterno
Tempo Vital Tumor Tempo Vital Tumor

Sujeito (Meses) Estado Classificar Assunto (Meses) Estado Série b
1 29 dod eu 21 155 ned eu
2 129 ned eu 22 102 dod eu
3 79 dod eu 23 34 ned eu
4 138 ned eu 24 109 ned eu
5 21 dod eu 25 15 dod eu
6 95 ned eu 26 122 ned H

7 137 ned eu 27 27 dod H
8 6 ned eu 28 6 dod H
9 212 dod eu 29 7 dod H
10 11 dod eu 30 2 dod H
11 15 dod eu 31 9 dod H
12 337 ned eu 32 17 dod H
13 82 ned eu 33 16 dod H
14 33 dod eu 34 23 dod H
15 75 ned eu 35 9 dod H
16 109 ned eu 36 12 dod H
17 26 ned eu 37 4 dod H
18 117 ned eu 38 0 dpo H
19 8 ned eu 39 3 dod H
20 127 ned eu
uma
dod ¼ morto de doença; ned ¼ sem evidência de doença; dpo ¼ morto pós-operação. b
L ¼ de baixo teor; H ¼ de alta qualidade.
Fonte: Dados fornecidos por cortesia do Dr. Nael Martini.
TABELA 14.3.2 Disposição de dados e cálculos para o procedimento de Kaplan-Meier, Exemplo 14.3.1
1 2 34 5 6
Estado vital 0 Pacientes cumulativo

Tempo ¼ censurado Pacientes Restante Sobrevivência Sobrevivência
(Meses) 1 ¼ morto em risco Vivo Proporção Proporção
Pacientes com Tumores de Baixo Grau
6 0
8 0
11 1 23 22 22=23 ¼ :956522 .956522
15 1
15 1 22 20 20=22 ¼ :909090 0,869564
21 1 20 19 19=20 ¼ :950000 .826086
26 0
29 1 18 17 17=18 ¼ :944444 .780192
33 1 17 16 16=17 ¼ :941176 .734298
34 0
75 0
79 1 14 13 13=14 ¼ :928571 0,681847
82 0
95 0
102 1 11 10 10=11 ¼ :909090 .619860
109 0
109 0
117 0
127 0
129 0
137 0
138 0
155 0
212 1 2 1 1=2 ¼ :500000 .309930
337 0
(Contínuo)
14.3 O PROCEDIMENTO KAPLAN-MEIER 759
TABELA 14.3.2 (Continuação)
1 2 34 5 6
Estado Vital 0 Pacientes cumulativo

Tempo ¼ Censurado 1 Pacientes Restante Sobrevivência Sobrevivência
(Meses) ¼ Morto em risco Vivo Proporção Proporção
Pacientes com tumores de alto grau
0 1 14 13 13=14 ¼ :928571 .928571
2 1 13 12 12=13 ¼ :923077 0,857142
3 1 12 11 11=12 ¼ :916667 .785714
4 1 11 10 10=11 ¼ :909090 .714285
6 110 99=10 ¼ :900000 0,642856
7 1 9 88=9 ¼ :888889 .571428
9 1
9 1 8 66=8 ¼ :750000 0,428572
12 1 6 5 5=6 ¼ :833333 .357143
16 1 5 4 4=5 ¼ :800000 .285714
17 1 4 3 3=4 ¼ :750000 .214286
23 1 3 2 2=3 ¼ :666667 .142857
27 1 2 1 1=2 ¼ :500000 0,071428
122 0 1 0
1. Começamos listando os tempos observados em ordem do menor para o maior em

Coluna 1.
2. A coluna 2 contém uma variável indicadora que mostra o estado vital
ð Þ 1 ¼ morreu; 0 ¼ vivo ou censurado .
3. Na coluna 3 listamos o número de pacientes em risco para cada tempo associado à
morte de um paciente. Só precisamos nos preocupar com os horários em que as
mortes ocorrem porque a taxa de sobrevivência não muda em horários censurados.
4. A coluna 4 contém o número de pacientes que permanecem vivos logo após um ou
mais mortes.
5. A coluna 5 contém a probabilidade condicional estimada de sobrevivência, que é obtida

dividindo a coluna 4 pela coluna 3. Observe que, embora houvesse duas mortes aos
15 meses no grupo de baixo grau e duas mortes aos 9 meses no grupo de alto grau
grupo, calculamos apenas uma proporção de sobrevivência nesses pontos. Os cálculos
levam em conta as duas mortes.
6. A coluna 6 contém a probabilidade cumulativa estimada de sobrevivência. Obtemos as
entradas nesta coluna por multiplicação sucessiva. Cada entrada após a primeira na
Coluna 5 é multiplicada pelo produto cumulativo de todas as entradas anteriores.
Após a conclusão dos cálculos, examinamos a Tabela 14.3.2 para determinar quais informações
úteis ela fornece. A partir da tabela, observamos os seguintes fatos, que nos permitem comparar a
experiência de sobrevivência dos dois grupos de indivíduos: aqueles com tumores de baixo grau e
aqueles com tumores de alto grau: 1. Tempo médio de sobrevida. Podemos determinar o tempo médio
de sobrevivência localizando o tempo, em meses, no qual a proporção cumulativa de sobrevivência é igual a

0,5.
Nenhuma das proporções cumulativas de sobrevida é exatamente 0,5, mas vemos que no grupo de
tumor de baixo grau, a probabilidade muda de 0,619860 para 0,309930 em 212 meses; portanto, a
sobrevida mediana para esse grupo é de 212 meses. No grupo de tumor de alto grau, a proporção
cumulativa muda de 0,571428 para 0,428572 em 9 meses, que é a sobrevida média para este grupo.
2. Taxa de sobrevida em cinco anos. Podemos determinar a taxa de sobrevivência de 5 anos ou 60 meses
para cada grupo diretamente da proporção de sobrevivência cumulativa em 60 meses. Para o grupo de
tumor de baixo grau, a taxa de sobrevida em 5 anos é de 0,734298 ou 73%; para o grupo de tumor de
alto grau, a taxa de sobrevida em 5 anos é de 0,071428 ou 7 por cento.
3. Tempo médio de sobrevivência. Podemos calcular para cada grupo a média dos tempos de sobrevivência,
que chamaremos de TL e TH para os grupos de baixo grau e alto grau, respectivamente. Para o grupo
de tumor de baixo grau calculamos TL ¼ 2201=25 ¼ 88:04, e para o grupo de tumor de alto grau
calculamos TH ¼ 257=14 ¼ 18:35. Como muitas das vezes no grupo de baixo grau são censuradas, o
verdadeiro tempo médio de sobrevivência para esse grupo é, na realidade, maior (talvez
consideravelmente) do que 88,04. O verdadeiro tempo médio de sobrevivência para o grupo de alto grau
também é provavelmente maior do que o calculado 18,35, mas com apenas um tempo censurado não
esperamos uma diferença tão grande entre a média calculada e a média real. Assim, vemos que temos
ainda outra indicação de que a experiência de sobrevivência do grupo de tumor de baixo grau é mais
favorável do que a experiência de sobrevivência do grupo de tumor de alto grau.
4. Taxa média de risco. A partir dos dados brutos de cada grupo também podemos calcular outra estatística
descritiva que pode ser usada para comparar as duas experiências de sobrevivência. Essa estatística é
chamada de taxa média de risco. É uma medida de potencial de não sobrevivência em vez de
sobrevivência. Um grupo com uma taxa de risco média mais alta terá uma probabilidade menor de
sobreviver do que um grupo com uma taxa de risco média mais baixa. Calculamos a taxa de risco média,
designada h, dividindo o número de indivíduos que não sobrevivem pela soma dos tempos de
sobrevivência observados. Para o grupo de tumor de baixo grau, calculamos hL ¼ 9=2201 ¼ :004089.
Para o grupo de tumor de alto grau, calculamos hH ¼ 13=257 ¼ :05084. Vemos que a taxa de risco
média para o grupo de alto grau é maior do que para o grupo de baixo grau, indicando uma chance
menor de sobrevivência para o grupo de alto grau. grupo de grau.
A coluna da proporção cumulativa de sobrevivência da Tabela 14.3.2 pode ser representada

visualmente em um gráfico de curva de sobrevivência no qual as proporções cumulativas de sobrevivência
são representadas pelo eixo vertical e o tempo em meses pelo eixo horizontal. Notamos que o gráfico
se assemelha a degraus com “degraus” ocorrendo nos momentos em que ocorreram os óbitos. O gráfico
também nos permite
EXERCÍCIOS 761
1,0
73%
.8 Nota baixa (N = 25)
.6
.5
.4
.2 7%
Alto grau (N = 14)
0,0
0 12 24 36 48 60 72 84 96 108 120
Tempo (meses)
FIGURA 14.3.1 Curva de sobrevivência de Kaplan-Meier, Exemplo 14.3.1, mostrando tempos médios de sobrevivência
e taxas de sobrevivência de 5 anos (60 meses).
para representar visualmente o tempo médio de sobrevivência e as taxas de sobrevivência,

como a taxa de sobrevivência de 5 anos. O gráfico para os dados cumulativos de
sobrevivência da Tabela 14.3.2 é mostrado na Figura 14.3.1.
Essas observações sugerem fortemente que a experiência de sobrevivência de
pacientes com tumores de baixo grau é muito mais favorável do que a de pacientes com
tumores de alto grau. &
EXERCÍCIOS
14.3.1 Cinquenta e três pacientes com câncer medular de tireoide (CMT) foram os sujeitos de um estudo de Dottorini et al.
(A-2), que avaliou o impacto de diferentes fatores clínicos e patológicos e o tipo de tratamento em sua sobrevida.
Trinta e dois dos pacientes eram do sexo feminino, e a média de idade de todos os pacientes foi de 46,11 anos
com desvio padrão de 14,04 (variando de 18 a 35 anos). A tabela a seguir mostra o estado de cada paciente em
vários períodos de tempo após a cirurgia. Calcule a função de sobrevivência usando o procedimento de Kaplan-
Meier e trace a curva de sobrevivência.
Sujeito Tempoa (Anos) Statusb Assunto Timea (Anos) Status b
1 0 documento 28 6 vivo
2 1 mtc 29 6 vivo
3 1 mtc 30 6 vivo
4 1 mtc 31 6 vivo
5 1 mtc 32 7 mtc
6 1 mtc 33 8 vivo
7 1 mtc 34 8 vivo
8 1 mtc 35 8 vivo
9 1 vivo 36 8 vivo
10 2 mtc 37 8 vivo
(Contínuo)
Tempo do Assuntoa (Anos) Statusb Tempo do Assuntoa (Anos) Statusb
11 2 mtc 38 9 vivo
12 2 mtc 39 10 vivo
13 2 vivo 40 11 mtc
14 2 vivo 41 11 documento
15 3 mtc 42 12 mtc
16 3 mtc 43 12 doc
17 3 vivo 44 13 mtc
18 4 mtc 45 14 vivo
19 4 vivo 46 15 vivo
20 4 vivo 47 16 mtc
24 5 vivo 51 17 documento
25 5 vivo 52 18 mtc
27 6 vivo
uma
O tempo é o número de anos após a cirurgia.

b
doc ¼ morto por outras causas; mtc ¼ morto de câncer medular de tireoide. fonte:
Dados fornecidos por cortesia do Dr. Massimo E. Dottorini.
14.3.2 Banerji et al. (A-3) acompanhou pacientes com diabetes mellitus não dependente de insulina (DMNID)
desde o início de sua hiperglicemia original e o início de sua remissão quase normoglicêmica após
o tratamento. Os sujeitos eram homens e mulheres negros com média de idade de 45,4 anos e
desvio padrão de 10,4. A tabela a seguir mostra a experiência de recaída/remissão de 62 indivíduos.
Calcule a função de sobrevivência usando o procedimento de Kaplan–Meier e trace a curva de sobrevivência.
Total Total Total

Duração de Duração de Duração de
Remissão Remissão Remissão Remissão Remissão Remissão
(Meses) Estado (Meses) Estado (Meses) Estado
3 1 8 2 26 1
3 2 9 2 27 1
3 110128 2
3 110129 1
3 111231 2
4 113131 1
4 116133 2
4 116239 2 5 117241 1 5 118244 1 5 120146 1 5 122146 2 5 122248 1 5 122248 2
(Contínuo)
14.4 COMPARAÇÃO DE CURVAS DE SOBREVIVÊNCIA 763
Total Total Total

Duração de Duração de Duração de
Remissão Remissão Remissão Remissão Remissão Remissão
(Meses) Estado (Meses) Estado (Meses) Estado
5 123148 1
6 124249 1
6 125250 1
6 125253 1
7 126170 2
8 226194 1
8 1
8 2
uma
1 ¼ sim (o paciente ainda está em remissão); 2 ¼ não (o paciente teve uma recaída).
Fonte: Dados fornecidos por cortesia da Dra. Mary Ann Banerji.
14.4 COMPARAÇÃO DE CURVAS DE SOBREVIVÊNCIA
O exame de uma curva de sobrevivência para um único grupo de indivíduos é valioso porque permite ver
características que não são tão facilmente vistas ao examinar um conjunto de valores tabulados.
Isso inclui visualizar a trajetória temporal para encontrar períodos de tempo em que houve mudanças dramáticas
na sobrevivência, encontrar períodos de tempo em que ocorreram relativamente poucas mudanças ou encontrar
a mediana aproximada da distribuição de dados. A construção de curvas de sobrevivência, no entanto, encontra
seu maior uso quando as comparações entre as distribuições de sobrevivência são de interesse. Por exemplo,
pode-se desejar examinar as diferenças no tratamento em que os indivíduos foram designados aleatoriamente,
ou pode-se desejar saber qual medicamento atrasa o início do evento de interesse por um período de tempo
mais longo.
Os resultados da comparação das experiências de sobrevivência de diferentes grupos nem sempre
serão tão dramáticos quanto os do nosso exemplo anterior. Para uma comparação objetiva das experiências de
sobrevivência de diferentes grupos, é desejável que tenhamos uma técnica objetiva para determinar se eles são
estatisticamente significativamente diferentes. Sabemos também que os resultados observados se aplicam
estritamente às amostras nas quais as análises se baseiam. De muito maior interesse é um método para
determinar se podemos concluir que existe uma diferença entre as experiências de sobrevivência nas populações
das quais as amostras foram retiradas. Em outras palavras, neste ponto, desejamos um método para testar a
hipótese nula de que não há diferença na experiência de sobrevivência entre as populações contra a alternativa
de que há uma diferença. Tal teste é fornecido pelo teste log-rank. O teste de log-rank é uma aplicação do
procedimento de Mantel-Haenszel discutido na Seção 12.7. A extensão do procedimento para dados de
sobrevivência foi proposta por Mantel (6). Embora possamos querer comparar as curvas de sobrevivência de
muitas populações, limitaremos nossa discussão à comparação de dois grupos: Para realizar esta tarefa,
calculamos a estatística log-rank e procedemos da seguinte forma:
1. Ordene os tempos de sobrevivência até a morte para ambos os grupos combinados, omitindo censura
vezes. Cada vez constitui um estrato conforme definido na Seção 12.7.
2. Para cada estrato ou tempo, ti, construímos uma tabela 2 2 na qual a primeira linha contém o número de
mortes observadas, a segunda linha contém o número de
TABELA 14.4.1 Tabela de Contingência para Stratum (Time) ti para Cálculo do Teste Log Rank
grupo A Grupo B Total
Número de mortes observadas ai bi ai + bi

Número de pacientes vivos ci di ci + di
Número de pacientes “em risco” ai + ci bi + di ni ¼ ai + bi + ci + di
pacientes vivos, a primeira coluna contém dados para um grupo, digamos, grupo A, e a segunda
coluna contém dados para o outro grupo, digamos, grupo B. A Tabela 14.4.1 mostra a tabela para
o tempo ti.
3. Para cada estrato, calcule a frequência esperada para a célula superior esquerda de sua tabela
pela Equação 12.7.5.
4. Para cada estrato calcule vi pela Equação 12.7.6.
5. Finalmente, calcule a estatística de Mantel-Haenszel (agora chamada de estatística log-rank) por
Equação 12.7.7.
Ilustramos o cálculo da estatística log-rank com o exemplo a seguir.
EXEMPLO 14.4.1
Vamos nos referir novamente aos dados sobre tumores malignos primários do esterno apresentados no
Exemplo 14.3.1. O exame dos dados revela que existem 20 períodos de tempo (estratos).
Para cada uma delas, uma tabela 2 2 seguindo o padrão da Tabela 14.4.1 deve ser construída.
A primeira dessas tabelas é mostrada como Tabela 14.4.2. Pelas Equações 12.7.5 e 12.7.6 calculamos
ei e vi da seguinte forma: ð Þ 0 þ 1 ð 0 þ 25 Þ ¼ :641 39 ð Þ 0 þ 1 ð Þ 25 þ 13 ð Þ 0 þ 25 ð Þ 1 þ 13 ¼
:230 392ð Þ 38
ei ¼
vi ¼
Os dados da Tabela 14.4.2 e dados semelhantes para os outros 19 períodos de tempo são mostrados
na Tabela 14.4.3. Usando os dados da Tabela 14.4.3, calculamos a estatística log-rank pela Equação
12.7.7 da seguinte forma:
2
ð Þ 9 17:811
x2MH ¼ ¼ 24:724
3:140
TABELA 14.4.2 Tabela de Contingência para Primeiro Estrato (Período de

Tempo) para Cálculo do Teste Log-Rank, Exemplo 14.4.1
Nota baixa Nota alta Total
Mortes 0 1 1
Pacientes vivos 25 13 38
Pacientes em risco 25 13 39
14.4 COMPARAÇÃO DE CURVAS DE SOBREVIVÊNCIA 765
TABELA 14.4.3 Cálculos intermediários para o teste Log-Rank, Exemplo 14.4.1
Tempo, ti ai ci ai þ ci bi di bi þ di ni ei sim
0 0 25 25 1 13 14 39 0,641 0,230
2 0 25 25 1 12 13 38 0,658 0,225
3 0 25 25 1 11 12 37 0,676 0,219
4 0 25 25 1 10 11 36 0,694 0,212
6 0 25 25 1 9 10 35 0,714 0,204
7 0 24 24 1 8 9 33 0,727 0,198
9 0 23 23 2 6 8 31 1.484 0,370
11 1 22 23 0 6 6 29 0,793 0,164
12 0 22 22 1 5 6 28 0,786 0,168
15 2 20 22 0 5 5 27 1.630 0,290
16 0 20 20 1 4 5 25 0,800 0,160
17 0 20 20 1 3 4 24 0,833 0,139
21 1 19 20 0 3 3 23 0,870 0,113
23 0 19 19 1 2 3 22 0,864 0,118
27 0 18 18 1 1 2 20 0,900 0,090
29 1 17 18 0 1 1 19 0,947 0,050
33 1 16 17 0 1 1 18 0,944 0,052
79 1 13 14 0 1 1 15 0,933 0,062
102 1 10 11 0 1 1 12 0,917 0,076
212 1 1 2 0 0 0 2 1.000 0,000
Totais 9 17.811 3.140
A referência à Tabela F do Apêndice revela que desde 24:724 > 7:879, o valor p para este
teste é < :005. Portanto, rejeitamos a hipótese nula de que a experiência de sobrevida é a
mesma para pacientes com tumores de baixo grau e tumores de alto grau e concluímos que
são diferentes.
Existem procedimentos alternativos para testar a hipótese nula de que duas curvas de
sobrevivência são idênticas. Eles incluem o teste de Breslow (também chamado de teste de
Wilcoxon generalizado) e o teste de Tarone-Ware. Ambos os testes, assim como o teste de log-
rank, são discutidos em Parmar e Machin (7) e Allison (4). Como o teste de log-rank, o teste de
Breslow e o teste de Tarone-Ware são baseados nas diferenças ponderadas entre os números
reais e esperados de mortes nos pontos de tempo observados. Enquanto o teste de log-rank
classifica todas as mortes igualmente, os testes de Breslow e Tarone-Ware dão mais peso às
mortes precoces. Para o Exemplo 12.8.1, o SPSS teste calcula
Breslow
º ume um
valor
valor
de 24:93ð
de 25:22ð
p < p:001
< :001
parapara
o
o teste para
Tarone–Ware.
este teste
º Kleinbaum
são encontradas
(27) discute
em Parmar
outro eteste
Machin
chamado
(7). O teste
teste de
de Peto.
Peto também
As fórmulas
dá
mais peso à parte inicial da curva de sobrevivência, onde encontramos o maior número de
indivíduos em risco. Ao escolher um teste, então, os pesquisadores que desejam dar mais peso
à parte inicial da curva de sobrevivência selecionarão o teste de Breslow, Tarone-Ware ou Peto.
Caso contrário, o teste de log-rank é apropriado.
Cobrimos apenas os conceitos básicos da análise de sobrevivência nesta seção. O

leitor que desejar aprofundar o assunto pode consultar um ou mais livros dedicados ao tema,
como os de Kleinbaum (8), Lee (9), Marubini e Valsecchi (10) e Parmar e Machin (7). ).
Análise de computador
Vários dos pacotes de software estatístico disponíveis, como o SPSS, são capazes de realizar
análises de sobrevivência e construir gráficos de suporte conforme descrito nesta seção.
Uma análise SPSS padrão dos dados discutidos nos Exemplos 14.3.1 e 14.4.1 é
mostrada na Figura 14.4.1. &
Médias e medianas para o tempo de sobrevivência
média Mediana
Intervalo de confiança de 95% Intervalo de confiança de 95%
tumor_grau Padrão Mais baixo Superior Padrão Mais baixo Superior

Estimativa Erro Limite Limite Estimativa Erro Limite Limite
H 18.357 8.251 2.186 34.528 9.000 1.852 5.371 12.629
eu 88.040 15.258 58.134 117.946 82.000 16.653 49.359 114.641
No geral 63.026 11.490 40.505 85.546 27.000 7.492 12.317 41.683
uma
A estimativa é limitada ao maior tempo de sobrevivência se for censurada.
Comparações gerais
qui-quadrado df Assinar
Log Rank (Mantel-Cox) 24.704 1 000

Breslow (Generalizado
Wilcoxon) 24.927 .000
Tarone-Ware 25.217 11 .000
Teste de igualdade de distribuições de sobrevivência para os diferentes níveis de tumor_grade.
FIGURA 14.4.1 Saída do SPSS para os Exemplos 14.3.1 e 14.4.1.

EXERCÍCIOS 767
EXERCÍCIOS
14.4.1 Se disponível em sua biblioteca, leia o artigo “Impacto da obesidade em pacientes com transplante de células-tronco
alogênicas: um estudo de caso controlado combinado”, de Donald R. Fleming et al. [American Journal of Medicine,
102 (1997), 265–268] e responda às seguintes perguntas: (a) Como foi determinado o tempo de sobrevida? (b)
Por que você acha que os autores usaram o teste de Wilcoxon (teste de Breslow) para comparar as curvas de
sobrevida?
(c) Explique o significado dos valores de p relatados para as Figuras 1 a 4. (d) Quais
resultados estatísticos específicos permitem que os autores cheguem à conclusão declarada?
14.4.2 Se disponível em sua biblioteca, leia o artigo “Melhor Sobrevivência em Pacientes com Câncer de Próstata
Localmente Avançado Tratados com Radioterapia e Goserelina”, de Michel Bolla et al. [New England Journal of
Medicine, 337 (1997), 295–300], e responda às seguintes perguntas: (a) Como foi determinado o tempo de
sobrevida? (b) Por que você acha que os autores usaram o teste de log-rank para comparar as curvas de
sobrevivência? (c) Explique o significado dos valores de p relatados para as Figuras 1 e 2. (d) Quais resultados
estatísticos específicos permitem que os autores cheguem à conclusão declarada?
14.4.3 Cinquenta indivíduos que completaram um programa de redução de peso em uma academia foram divididos em dois grupos
iguais. Os indivíduos do grupo 1 foram imediatamente designados para um grupo de apoio que se reunia semanalmente.
Os sujeitos do grupo 2 não participaram das atividades do grupo de apoio. Todos os indivíduos foram
acompanhados por um período de 60 semanas. Eles se apresentavam semanalmente ao centro de fitness, onde
eram pesados e se determinava se estavam dentro do objetivo. Os indivíduos foram considerados dentro da
meta se seu peso semanal estivesse dentro de 5 libras de seu peso no momento da conclusão do programa de
redução de peso. A sobrevida foi medida a partir da data de conclusão do programa de redução de peso até o
término do acompanhamento ou o ponto em que o sujeito excedeu a meta. Os seguintes resultados foram
observados:
Status Status
(G ¼ Dentro do Objetivo (G ¼ Dentro do Objetivo
Tempo Gþ ¼ Meta Superada Tempo Gþ ¼ Meta Superada
Sujeito (Semanas) L ¼ Perdido para Acompanhamento) Assunto (Semanas) L ¼ perdido para acompanhamento)
Grupo 1 Grupo 2
1 60 G 1 20 Gþ
2 32 eu 2 26 Gþ
3 60 G 3 10 Gþ
4 22 eu 4 2 Gþ
56 Gþ 6 5 36 Gþ
60 G 6 10 Gþ
7 60 G 7 20 Gþ
8 20 Gþ 8 18 eu
9 32 Gþ 9 15 Gþ
10 60 G 10 22 Gþ
11 60 G 11 4 Gþ
12 8 Gþ 12 12 Gþ
(Contínuo)
Status Status
(G ¼ Dentro do Objetivo (G ¼ Dentro do Objetivo
Tempo Gþ ¼ Meta Superada Tempo Gþ ¼ Meta Superada
Sujeito (Semanas) L ¼ Perdido para Acompanhamento) Assunto (Semanas) L ¼ perdido para acompanhamento)
Grupo 1 Grupo 2
13 60 G 13 24 Gþ
14 60 G 14 6 Gþ
15 60 G 15 18 Gþ
16 14 eu 16 3 Gþ
17 16 Gþ 17 27 Gþ
18 24 eu 18 22 Gþ
19 34 eu 19 8 Gþ
20 60 G 20 10 eu
21 40 eu 21 32 Gþ
22 26 eu 22 7 Gþ
23 60 G 23 8 Gþ
24 60 G 24 28 Gþ
25 52 eu 25 7 Gþ
Analise esses dados usando os métodos discutidos nesta seção.
14.5 REGRESSÃO DE COX: O MODELO DE RISCOS

PROPORCIONAIS
Nos capítulos anteriores, vimos que os modelos de regressão podem ser usados para medidas de resultados contínuos e
para medidas de resultados binários (regressão logística). Técnicas de regressão adicionais estão disponíveis quando as
medidas dependentes podem consistir em uma mistura de dados de tempo até o evento ou observações de tempo
censuradas. Voltando ao nosso exemplo de um ensaio clínico da eficácia de dois medicamentos diferentes para prevenir
um segundo infarto do miocárdio, podemos desejar controlar as características adicionais dos indivíduos incluídos no
estudo. Por exemplo, esperaríamos que os indivíduos fossem diferentes em suas medições de pressão arterial sistólica,
história familiar de doença cardíaca, peso, massa corporal e outras características. Como todos esses fatores podem
influenciar a duração do intervalo de tempo até um segundo infarto do miocárdio, gostaríamos de levar em consideração
esses fatores na determinação da eficácia dos medicamentos. O método de regressão conhecido como regressão de Cox
(em homenagem a DR Cox (11), que primeiro propôs o método) ou regressão de risco proporcional pode ser usado para
explicar os efeitos de medições contínuas e discretas de covariáveis (variáveis independentes) quando a variável
dependente é possivelmente censurada dados de tempo até o evento.
Descrevemos essa técnica revisando primeiro a função de risco da Seção 14.2, que descreve a probabilidade
condicional de que um evento ocorrerá em um tempo um pouco maior do que ti , desde que tenha sobrevivido sem eventos
até o tempo ti. Essa função geralmente é escrita como h(ti). O modelo de regressão exige que assumamos que as
covariáveis têm o efeito de
14.5 REGRESSÃO DE COX: O MODELO DE RISCOS PROPORCIONAIS 769
aumentando ou diminuindo o perigo para um determinado indivíduo em comparação com algum valor de
linha de base para a função. Em nosso exemplo de ensaio clínico, podemos medir k covariáveis n sujeitos
dos sujeitos onde há i ¼ 1; ... função de risco. Descrevemos o; emodelo
h0 tð Þideé regressão
a linha de como
base em cada um
h tð Þ¼i h0 tð Þi exp ðb1zi1 þ b2zi2 þþ bk Þ zik (14.5.1)
Os coeficientes de regressão representam a mudança no perigo que resulta do fator de risco, zik,
que medimos. A reorganização da equação acima mostra que o coeficiente exponenciado representa a
razão de risco ou a razão das probabilidades condicionais de um evento. Esta é a base para nomear este
método de regressão de riscos proporcionais. Você deve se lembrar de que foi assim que obtivemos a
estimativa da razão de chances a partir do coeficiente estimado quando discutimos a regressão logística
no Capítulo 11.
h tð
Þi Þi
ð Þ zik ¼ exp b1zi1 þ b2zi2 þþ bk h0 tð (14.5.2)
Estimar os efeitos de covariáveis, b^ requer o uso de um pacote de software estatístico porque não há
uma única equação direta que forneça as estimativas para este modelo de regressão. A saída do
computador geralmente inclui estimativas dos coeficientes de regressão, estimativas de erro padrão,
estimativas de taxa de risco e intervalos de confiança. Além disso, a saída do computador também pode
fornecer gráficos das funções de risco e funções de sobrevivência para sujeitos com diferentes valores de
covariáveis que são úteis para comparar os efeitos das covariáveis na sobrevivência.
EXEMPLO 14.5.1
Para determinar se o tempo de recaída entre usuários de drogas está relacionado à idade do paciente e/
ou à droga de escolha, Cross (dados clínicos não publicados) revisou uma amostra aleatória de arquivos
de casos para usuários de drogas de alto risco em uma clínica de tratamento ambulatorial. Os dados
representam o tempo auto relatado em que ocorreu a recaída (ou o tempo em que o paciente perdeu o
acompanhamento), o estado do paciente, a droga de escolha e a idade do paciente. Os dados estão
resumidos na Tabela 14.5.1.
TABELA 14.5.1 Dados de sobrevida para pacientes em uma clínica de tratamento ambulatorial
Status Status Droga

Tempo 0 ¼ Censurado Droga 1 ¼ Tempo 0 ¼ Censurado 1 ¼ Opiáceo
Sujeito (Semanas) 1 ¼ Recaída Opiáceo 2 ¼ Outra Idade Sujeito
(Semanas) 1 ¼ Recaída 2 ¼ Outra Idade
1 12 1 121 21 21 1 228
2 8 1 1 18 22 41 1 2 31
3 5 1 1 17 23 23 0 2 22
4 17 1 117 24 15 1 231
5 19 1 125 25 15 0 225
6 12 0 130 26 21 1 219
(Contínuo)
TABELA 14.5.1 (Continuação)
Status Droga Status Droga

Tempo 0 ¼ Censurado 1 ¼ Opiáceo Tempo 0 ¼ Censurado 1 ¼ Opiáceo
Sujeito (Semanas) 1 ¼ Recaída 2 ¼ Outra Idade Sujeito (Semanas) 1 ¼ Recaída 2 ¼ Outra Idade
7 10 1 1 16 27 45 1 2 21
8 11 1 1 23 28 37 1 2 23
9 5 1 1 31 29 51 1 2 15
10 2 1 1 21 30 50 1 2 29
11 10 1 1 19 31 42 1 2 28
12 7 0 1 18 32 21 1 2 31
13 19 1 1 18 33 20 1 2 31
14 11 1 1 21 34 15 1 2 26
15 11 1 1 23 35 40 1 2 28
16 19 1 1 15 36 39 1 2 31
17 19 1 1 17 37 33 1 2 23
18 24 1 1 21 38 37 1 2 23
19 21 1 1 22 39 15 0 2 29
20 14 1 1 17 40 52 0 2 37
Fonte: Dados fornecidos por cortesia do Dr. Chad L. Cross.
Para este exemplo, empregaremos os algoritmos do método Cox Regression fornecidos no software SPSS. Todas as
referências a tabelas e figuras nas explicações abaixo se referem à Figura 14.5.1, que mostra a saída SPSS selecionada
para este exemplo.
1. Teste geral. O SPSS fornece um teste geral de significância muito semelhante ao relatado para regressão logística
discutido no Capítulo 11. Nesse teste, a verossimilhança é usada para comparar um modelo sem parâmetros (o
modelo nulo) e um modelo com as variáveis de interesse incluídas. Se houver uma diferença significativa na função
de verossimilhança entre o modelo com parâmetros e o modelo nulo, então o modelo de regressão de Cox é
significativo e pelo menos uma das variáveis de interesse está significativamente relacionada à variável de
resultado. Um exame da saída mostra que o Teste Omnibus para Coeficientes de Modelo com idade e droga
inseridos no modelo é significativamente diferente do modelo nulo, com p < 0,001.
2. Variáveis do modelo. O próximo SPSS fornece uma tabela para cada uma das variáveis inseridas no modelo. Muito
parecido com um modelo de regressão padrão, o parâmetro do modelo, seu erro padrão e um teste de significância
são fornecidos para testar o nulo, Ho: b ¼ 0. Para esses dados, o tipo de droga foi significativamente preditivo do
tempo de recaída (p <. 001), mas a idade não (p ¼ .792).
3. Curvas de sobrevivência. Uma vez que a droga de escolha foi significativamente relacionada ao tempo de recaída, é
instrutivo examinar as curvas de sobrevida para esses dados. Ao examinar essas curvas, fica claro que há uma
diferença no tempo até a recaída, com aqueles que relatam o uso de opiáceos como droga principal de escolha
recaindo em um ritmo muito mais rápido do que aqueles que relatam o uso de outras drogas que não os opiáceos.
4. Taxas de risco. As taxas de risco são fornecidas para cada variável no modelo. Como na regressão logística, onde
calculamos as razões de chances, as taxas de risco são encontradas por
14.5 REGRESSÃO DE COX: O MODELO DE RISCOS PROPORCIONAIS 771
Testes Omnibus de Coeficientes de Modelo
Pontuação geral)
Chi
Probabilidade quadrado df
de –2 Log 167.40725.558 2 Assinar 000
Variáveis na equação
95,0% Cl para Exp(B)
B SE Wald df Exp(B) Mais baixo Superior

Medicamento
2.139 .531 16.239 1 Assinar 000 8.492 3.000 24.036
era –.009 0,032 0,070 1 0,792 0,991 0,930 1.057
medicamento
1,0
Opiáceo
De outros
0,8
0,6
Sobrevivência
Cumulativa
0,4
0,2
0,0
0,00 10,00 20,00 30,00 40,00 50,00 60,00
Semanas
FIGURA 14.5.1 Saída da análise de sobrevivência de regressão Cox do software SPSS para
Exemplo 14.5.1.
calculando exp(b). Examinando a variável droga, onde os opiáceos foram usados

como variável indicadora no SPSS, o risco de recaída é quase 8,5 vezes mais
provável para opiáceos em comparação com outras drogas, controlando a covariável
de idade. Embora possamos calcular a taxa de risco para idade da mesma forma que
para drogas, muitas vezes é útil para covariáveis quantitativas considerar o cálculo
da função 100(exp(b) 1), que fornece uma estimativa da variação percentual no risco
quando a covariável aumenta em uma unidade. No presente exemplo para a idade, isso leva a
100(0,991 1) ¼ 0,9. Portanto, para cada aumento de 1 ano na idade, o risco de recaída diminui em uma média de
cerca de 0,9%.
5. Conclusão. Com base nos resultados dessa amostra limitada, aprendemos que a idade do paciente, embora não
estatisticamente significativa, sugere que, em geral, a idade pode ser um pouco protetora, pois o risco de recaída
diminui com a idade. Também aprendemos que aqueles que sofrem dependência de opiáceos são propensos a
recaídas muito mais cedo em seu tratamento. Os resultados deste estudo preliminar podem ser usados para
desenvolver estudos adicionais para determinar se programas de tratamento diferentes, e talvez mais intensivos,
são mais bem-sucedidos para atingir aqueles que sofrem de dependência de opiáceos em comparação com outras
drogas. &
Claramente, a regressão de Cox pode se tornar muito complexa à medida que o número de variáveis aumenta.
Assim como os modelos de regressão padrão discutidos nos capítulos anteriores, pode-se optar por usar procedimentos
de seleção (para frente, para trás ou passo a passo) ou examinar as interações entre as variáveis nos modelos. Além
disso, pode-se ter covariáveis dependentes do tempo em que o valor da covariável pode mudar a cada tempo de medição.
Exemplos disso podem ser o casamento ou o diagnóstico de uma condição de saúde. Essas covariáveis estão em contraste
com as covariáveis de tempo constante, que não mudam (por exemplo, gênero). Em resumo, a regressão de Cox é uma
técnica muito útil para modelar dados de sobrevivência. Para os interessados em ler mais, os textos de Kleinbaum e Klein
(1), Lee (2), Hosmer e Lemeshow (3) e Allison (4) são altamente recomendados.
EXERCÍCIOS
14.5.1 Em um estudo que examinou o tempo de início do câncer após a exposição à luz ultravioleta em ratos, a idade (meses) foi usada como
uma covariável em um modelo de regressão de Cox. No modelo, a estimativa do parâmetro para peso foi de 0,19 e teve um valor p
de 0,021. Forneça uma interpretação dessa estimativa de parâmetro em termos da taxa de risco.
14.5.2 No estudo descrito no Exercício 14.5.1, os pesquisadores também estavam interessados em saber se havia diferença entre os sexos no
tempo que levava para desenvolver o câncer. Para gênero, a estimativa do parâmetro foi de 0,77 e teve um valor p de 0,014.
Forneça uma interpretação dessa estimativa de parâmetro em termos da taxa de risco.
14.5.3 A intenção de um estudo de Weaver et al. (A-4) foi avaliar se as metástases linfonodais ocultas são indicadores importantes de
recorrência da doença ou sobrevida em pacientes com câncer de mama. Os dados abaixo fornecem alguns dos resultados
pertinentes de um modelo de regressão de Cox para esses dados. (a) Calcule os coeficientes dos parâmetros de regressão para
cada variável. (b) Forneça uma interpretação desses resultados usando os conceitos aprendidos nesta seção.
Variável Razão de risco (HR) 95% CI para valor-p de HR
Idade (50þ vs. <50) 1,69 (1,24, 2,31) 0,001
Tamanho do tumor (>2 cm vs. 2 cm) 1.32 (0,98, 1,76) 0,060
Quimioterapia vs. sem quimioterapia Radiação .88 (0,68, 1,13) .31

vs. sem radiação 0,54 (0,40, 0,73) 0,001
14.6 RESUMO
Neste capítulo, foi fornecida uma introdução aos dados de tempo até o evento. Em particular,
foi introduzido o conceito de censura de dados, em que os tempos exatos não são conhecidos
para os sujeitos. Distribuições úteis na análise de sobrevivência, incluindo a função de
distribuição cumulativa, a função de sobrevivência e a função de risco foram discutidas. O
cálculo de curvas básicas de sobrevida usando o procedimento de Kaplan-Meier foi discutido,
assim como os métodos para comparar curvas de sobrevida usando métodos não paramétricos.
Conceitos de regressão usando regressão de Cox foram fornecidos e uma análise detalhada
de exemplos foi fornecida. A relação de vários métodos abordados neste capítulo foi vinculada
a conceitos aprendidos anteriormente no texto, incluindo regressão linear, análise de dados de
frequência e estatística não paramétrica.
Fórmula Nome Fórmula

Número
14.2.1 Função de FðtÞ ¼ PðT tÞ

distribuição cumulativa
14.2.2 função de sobrevivência SðtÞ ¼ 1 FðtÞ
14.2.3 Função de Pðt T < t þ DtÞ fðtÞ ¼

; como Dt! 0
distribuição de probabilidade Dt
14.2.4 Relação da função

DFðtÞ ¼
DSðtÞ
de distribuição de fðtÞ ¼
Dt Dt
probabilidade
à função de
distribuição cumulativa e
à função de sobrevivência
14.2.5 função de perigo Pðt T < t þ DtjT tÞ hðtÞ ¼

; como Dt! 0
Dt
14.2.7 Relação da função de fðtÞ

risco com hðtÞ ¼
SðtÞ
a função de
distribuição de probabilidade
e a sobrevivência
função
14.3.1 Probabilidade de sobrevivência número de indivíduos sobreviventes pelo menosð período

Þt1 de tempo que
também sobrevivem ao t-ésimo período ^pi ¼ número
de indivíduos vivos no final do período de tempo ð
t Þ1
14.3.2 Função de sobrevivência ^p2

^S tðÞ¼ ^p1 ^pt
estimada
14.5.1 Modelo de regressão h tð Þ¼i h0 tð Þi exp b1zi1

ð þ b2zi2 þþ bk Þ zik
de perigo
14.5.2 Modelo de risco h tð

proporcional Þi ð Þ zik ¼ exp b1zi1 þ b2zi2 þþ bk ho tð Þi
Símbolo b ¼ coeficiente de regressão

Chave D ¼ mudança
F(t) ¼ função de distribuição cumulativa f(t) ¼
função de densidade de probabilidade h(t) ¼ função
de risco p ¼ probabilidade
S(t) ¼ função de sobrevivência

T ¼ tempo de interesse
t ¼ tempo até o evento
z ¼ fator de risco na regressão de Cox
1. Descreva em palavras o conceito de censura de dados.
2. Defina o seguinte: (a) Taxa de
risco (b) Função de risco (c)
Função de distribuição de
probabilidade (d) Função de sobrevivência (e)
Estimativa de Kaplan–Meier
3. Explique os conceitos subjacentes ao modelo de regressão de Cox.
4. Qual é a diferença entre censura à direita e censura à esquerda? Forneça um exemplo de cada.
5. Discuta por que muitas vezes é preferível usar um teste não paramétrico para comparações de curvas de sobrevivência.
6. Por que a regressão de Cox é chamada de modelo de “riscos proporcionais”?
7. Se a função de distribuição de probabilidade no tempo 5 for igual a 0,25 e a função de sobrevivência no tempo 5 for
igual a 0,15, qual é a função de risco no tempo 5?
8. Se descobrirmos que uma medição no intervalo de tempo entre o tempo 2 e 10 resulta em uma estimativa da função de distribuição
de probabilidade de 0,03, qual é a mudança estimada na função de distribuição cumulativa?
9. Usando os dados da pergunta 8, qual é a mudança estimada na função de sobrevivência?
10. Explique por que a função de distribuição cumulativa e a função de sobrevivência são imagens espelhadas de uma
outro.
11. O objetivo do estudo de Lee et al. (A-5) foi melhorar a compreensão do comportamento biológico dos tumores estromais epitelioides
gástricos. Eles estudaram as características clínicas, achados histológicos e ploidia do DNA de uma série de tumores para identificar
fatores que possam distinguir entre variantes benignas e malignas desses tumores e tenham relevância para o prognóstico.
Cinquenta e cinco pacientes com tumores
foram classificados com base em se seus tumores eram malignos de alto grau (grau 2), malignos de
baixo grau (grau 1) ou benignos (grau 0). Entre os dados recolhidos estavam os seguintes:
Resultado Número de Resultado Número de

(1 ¼ Morte por dias para durar (1 ¼ Morte por dias para durar
Tumor Acompanhamento ou Tumor Acompanhamento ou
Paciente Nota Doença) Morte Paciente Nota Doença) Morte
0 0 87 0 0 1616
1 0 0 775 8 0 0 1982
2 0 0 881 9 0 0 2035
34 0 0 914 10 11 0 0 2191
5 0 0 1155 12 0 0 2472
6 0 0 1162 13 0 0 2527
7 0 0 1271 14 0 0 2782
15 0 0 3108 36 0 0 7318
16 0 0 3158 37 0 0 7447
17 0 0 3609 38 0 0 9525
18 0 0 3772 39 0 0 9938
19 0 0 3799 40 0 0 10429
20 0 0 3819 41 1 1 450
21 0 0 4586 42 1 1 556
22 0 0 4680 43 1 1 2102
23 0 0 4989 44 1 0 2756
24 0 0 5675 45 1 0 3496
25 0 0 5936 46 1 1 3990
26 0 0 5985 47 0 5686
27 0 0 6175 48 0 6290
28 0 0 6177 49 0 8490
29 0 0 6214 50 1 1 106
30 0 0 6225 51 1 1 169
31 0 0 6449 52 1 1 306
32 0 0 6669 53 2 1 348
33 0 0 6685 54 2 1 549
34 0 0 6873 55 2222 1 973
35 0 0 6951
Fonte: Dados fornecidos por cortesia do Dr. Michael B. Farnell.
12. Girard et al. (A-6) conduziram um estudo para identificar fatores prognósticos de melhora da sobrevida
após ressecção de metástases pulmonares (PM) isoladas de câncer colorretal. Entre os dados coletados
estavam os seguintes em relação ao número de MP ressecados, sobrevida e desfecho para 77
pacientes submetidos a ressecção completa na primeira operação torácica:
Número de Sobrevivência Número de Sobrevivência
Paciente PM ressecado (Meses) Status Paciente PM ressecado (Meses) Estado
1 1 24 Vivo 8 1 15 Morto
2 1 67 Vivo 9 1 10 Morto
3 1 42 Vivo 10 1 41 Morto
4 >1 28 Morto 11 >1 41 Morto
5 1 37 Morto 12 1 27 Morto
6 1 133 Vivo 13 93 Vivo
7 1 33 Morto 14 1> 0 Morto
15 1 60 Morto 47 11 54 Morto
(Contínuo)
Número de Sobrevivência Número de Sobrevivência
Paciente PM ressecado (Meses) Status Paciente PM ressecado (Meses) Estado
16 1 43 Morto 48 >1 57 Vivo

17 >1 73 Vivo 49 >1 16 Morto
18 1 55 Vivo 50 1 29 Morto
19 1 46 Morto 51 1 14 Morto
20 1 66 Vivo 52 >1 29 Morto
21 1 10 Morto 53 >1 99 Morto
22 >1 3 Morto 54 >1 23 Morto
23 >1 7 Morto 55 1 74 Vivo
24 >1 129 Vivo 56 1 169 Vivo
25 1 19 Vivo 57 >1 24 Morto
26 >1 15 Morto 58 >1 9 Morto
27 1 39 Vivo 59 1 43 Morto
28 1 15 Morto 60 1 3 Vivo
29 >1 30 Morto 61 >1 20 Morto
30 1 35 Vivo 62 1 2 Morto
31 >1 18 Morto 63 >1 41 Morto
32 27 Morto 64 >1 27 Morto
33 121 Vivo 65 45 Vivo
34 11 Morto 66 26 Morto
35 8 Vivo 67 11 10 Morto
36 24 Vivo 68 143 Vivo
37 Morto 69 16 Morto
38 >1 Morto 70 29 Vivo
39 11 Morto 71 17 Morto
40 1> Morto 72 >1 20 Morto
41 Morto 73 92 Vivo
42 Morto 74 11 15 Morto
43 1> Morto 75 5 Morto
44 1> Morto 76 11 73 Vivo
45 11 127 26 7 26 17 18 17Vivo
10 33 42 77 >11>11>11 19 Morto
46 1>1>1>11 40 Vivo
Fonte: Dados fornecidos por cortesia do Dr. Philippe Girard.
13. Em um estudo de Alicikus et al. (A-7), o controle a longo prazo do câncer de próstata recebendo radioterapia foi
examinado em pacientes após 10 anos. Os autores usaram a análise de regressão de Cox para analisar
esses dados, o que resultou nos dados resumidos na tabela abaixo. Para estes dados:
(a) Calcule as estimativas dos parâmetros para o modelo de regressão de

Cox. (b) Forneça uma explicação sobre as taxas de risco (HR) e seu significado.
(c) Para idade, forneça uma medida alternativa para HR e forneça seu significado em termos de variação
percentual em anos.
Variável Razão de risco (HR) 95% CI para valor-p de HR
1,02 (0,96, 1,08) .51

Terapia hormonal da idade (sim vs. não) ,89 (0,44, 1,81) .75
Pré-PSA, >10 ng/mL vs. 10 ng/mL 2,41 (1,19, 4,88) .015
Classificação do tumor 1,42 (1,17, 1,71) <.001
Fonte: ZUMRE A. ALICIKUS, YOSHIYA YAMADA, ZHIGANG ZHANG, XIN PEI, MARGIE HUNG, MARISA
KOLLMEIER, BRETT COX e MICHAEL J. ZELEFSKY, “Ten-year Outcomes of High-Dose, Intensity-Modulated
Radiotherapy for Localized Prostate Cancer, ” Câncer, 117 (2010), 1429–1437.
REFERÊNCIAS 777
REFERÊNCIAS
1. DAVID G. KLEINBAUM e MITCHEL KLEIN, Análise de Sobrevivência: Um Texto de Autoaprendizagem, Segunda Edição, Springer, Novo
Iorque, 2005.
2. ELISA T. LEE, Statistical Methods for Survival Data Analysis, Third Edition, Wiley, New York, 2003.
3. DAVID W. HOSMER, JR. e STANLEY LEMESHOW, Applied Survival Analysis: Regression Modeling of Time to Event
dados, Wiley, Nova York, 1999.
4. PAUL D. ALLISON, Survival Analysis using SAS®: A Practical Guide, Second Edition, SAS Publishing, Cary, NC,
2010.
5. EL KAPLAN e P. MEIER, "Estimativa não paramétrica de observações incompletas", Journal of the American
Statistical Association, 53 (1958), 457–481.
6. NATHAN MANTEL, “Avaliação de Dados de Sobrevivência e Duas Novas Estatísticas de Ordem Surgidas em Sua Consideração,”
Cancer Chemotherapy Reports, 50 (março de 1966), 163–170.
7. MAHEESH KB PARMAR e DAVID MACHIN, Análise de Sobrevivência: Uma Abordagem Prática, Wiley, Nova York, 1995.
8. DAVID G. KLEINBAUM, Survival Analysis: A Self-Learning Text, Springer, Nova York, 1996.
9. ELISAT. LEE, Statistical Methods for Survival Data Analysis, Lifetime Learning Publications, Belmont, CA, 1980.
10. ETTORE MARUBINI e MARIA GRAZIAVALSECCHI, Analyzing Survival Data from Clinical Trials and Observational Studies, Wiley,
Nova York, 1995.
11. DAVID R. COX, “Regression Models and Life Tables” (com discussão), Journal of the Royal Statistical Society,
B34 (1972), 187–220.
1. NAEL MARTINI, ANDREW G. HUVOS, MICHAEL E. BURT, ROBERT T. HEELAN, MANJIT S. BAINS, PATRICIA M. MCCORMACK,
VALERIE W. RUSCH, MICHAEL WEBER, ROBERT J. DOWNEY e ROBERT J. GINSBERG, “ Previsões de Sobrevivência em
Tumores Malignos do Esterno,” Journal of Thoracic and Cardiovascular Surgery, 111 (1996), 96–106.
2. MASSIMO E. DOTTORINI, AGNESE ASSI, MARIA SIRONI, GABRIELE SANGALLI, GIANLUIGI SPREAFICO e LUIGIA COLOMBO,
“Análise Multivariada de Pacientes com Carcinoma Medular da Tireóide,” Câncer, 77 (1996), 1556–1565.
3. MARY ANN BANERJI, ROCHELLE L. CHAIKEN e HAROLD E. LEBOVITZ, “Long-Term Normoglycemic Remission in
Black Newly Diagnosed NIDDM Subjects,” Diabetes, 45 (1996), 337–341.
4. DONALD L. WEAVER, TAKAMARU ASHIKAGA, DAVID N. KRAG, JOAN M. SKELLY, STEWART J. ANDERSON, SETH P.
HARLOW, THOMAS B. JULIAN, ELEFTHERIOS P. MAMOUNAS e NORMALWOLMARK, “Effect of Occult Metastases on Survival
em câncer de mama com nódulo negativo,” The New England Journal of Medicine, 364 (2011), 412–421.
5. JOY SY LEE, ANTONIO G. NASCIMENTO, MICHAEL B. FARNELL, J. AIDAN CARNEY, WILLIAM S. HARMSEN e DUANE M.
ILSTRUP, "Epithelioid Gastric Stromal Tumours (Leiomyoblastomas): A Study of Fifty-five Cases," Surgery, 118 (1995), 653-661.
6. PHILIPPE GIRARD, MICHEL DUCREUX, PIERRE BALDEYROU, PHILIPPE LASSER, BRICE GAYET, PIERRE RUFFIE e
DOMINIQUE GRUNENWALD, “Surgery for Lung Metástases from Colorectal Cancer: Analysis of Prognostic Factors,” Journal of
Clinical Oncology, 14 (1996), 2047 –2053.
7. ZUMRE A. ALICIKUS, YOSHIYA YAMADA, ZHIGANG ZHANG, XIN PEI, MARGIE HUNG, MARISA KOLLMEIER, BRETT COX e
MICHAEL J. ZELEFSKY, “Ten-year Outcomes of High-Dose, Intensity-Modulated Radiotherapy for Localized Prostate Cancer, ”
Câncer, 117 (2010), 1429–1437.
APÊNDICE
TABELAS ESTATÍSTICAS
A-1
A-2 APÊNDICE TABELAS ESTATÍSTICAS

APÊNDICE TABELAS ESTATÍSTICAS A-3






































































































REFERÊNCIAS PARA TABELAS ESTATÍSTICAS
A. The Rand Corporation, A Million Random Digits with 1000,000 Normal Deviates, The Free Press, Glencoe, IL,
1955.
E. Laboratories Geigy, Documenta Geigy, Scientific Tables, Seventh Edition, CIBA-Geigy Limited, Basel,
Suíça, 1970.
FA Hald e SA Sinkbaek, “Uma tabela de pontos percentuais da distribuição x2 ,”
Skandinavisk Astuartietidskrift, 33 (1950), 168–175.
GHO Hartley e ES Pearson, Biometrika Tables for Statisticians, Volume 1, Terceira Edição, Bentley
House, Londres, 1970.
HHO Hartley e ES Pearson, Biometrika Tables for Statisticians, Volume 1, Terceira Edição, Bentley
House, Londres, 1970.
j. ES Pearson e HO Hartley, Biometrika Tables for Statisticians, Volume 1, Terceira Edição, The Syndics of
the Cambridge University Press, 1966. E R. Latscha, “Tests of Significance in a 2 2 Contingency Table:
Extension of Finney's Table,” Biometrika , 40 (1953), 74–86.
K. Frank Wilcoxon, SK Katti e Roberta A. Wilcox, Valores Críticos e Níveis de Probabilidade para o Wilcoxon
Signed Rank Test, Lederle Laboratories Division, American Cyanamid Company, Pearl River, NY, em
cooperação com o Departamento de Estatística, Estado da Flórida University, Tallahassee, Flórida, 1963.
EU. LR Verdooren, “Tabelas estendidas de valores críticos para a estatística de teste de Wilcoxon,”
Biometrika, 50 (1963), 177-186. E WJ Conover, Practical Nonparametric Statistics, John Wiley and
Sons, Nova York, 1971, 384–388.
MLH Miller, "Tabela de Pontos Percentuais de Estatísticas de Kolmogorov", Journal of the American Statistical
Association, 51 (1956), 111–121. E WJ Conover, Practical Nonparametric Statistics, Third Edition, John
Wiley and Sons, New York, 1999, 547.
NWH Kruskal e WA Wallis, “Use of Ranks in One-Criterion Analysis of Variance,”
Journal of the American Statistical Association, 47 (1952), 583–621; errata, ibid, 48 (1953), 907-911.
OM Friedman, “O uso de classificações para evitar a suposição de normalidade implícita na

Analysis of Variance,” Journal of the American Statistical Association, 32 (1937), 675–701.
P. Gerald J. Glasser e Robert F. Winter, “Valores críticos do coeficiente de correlação de
classificação para testar a hipótese de independência”, Biometrika, 48 (1961), 444–448.
RESPOSTAS PARA
EXERCÍCIOS DE NUMERAÇÃO ÍMPAR
Capítulo 1
Exercícios de revisão
7. Situação A
(a) 300 domicílios (c) (b) todos os domicílios na pequena cidade do sul (d)
número de crianças em idade escolar presentes todos os que relataram um ou mais
(e) nominal (categorias: 0 filhos, 1 filho, e assim por diante)
Situação B
(a) 250 pacientes (b) todos os pacientes admitidos no hospital durante os últimos (d) 250
(c) distância
hospitalização (e) razão que o paciente vive do ano de distâncias
Capítulo 2
2.3.1. (uma)
cumulativo
frequência de intervalo Frequência Frequência Frequência
0–0,49 3 3,33 3,33

0,5–0,99 3 3 3,33 6,67
1,0–1,49 15 6 21 16,67 23,33
(Continuação)
Histograma de píndice Polígono de frequência do pindex

50 50
40 40
30 30
20 20
10 10
0 0
0,750,25 1,25 1,75 2,25 2,75 0,25 0,75 1.25 1,75 2.25 2,75 3.25
Pindex Pindex
A-107
A-108 RESPOSTAS PARA EXERCÍCIOS DE NÚMEROS IMPAR
cumulativo
frequência de intervalo Frequência Frequência Frequência
1,5–1,99 15 36 16,67 40,00

2,0–2,49 45 81 50,00 90,00
2,5–2,99 9 90 10.00 100,00
(b) 40,0% (c) 0,7667 (d) 16,67% (f) 16,67% (g) 2,17, porque
(e)compõe
9 quase 25% dos
dados e é o valor que ocorre com mais frequência no conjunto de dados. 2.3.3. (uma)
(h) Desviado para a esquerda.
cumulativo
20–24,99 2 2 0,069 6,90

25–29,99 11 13 0,3793 44,83
30–34,99 6 19 0,2069 65,52
35–39,99 2 21 0,069 72,41
40–44,99 5 26 0,1724 89,66
45–49,99 2 28 0,069 96,55
50–54,99 1 29 0,0345 100,00
Histograma de IMC Polígono de frequência do IMC

12 12
10 10
8 8
Frequência
6
Frequência
4 4
2 2
0 0
22,5 27,5 32,5 37,5 42,5 47,5 52,5 17.5 27,5 37,5 47,5 57,5
IMC IMC
(b) 44,83% (c) 24,14% enviesado (d) 34,48% (e) Os dados estão corretos
(f) 21
RESPOSTAS PARA EXERCÍCIOS DE NÚMEROS IMPAR A-109
2.3.5. (uma)
Classe Relativo
Intervalo Frequência Frequência
0–2 5 0,1111
3–5 16 0,3556
6–8 13 0,2889
9–11 5 0,1111
12–14 4 0,0889
15–17 2 0,0444
45 1.000
Histograma de Horas
18
16
14
12
Frequência
10
8
6
4
2
0
1 4 7 10 13 16
Horas
Polígono de Frequência de Horas

18
16
14
12
Frequência
10
8
6
4
2
0
–2 1 4 7 10 13 16 19
Horas
(b) Inclinado para a direita

2.3.7. (uma)
cumulativo
110–139 0,0516 0,0516

140–169 8 8 0,1032 0,1548
170–199 16 24 0,2968 0,4516
200–229 46 70 0,3161 0,7677
230–259 49 119 0,1677 0,9354
260–289 26 9 145 0,0581 0,9935
290–319 1 154 155 0,0065 1,0000
Histograma de pontuações
50
40
30
Frequência
20
10
0
125 155 185 215 245 275 305
pontuações
Polígono de Frequência de Pontuações
50
40
30
Frequência
20
10
0
95 125 155 185 215 245 275 305 335
pontuações
(b) Não muito enviesado

2.3.9. (uma)
Exibição de caule e folha: Exibição de caule e folha:

Hospital A Hospital B
Caule e folha de C1 N = 25 Unidade Folha Caule e folha de C2 N = 25 Unidade Folha

= 1,0 = 1,0
1 17 1 1 12 5
2 18 4 2 13 5
4 19 15 4 14 35
9 20 11259 9 15 02445
(6) 21 233447 (4) 16 5678

10 22 2259 12 17 38
6 23 389 10 18 466
3 24 589 7 19 0059
3 20 3
2 21 24
(b) Ambos assimétricos: A é assimétrico para a esquerda e B é assimétrico para a direita.
2.3.11. (uma)
cumulativo
.0–.0999 45 45 20.83 20.83

.1–.1999 50 95 23.15 43,98
.2–.2999 34 129 15.74 59,72
.3–.3999 21 150 9.72 69,44
.4–.4999 23 173 10.65 80.09
.5–.5999 12 185 5.56 85,65
.6–.6999 11 196 5.09 90,74
.7–.7999 6 202 2,78 93,52
.8–.8999 4 206 1,85 95,37
.9–.9999 5 211 2.31 97,69
1,0–1,0999 4 215 1,85 99,54
1.1–1.1999 1 216 0,46 100,00
Histograma da relação S/R
50
40
30
Frequência
20
10
0
0,05 0,15 0,25 0,35 0,45 0,55 0,65 0,75 0,85 0,95 1,05
Relação S/R
Polígono de Frequência da Razão S/R
50
40
30
Frequência
20
10
0
0,05 0,15 0,25 0,35 0,45 0,55 0,65 0,75 0,85 0,95 1.05 1.15 1.25
0,05
–
Relação S/R
Caule e folha de C1 N = 216

Unidade Folha = 0,010
46 0 124556677788889999999999999999999999999999999
96 1 00000000001122233334444555555666666677777778888999
(34) 2 0011111223444444445566666788889999
86 3 001111244445556668999
65 4 00001122223333444568899 42 5 002334444599
30 6 02236788999 19 7 012289 13 8 0237
9 9 05588 4 10 236
1 11 6
(b) Desviado à (c) 10, 4,62% (d) 196, 90,74%; 67, 31,02%, 143,
direita 19,91%
2.5.1. (a) 193,6 (f) 74,62
(b) 205,0 (c) sem modo (d) 255 (h) 100,5 (e) 5568.09
2.5.3. (a) 47,42(g) 38,54 (c) 54,0, 33,0 (h) 13,72 (c) 15
(f) 8,75 2.5.5. (a) 16,75(b) 46,35 (d) 43 (e) 124,02 (f) 11,14
(d) 29,6 (e) 76,54
(g) 66,51 2.5.7.
(g) 18,45
(a) 1,8172 (f) ,5625 (b) 15 (h)
2.5.9. (a) 33,878,25 (b)
(f) 8,00 2.5.11. (a) 6.7112 (g) (c) 2,17 (d) 2,83 (e) 0,3164
(f) 4.026 2.5.13.
30,95 (b) (h) ,6700
(a) 204,19 (e) 1257,9930,49 (g) (c) (d) 29,84 (e) 64,00
23,62 (b) nenhum
7,00 (g) (h) 13,4 (d) 16 (e) 16.21
59,99 (b) ) (c) 7,00
204 (f) (h) 5,5 (c) 198, 204, (d) 196
35,47 205, 212 (g) 17,37 (h) 46
13. (a) Unidade Folha = 1,0 2 2 55
4 2 67
7 2 999
10 3 001
17 3 2223333
(12) 3 444555555555 21 3
666666666666666666677 (b) enviesado (d) x ¼
33:680, mediano ¼ 35:00, s ¼ 3:210,
(c) a cirurgia s2 ¼antes
é realizada 10:304
do nascimento; nascimento é geralmente em torno de 37
s2 ¼ 292:07 (b)
semanas
Caule e15.
folha
(a) de
x ¼GFR
43:39,
N =mediana
28 ¼ 42, s ¼ 17:09, C:V: ¼ 39:387,
Unidade Folha = 1,0
1 18
6 2 11377
12 3 022267
(7) 4 1223388 9 5 158
6 6 02378
1 7
1 88
(c) Ver gráfico na página seguinte (A-113)
(d) 67,9%, 96,55%, 100%
Boxplot de TFG
90
80
70
60
TFG
50
40
30
20
10
17. Alguns exemplos incluem diferença, diversidade, partida, discrepância, desvio e

entropia
19. x ¼ 3:95, Mediana ¼ 3, s ¼ 3:605, s2 ¼ 12:998 21. As
respostas variam: Não é incomum que os alunos obtenham notas mais altas nos exames como
semestre avança; portanto, é provável que as pontuações do exame fiquem distorcidas, fazendo
com que a mediana, que é menos afetada pela distorção, seja a melhor escolha. k ¼ 1 þ 3:322ð
R
23. As respostas variam: usando a regra de Sturges, onde w ¼ Þ log10300 ' 9:23.do
k; Uma
desvio
estimativa
padrão da amostra pode ser encontrada dividindo o intervalo da amostra por 4. Portanto, s 160
R
e w ¼ 9:23 4 de modo que R 4s. Usando esta fórmula, então R ¼ 160
¼ 17:33 sugerindo que (d) ou (e) podem ser apropriados.
25. As respostas variam: Imagine que você está examinando a ingestão de proteínas entre estudantes universitários.
Em geral, a maioria dos estudantes tende a consumir a ingestão média diária de proteína, mas
entre essa população é provável que haja um número razoável de atletas que consomem grandes
quantidades de proteína devido às demandas de seu esporte. Nesse caso, é provável que os dados
sejam assimétricos positivamente e a mediana represente melhor a tendência central dos dados.
27. Variável N Média Mediana TrMean StDev SE Média

S/R 216 0,3197 0,2440 0,2959 0,2486 0,0169
Variável Mínimo Máximo Q1 Q3
S/R 0,0269 1.1600 0,1090 0,4367
IQR ¼:3277, Faixa ¼ 1:1331, IQR=R ¼:2892
Boxplot da relação S/R

1.2
*
*
1,0 *
*
*
0,8
Relação
S/
R 0,6
0,4
0,2
0,0
29. (a) Variável N Média Mediana TrMean StDev SE Média 1,32

nutri 107 75,40 73,80 74,77 13,64
nutrição variável Mínimo Máximo 45,60 Q1 Q3 67,50

130,00 80,60
Variância ¼ 186:0496, Faixa ¼ 84:4, IQR ¼ 13:1, IQR=R ¼ :1552
Histograma de Estado
40
30
Frequência
20
10
0
60 80 100 120
Estado nutricional
Polígono de Frequência de Status
40
30
20
Frequência
10
0
50 75 100 125 150
Estado nutricional
Caule e folha de C1 N = 107 Unidade Folha = 1,0
145
5 5 0004
12 5 5556899
18 6 013444
31 6 5555666777888
(28) 7 0000011122222222333333344444
48 7 666666666677888999
30 8 000002234444
18 8 56889
13 9 01223
8 9 679 5 10
00 3 10 9 2 11
2 11 2 12 3
1 12
1 13 0
Boxplot de Status
130 *
*
120
110 *
100
Status
90
80
70
60
50
*
40
(d) 75:4 13:64; 61,76, 89,04; 79=107 ¼ :7383; 75:4 2 13 ð Þ :64 ; 48,12,102,68; 103=107 ¼
:9626; 75:4 3 13 ð Þ :64 ; 34,48, 116,32;
¼ :0093
105=107 ¼ :9813 (e) 102=107 ¼ :9533 (f) 1=107
Capítulo 3
3.4.1. (a) 0,6631 (b) marginal (f) (c) 0,0332 (d) junta (h) (e) 0,0493
condicional (g) 0,3701 (a)
3.4.3.
drogas regra de adição
masculinas e divididas, 0,3418 (b) masculino ou drogas divididas ou ambos, 0,8747
(c) homens receberam drogas (d) masculino, 0,6592
divididas, 0,6134 3.4.5. .95 3.4.7. .301 3.5.1.
(a) Um sujeito tendo o sintoma (S) e não
tendo a doença. (b) Um sujeito que não tem S, mas tem a doença. (c) 0,96 (d)
0,9848 (e) 0,0595 (f) 0,99996 (g) 0,00628, 0,999996, 0,3895, o
0,9996,
valor (h)
preditivo aumenta
9955
conforme
aumentos
a taxa de doença hipotética 0,8753, 0,8753,
3.5.3. .9999977
3. (a) 0,2143 (b) 0,5519 (c) 0,1536 (b) (d) 0,4575 (e) 0,5065
5. (a) 0,1349 0,6111 (c) 0,3333
0,3269
(g) 0 (h) (d) 0,5873 (e) 0,3571
(f) 0,6667
7. (a) 1. .2200 2. .5000 (b) 1. .3000 2. 3. .0555 4. .1100 4. 5. .5900 5.

.3900 9. (a) .0432 (b) .0256
(g) .9810
(f) .9639 3. .3900 .1667 (d) .0700 (e) 6. .6000
11. .0060 13. 0625 15. menos
mães com
de 24 (c) .0247 .9639 .5713
anos 17. conjunto eventos
nulo, pois os
são
mutuamente exclusivos 19. (a)
lipoproteína plasmática entre 10–15 ou
maior ou igual a 30. (b) lipoproteína
plasmática entre 10–15 e maior ou igual a 30. (c)
lipoproteína plasmática entre 10–15 e menor ou igual a 20. (d) lipoproteína plasmática entre
10–15 ou menor ou igual a 20. 21. (a) 0,7456 23 .0125
(b) 0,3300
Capítulo 4
4.2.1. (uma)
Número de Frequência Relativo cumulativo
Substâncias usadas Frequência Frequência
0 144 .19 .19

1 342 .44 .63
2 142 .18 .81
3 72 .09 .90
4 39 .05 .95
5 20 .03 .98
6 6 .01 .99
7 9 .01 1,00
8 2 .003 1,003
9 .001 1,004
Total 1 777 1.004
(b) 0,5
0,4
0,3
Frequência
0,2
0,1
0,0
01234567 8 9
Número de substâncias usadas
1,0
0,9
0,8
0,7
Frequência
0,6
0,5
0,4
0,3
0,2
0,1
0 1234 567 8 9
Número de substâncias usadas
4.2.3. x ¼ 1:58, s2 ¼ 2:15, s ¼ 1:47 4.3.1.

(a) 0,1484 (b) 0,8915 (c) 0,2536,
0,1085 4.3.3.
(b) 0,3461
(a) (c) (d) 0,8080
0,7330 4.3.5. média ¼ 4:8,
(a)variância
0,5314 (b)
¼ 3:264
0,3740
0,0946
4.3.7.
(c) (f) (d) 0,9067 (e) 0,0008
0,0069
(d) 0,9931 (e) 0,0946
4.3.9.
Número de Probabilidade, f(x)
Sucessos, x
0 3! 3 0 ¼ :008
ðÞ ð Þ :8
:2 0!3!
1 3! 2 1 ¼ :096
ðÞ ð Þ :8
:2 1!2!
2 3! 1
ðÞ ð Þ :8 2 ¼ :384
:2 2!1!
3 3! 0 3 ¼ :512
ðÞ ð Þ :8
:2 3!0!
Total 1
4.4.1. (a) 0,156 (b) 0,215 (c) 0,629 (d) 0,320

4.4.3. (a) 0,105 (b) 0,032 (c) 0,007 (d) 0,440
4.4.5. (a) 0,086 (b) 0,946 (c) 0,463 (d) 0,664 (e) 0,026
4.6.1. .4236 4.6.3.
.2912 4.6.5. .0099
4.6.7. .95 4.6.9.
.901 4.6.11. 2.54
4.6.13. 1,77
4.6.15. 1.32
4.7.1. (a) 0,6321 (b) 0,4443 (c) 0,0401 (d) 0,3064

4.7.3. (a) 0,1357 (b) 0,2389 (c) 0,6401 (d) 0,0721 (e) 0,1575
4.7.5. (a) 0,3413 (b) 0,1056 (c) 0,0062 (d) 0,3830
4.7.7. (a) 0,0630 (b) 0,0166 (c) 0,7719
15. (a) .0212 17. (b) 0,0949 (c) 0,0135 (d) 0,7124
(a) .034 19. (a) (b) 0,467 (b) (c) 0,923 (c) (d) 0,010 (e) 0,105 (d)
.4967 21. (a) 0,5033 (b) 0,1678 (c) 0,0104 (e) 0,8218
.0668 23. (a) 0,6247 (b) 0,6826 (c)
.0013 25. 57.1 0,0668 0,8931
27. (a) 64.75 29.
14.90 31. 10.6 (b) 118,45 (c) 130,15 (d) 131,8
33. (a) Bernoulli
assumindo que
há uma probabilidade igual de ambos os sexos (b) Não (c) Não Bernoulli - peso não é um
Bernoulli—mais de dois resultados possíveis variável
binária
capítulo 5
5.3.1. 204, 6.2225

5.3.3. (a) 0,1841 (b) 0,7980 (c) 0,0668
5.3.5. (a) 0,0020 (b) 0,1736 (c) 0,9777 (d) 0,4041
5.3.7. (a) 0,9876 5.3.9. (b) 0,0668 (c) 0,0668 (d) 0,6902
Amostra x
6, 8, 10 8,00
6, 8, 12 8,67
6, 8, 14 9,33
6, 10, 12 9,33
6, 10, 14 10,00
6, 12, 14 10,67
8, 10, 12 10,00
8, 10, 14 10.67
8, 12, 14 11.33
10, 12, 14 12h00
m x ¼ 10; sx ¼ 1:333
5.4.1. .3897
5.4.3. .0038
5.4.5. .0139
5.5.1. .1131
5.5.3. .0808
5.5.5. (a) 0,1539 (b) 0,3409 (c) 0,5230
5.6.1. .1056 5.6.3.
0,7938
. Sim
(c) Não (d) Sim (olhos (f) Sim

Capítulo 6
6.2.1. (a) 88, 92 (b) 87, 93 (c) 86, 94 6.2.3. (a)
7,63, 8,87 (b) 7,51, 8,99 (c)
1603.688,
7,28, 9,22
1891.563;
6.2.5.1576.125,
1919.125; 1521.875, 1973.375 6.3.1. (a) 2,1448 (b) 2,8073 (c)
1,8946 6.3.3. (a) 1,549,normalmente
0,387 (b) 2,64,
distribuídos
qual
4,36;
a amostra
0,49,
na0,91
população
foisão
(d) extraída.
2,0452 da
(d) mais estreito (e) mais largo
80.3 6.3.5.
6.4.1. 66,2,
549:82;
76,8;
340:17;
65,1, (c)
571:28;
77,9; 62.7,
Taxas de difusão de óxido nítrico
318:72; 615:52; 274:48 6.4.3. 5:90; 17:70; 8:15; 19:95; 12h60;
24h40 6.4.5.4.5;
64,09,
1,8, 479,91;
4,8; 1.3,19.19,
5.3
34:87; 524.81;
6.4.9.
23:13 77:49,
32:58;
6.5.1.
25:42;621,49
.1028, 6.4.7.
33:33;
.1642 2.1,
24:67;
6.5.3.
.4415, .6615 6.6.1. .0268, .1076 6.6.3. :0843, .2667 6.7.1. 27, 16 6.7.3. 19
6.8.1. 683, 1068 6.8.3. 385, 289 6.9.1. 6.334, 44.63 6.9.3. 793.92, 1370.41
6.9.5. 1.17, 2.09 6.9.7. 170:98503 s2 630:65006
6.10.1. .44, 17.37

6.10.3. .49, 2.95
6.10.5. .9, 3.52
6.10.7. 5.13, 60.30
13. x ¼ 79:87, s2 ¼ 28:1238, s ¼ 5:3; 76,93, 82,81

15. ^p ¼ :30; .19, .41
17. ^p1 ¼ :20; ^p2 ¼ :54, .26, .42 19.

^p ¼ :90; 0,87, 0,93 21. x ¼ 19:23,
s2 ¼ 20:2268; 16,01, 22,45 23. 2:18, 2,82 25.
362,73, 507,27 27. 0,44, 0,74 29. :416, 0,188 31.
O nível de confiança diminui. O intervalo não teria
largura. O nível de
confiança seria zero. 33. z,

8.1, 8.1 35. Todos os motoristas
com 55 anos ou mais. Motoristas com 55 anos ou mais participando do estudo da visão.
37. .2865, .3529 (Use z desde n > 30)
Capítulo 7
7.2.1. Rejeitar H0 porque 2:57 < 2:33, p ¼ :0051 < :01 7.2.3. Falha
ao rejeitar H0 porque :76 < 1:333: p > :10 7.2.5. Sim, rejeitar H0, z ¼
5:73 < 1:645: p < :0001 7.2.7. Não, falha em rejeitar H0. t ¼ 1:5 >
1:709: :05 :2
7.2.15. z ¼ 4:18, rejeitar H0. p < :0001 7.2.17. z ¼ 1:67, falha em rejeitar
H0. p ¼ 2ð:0475Þ ¼ :095 7.2.19. Rejeitar H0 desde z ¼ 4:00: p < :0001
7.3.1. Rejeitar H0 porque 10:9 < 2:388; p < :005 7.3.3. Rejeitar H0 porque
9:60 < 2:6591; p < 2ð:005Þ 7.3.5. Rejeitar H0 porque z ¼ 3:39 > 1:96: p ¼
2ð:0003Þ 7.3.7. s2 ¼ 5421:25; t ¼ 6:66. Rejeitar H0. p < 2ð:005Þ ¼ :010
7.3.9. z ¼ 3:39. Rejeitar H0. p ¼ 2ð1 :9997Þ ¼ :0006 7.3.11. t ¼ 3:3567.
Rejeitar H0. p < :01 7.4.1. Rejeitar H0 porque 3:17 > 2:624; p < :005 7.4.3.
Rejeitar H03:1553 < 1:8125; :005 :0384
1:645: p ¼ Rejeitar
7.5.5. :0526
p
H0 porque z ¼ 2:21; p ¼ :0136 7.6.1. Rejeitar H0 porque 2:86 < 2:58; p ¼
:0042 7.6.3. Falha ao rejeitar H0 porque z ¼ 1:70 < 1:96; p ¼ :088 7.7.1.
Não rejeite H0 desde 5:142 < 20:723 < 34:267; p > :01 (teste bilateral).
7.7.3. x2 ¼ 6:75. Não rejeite H0. p > :05 (teste bilateral) 7.7.5. x2 ¼ 28:8.
Não rejeite H0. p > :10 7.7.7. x2 ¼ 22:036; :10 > p > :05 7.8.1. Falha ao
rejeitar porque V:R: ¼ 1:226 < 1:74p > :10 7.8.3. Não, V:R: ¼ 1:83; p > :10
7.8.5. Rejeitar H0. V:R: ¼ 4; :02 :10
7.9.1.
Alternativo Valor do poder
Valor de m b Função 1b
516 0,9500 0,0500

521 0,8461 0,1539
528 0,5596 0,4404
533 0,3156 0,6844
539 0,1093 0,8907
544 0,0314 0,9686
547 0,0129 0,9871
7.9.3. 1,0
0,8
0,6
Poder
0,4
0,2
0,0
515 520 525 530 535 540 545 550
Valores alternativos de mu
Alternativo Valor do Poder

Valor de m b Função 1b
4,25 0,9900 0,0100

4,50 0,8599 0,1401
4,75 0,4325 0,5675
5,00 0,0778 0,9222
5,25 0,0038 0,9962
1,0
0,8
0,6
Poder
0,4
0,2
0,0
4.2 4.4 4.6 4.8 5,0 5.2

Valores alternativos de mu
7.10.1. n ¼ 548; C ¼ 518:25. Selecione uma amostra de tamanho 548 e calcule x. Se x 518:25,
rejeitar H0. Se x < 518:25 não rejeite H0.
7.10.3. n ¼ 103; C ¼ 4:66. Selecione uma amostra de tamanho 103 e calcule x Se x 4:66, rejeite
H0. Se x < 4:66, não rejeite H0.
19. Rejeitar H0 desde 29:49 > 2:33: p < :0001

21. Falha ao rejeitar o nulo porque z ¼ 1:48 < 1:96: p ¼ :1388 23.
Rejeitar H0 desde 12:79 > 2: 58: p < :0001 25. Falha ao rejeitar H0
porque 1:10 < 1:645; p ¼:1357 27. t ¼ 3:873; p < :005 29. d ¼
11:49; s2 ¼ 256:679; SD ¼ 16:02; t ¼ 2:485; :025 > p > :01 31.
Rejeitar H0 desde d2:286 < 1:7530; :025 > p > :01
Respostas dos Exercícios 41–55 obtidas pelo MINITAB

41. IC 95,0%
(456,8, 875,9)
valor tp 7,09
0,0000 Teste
de m ¼ 0 vs.
45. Leg press: 95,0% CI Abdutor de braço: IC 95,0%

(32,22, 56,45) (3,717, 7,217)
tp valor 7,85 valor tp 6,70
0,0000 Teste 0,0000 Teste
de m ¼ 0 vs. m não ¼ 0 de m ¼ 0 vs. mnot ¼ 0
Extensor do quadril: 95,0% Abdutor de braço: IC 95,0%
CI (6,031, 10,236) (4,597, 7,670)
valor tp 8,30 valor tp 8,56
0,0000 Teste de m 0,0000 Teste
¼ 0 vs. m não ¼ 0 de m ¼ 0 vs. mnot ¼ 0
47. IC 95,0%
ð 71:9; 26:5 Þ
valor tp
4:34 0,0001
Teste de m ¼ 0 vs. m não ¼ 0
49. IC 95,0% para m1 m2 : ð Þ 83:8; teste20 m1t

m2ð Þ vs: não ¼ m1: tm2ð
¼ 3:30
Þd:f:
vs:
p¼¼<42
::0021
t t¼teste
3:30 p ¼ :0011 d:f: ¼
42 51. 95,0% CIt teste
para m
m GRUPO
GRUPO 1–m 1¼m GRUPO
GRUPO 2 (0,5,
2 vs ð
26,4)
Þ:
não ¼ : t ¼ 2:88 p ¼ :045 d:f: ¼ 4 53. IC 95,0% para m1 m2 : ð
Þ 3:00; 22 teste t m1 ¼ m2ð Þ vs: nãoAmbos ¼ : t ¼d:f:
usam
:29¼p53
Pooled
¼ :77 StDev ¼ 4:84
55. 95,0% CI para mPT mC : ð7:6;4:78 18:8Þ p¼ teste
0:0000
t mPTd:f:¼¼mCð
31 Þ vs: não ¼ : t ¼
Capítulo 8
Respostas para 8.2.1–8.2.7 obtidas por SAS1
8.2.1. F = 6,24 p =
0,0004 Erro Alfa

Graus de 0,05
Liberdade Erro Quadrado Médio Valor 325
Crítico da Faixa Estudantilizada 1,068347

3,65207
Diferença Simultâneo
Grupo Entre 95% de confiança
Comparação 90 - Meios Limites

30 0,1911 -0,1831 0,5652
90 - 120 0,6346 0,1320 1,1372 ***
90 - 60 0,6386 0,1360 1,1413 ***
30 - 90 -0,1911 -0,5652 0,1831
30 - 120 0,4436 -0,1214 1,0085
30 – 60 0,4476 -0,1173 1,0125
120 - 90 -0,6346 -1,1372 -0,1320 ***
120 - 30 -0,4436 -1,0085 0,1214
120 - 60 0,0040 -0,6531 0,6611
60 - 90 60 - -0,6386 -1,1413 -0,1320 *** -1,0125 0,1173
30 60 - 120 -0,4476 -0,6611 0,6531
8.2.3. F = 9,36 -0,0040
p = < 0,0001 Graus de
liberdade de erro
alfa 0,05
109
Quadrado médio do erro 211252.3
Valor crítico da faixa estudantil 3.68984
Diferença Limites de confiança
Grupo Entre simultâneos de 95%
Comparação Meios 865,71 ***

A-B 455,72 45,73 913,59 *** 905,39
A-C 574,54 235,48 ***
DE ANÚNCIOS 596,63 287,88
BA -455,72 -865,71 -45,73 ***
B-C 118,82 -271,45 509.09
B-D 140,91 -223,34 505.17
C-A -574,54 -913,59 -235,48 ***
C-B -118,82 -509,0 271,45
CD 22.10 -259,95 304.14
D-A -596,63 -905,39 -287,88 ***
D-B -140,91 -505,17 223,34
D-C -22,10 -304,14 259,95
8.2.5. F = 9,26
p = 0,0009 Erro
Alfa Graus de 0,05
Liberdade Erro Quadrado Médio Valor Crítico 26

da Faixa Estudantilizada 637.384
3.51417
Comparação Meios 46,98

Y - MA 18.16 -10,67
VÓS 48.13 20.07 76.19 ***
PODERIA -18.16 -46,98 10.67
MA-E 29,97 1.15 58,80 ***
E-Y -48,13 -76,19 -20.07 ***
E-MA -29,97 -58,80 -1,15 ***
8.2.7. F = 4,94
p = 0,0026 Erro
Alfa Graus de 0,05
Liberdade Erro Quadrado Médio Valor Crítico 174
da Faixa Estudantilizada 0,17783

3.66853
Comparação 0 - 1 Meios -0,13866

0-2 0,10165 0,34196 -0,2188 0,37822
0,17817
Comparação 0 - 3 Meios 0,10511

0,35447 0,60383 ***
1-0 -0,10165 -0,34196 0,13866
1-2 0,07652 -0,17257 0,32561
1-3 0,25281 -0,03737 0,54300
2-0 -0,17817 -0,37822 0,02188
2-1 -0,07652 -0,32561 0,17257
2-3 0,17630 -0,08154 0,43413
3-0 -0,35447 -0,60383 -0,10511 ***
3-1 -0,25281 -0,54300 0,03737
3-2 -0,17630 -0,43413 0,08154
8.3.1. V:R: ¼ 19:79; p < :005

8.3.3. V:R: ¼ 30:22; p < :005
8.3.5. V:R: ¼ 7:37; :025 > p > :01
8.3.7. Total d:f : ¼d:f41: ¼
Bloco (Cães)
5 Tratamentos (Tempos) d:f : ¼ 6, Erro d:f : 30 8.4.1. V:R: ¼ ¼
48:78; p < :005 8.4.3. V:R: ¼ 16:45; p < :005 8.4.5. Total d:f: ¼ 29, Bloco
(Assunto) d:f: ¼ 9, Tratamento (Tempo) d:f: ¼ 2, Erro d:f: ¼ 18
8.5.1. Íon V:R: ¼ 6:18; p ¼ :023; dose V:R: ¼ 74:59; p ¼ :000; inter V:R: ¼ :89 p ¼
:427
8.5.3. Enxaqueca V:R: ¼ 19:98; p < :0001; tratar V:R: ¼ 2:13; p¼:1522; interação
V:R: ¼ 1:42; p ¼ :2404
13. V:R: ¼ 7:04; p ¼ :000. A média da amostra para os indivíduos saudáveis é

significativamente diferente das médias das categorias B, C e D. Nenhuma outra
diferença entre as médias da amostra é significativa.
15. V:R: ¼ 1:35; p ¼ :274. Não rejeite H0.
17. Tabagismo V:R: ¼ 3:16; p ¼ :052, Grupo de Exaustão Vital V:R:
¼ 6:84; p ¼ :003, Interação V:R: ¼ 2:91; p ¼ :032 19. V:R: ¼
4:23; p < :001 21. V:R: ¼ 6:320; p ¼ :008 23. V:R: ¼ 3:1187; p ¼
:043. A média da amostra D é significativamente diferente da média
da amostra B. Nenhuma outra diferença entre médias amostrais é significativa.
25. V:R:ðIdadeÞ ¼ 29:38; p < :001; Ocupação V:R: ¼ 31:47; p < :001; Interação V:R:
¼ 7:12; p < :001 27. 499,5, 9, 166,5, 61,1667, 2,8889, 57,6346, < :005 29. (a)
Completamente randomizado, (b) 3, (c) 30, 1:0438 < 3:35
(d) Não, porque
31. V:R: ¼ 26:06; p < :001: HSD ¼ 2:4533. Todas as diferenças significativas, exceto mLight
mModerado
33. V:R: ¼ 2:37; p ¼ :117, Tukey HSD não é necessário. 35. (a) ANOVA
de um fator (b) Resposta: pontuação pós-pré-treinamento (c) Fatores:
Grupos de anos de experiência (com 4 níveis) (d) experiência
cirúrgica e interesse em obstetrícia (e) sem efeitos de transição ( f) tratamento
é anos de experiência d:f: ¼ 3, total d:f: ¼ 29, erro d:f: ¼ 26. 37. (a) medidas
repetidas (b) Resposta: BMD (c) Fatores: períodos de tempo (com seis níveis)
(d) dieta, exercício e ingestão de cálcio (e) sem efeitos de transição (f) fator de tempo d:f: ¼ 5, fator de
assunto d:f: ¼ 25, total, erro d:f: ¼ 125.
39.
Análise de variância para bilirrubi
Fonte DF SS EM F P
tempo de 17 2480,83 145,93 45,57 0,000
assunto 6 89.09 14.85 4.64 0,000
Erro 102 326,65 3.20
Total 125 2896,57
41. CR = Taxa de compressão

Análise de Variância para CR
Fonte DF SS EM F P
Grupo 9092 2273 8.12 0,001
Erro 4 5319 280
Total 19 23 14411

Nível N Mean StDev ---+--------+---------+---------+---
Controle 6 79,96 5.46 (-----*-----) (------*------)
EU 4 78,69 21,44
II 4 47,84 23,74 (-----*------) (-----*------)
III 5 43,51 10,43
4 5 33,32 20,40 (-----*------)
---+--------+---------+---------+---
StDev agrupado = 16,73 25 50 75 100
Comparações pareadas de Tukey
Taxa de erro familiar = 0,0500 Taxa de erro

individual = 0,00728
Valor Crítico = 4,25
Intervalos para (média de nível de coluna) - (média de nível de linha)

Ao controle EU II III
EU -31,19
33,72
II -0,34 -4,70
64,58 66,41
III 6,00 1,45 -29,41

66,89 68,91 38.05
4 16.19 11,64 -19,21 -21,61

77.08 79,10 48.24 41,99
43. ANOVA de duas vias: BC versus calor, análise de cromo de variância

para BC Source SS
DF EM F P
calor 1 0,1602 0,1602 3,95 0,061
cromo 1 0,6717 0,6717 16,55 0,001
Interação 1 0,0000 0,0000 0,00 0,994
Erro 20 0,8119 0,0406
Total 23 1.6438
Análise de Variância para AC

Fonte DF SS EM F P
calor 1 0,0468 0,0468 1,99 0,4554 19,34 0,174
cromo 0,4554 0,16 0,000
Interação 0,0039 0,0039 0,4709 0,0235 0,690
Erro 11 0,9769
Total 20 23
Análise de Variância para AC/BC

Fonte DF SS EM F P
calor 1 0,04524 0,04524 15,62 0,001
cromo 1 0,00000 0,00000 0,00 1.000
Interação 1 0,00385 0,00385 1.33 0,262
Erro 20 0,05793 0,00290
Total 23 0,10702
45. CA = Análise de Ângulo de Congruência de

Variância para CA
Fonte SS DF EM F P
Grupo 3 7598 2533 14,83 0,000
Erro 86 14690 171
Total 89 22288

Nível N Mean StDev -----+---------+---------+---------+-
Lateral 27 6,78 15,10 Medial 26 -10,81 10,80 (----*----)
Multi 17 -18,29 15,09 Normal 20 -7,00 10,76 (----*----)
(------*-----)
(-----*-----)
-----+---------+---------+---------+-
StDev agrupado = 13,07 -20 -10 0 10
comparações pareadas de Tukey

individual = 0,0103
Valor crítico = 3,71

Lateral Medial multi
Medial 8.16
27.01
multi 14.46 -3,21

35,69 18.18
Normal 3,66 -14.01 -22,60

23.89 6.39 0,02
47.
Análise de variância para resposta
Fonte DF SS EM F P
temperatura do 5 25,78 4,72 0,0185.16
30,34 15,17 13,87 0,001 10,93
assunto 67,06
Erro 2 1.09
Total 10 17
49. GC = concentração de glicose Análise de Variância

para GC
Fonte DF SS EM F P
assunto 3 8,341 2,780 10,18 0,001
do grupo 5 8.774 1.755 6,43 0,002
Erro 15 4,096 0,273
Total 23 21.210
51.
Análise de Variância para T3
Fonte DF SS EM F P
dia do 11 8967 815 2,55 0,030
assunto 2 12466 6233 19,50 0,000
Erro 22 7033 320
Total 35 28467
53. BBL = níveis de bilirrubina no sangue Análise de
variância para BBL Source DF

SS EM F P
Grupo 4077 2039 3,31 0,090
Erro 4931 616
Total 2 8 10 9008
Controle N Mean StDev ---+--------+---------+---------+---
de Nível 4 63,50 28,25 Hipercarro 4 50,00 22,69 (--------*---------) (--------*--------) (---------
Hiperosm 3 98,00 22,27 -*----------)
---+--------+---------+---------+---
StDev agrupado = 24,83 30 60 90 120

individual = 0,0213
Controlar hipercarro
hipercarro -36,7
63,7
Hiperosmo -88,7 -102,2

19.7 6.2
55.
Análise de variância para pontuações de respiração

Fonte DF SS EM F P
grupo 2 244,17 122,08 14,50 0,000 319,88 564,05
Erro 38 8.42
Total 40
Nível N Média StDev ----+---------+---------+---------+--
1 13 13.231 1.739 (-----*-----) (-----*-----)
2 14 13.786 2.833
3 14 18.643 3.713 (------*-----)
----+---------+---------+---------+--
StDev agrupado = 2,901 12.5 15,0 17.5 20,0

individual = 0,0195
1 2
2 -3.281
2.171
3 -8,138 -7.532
-2,686 -2.182
57. Pontuação PSWQ ¼ PSWQ
Análise de variância para PSWQ

Fonte DF SS EM F P
Grupo 3 16654,9 5551,6 74,11 0,000
Erro 115 8614.6 74,9
Total 118 25269.5
Nível N Média StDev -----+---------+---------+---------+-

1 15 62.933 8.556 (---*---)
2 30 38.333 7.494 (--*--)
3 19 64.158 10.259 (---*---) (--*-)
4 55 66.536 8.678
-----+---------+---------+---------+-
StDev agrupado = 8,655 40 50 60 70

individual = 0,0103
12 3
2 17.459
31.741
3 -9.025 -32.446
6.575 -19.203
4 -10.181 -33.329 -8.388

2.975 -23.077 3.631
59.
Análise de variância para idade
Fonte DF SS EM F P
Grupo 2 16323,2 8161,6 139,79 0,000 58,4
Erro 189 11034,7 191
Total 27357,9

Nível N Mean StDev -+---------+---------+---------+-----
Filha 50 49.420 7.508 Marido 65 71.985 (--*-)

7.516 (-*-)
Esposa 77 68.649 7.828 (-*-)
-+---------+---------+---------+-----
StDev agrupado = 7,641 48,0 56,0 64,0 72,0

individual = 0,0192
Filha Marido
Marido -25.959
-19.170
Esposa -22.507 0,296

-15.952 6,375
61. SAP ¼ nível sérico de fosfatase alcalina
Análise de Variância para SAP

Fonte DF SS EM F P
Nota 2 36181 18091 5,55 0,009
Erro 29 94560 3261
Total 31 130742

Nível N Média StDev -+---------+---------+---------+-----
EU 9 118,00 61,85 8 143,63
(--------*--------)
II 55,90 15 194,80 54,82
(--------*---------)
III
(-------*------)
-+---------+---------+---------+-----
StDev agrupado = 57,10 80 120 160 200

individual = 0,0197
EU II
II -94,1
42,8
III -136,2 -112,9

-17,4 10.5
63.
Análise de variância para fonte de hematócrito
DF SS EM F P
Grupo 2 817,5 408,8 20,26 0,000 27 544,8 29 1362,3
Erro 20.2
Total

Nível N Mean StDev ------------+---------+---------+----
Farsa, falso 10 38.200 2.573 (----*----) (---*---)
Tratados 15 40.200 5.348
Não tratada 5 53,200 4,604 (------*------)
------------+---------+---------+----
StDev agrupado = 4,492 36,0 42,0 48,0 54,0

individual = 0,0196
Tratamento falso
tratado -6,551 2,551
Não tratado -21.106 -18.757 -8.894 -7.243
65. Ambos ¼ rhIGF-I þ rhGH
Análise de Variância para Resposta

Fonte DF SS EM F P
Grupo 3 4.148 1.383 1.39 0,282
Erro 16 15.898 0,994
Total 19 20.046
Nível N Mean StDev ----------+---------+---------+-------
Ambos 5 11,520 0,653 (--------*---------)
rhGH 5 11,250 0,570 (--------*---------) (--------*--------) (---------
rhIGF-I 6 10.800 1.418 *----------)
Salina 4 10,250 0,971
----------+---------+---------+-------
StDev agrupado = 0,997 10,0 11,0 12,0

individual = 0,0113
Ambos rhGH rhIGF-I
rhGH -1,5354
2.0754
rhIGF-I -1,0086 -1,2786

2.4486 2.1786
Salina -0,6450 -0,9150 -1,2927

3.1850 2.9150 2.3927
Capítulo 9
9.3.1. (a) Direto, (b) Direto, 9.3.3. ^y ¼ (c) Inverso

560 þ 0:140x 9.3.5. ^y ¼ 68:6 19:5x 9.3.7.
^y ¼ 0:193 þ 0:00628x 9.4.1 Previsor
Coef SE Coef T P
Constante 559,90 29,13 19,22 0,000
Metanfetamina 0,13989 0,06033 2,32 0,035
S = 68,28 R-Sq = 26,4% R-Sq(ajuste) = 21,5%
Fonte DF SS EM F P
Regressão 1 25063 25063 5,38 0,035
Erro residual 15 69923 4662
Total 16 94986
Intervalo de confiança para b^1 0,011, 0,268
9.4.3. preditor Coef SE Coef T P

Constante 68,64 16.68 4.12 0,006
Cmáx c/ -19.529 4.375 -4,46 0,004
S = 18,87 R-Sq = 76,9% R-Sq(ajuste) = 73,0%
Fonte DF SS EM F P
Regressão 1 7098,4 7098,4 19,93 0,004
Erro residual 6 2137,4 356,2
Total 7 9235,9
Intervalo de confiança para b^1 -30,23, -8,82
9.4.5. preditor Coef SE Coef T P

Constante 0,19290 0,04849 3,98 0,001
DTPA GFR 0,006279 0,001059 5.93 0,000
S = 0,09159 R-Sq = 58,5% R-Sq(ajuste) = 56,8%
Fonte DF SS EM F P
Erro residual de 1 0,29509 0,29509 35,18 0,000
regressão 25 0,20972 0,00839
Total 26 0,50481
Intervalo de confiança para b^1 0,0041, 0,0085

9.5.1. (a) 580,6, 651,2 9.5.3. (b) 466,1, 765,6 (b)

(a) 30:42, 5.22 9.5.5. (a) 62:11, 36,92
0,3727, 0,4526 (b) 0,2199, 0,6055 9.7.1. r ¼ :466; t ¼ 2:23; p ¼
:038; :030 < r < :775 9.7.3. r¼ :812; t ¼ 3:11; p ¼ :027; 1 < r < :152
9.7.5. r ¼ :531; t ¼ 3:31; p ¼ :003; :770 <r < :211
17. BOARD ¼ 191 þ 4:68 AVG; r2 ¼ :772; t ¼ 17:163; p < :001 19. y-hat = 12,6 + 1,80x

Constante 12.641 2.133 5.93 0,000
não. de p 1,8045 0,5585 3.23 0,005
S = 7,081 R-Sq = 38,0% R-Sq(ajuste) = 34,4%
Fonte DF SS EM F P
Regressão 1 523,41 523,41 10,44 0,005
Erro residual 17 852.38 50.14
Total 18 1375,79
21. A equação de regressão é B = 1,28 + 0,851 A

Constante 1,2763 0,3935 3,24 0,006
UMA 0,8513 0,1601 5,32 0,000
S = 0,2409 R-Sq = 68,5% R-Sq(ajuste) = 66,1%
Fonte DF SS EM F P
Regressão 1 1,6418 1,6418 28,29 0,000
Erro residual 13 0,7545 0,0580
Total 14 2.3963
23. ^y ¼ 61:8819 þ :509687x; V:R: ¼ 4:285; :10 > p > :05; t ¼ 2:07; CI de 95% para
p : :03,.79; 110.3022; 87.7773, 132.8271
25. ^y ¼ 37:4564 þ :0798x; V:R: ¼ 77:13; p < :005; t ¼ 8:78; IC de 95% para r: 0,91, 1;
40.63, 42.27.
29. A equação de regressão é A = 570 + 0,429 B

Constante 569,8 141,2 4,03 0,000
B 0,42927 0,04353 9,86 0,000
S = 941,6 R-Sq = 54,0% R-Sq(ajuste) = 53,4%
Correlação de Pearson de B e A = 0,735

Valor P = 0,000
31. A equação de regressão é y = 45,0 + 0,867 x

Constante 44,99 33.54 1.34 0,193
x 0,86738 0,07644 11h35 0,000
S = 102,9 R-Sq = 84,8% R-Sq(ajuste) = 84,2%
Correlação de Pearson de x e y = 0,921 Valor P = 0,000
33. A equação de regressão é S = -1,26 + 2,10 DBS

Constante -1,263 3,019 -0,42 0,680
DBS 2,0970 0,1435 14,62 0,000
S = 8,316 R-Sq = 90,3% R-Sq(ajuste) = 89,9%
Correlação de Pearson de S e DBS = 0,950

Valor P = 0,000
35. A equação de regressão é log y = 2,06 + 0,0559

PCu

Constante 2.0603 0,3007 6,85 0,000
PCu 0,05593 0,01631 3.43 0,001
S = 0,3873 R-Sq = 16,4% R-Sq(ajuste) = 15,0%
Correlação de Pearson de PCu e log y = 0,405 P-Value = 0,001
37. A equação de regressão é

C6 = -0,141 - 1,33 C5

Constante -0,1413 0,2267 -0,62 0,540
C5 -1,3286 0,1242 -10,69 0,000
S = 1,086 R-Sq = 84,5% R-Sq(ajuste) = 83,7%
Correlação de Pearson de IGELogE e SkinLogE = -0,919 P-Value = 0,000
39. Normotenso C6 ¼ C4 C5; C7 ¼ ð Þ C4 þ C5 =2; C8 ¼¼C2

ð ÞC3;
C2C9
þ C3 =2
A equação de regressão é C6 = 4,2 + 0,106 C7

Constante 4.19 17h30 0,24 0,811
C7 0,1060 0,1590 0,67 0,512
S = 5,251 R-Sq = 2,0% R-Sq(ajuste) = 0,0%
Correlação de Pearson de C6 e C7 = 0,141 P-Value = 0,512
A equação de regressão é C8 = 0,2 + 0,268 C9

Constante 0,25 18.53 0,01 0,989
C9 0,2682 0,2932 0,91 0,370
S = 5,736 R-Sq = 3,7% R-Sq(ajuste) = 0,0%
Correlação de Pearson de C8 e C9 = 0,191

Valor P = 0,370
Pré-eclâmptica
A equação de regressão é C6 = 57,9 - 0,363 C7


Constante 57,89 17.10 3.39 0,003
C7 -0,3625 0,1273 -2,85 0,009
S = 7,109 R-Sq = 26,9% R-Sq(ajuste) = 23,6%
Correlação de Pearson de C6 e C7 = -0,519 P-Value = 0,009
A equação de regressão é C8 = 54,4 - 0,540 C9

Constante 54.377 9.771 5.56 0,000
C9 -0,5403 0,1154 -4,68 0,000
S = 5,787 R-Sq = 49,9% R-Sq(ajuste) = 47,6%
Correlação de Pearson de C8 e C9 = -0,707

Valor P = 0,000
41. A equação de regressão é

LBMD = 0,131 + 0,511 ABMD

Constante 0,13097 0,05413 2.42 0,018
ABMD 0,51056 0,05935 8,60 0,000
S = 0,09188 R-Sq = 53,6% R-Sq(ajuste) = 52,9%
Correlação de Pearson de ABMD e LBMD = 0,732 P-Value = 0,000
43. WL, VO2
A equação de regressão é WL = 0,01 + 0,262

VO2

Constante 0,013 1.308 0,01 0,992
VO2 0,26237 0,07233 3.63 0,003
S = 1,835 R-Sq = 52,3% R-Sq(ajuste) = 48,3%
Correlação de Pearson de WL e VO2 = 0,723

Valor P = 0,003
WL, AT

AT

Constante 0,752 1,761 0,43 0,677
NO 0,3668 0,1660 2,21 0,047
S = 2,241 R-Sq = 28,9% R-Sq(aj) = 23,0%
Correlação de Pearson de WL e AT = 0,538

Valor P = 0,047
WL, ET

ET

Constante 0,739 1.173 0,63 0,541
ET 0,006375 0,001840 3.46 0,005
S = 1,879 R-Sq = 50,0% R-Sq(ajuste) = 45,8%
Correlação de Pearson de WL e ET = 0,707

Valor P = 0,005
45. A equação de regressão é CL/F = 19,4 + 0,893

CLer

Constante 19.393 4,496 4,31 0,000
CLer 0.89250 0,05671 15,74 0,000
S = 28,20 R-Sq = 59,3% R-Sq(ajuste) = 59,1%
Correlação de Pearson de CL/F e CLer = 0,770

Valor P = 0,000
Capítulo 10
10.3.1. ^y ¼ 31:4 þ 0:473x1 þ 1:07x2 10.3.3. ^y ¼

13:45 þ 4:02x1 þ 281x2 10.3.5. ^y ¼ 422:00 þ
11:17x1 :63x2
10.4.1.
Fonte DF Soma dos quadrados médios

ao quadrado Valor F 21576,99011 788,49506 32 Pr > F
Modelo 136,29516 4,25922 34 1713,28527 185,13 <.0001
Erro
Total corrigido
Raiz MSE 2,06379 R-Quadrado 0,9204

Coeff Var 4,02684
Parâmetro Padrão
Estimativa DF Variável Erro t Valor Pr > |t| 95% de confiança Limites
Interceptar 1 -31,42480 X1 1 0,47317 6.14747 -5,11 <.0001 -43,94678 -18,90282

0,06117 7.74 <.0001 0,34858 0,59776
X2 1 1.07117 0,06280 17.06 <.0001 0,94326 1.19909
(a) 0,9204 (d) 95%

(c)CIValor
parapinclinação para X1
de X1 < :0001; X2: p-valor
ð0:34858 0:59776Þ, 95% CI para inclinação para
< :0001
X2 : ð0:94326 1:19909Þ
10.4.3.
Fonte DF Soma Valor

dos quadrado médio F 7,05 Pr > F
Modelo 2 quadrados 452,56375 226,28188 0,0210
Erro 7 224,70025 32,10004 677,26400
Total corrigido 9

Coeff Var 9.91198
Parâmetro Padrão
Estimativa DF Variável Erro t Valor Pr > |t| 95% de confiança 13,44923 13,23156 Limites
Interceptar 1 1.02 0,3433 -17,83843 44,73689
X1 1 4.01680 1.07136 3,75 0,0072 1,48344 6.55016
X2 1 2.81175 1.37859 2.04 0,0808 -0,44809 6.07160
(a) 0,6682 (c) X1 p-valor ¼ :0072; X2 valor p ¼ :0808 inclinação (d) IC de 95% para
para X1 : ð1:48344 6:55016Þ
10.4.5.
Fonte DF Soma de
Quadrados Quadrado valor F Pr > F
Modelo 17018 Médio 8508.89242 4,89 0,0175
Erro 2 22 38282 1740.10069
Total corrigido 24 55300

Dependente Médio 537,00000 Coeff Var Aj R-Sq 0,2448
7,76807
Parâmetro Padrão
DF variável Estimativa Erro t Valor Pr > |t| 95% de confiança Limites
Interceptar 1 -421.99671 339.76199 X1 3.65523 -1,24 0,2273 -1126,61995 282,62653
1 11.16613 3.05 0,0058 3,58564 18,74663
X2 1 -0,63032 0,93826 -0,67 0,5087 -2,57615 1.31552
(a) 0,3077 (c) X1 p-valor ¼ :0058; X2 p-valor ¼ :5807 declive para X1 : (d) IC de 95% para
ð3:58564 18:74663Þ 10.5.1. CI: 50.289, 51.747. PI: 46.751, 55.284
10.5.3. CI: 44,22, 56,59; IP: 35,64, 65,17 10,5,5. CI: 514,31, 550,75; PI:
444.12, 620.94 10.6.1. (a) Correlações de pares:
DNA-Bloo Co-cult DNA-Rect

Co-culto 0,360
DNA-Ret 0,532 0,303
RNA-Ret 0,202 0,674 0,430
(b) R ¼ :370; F ¼ 7:06; p ¼ :001 (c)

ry1:23 ¼ :3472; 2:13 ¼ :5232; ry3:12 ¼ :2538 (d) r12:y3 ¼
:1660 (e) r13:y2 ¼ :6615 (f) r23:y1 ¼ :3969 10.6.3. (a) R ¼
:9517; F ¼ 57:638; p < :005 (b), (c) ry1:2 ¼ :9268; t ¼ 8:549;
p < :01; ry2:1 ¼ :3785; t ¼ 1:417; :20 > p > :10; r12:y ¼
:1789; t ¼ :630; p > :20
7. R ¼ :3496 F ¼ :83 ðp > :10Þ 9. (a)

^y ¼ 11:419 þ 1:2598x1 þ 3:1067x2 (b) R2 ¼ :92
(c)
Fonte SS df MS RV p
Regressão 1827.004659 913,50 69.048 <0,005

Residual 158.728641 2 12 13,23
1985.7333 14
(d) ^y ¼ 11:419 þ 1:2598ð10Þ þ 3:1067ð5Þ ¼ 39:55
11. (a) ^y ¼ 126:505 þ :176x1 1:563x2 þ 1:575x3 þ 1:6292x4

(b)
Fonte SS df EM RV p
Regressão 30873.47 4 7718.367 13h37 <0,005

Residual 5774,93 10 577.493
36648.40 14
(c) t1 ¼ 4:40; t2 ¼ :78; t3 ¼ 3:53; t4 ¼ 2:59 (d) R2
y :1234 ¼ :842423; Ry:1234 ¼ :91784

13. (a) correlação (b)
log dos níveis plasmáticos de
adiponectina (c) idade e taxa de filtração
glomerular (d) ambas as correlações não
foram significativas (e) indivíduos com doença
renal terminal 15. (a) correlação (b) inspiração
estática pressão na boca (c) volume expiratório
forçado, pico de fluxo expiratório e fluxo inspiratório máximo (d) ambas as correlações não
foram significativas (e) meninos e meninas de 7 a 14 anos
17.
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13
X1 1
X2 .737() 1
X3 0,109 .244 1
X4 .760() .698() .316 1
X5 .556() .608() .273 .760() .136 1
X6 0,040 .213 .647() .093 .412(
.101) .227 .568() 1
X7 .291 .289 .763() .146 .345
.293.508() .467(
.419( ) .231
X8 .570() .659() .400( ) .250 .260 .271 .305 1 .481( ) .555()
X9 .555() .566() 1 .454( ) .717() .503() .650() .922() .455( ) .640() .377 .224 1
X10 .621() .702() .178 .228 .448( ) . 380 .346
.480(
.518()
) .905() .788() .388( ) .732() 1
X11 .652() .646() .582() 1 .390( ) .778() .641() .717() . 667() .796()
X12
X13 1 .348 .524() .645() .707() .729() .744() .864() 1
a correlação é significativa no nível 0,01 (bilateral). a

correlação é significativa no nível 0,05 (bilateral).
19.
v1 v2 v3 v4 v5 v6 v7 v8
v1 1
v2 .123 1
v3 .115 .963() 1
v4 .417() .063 0,041
v5 .005 .102 .103 1 1
v6 .001 .270() .295() .059 .137
v7 .113 .074 .076 .036 .134 1
v8 .077 .002 .023 .052 .146 .165 .061 .202 1 .032 1
A correlação é significativa no nível 0,01 (bilateral).
Capítulo 11
11.2.1. mobilizador: 0 G-CSF, 1-Etoposídeo
A equação de regressão é conc = 12,9 -

0,0757 idade - 5,48 mobilizador

Constante 12.933 2,787 4,64 0,000
idade -0,07566 0,04388 -1,72 0,092
mobilizar -5.480 1.429 -3,83 0,000
S = 3,965 R-Sq = 27,1% R-Sq(ajuste) = 23,6%
Fonte DF SS EM F P
Erro Residual de 2 240,02 120,01 7,63 0,002
Regressão 41 644,60 15.72
Total 43 884,62
11.2.3.
A equação de regressão é QTc = 23,0 + 39,4

sexo + 0,825 dose

Constante 22,98 46,92 39,40 42,14 0,49 0,632
sexo 0,82456 0,07556 0,93 0,366
dose 10,91 0,000
S = 84,10 R-Sq = 89,6% R-Sq(ajuste) = 88,1%

Fonte DF SS EM F P
Regressão 2 850164 425082 60,10 0,000
Erro residual 14 99018 7073
Total 16 949182
11.3.1.
Etapa
Constante 1 51,93 2 116,07 3 115,54
MEM 0,66 0,60 0,57
Valor T 5,75 5.87 5.53

Valor P 0,000 0,000 0,000
SOCIALSU -0,476 -0,492
Valor T -5,28 -5,51

Valor P 0,000 0,000
CGDUR 0,122
Valor T 1,88
Valor P 0,064
S 17.4 15.4 15.2
R-Sq 25.20 41,92 43,97

R-Sq(adj) 24.44 40,72 42.22
11.3.3.
Alfa para entrar: 0,15 Alfa para remover: 0,15
A resposta é REATIVA em 6 preditores, com N = 68
Etapa 1 2 3
Constante 3.374 5.476 5.418
AGEABUSE -0,38 -0,45 -0,42

Valor T -2,49 -3,00 -2,91
Valor P 0,015 0,004 0,005
VERBALIQ -0,0219 -0,0228

Valor T -2,75 -2,93
Valor P 0,008 0,005
STIM 0,61
Valor T 2.05
Valor P 0,044
S 1.06 1.01 0,990

R-Sq 8.57 18.10 23.15
R-Sq(adj) 7.19 15.58 19h55
Cp 10.4 4.6 2.5
11.4.1.
Padrão Wald
Parâmetro Estimativa DF Erro Qui-quadrado Pr > ChiSq
Interceptar 1 2,1192 0,1740 148,3439 <,0001

sexo 1 0,0764 0,2159 0,1252 0,7234
Estimativas da razão de chances

Efeito Estimativa de pontos 95% de confiança de Wald Limites
sexo 1.079 0,707 1.648
15. ^y ¼ 1:87 þ 6:3772x1 þ 1:9251x2
Coeficiente Erro padrão t
1,867 .3182 5,87

6,3772 .3972 16,06
1,9251 .3387 5,68
R2 ¼ :942
Fonte SS df EM RV
Regressão 284.6529 142.3265 202.36954

Residual 17.5813 2 25 .7033
302.2342 27
17. ^y ¼ 1:1361 þ :07648x1 þ :7433x2 :8239x3 :02772x1x2 þ :03204x1x3
Coeficiente Desvio padrão t pa
1:1361 .4904 2:32 :05 > p > :02 <

.07648 .01523 5,02 :01 > :20
.7433 .6388 1,16 :20 > p >
:8239 .6298 1:31 :10 :20 > p > :10
:02772 .02039 1:36 :20 > p > :10
.03204 .01974 1,62
uma
Aproximado. Obtido usando 35 df

R2 ¼ :834.
Fonte SS df EM RV
Regressão 3,03754 .60751 34.04325

Residual ,60646 5
3,64400 34 39 0,01784
1 se 1 se
x2 ¼ x3 ¼
A 0 caso contrário B 0 caso contrário
Para A: ^y ¼ ð1:1361 þ :7433Þþð:07648 :02772Þx1 ¼ :3928 þ :04875x1

Para B: ^y ¼ ð1:1361 þ :8239Þþð:07648 þ :03204Þx1 ¼ 1:96 þ :10852x1
Para C: ^y ¼ 1:1361 þ :07648x1
23.
Resposta ¼ V, Dummy1 ¼ 1 se criança, 0 caso contrário, Dummy2 ¼ 1 se criança, 0

por outro lado
A equação de regressão é V = 11,7 + 0,137 W

- 11,4 DUMMY1 -11,7 DUMMY2 + 0,226 INTER1 + 0,223
INTER2

Constante 11.750 3.822 3.07 0,004
C 0,13738 0,05107 2,69 0,010
MANEQUIM1 11.421 4,336 2,63 0,012
DUMMY2 11.731 3,966 2,96 0,005
INTER1 0,2264 0,2208 1.03 0,311
INTER2 0,22332 0,06714 3,33 0,002
S = 1,73234 R = quadrado = 94,9% R=sq(adj) = 94,3%
Fonte DF SS EM F P
Regressão 5 2304,47 460,89 153,58 3,00 0,000
Erro residual 41 123,04
Total 46 2427,51
Fonte DF Seq SS 1
C 2265.07
MANEQUIM1 1 5.59
DUMMY2 1 0,00
INTER1 1 0,60
INTER2 1 33.20
Obs C V Apto SE Fit Residual St Resid 2,48R 1,21X 4,17RX

17 10,8 8.366 4.257 0,496 4.109 4,83R
36 47,0 41 96,0 15.400 16.971 1.145 1.571
46 87,0 20.000 24.938 1,265 4.938
30.900 23.702 0,881 7.198
R designa uma observação com um grande resíduo padronizado.
X denota uma observação cujo valor de X lhe confere grande influência.
Capítulo 12
12.3.1. X2 ¼ 2:072; p > :05 12.3.3.

X2 ¼ 3:417; p > :10 12.3.5. X2 ¼
2:21; p > :10 12.4.1. X2 ¼ :078; p >
:10 12.4.3. X2 ¼ 816:410; p < :005
12.4.5. X2 ¼ 42:579; p < :005 12.5.1.
X2 ¼ 3:622; d:f : ¼ 3; p > :10 12.5.3.
X2¼ :297; d:f : ¼ 1; p > :10 12.5.5.
¼ 82:373;
X2 d:f :
¼ 2; p < :005 12.6.1. Como b ¼
¼ 710;
> 3B ðpara
¼ 10; Aa
¼ 8Þ; p > 2ð:035Þ ¼ :070. Não rejeite
H0.
12.6.3. Como b ¼ 1 ðpara A ¼ 9; B ¼ 7; a ¼ 16Þ; p ¼ 2ð:002Þ ¼ :004. Rejeitar H0.
12.7.1. RRc ¼ 13:51, IC 95% 9,7, 18,8 12.7.3.
X2 ¼ 12:898; p < :005; ORc ¼ 1:967 12.7.5. ORcMH
¼ 3:733; X2 ¼ 25:095; p < :005 MH
15. X2 ¼ 7:124; d:f : ¼ 3; p > :05, Falha ao rejeitar.

17. X2 ¼ 2:40516; p > :10 19. X2
¼ 5:1675; p > :10 21. X2 ¼
67:8015; p < :005 23. X2 ¼
7:2577:05 > p > :025 25. Independência
27. Homogeneidade 35. Satisfação geral
X2 ¼ 3:143
d:f: ¼ 2; p ¼ 0:208 2
células com contagens esperadas menores que 5,0
Dor
X2 ¼ 0:444 d:f: ¼
2; p ¼ 0:801 2 células com
contagem esperada inferior a 5,0 Náuseas e Vômitos X2

¼ 0:483 d:f: ¼ 2; p ¼ 0:785
37. ORc ¼ 2:06; 95% CI: 0,92, 4,61

41. X2 ¼ 13:530 d:f: ¼ 1; p ¼ 0:000
43. Estatística de teste ¼ 2; p
¼ :019 (teste unilateral)
45. X2 ¼ 8:749
d:f: ¼ 1; p ¼ 0:003
47. X2 ¼ 4:875 d:f: ¼ 1;
p ¼ 0:027 49. ORc
¼ 3:79; 95% CI: 1,52, 9,48OR 51. X2 ¼
11:589 d:f: ¼ 1; p ¼ 0:001
Capítulo 13
13.3.1. P ¼ :3036, p ¼ :6072

13.3.3. Pðx 2j13; :5Þ ¼ :0112. Desde :0112 < :05, rejeitar H0: p ¼ :0112
13.4.1. Tþ ¼ 48:5. :1613 < p < :174 13.4.3. T ¼ 11:5, :1054 :20
13.8.1. H ¼ 11:38, p ¼ :003, df ¼ 3.
13.8.3. H ¼ 18:13, p < :0001, d:f : ¼ 2.
13.8.5. H ¼ 19:61 (ajustado para empates), p < :005 13.9.1. x2
r ¼ 8:67, p ¼ :01
13.9.3. x2r ¼13.10.1.
29:38, prs<¼:005
0:07,
p > :20 13.10.3. rs ¼ :018, n
¼ 20, p > :05 13.10.5. rs ¼ :43, n ¼
30, :01 :20
13. rs ¼ :09, p ¼ :4532
15. T ¼ 29:5, p ¼ 0:0263, Rejeitar H0
17. H ¼ 9:02, d:f: ¼ 3, p ¼ 0:029 H ¼
9:30, d:f: ¼ 3, p ¼ 0:026 (ajustado para empates)
19. rs ¼ :036, p ¼ :802
21. T ¼ 62:5, p ¼ :0072, Rejeitar
H0 23. USO:r x2 ¼ 3:94, p ¼ :140
BSO: x2r ¼ 4:77, p ¼ :093
25. T ¼ 89, p ¼ :0046, Rejeitar H0
27. PFK: T ¼ 38, p ¼ :8598, Falha ao rejeitar H0
HK: T ¼ 61:5, p ¼ :0703, Falha ao rejeitar
H0 LDH: T ¼ 37, p ¼ :7911, Falha ao rejeitar
H0 29. rs ¼ :733, p ¼ :001
Capítulo 14
14.3.1
Número de casos: 53 Censurado: 34 (64,1 5%) Eventos: 19
Tempo de Sobrevivência Erro Padrão 95% Intervalo de Confiança

Significar: 12.57 1.10 ( 10.40, 14.73 )
(Limitado às 19h00)
Mediana: 16,00 1,80 ( 12.47, 19.53 )
Percentis 25,00
50,00 75,00 18,00 16,00 4,00 1,80
Valor 3,76
Erro padrão
14.4.3 Grupo de apoio:

Número de casos: 22 Censurado: 0 (0,00%) Eventos: 22
Significar: 45.09 3,98 ( 37.29, 52.89 ) ( )
Mediana: 60,00 0,00 . , .
percentis
25,00 50,00 75,00
Valor 60,00 60,00 26,00
Erro padrão . . 6,96
Grupo não apoiador:

Número de casos: 28 Censurado: 0 (0,00%) Eventos: 28
Média: Mediana:16,04
15,00 1,86 ( 12.39, 19.68 ) ( 4.63,
5,29 25.37 )
Percentis 25,00
50,00 75,00 Valor 22,00 15,00 7,00
Erro padrão 3,44 5,29 ,92
Estatística Log Rank e (significância): 29,22 (0,0000)

Estatística de Breslow e (significância): 23,42 (0,0000)
Estatística Tarone-Ware e (significância): 26,28 (0,0000)
Teste de Breslow = 21,843, p < 0,001
14.5.1 A variável “peso” foi significativa neste modelo quando usada para prever o tempo de
aparecimento do câncer após a exposição à luz ultravioleta. 100ðe:19 1Þ ¼ 20:9%; portanto,
para cada unidade de aumento de peso, o risco de tempo de aparecimento do câncer
aumenta em 20,9%.
14.5.3 (a) Idade: b ¼ lnð1:69Þ ¼:525; Tamanho do tumor: b ¼ lnð1:32Þ ¼ :278; Quimioterapia: b
¼ lnð:88Þ¼:128; Radiação: b ¼ lnð:54Þ¼:616. (b) O risco de metástases é aumentado
para 1,69 vezes para aqueles com 50þ, 1,32 vezes se o tamanho do tumor for > 2 cm,
0,88 vezes para aqueles que recebem quimioterapia e é 0,54 vezes para aqueles que
recebem radiação. Portanto, o aumento da idade e o tamanho maior do tumor são
preditivos de aumento de metástases, enquanto a quimioterapia e a radiação são
protetoras contra metástases.
7. hðtÞ ¼ :25=:15 ¼ 1:67 DsðtÞ
ð10 2Þ 11.
9. 03 ¼ ¼ :24
Análise de
Sobrevivência para DAYS
Fator GRADE = 1
Tempo Status Cumulativo Padrão Cumulativo Número
Sobrevivência Erro Eventos Restantes 8
450 1 . 8889 .1048 1
556 1 0,7778 .1386 2 7
2102 1 .6667 .1571 3 6
2756 0 3 5
3496 0 3 4
3990 1 0,5000 .1863 4 3
5686 0 4 2
6290 0 4 1
8490 0 4 0
Número de Casos: 9 Censurados: 5 (55,56%) Eventos: 4
Erro Padrão de Tempo de Sobrevivência 95% Intervalo de Confiança 1197

Significar: 5255 (2910, 7601)
(Limitado a 8490)
Mediana: 3990 . ( ., . )
Análise de Sobrevivência para DAYS
Fator GRADE = 2 Status

de tempo Sobrevivência cumulativa padrão cumulativa 0,8333 0,6667 Número
Erro Eventos Restantes 5 4
106 1 0,1521 1
169 1 0,1925 2
306 1 0,5000 .2041 3 3
348 1 .3333 .1925 4 2
549 1 .1667 .1521 5 1
973 1 .0000 .0000 6 0
Número de Casos: 6 Censurados: ( .00%) Eventos: 6

Significar: 409 129 ( 155, 662 ) ( 91,
Mediana: 306 110 521 )
Análise de Sobrevivência para DAYS
Total Número Número Por cento

Eventos 0 Censurado Censurado 100,00
NOTA 0 40 40 55,56 ,00
NOTA 1 81,82
NOTA 2
No geral 9 6 55 4 6 10 5 0 45
Teste de Breslow 73,630, p < 0,001
13. (a) Idade: b ¼ lnð1:02Þ ¼ :020; Terapia hormonal: b ¼ lnð:89Þ¼:117; Pré-PSA: b ¼ lnð2:41Þ ¼ :880;
Classificação do tumor: b ¼ lnð1:42Þ ¼ :351. (b) A idade e a terapia hormonal não foram significativas
em termos de controle a longo prazo do câncer de próstata. Ter um PSA pré-tratamento de > 10 ng=mL
e uma classificação tumoral alta foram fatores de risco significativos (PSA pré-aumentou o risco em
2,41 vezes e a classificação tumoral alta aumentou o risco 1,42 vezes). (c) 100 eð Þ¼ 1 2%; portanto, um
aumento em 1 unidade de idade aumenta o risco de câncer a longo prazo em 2%.
:02
Capítulo 15 - APENAS ONLINE
15.2.1 (a) 5.8 (e) (b) Branco: 10,0, Preto: 3,7, (f) MN (c) 9.43 (d) 5,5
9.43 22,2, MCD 34,5
15.2.3
Era Populaçãoa Mortesb EUA Era População Número de

(Anos) Populaçãoc Específico padrão com Esperado
Morte base nos EUA Mortes em
Taxas Padrão
(por População População
100.000) 2000
0–4 539.509 5–14 1.178 19.175.798 224 218,3 68139 149

1.113.920 15–24
1.117.439 41.077.577 954 20,1 145964 29
25–34 1.213.415 35–44 39.183.891 1.384
39.891.724 85,4 139235 119
1.287.120 45–54 2.823 45.148.527
37.677.952
5.271 114.1 141751 162
1.085.150 55–64 723.712 8.035 24.274.684 219,3 160430 352
65 e 485,7 133884 650
1110.2 86257 958
Sobre 969.048 51.863 34.991.753 5352.0 124339 6655
Total 8.049.313 71.732 281.421.906 891.2 1000000 9073
Taxa de mortalidade ajustada por idade ¼ 9:1
15.3.1 (a) (10–14): 1,3, (15–19): 59,9, (20–24): 126,7, (25–29): 112,6, (30–34): 83,6, (35–39 ): 36,5, (40–
over): 2,6; (b) 2142,1 (c) (10–14): 6,3, (15–19):
1920,2,
305,9,
(35–(20–24):
39): 2102,9,
46,7
939,2,
15,3,3
(40–
(25–29):
acima):
(a) (10–14):
1502,3,
2142,1
1,2,
(30–34):
(d)(15–
19): 58,5, (20–24): 120,2, (24–29 ): 113,7, (30–34): 84,2, (35–39): 33,8, (40–44): 6,0, (45 e mais):
0,5; (b) 2089,6 (c) (10–14):
(35– 6,1,
39): (15–19):
2058,2, (40–44):
298,5, (20–24):
2088,1,899,6,
(45 e mais):
(25–29):
2089,6
1468,1,
(d) (30–34):
45,6 15,4,1
1889,3,
(a)
taxa de imaturidade: 1997—7,3, 2001—8,1 (b) taxa de prevalência: Nevada— 22,2, Estados Unidos—20,5
(c) taxa de incidência—14,5 por 100.000
9. 8,9
11. Mortalidade infantil: Total—5,7; branco—5,3; não branco — 6,5; Causa da morte: total de
doenças cardíacas — 36,8; branco 37,7; não-brancos 32,3 Total de câncer — 23,7; branco—
23,8; não branco—23,1 AIDS total—1,5; branco 0,8; não branco 4,9 Índice de imaturidade: total
— 7,0; branco—6,7; não-brancos — 7,5 Taxa de incidentes Cesárea: total — 22,6; branco
25,0; não branco - 18,3
13. 15.9, 51.6
ÍNDICE
Os números precedidos por A referem-se às páginas do Apêndice.
UMA
Distribuição qui-quadrado, 195–197, 600–657
Precisão, 14 propriedades matemáticas, tabela 601–604, uso
Regra da adição, 72–73 A-41 em testes de qualidade de ajuste, 604–619
Análise de variância, 306–308 pequenas frequências esperadas, 604 uso em
suposições, 307 delineamento testes de homogeneidade, 630–634 pequeno
completamente aleatório, 308–334 unidirecional, frequências esperadas, 633 uso em testes de
309–334 procedimento, 307–308 delineamento independência, 619–630 pequenas frequências
em bloco completo randomizado, 334–346 esperadas, 625 2 2 tabela, 625–627
delineamento de medidas repetidas, 346–356
bidirecional, 336– 346
Intervalo de aula, 22
média aritmética, 38 Coeficiente de determinação, 427-428
Taxa média de perigo, 760 Coeficiente de determinação múltipla, 501-503
B Coeficiente de variação, 45-46

Eliminação para trás, 564 Combinação, 101
Teorema de Bayes, 68, 80-83 Design completamente aleatório, 308–334
Processo de Bernoulli, 99-101 Tabela ANOVA, 317
b1, intervalo de confiança, 438 suposições, 311
teste de hipótese, 432-434 Simetria composta, 348
Distribuição binomial, 99–108 Computadores:
parâmetros, tabela 105–107, A-3– e análise de variância, 308, 321–323, 326–327,
A-31 341–343, 350–351, 355 e
Uso da tabela, 104–105 análise bioestatística, 15–16 e qui-
Bioestatística, 3 quadrado, 615, 623 e estatística
Taxa de natalidade, bruta, 15-10 descritiva, 21, 22–30, 47 e teste de hipótese,
Distribuição normal bivariada, 445 232–233, 243–244, 258–259 e estimativa de
Método de Bonferroni, 324, 327 intervalo, 169–170 e regressão logística, 573
Gráfico de caixa e bigode, 50–52 e análise de correlação múltipla, 512–519 e análise
de regressão múltipla, 494–496 e números aleatórios,
C 16 e regressão linear simples e análise de correlação,
Taxa de letalidade, 15-14 450–451 e regressão passo a passo, 560– 563
Taxa de causa de morte, 15-8
Dados censurados, 752
Teorema do limite central, 139-140
Tendência central, medidas, 38-43
I-1
I-2 ÍNDICE
Coeficiente de confiança, 169 Taxas e proporções de mortalidade, 15-3 a 15-10

Intervalo de confiança: Taxa de mortalidade, fetal, 15-7
para b1, 438 regressão Regra de decisão, 218
múltipla, 506 Graus de liberdade, 45
para diferença entre duas médias populacionais, 177–185 Função de densidade, 115
populações não normais, 179–180 para diferença Estatísticas descritivas, 2, 19–64
entre duas proporções populacionais, 187–188 para Dispersão, medidas, 43-49
média de Y, dado X, 441–442 para myj1k, 508–509 para Procedimentos sem distribuição, 671
média populacional, 165–178 Variável fictícia, 544–559
E
Epidemiologia, 779
populações não normais, 168–171 para Estimativa, 161-210
proporção populacional, 185–186 em análise de regressão linear simples, 434,
interpretação prática, 167 para Y previsto, 441
441–442, 508–509 interpretação Estimador, 165
probabilística, 167 para razão de duas robusto, 170
variâncias, 198–201 para r, 454 para Eventos:
variância, 194– 198 complementares, 74
independentes, 73-74
Matriz de confusão, 219 mutuamente exclusivos, 68
Tabela de contingência, 619 EXCEL: e
Correção para continuidade, 152 distribuição binomial, 106
Coeficiente de correlação: Exclusivo ou, 73
múltiplo, 510–513 simples, Experimentos, 10
446–450 design, 14–15
Modelo de correlação: Análise exploratória de dados, 52
múltiplo, 510–519 Extrapolação, 442, 459–460
simples, 445–446
Modelo de regressão de Cox, função de F
risco 768-772, 768-769 Fatorial, 101
Região crítica, 224 Experimento fatorial, 358-369
Valor crítico, 224 Tabela ANOVA, 364
Frequências cumulativas, 25 suposições, 362
Frequências relativas cumulativas, 25 Falso negativo, 79
Falso positivo, 79
D Taxas de erro familiares, 506
Dados, Distribuição F, tabela
2 agrupados, 22– 199 de, A-42–A-51
37 brutos, 20 Fecundidade, 15-10
fontes, 3 Fertilidade, 15-10
Taxa de medidas, 15-10 a 15-12
mortalidade: Taxa de
bruta, 15-3 fertilidade: específica
fetal, 15-7 para a idade, 15-11
específica, 15-3 padronizada, 15-3 cumulativa, 15-12 geral, 15-10
ÍNDICE I-3
padronizado, 15-12 total, duas variações populacionais, 267-272

15-12 bilateral, 226
Correção de população finita, 141
EU
Teste exato de Fisher, tabela
636–640 para, A-55–A-85 Taxa de imaturidade, 15-14
Fisher's z, tabela 453– Taxa de incidência, 15-13
454, A-54 Inclusivo ou, 73
Modelo de efeitos fixos, 311 Estatísticas inferenciais, 2, 162
Teste F-max, 198 Interação, 359–360, 550
Seleção de encaminhamento, 563 Interpolação, 442
Distribuição de frequência, 22-37 Intervalo interquartílico, 48

Estimativa de intervalo, 165
Polígono de frequência, 27
Teste de Friedman, 712-716 Escala de intervalo, 6
tabela para, A-102–A-103

J
Teste F, 316-317
Distribuição conjunta, 445
G k
Testes de qualidade de ajuste, 604-616
Procedimento Kaplan-Meier, 756–761
Dados agrupados, 22–37 Teste de Kolmogorov-Smirnov, 698–703
vantagens e desvantagens, 703 e análise
H
de computador StatXact, tabela 702 para, A-99
Histograma, 25–28
Hipótese, 215 Teste de Kruskal-Wallis, tabela
alternativa, 216 704-709 para, A-100-A-101
formulação, 14 nula, Curtose, 48–49
216 pesquisa, 215
estatística, 216 eu
Mínimos quadrados, método, 420

Testes de hipótese, 215–303 por Linha de mínimos quadrados, 420–422
meio de intervalo de confiança, 225–226 diferença Teste de Levene, 201, 270
entre as médias, 236–249 populações não normais, Parâmetros de localização, 47
242–243 variações populacionais conhecidas, Teste de classificação de log, 763-765
236–238 variações populacionais desconhecidas, Regressão logística, 569-581

238–243 Perda no acompanhamento, 751
para bi, regressão múltipla, 504–506 para b1,
regressão linear simples, 427–432 unilateral, 226– M
228 objetivo, 215, 220 média de população única, Teste de Mann-Whitney, tabela 690–
222–236 696 para, A-95–A-98
Estatística de Mantel-Haenszel, 650–653
população não normal, 230–232 variação Margem de erro, 168
populacional conhecida, 222–228 variação Média, 38–40
populacional desconhecida, 228–230 propriedades, 40
proporção de população única, 257–259 variância Medição, 6
de população única, 264–266 etapas, 216 duas Escalas de medição, 5–6
proporções de população, 261–264 Mediana, 40
propriedades, 41
I-4 ÍNDICE
Teste mediano, 686-689 N

MINITAB: e Escala nominal, 6
distribuição binomial, 107 e gráficos Estatísticas não paramétricas, 671–747
de caixa e bigode, 51–52 e qui-quadrado, Região de não rejeição, 218
615–616, 623, 632 e intervalos de confiança Distribuição normal, 118–127
para uma média, 169–170 e medidas descritivas, 47 e aplicações, 122–127
variáveis fictícias, 546 –547, 550, 555 e experimento características, 118–119 padrão,
fatorial, 367–368 e distribuições de frequência, 27 e teste tabela 118–122, A-38–A-39
de Friedman, 716 e histogramas, 26–27 e teste de
hipóteses, 253, 258–259 e teste de Kruskal-Wallis, 709
e teste de Mann-Whitney , 694–696 e teste mediano, O
689 e correlação múltipla, 512, 515, 517 e regressão Observação, 14
múltipla, 495, 508 e distribuição normal, 126–127 e Estudo observacional, 642-643
ANOVA unidirecional, 321–322 e matriz ordenada, 20– Razão de chances, 645-648
21 e Poisson distribuição, 111–112 e ANOVA de medidas Ogiva, 96
repetidas, 349–350 e teste de sinal, 680 e regressão Curva característica operacional, 277
linear simples, 421, 444 e correlação de classificação de Matriz ordenada, 20–21
Spearman, 724 e exibições de ramo e folha, 29–30 e Escala ordinal, 6
regressão passo a passo, 560–563 e ANOVA de duas Atípicos, 52
vias, 341–342 e teste de Wilcoxon, 685
P
Comparações pareadas, 249–254
Parâmetro, 38
Correlação parcial, 513-519
Coeficientes de regressão parcial, 492
Percentil, 47
Estimativa pontual, 163
Distribuição de Poisson, tabela de
108–113, A-32–A-37
Processo de Poisson, 109
Modo, 41 População, 5
Morbidade, 15-13 finitos, 5
medidas, 15-13 a 15-14 infinitos, 5
Taxa de amostrados, 164
mortalidade: alvos, 164
infantil, 15-7 Poder, 272–279
materna, 15-6 Precisão, 14, 168
neonatal, 15-7 perinatal, 15-7 Valor preditivo negativo, 80
Multicolinearidade, 542 Valor preditivo positivo, 80
Comparação múltipla, 322-326 Estudo prospectivo, 642
Coeficiente de correlação múltipla, Intervalo de previsão
510-513 regressão múltipla, 508-509
Modelo de correlação múltipla, 510-513 regressão linear simples, 441-442
Regra de multiplicação, 71–72 Taxa de prevalência, 15-14
Distribuição multivariada, 510 Probabilidade, 65-85
Distribuição normal multivariada, 510 posterior, 68
ÍNDICE I-5
anterior, não paramétrico, 727–730 linha

68 clássica, 66–67 resistente, 442–444 linear
condicional, 70 simples, 413–446
conjunta, 71 marginal, suposições, equação 415–
70, 75 objetiva, 66– 416, modelo 417–423, 414–
67 personalística, 67 416 passo a passo, 560–564
propriedades, 68–69
frequência relativa, 67 Região de rejeição, 218
subjetiva, 67–68 Frequências relativas, 24–25
Risco relativo, 643-645
Distribuições de probabilidade, 92-132 Confiabilidade, 14
de variáveis contínuas, 113–128 de Coeficiente de confiabilidade, 167
variáveis discretas, 93–113 cumulativas, Projeto de medidas repetidas, 346–356
96–98 propriedades, 95 suposições, 347–348 definição, 347
Método de limite de produto, consulte o procedimento de Kaplan-Meier Estudo de pesquisa, 10

Modelo de riscos proporcionais, consulte modelo de regressão Residual, 429
de Cox Linha resistente, 442-444
Taxa de mortalidade proporcional, 15-8 Estudo retrospectivo, 643
valores p, 225 Fator de risco, 642
Q S
Variáveis qualitativas, 4, 543-556 Amostra, 5
Quartil, 47–48 conveniência, 165 não
aleatório, 164–165 aleatório,
R 164–165 aleatório simples,
R tamanho 7–10 para
e gráficos box-and-whisker, 51 e controlar erros tipo II, tamanho 277–279
intervalo de confiança entre duas médias, para estimar médias, tamanho 189–
183 191 para estimar proporções, 191–193
Dígitos aleatórios, tabela, uso proporcional estratificado tamanho, 13 aleatório
A-2, 9–10 estratificado, 12 sistemático estratificado, 12
Projeto de bloco completo randomizado, 334–346 sistemático, 11
Tabela ANOVA, 338
suposições, 337
Alcance, 43–44 Distribuição amostral, 135–160
Transformação de classificação, 672 características, 136 construção de,
Taxa, 15-2 135 definição, 135 diferença entre
Razão, 15-2 médias amostrais, 145–150
Escala de proporção, 6 populações não normais, 148 diferença entre proporções
Regressão: amostrais, 154–156
logística, múltiplo 569–
581, suposições 489–
510, equação 491, da média da amostra, 136–145
modelo 491–492, 490– populações não normais, 139–141
492 da proporção da amostra, 150-153
I-6 ÍNDICE
SAS: Estatística, 38
e análise qui-quadrado, 623–625 e medidas Inferência estatística, 7, 162
descritivas, 47 e experimento fatorial, 367, Estatísticas, 2
368 e teste de hipóteses, 233, 244–245 e Exibição de caule e folha, 28–30
regressão logística, 572–576 e regressão Regressão passo a passo, 560-569
múltipla, 493, 496 e unidirecional ANOVA, 322 Faixa estudantil, mesa 324
e medidas repetidas ANOVA, 350–351 e de, A-52–A-54
regressão linear simples e correlação, 442–443, Distribuição do aluno, tabela 172–177
450–451 e teste HSD de Tukey, 326 e ANOVA de de, A-40
duas vias, 341–342 Regra de Sturges, 22
Análise de sobrevivência, 750-776
tempos de sobrevivência censurados,
752 tipos, 752-753
Diagrama de dispersão, 419-420 Regressão de Cox, função de risco, 768-772 função
Métodos científicos, 13–15 de distribuição cumulativa, 754
Taxa de ataque secundário, 15-14 Procedimento de Kaplan–Meier, 756–761
Sensibilidade, 80 técnica não paramétrica, 756 probabilidade
Nível de significância, 218-219 de sobreviver, 756–757 função de
Teste de sinal, 673-680 distribuição de probabilidade, 755 funções de
Amostragem aleatória simples, 7–10 distribuição estatística, 753 curvas de
sem reposição, 7–8 com reposição, sobrevivência, comparando, 763–766 dados de
7–8 tempo até o evento, 751–756
Distorção, 41–42
Encosta, 415
Coeficiente de correlação de classificação de Spearman, 718-724 Distribuição T t, 171–177 e
tabela para, A-104 diferença entre as médias, 179–183 variâncias
Especificidade, 80 populacionais iguais, 179–180 variâncias
Esfericidade, 348 populacionais não iguais, 180–183 propriedades,
SPSS: 172 tabela de, A-40
e teste exato de Fisher, 640 e
distribuição de frequência, 25–26 e curtose, Dados de tempo até o evento, consulte Análise de sobrevivência
49 e regressão logística, 577 e teste de Estatística de teste, 217–218
Mann-Whitney, 695–696 e teste de Mantel- Média aparada, 170
Haenzcel, 652–653 e regressão múltipla, Teste HSD de Tukey, 323–324
493 e razão de chances , 648 e correlação linha de Tukey, 443-444
parcial, 516, 518–519 e medidas repetidas Erro tipo I, 219
ANOVA, 350–351 e assimetria, 43 e análise Erro tipo II, 219, 272–279
de sobrevivência, 665–666 e teste HSD de
Tukey, 327 você
Imparcialidade, 163
Distribuição uniforme, 614-616
Unidade de associação, 459
Desvio padrão, 45
Erro padrão da média, 139 V
Distribuição normal padrão, 118-122 Variável, 3
tabela de, A-38–A-39 aleatório contínuo, 4
ÍNDICE I-7
dependente, 415 Variância, estimativa

aleatório discreto, 4 de intervalo 44-45, 194-197
fictício, 544–556 Razão de variância, 316
explicativo, 490 Teste de razão de variância, 198, 268–272
estranho, 307 Estatísticas vitais, 778-796
independente, 415
preditor, 417, 490 C
qualitativo, 4, 543–556 Distribuição de Weibull, 755–756
quantitativo, 4 aleatório, 4 Teste de Wilcoxon, tabela
resposta, 307, 417 tratamento, 681–686 para, A-86–A-95
307
Y
Seleção variável Correção de Yates, 627
procedimentos, 560-564 interceptação y, 415

Biostatistics - A Foundation For Analysis in The Health Sciences (10th Ed) - Traducao

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Biostatistics - A Foundation For Analysis in The Health Sciences (10th Ed) - Traducao

Enviado por

Direitos autorais:

Formatos disponíveis

Machine Translated by Google

Machine Translated by Google

WAYNE W. DANIEL, PH.D.

Faculdade de Pós-Graduação Associada

VP & EDITORA EXECUTIVA: Laurie Rosatone

Este livro é impresso em papel livre de ácido. 1

Dados de catalogação na publicação da Biblioteca do Congresso

Impresso nos Estados Unidos da América

MUDANÇAS E ATUALIZAÇÕES PARA ESTA EDIÇÃO

IDEIAS DE COBERTURA DE CURSOS

Curso de Graduação para Estudantes XXXXXXXXX OXOOO

Curso de Graduação em XOOOXXXXXX OXXXO

Primeiro curso de bioestatística para XXXXXXXXXX OXXXO

Curso de Bioestatística para XOOOOXXXXXX XXXXX

X: Cobertura sugerida; O: Cobertura opcional.

1 INTRODUÇÃO À BIOSTATÍSTICA 1 11 ANÁLISE DE REGRESSÃO: ALGUMAS

4 DISTRIBUIÇÕES DE PROBABILIDADE 92 13 NÃO PARAMÉTRICOS E

6 ESTIMATIVA 161 15 ESTATÍSTICAS VITAIS (ONLINE)

7 TESTE DE HIPÓTESE 214 APÊNDICE: TABELAS ESTATÍSTICAS A-1

8 ANÁLISE DE VARIÂNCIA 304 RESPOSTAS PARA NUMERADOS IMPAR

1 INTRODUÇÃO À BIOSTATÍSTICA 1 Questões de Revisão e Exercícios 85

1.2 Alguns Conceitos Básicos 1.3 2

4.5 Distribuições de Probabilidade Contínua 4.6 A 113

4.7 Aplicações de Distribuição Normal 4.8 Resumo 122

2.2 O Array Ordenado 20 2.3 Dados

Cálculo da probabilidade de um evento 69 3.5 Teorema

6.2 Intervalo de confiança para uma média populacional 165

6.3 A Distribuição t 171 8 ANÁLISE DE VARIÂNCIA 304

Variâncias de Duas Populações Normalmente 9.1 Introdução 414

441 9.6 O Modelo de Correlação 445

9.7 O Coeficiente de Correlação 446

9.9 Resumo 460

7.10 Determinando o tamanho da amostra para controlar erros

7.11 Resumo 280 Questões 525

11 ANÁLISE DE REGRESSÃO: ALGUMAS 13.8 A Análise de Variância Unidirecional de Kruskal-Wallis

14 ANÁLISE DE SOBREVIVÊNCIA 750

14.2 Dados de tempo até o evento e censura 751 14.3 O

12.8 Resumo 655 Questões 15 ESTATÍSTICAS VITAIS (ONLINE)

13.1 Introdução 671 13.2 Escalas

13.5 O Teste Mediano 686 RESPOSTAS PARA NUMERADOS IMPAR

13.6 O teste de Mann-Whitney 690 13.7 O teste EXERCÍCIOS A-107

VISÃO GERAL DO CAPÍTULO

1.2 ALGUNS CONCEITOS BÁSICOS

1.3 MEDIDAS E BALANÇAS DE MEDIDA

1.4 AMOSTRAGEM E INFERÊNCIA ESTATÍSTICA

1.5 O MÉTODO CIENTÍFICO E O DESENHO DE EXPERIMENTOS

1.6 COMPUTADORES E ANÁLISE BIOSSTATÍSTICA

Depois de estudar este capítulo, o aluno irá: 1. compreender

2 CAPÍTULO 1 INTRODUÇÃO À BIOSTATÍSTICA

Frequentemente somos lembrados do fato de que estamos vivendo na era da informação.

1.2 ALGUNS CONCEITOS BÁSICOS

1.2 ALGUNS CONCEITOS BÁSICOS 3

Fontes de dados A realização de atividades estatísticas é motivada pela necessidade de responder a

3. Experimentos. Freqüentemente, os dados necessários para responder a uma pergunta estão

Bioestatística As ferramentas da estatística são empregadas em muitos campos — negócios, educação,

4 CAPÍTULO 1 INTRODUÇÃO À BIOSTATÍSTICA

Variável Aleatória Sempre que determinamos a altura, o peso ou a idade de um indivíduo, o

1.3 MEDIDA E ESCALAS DE MEDIDA 5

Devido às limitações dos instrumentos de medição disponíveis, no entanto, as observações

1.3 MEDIDAS E BALANÇAS DE

6 CAPÍTULO 1 INTRODUÇÃO À BIOSTATÍSTICA

1.4 AMOSTRAGEM E INFERÊNCIA ESTATÍSTICA 7

A mecânica de extrair uma amostra para satisfazer a definição de um aleatório simples