Berquo - Bioestatistica 2ed

Dados Internacionais de Catalogação na Publicação (CIP)
Câmara Brasileira do Livro, SP, Brasil)
erquó, Elza Salvatori.

B449b Bioestatística / Elza Salvatori Berquó, José
Maria Pacheco de Souza, Sabina Léa Davidson
Gotlieb. - 1“ ed. rev. São Paulo: EPU, 1981
l.Bioestatística 2. Estatística 1. Souza,

José Maria Pacheco de. II. Gotlieb, Sabina Léa
Davidson. III. Título.
81-0394 CDD-570.182
Índices para da sistemático:
1. Bioestatística
2. Ciências da vida astsELqUiCa aplicada 570.182
Métodos estatísticos 570.182
4. Métodos estatísticos : Ciências da vida 570.182
Elza Salvatori Berquó
José Maria Pacheco de Souza
Sabina Léa Davidson Gotlieb
DEDALUS - Acervo - FMRP
AA 11200000952
Bioestatística
2º Edição revista
: MEDICINA DE
ERIBEIR O PRETO DA U.S.P.
ERU,
Editora Pedagógica e Universitária Ltda.
São Paulo
ELZA SALVATORI BERQUO
Bacharel em Matemática pela Pontifícia Universidade Católica de Campinas;

pós-graduação em Estatística e Matemática pela U.S.P.;
Master em Bioestatística
pela Columbia University, New York, U.S.A.; Livre-docente em Estatística pela
U.S.P.: especialização em Teoria da Amostragem pela University of Michigan,
Ann Arbor, U.S.A.: especialização em Análise Seqiencial pela Columbia
sity. New York, U.S.A.:
Univer-
especialização em Teoria Estatística de Epidemias
University pela
of Berkeley, Califórnia, U.S.A.; Professora Catedrática de Bioestatística
da Faculdade de Saúde Pública da U.S.P.; membro do Instituto Internacional de
Estatística, membro do CEBRAP.
JOSE MARIA PACHECO DE SOUZA
Cirurgião-dentista pela Faculdade de Farmácia e Odontologia da U.S.P.; pós.

graduação em Saúde Pública na Faculdade de Saúde Pública da U.S.P.; pós-gradua-
ção em Matemática e Estatística para Investigadores no Campo Biológico (Facul-
dades de Medicina e de Saúde Pública da U.S.P.); Mestre em Saúde Pública e
Doutor em Saúde Pública pela U.S.P.; Master of Science in Public Health (Biosta-
tistics) pela University of North Carolina, Chapel Hill, U.S.A.;
Professor Assistente
Doutor do Departamento de Epidemiologia da Faculdade de Saúde Pública
da USP.
SABINA LÉA DAVIDSON GOTLIEB
Cirurgiã-dentista pela Faculdade de Farmácia e Odontologia da U.S.P.; pós-gra-

duação em Saúde Pública na Faculdade de Saúde Pública da U.S.P.; Mestre em
Saúde Pública e Doutora em Saúde Pública pela U.S.P.; Professora Assistente
Doutora do Departamento de Epidemiologia da Faculdade de Saúde Pública
da U.S.P.
7* reimpressão , 2001
ISBN 85-12-40280-6
€ E.PU. - Editora Pedagógica e Universitária Ltda., São Paulo, 1984. Todos os direitos reservados.
A reprodução desta obra, no todo ou em parte, por qualquer mcio, sem autorização expressa epor
escrito da Editora, sujeitará o infrator, nos termos da lei nº 6.895, de 17-12-1980, à penalidade
prevista nos artigos 184 c 186 do Código Penal, a saber: reclusão de um a quatro anos.
E. P.U. - Telefone (0++11) 3168-6077 - Fax. (0++11) 3078-5803
E-Mail: vendas()epu.com.br Site na Internet: http://www.cpu.com.br
Rua Joaquim Floriano, 72 - 6º andar - conjunto 65/68 - 04534-000 São Paulo - SP
Impresso no Brasil Printed in Brazil
Sumário
P to científico, Estatística e Bi
1.1 O pensamento científico e a Estatística

1.2 Evolução do papel da Estatística ...........c.
1.3 Os termos Estatística e Bioestatística
Levantamento de dados*
2.1 Tipos de levantamento ...........cciicctico

2.2 Níveis de mensuração sá
2:3 Apuração de dados s qua aus pouas sas mamas dosdass
2.4 Apresentação tabular ..........cccccciscceeio
2.5 Apresentação gráfica ........cccccciiitiserees
Asas e
de uma
variáveis qualitativas 47
3.1 Estudo da associação em tabelas de 2x2 ......... 47

3.2 Estudo da associação em tabelas de rxs ... 55
3.3 Medidas baseadas no conceito de melhor predição da
ASSOCIAÇÃO! ua eau siiua Sant fado ndo dias Ra GC BSM iASO em 61
Análise descritiva de variáveis quantitativas: medidas de po-

sição, de abilidade, de ii ia e de ach
noções sobre correlação e regressão ...........c..c.... 69
4.1 Medidas de posição ou de tendência central ou médias a

4.2 Medidas de variabilidade ou de dispersão .......... 86
4.3 Medidas de assimetria ........ccciciisscitiiios
4.4 Medidas de achatamento ou “curtose” ............ 97
4.5 Noções de correlação e regressão ............... . 98
vi
5. Noções sobre a teoria das probabilidades ..............,
5. Noções elemenares sobre a teoria dos conjuntos ..

5.2 Conjunto de todos os resultados possíveis de um
experimento mesm mera mimo é mae à como a ra esa 5
5.3 Eventos ...... cc...
5.4 Variável aleatória .....
5.5 Probabilidade .........
5.6 Probabilidade condicional
6: AMOSTADEM, us res darem qua pose pra E BEST MES É qm e
6.1 Etapas de um levantamento por amostragem ......

6.2 Tipos de amostragem
6.3 Amostragem probabilística
6,4 Precisão! . cs é sussa x visao aces postas égua o casos pesa
6.5 Vício ..... “es
6.6 Considerações finai
7. Delineamento de pesquisa ............clcccccceo
7.1 Considerações sobre a relação causa-efeito.........

7.2 Experimento; controle; casualização ....... o.
7.3 Estudos não-experimentais ..........iccccici.
7.4 Considerações finais ......icccccicicisicics
8. Distribuição binomial
8.1 A distribuição .......lc

8.2 Análise da distribuição binomial
8.3 Tabelas
8.4 Distribuição da variável proporção de sucessos ....
8.5 Considerações finais
9. Distribuição normal
9.1 A distribuição ecl

9.2 Tabelas da distribuição normal
PS Distribuição amostral de médias
9.4 Papel de curva normal
VII
10) Teste de hipóteses
10.1 Considerações básicas

10.2 O teste de hipóteses...
10.3 Curva característica operacional .....iililo
10.4 Observações sobre os testes de hipóteses
10.5 Representatividade da amostra
Teste de uma proporção populacional ...............

11.1 O valor de p a ser considerado .........cillll
11.2 Teste das hipóteses H,: Pr=peH :p <p...
11.3 Teste de uma proporção usando a aproximação
normal.
12. Teste de uma média populacional ..................

Não!
12.1 O desvio padrão da população é conhecido .........
12.2 O desvio padrão da população é desconhecido ......
(3. Comparação entre as médias de duas populações ........

Nes
13.1 Teste de hipóteses para as médias de duas populações
não-correlatas «sup sus nessas nas sor cus pose
correlatas s ausa ones umas suco asa musas emos suma visa sagas
Teste de uma variância populacional ER Car a, sa
14.1 A distribuição a MET TO

14.2 O teste Hj 26 = Op ces sinim
cem sse cores
La * op
c ão de variâncias
de k populações independ
15.1 O teste de hipóteses H, : 6 = o». A distribuição F
E EO) EO vaga gas mou vara
15.2 O teste de hipóteses para mais de duas variabilidades
populacionais .......ccciiciiiiciccctsteceses
Medium Mesa cados Da vusl

Comparação de médias de k populações independentes —.
Análise de variância a um critério de classificação ...... 269
16.1 A análise de variância ...ccccssssercsse risco. 269
16.2 Quadro-resumo de uma análise de variância ...... 275
16.3 Observações finais ....cccccccccccccllcclrl. 278
17. Testes de hipóteses em tabelas de 2 x Ze der xs ........ 281
17.1 Testeside associação: eus cn » aneis ersusns means suesecy ganas 3 281
17.2 Testes de duas proporções 286
Teste de um fici de l e de um fi
DE TESTESSÃO cs ass css cpseses ses ares cam cane pars é 299
18.1 Teste de correlação .........cccicicc 299

18.2 Teste de regressão .......... gas vtd
o ra esto aÃ 300
Estimação de parâmetros populacionais — Por ponto e por

intervalos de confiança ..........cccccl 305
19.1 Estimação por ponto; estimador não-viciado ...... 305

19.2 Estimação por intervalo de confiança ............. 306
Análise segiencial ........l 323

20.1 O método segiiencial de testar uma hipótese ....... 325
20.2 O teste seqiiencial da razão de probabilidades ......
326
20.3 Teste de uma proporção .........iiiiii 330
Dedicatória
Dedicamos este nosso trabalho a dois mestres que pela inestimável

contribuição que deram para o desenvolvimento da Estatística no Brasil
merecem o maior respeito e profundo reconhecimento.
Sem se conhecerem, o elo que os uniu foi o de terem, cada um deles
a seu modo. encontrado na Estatística a forma suprema de extravasarem
sua criatividade de homens de ciência, sem contudo perderem a sensibi-
lidade diante dos constantes desafios que constituem os problemas hu-
manos.
Contemporâneos, por viverem seus tempos biográficos em contextos
sócios-culturais distintos, chegaram, por isso mesmo, a patamares tam-
bém distintos na árdua caminhada em busca das verdades.
Pedro Egydio de Oliveira Carvalho, desaparecido prematuramen-
te em 1958, era, na época, e o fora por muitos anos, professor de Bioes-
tatística da Faculdade de Higiene e Saúde Pública da Universidade de
São Paulo. Médico por profissão e matemático por vocação e adoção,
sem nunca ter saído de sua pátria, conheceu, por isso, a solidão que
habita o coração daqueles que, em seus meios, estão à frente de seu
tempo.
Pesquisador por excelência, seu trabalho marcou o início de uma
fase nova no que se refere ao conhecimento e aplicação da Estatística,
bem como da pesquisa estatística propriamente dita. Não fora sua
incomum modéstia e o meio científico internacional o teria conhecido
ainda em vida, como ficou demonstrado quando, pelas mãos de seus
discípulos, seus trabalhos foram divulgados em revistas especializadas.
Amigo incansável, deixou em nós uma saudade sentida que o tempo
só faz crescer. ,
Jerzy Neyman, muito jovem, já brindara o mundo da ciência com
seu gênio refletido na formulação rigorosa e sistemática da teoria dos
testes de hipóteses, ponto de partida para a edificação de todas as teo-
Tias estatísticas que se seguiram, paramétricas ou não, seqiienciais ou a
tamanhos fixos. Seu espírito aberto de cientista, Neyman o demonstrou
ao anunciar a limitação dessas posturas anteriores frente aos modelos
estocásticos que tomaram conta do cenário científico e se constituem,
xi
até o momento. no enfoque mais amplo e rico para se conhecer, na
intimidade, os mecanismos que governam os fenômenos do nosso universo,
Enveredando com segurança por este novo domínio, vem dando impor-
tantes contribuições para a astronomia, teorias de epidemias e estudos de
cancerolegia. Professor há muitos anos do Departamento de Estatística
Matematica da Universidade da Califórnia em Berkeley, Neyman, em
1961. passou algum tempo no Brasil, a convite da Universidade de São
Paulo. para estudar a viabilidade da criação de um Instituto de Esta-
tística: neste sentido, deve ser considerado, juntamente com Pedro Egy-
dio. o precursor da idéia de se dotar a Universidade com uma unidade
autônoma devotada à pesquisa e ao ensino da Estatística em nível de
graduação e de pós-graduação. Hoje, com seus oitenta anos de idade,
Neyman continua a ser O guardião ativo das liberdades da ciência e
dos cientistas; cidadão do mundo, sempre que em alguma parte a ciên-
e ia ou o cientista estão em perigo seus protestos não demoram a chegar
suas mãos se estendem para proteger o direito da pessoa humana.
Apresentação
Esta publicação pretende saldar uma dívida que fomos assumindo

ao longo de vários anos com a nossa comunidade científica, principal-
mente com pesquisadores ligados à área de saúde.
A falta de um livro de texto em idioma português, visando a ex-
posição do raciocínio estatístico que deve preceder as técnicas corres-
pondentes, ilustradas com exemplos colhidos na investigação do dia-a-dia
em nossos meios de pesquisa, nos convenceu da necessidade de uma
obra como a que ora se propõe.
Ela reflete a experiência que fomos acumulando pelo ensino da
Bioestatística a profissionais que passaram pelos cursos da Faculdade
de Saúde Pública da USP: médicos, dentistas, veterinários, enfermeiros,
farmacêuticos, cientistas sociais e outros, com o fim de se tornarem
sanitaristas.
Inspirou-se por isso na apostila intitulada “Bioestatística”, que nos
serviu de instrumento de trabalho para os cursos que desenvolvemos no
então Departamento de Estatística daquela Faculdade.
Vários capítulos foram introduzidos, além daqueles que faziam par-
te da apostila, e mesmo aqueles foram aqui tratados em maior profun-
didade. Optamos por sacrificar as demonstrações sempre que estas
envolvessem conhecimentos de Matemática que julgamos estarem acima
das possibilidades dos leitores para os quais escrevemos esta obra.
Esta tarefa nos proporci de dadeii p
por ter possibilitado a oportunidade de um reencontro acadêmico com
os colegas José Maria e Sabina, que continuaram nosso trabalho no
então Departamento de Estatística Aplicada da Faculdade de Saúde
Pública, após nossa saída da USP em março de 1969.
o apresentarmos este livro, fazemo-lo nã esperança de que esta
disciplina possa ajudar a todos aqueles que, tendo como meta final o
bem-estar físico, mental e social do homem, procuram compreender o
mundo em que vivemos, para mantê-lo ou modificá-lo em favor do
bem comum.
Elza Berquó
x
“Capítulo 1
Pensamento científico, Estatística e
Bioestatística
1.1 O pensamento científico e a Estatística
O” pensamento científico se dá ao nível de uma linguagem teórica

sobre conceitos e hipóteses científicas, para cuja “comprovação” quase
sempre se faz necessária a passagem a outro nível, ou seja, o da lin-
guagem operacional. Neste segundo nível é que se situam as hipó
estatísticas que dizem respeito a formulações do mesmo conceito, po-
rém explicitando os procedimentos de observação direta ou mensuração.
Um exemplo concreto pode ajudar a compreender a diferença entre
os dois níveis. Suponha-se um investigador interessado em estudar a
veracidade da seguinte proposição: “Quanto mais bem-educada uma
pessoa, menor o seu preconceito em aceitar uma certa campanha sani-
tária”. Como se percebe, esta proposição encerra dois conceitos teóri-
cos: educação e preconceito. Para cada um deles pode-se adotar um
conjunto de definições: preconceito, por exemplo, pode ser definido
como a atitude negativa baseada em um pré-julgamento; educação pode
estar conceituada como um conjunto de conhecimentos que permite a
uma pessoa ter uma visão global do mundo. Porém, sejam quais forem
as definições teóricas adotadas, quando se pensa em proceder à com-
provação da referida proposição, sente-se de imediato que uma ponte
precisa ser edificada, buscando a passagem desses conceitos para defi-
nições operacionais. Ou seja, como observar ou medir educação e pre-
conceito? Educação pode ser traduzida operacionalmente, por exemplo,
por anos de escolaridade. Analogamente, com relação a preconceito,
na prática, escalas apropriadas permitem classificar os indivíduos se-
gundo suas respostas a uma bateria de perguntas, atribuindo-lhes escores
ou notas.
Nestas condições, a proposição, isto é, a hipótese científica, pode ser

enunciada, em termos de uma hipótese estatística, como segue: “Quan-
to mais anos de escolaridade tem uma pessoa, menor o seu escore em
uma escala de preconceito”.
Em outras palavras, esta hipótese estatística diz que é negativa a
correlação entre anos de escolaridade e nota em uma escala de precon-
1
|
ceito. Caso esta afirmação se refira a João, José e Pedro, então basta
encerrada. A
verificar se cla é verdadeira para eles e a questão estará
ciência, porém, não avançou nada ou caminhou muito pouco com este
mais gerais e sempre
tipo de veriticação. As hipóteses estatísticas são
dizem respeito a parâmetros populacionais; neste caso,O coeficiente de
correlação de uma distribuição populacional bidimensional constituída
por todos os pares de valores das variáveis X (anos de escolaridade)
e Y (escore ou nota em uma escala de preconceito).
Formulada uma hipótese estatística, o passo seguinte consiste em
testá-la. Para tanto, são elaborados planos para a coleta e análise dos.
dados que serão usados para testar a hipótese, bem como são estabe-.
lecidas regras de decisão a que obedecerá o referido teste. Em seguida,
são coletados os dados, de acordo com o delineamento prévio, e sobre
estes é realizada uma análise baseada em técnicas estatísticas adequa-
das. Finalmente, diante dos resultados encontrados, decisões são to-
madas com relação à hipótese estatística, com base nas regras de deci-
são anteriormente estabelecidas e, através de uma inferência indutiva,
aceita-se como provável a veracidade ou a falsidade da hipótese esta-
tística formulada e, consegiientemente, de sua correspondente hipótese
científica. Todo o processo descrito pode ser sumariado no seguinte en-
cadeamento lógico:
1) a partir de uma hipótese científica se deduz (inferência deduti-
va) uma hipótese estatística em termos de definições operacionais que
se refere a afirmações sobre parâmetros populacionais;
2) da hipótese estatística se deduzem (inferência dedutiva) as
consegiiências lógicas em termos do que deve ser esperado empirica-
mente com relação ao estimador do parâmetro populacional em causa;
3) regras de decisão são estabelecidas para o teste da hipótese es-
tatística;
4) um delineamentoé elaborado para fixar'as normas de coleta
dos dados empíricos, bem como as técnicas apropriadas de análise dos
resultados;
5) a coleta é efetuada, isto é, observa-se o que é observável e me-
de-se o que é mensurável;
. 6) o material empírico coletado é analisado estatisticamente,
ou
seja, valores numéricos são encontrados para os estimadores dos pa-
râmetros populacionais referidos na hipótese estatística;
, 7) de acordo com as regras de decisão estabelecidas (item 3),
induz-se (inferência indutiva), a partir dos resultados empíricos e com
base na teoria das probabilidades, a veracidade ou falsidade da hipótesê
estatística;
2
da veracidade ou falsidade da hipótese estatística, induz-se
(inferência indutiva) a veracidade científica correspondente.
Em resumo, o processo Jógico da acumulação do conhecimento em

ciência é circular e envolve inferências tanto dedutivas como indutivas
É importante observar que a inferência indutiva, no que respeita à hi-
pótese estatística, terá tanto mais significado quanto mais adequado
tenha sido o delineamento sobre a coleta dos dados empíricos e quanto
mais apropriada a análise estatística realizada sobre os dados assim
coletados. Basta que alguma falha ou inadequacidade ocorra nesta fase e
os estimadores propostos ou seus valores numéricos podem não refle-
tir bem os seus correspondentes parâmetros teóricos. Por outro lado.
a inferência indutiva da hipótese estatística para a hipótese científica cor-
respondente será tanto melhor quanto mais adequada tenha sido a ope-
racionalização dos conceitos teóricos contidos nesta última.
O papel da Estatística na pesquisa científica está em contribuir
junto ao investigador: na formulação das hipóteses estatísticas e fixação
das regras de decisão, no fornecimento de técnicas para um eficiente
delineamento de pesquisa, na coleta, tabulação e análise dos dados em-
píricos (estatística descritiva) e em prover testes de hipóteses a serem
realizados de tal modo que a incerteza da inferência indutiva possa ser
expressa em um nível probabilístico pré-fixado (estatística indutiva).
A indução estatística, que envolve um processo complexo de ra-
ciocínio para inferir indutivamente propriedades de uma população (ou
universo) à base de resultados de amostras (ou subconjuntos do uni-
verso), constitui uma ferramenta muito importante no desenvolvimento
de uma disciplina científica. Toda a inferência indutiva na Estatística
está baseada na teoria das probabilidades, a qual, por ser um ramo da
Matemática, é, por sua vez, uma disciplina essencialmente dedutiva.
1.2 Evolução do papel da Estatística : E

Isto posto, uma pergunta surge naturalmente: a partir de quando
a Estatística foi pensada no sentido acima descrito e, antes disso, como
foi evoluindo o seu papel na investigação científica? De fato, toda vez
que se vai introduzir uma disciplina, o estudioso espera uma apresen-
tação que inclua uma definição do objeto de estudo, acompanhada,
quase sempre, de um pequeno histórico a respeito. Mas, como salienta
mo-
Kendall +, “conquanto toda história precise começar em algum
mento, a história não tem começo”. Para ele, não há traços da história
E
* Kendall, M. G., “Where Shall the History of Statistics Begin?”, in Studies in
the History of Statistics and Probability, Griffin, London, 1970.
3
i
|
ocasião em que começavainde-. nal
da Estatística antes de cerca de 1660. política e foram surgindo
Europa o grande impulso da aritmética
nesta direção. Por exemplo,
pendentemente. em vários paises, trabalhos
em 1662, e o livro de Hudde,
o famoso Observations, de John Graunt, com poucos anos de.
4 s. em 1671. No encerramento do século,
diferença. aparecer: am os trabalhos de Willian Petty, Political Aritmetics,
em 1690, Halley” Estimates, em 1693, Observations, por Gregory King,
em 1696.
em
Nevman* divide a história do “indeterminismo em ciência”
quatro períodos perfeitamente distinguíveis, a saber: indeterminismo
indeterminística está-
marsinal, indeterminismo estático, experimentação
marginal.
ticae indeterminismo dinâmico. Para ele o indeterminismo
compreende um período que teve início há uns dois séculos e foi mar-
cado pelos trabalhos de Laplace e Gauss sobre a teoria dos “erros de
verificados na astronomia: ao tentarem pre-
mensuração”. notadamente
dizer exatamente a posição de um corpo celeste. em um tempo t. conhe-
cidas as suas posições em tempos anteriores ti, to. ... tm. Verificaram
que esta predição estava afetada por erros de mensuração incontroláveis,
o que levou às idéias da estimação estatística por valor ou por ponto.
Esta concepção de indeterminismo não afetou, entretanto. a maneira
de considerar o objeto fundamental da investigação científica da época.
que se continuou a ver sob a ótica determinística, como. por exemplo,
as leis sobre o movimento de um determinado planeta. Daí a denomina-
ção de indeterminismo marginal em ciência.
O segundo período, isto é. do indeterminismo estático, marcou o
fim do século XIX e começo do século XX com os trabalhos de astrô-
nomos como Bruns e Charlier e dos primeiros biometristas como Galton
e Karl Pearson. É nesta época que se toma consciência da presença da
variabilidade quando se passa de um indivíduo a outro. todos satisfa-
zendo a uma definição comum. Por exemplo. a altura troncocefálica
de adultos masculinos de um grupo étnico específico varia de um indi
víduo a outro dentro do grupo. Este tipo de constatação levou automa-
ticamente à consciência da necessidade de se considerar não apenas uma
manifestação isolada de um fenômeno em estudo, mas o conjunto de
todas as suas manifestações, isto é, de uma população de valores da
variável em causa. O passo seguinte consistiu na procura de procedi-
mentos matemáticos capazes de descrever esta variabilidade, o que ex-
ndo ho psd sema se caracterizado pela busca de fórmulas
distribuições
vários (sistemas:empíricas
de d eà a
fregiiências.de ajuste; ae
Neste sentido, fim
são declássicos aOº
curvas teóricas propostos por Karl Pearson. Como
* Nesman. 5. Indeterminism in Science

e and New Demands on Statisticians”.
Journal of the American Statistical Association, 55: 625-639, dec. 1960.
4
este período
salienta Neyman, do ponto de vista da conquista científica
ancestral” de
foi bastante modesto, a não ser pela “lei da herança
berta por Galton e Pearson.
O aparecimento no cenário científico de R. A. Fisher caracteriza o
terceiro período, o de experimentação indeterminística estática, que se
estendeu de 1920 a 1940. Trabalhando com problemas ligados à agricul-
tura, Fisher percebeu que a produção de um certa variedade de deter-
minada planta, o trigo, por exemplo, por unidade de área cultivada,
não significa a verdadeira produção desta variedade, mas apenas um
dentre os resultados possíveis de uma população (hipotética) de produ-
ções por unidade de área. Verificou também que a distribuição deste
tipo de variável é unimodal, aproximando-se daquela que Gauss já havia
encontrado para representar a distribuição dos erros de mensuração,
isto é, da distribuição normal. A característica fundamental deste pe-
ríodo “fisheriano” foi, portanto, a adoção de uma postura de indetermi-
nismo na ciência, consistente em caracterizar que a experimentação lida
com populações das quais amostras casuais São possíveis e quase sem-
pre os únicos meios disponíveis. Do ponto de vista do desenvolvimento
de técnicas estatísticas, os tados al d ivados pela experi-
mentação agrícola foram de grande alcance não só para a agfonomia,
mas também para outros domínios de investigação em outras ciências.
Ainda nestes vinte anos que precederam a Segunda Guerra
Mundial, como salienta Neyman, foram cunhados termos e desenvolvi-
dos conceitos sobre os testes de hipóteses e estimação por intervalos.
Neyman, por modéstia, não explicita em seu excelente artigo que seu
próprio nome está indelevelmente ligado a estas importantes contri-
buições, as quais, juntamente com as de Fisher sobre os delineamentos
de experimentos, devem constituir até hoje a bagagem fundamental de
todo pesquisador que pretenda viajar pelos domínios da investigação
científica. A limitação do período que se acaba de descrever consiste
essencialmente no fato de que nele os métodos propostos o foram com a
finalidade explícita de estudar uma população ou de comparar duas ou
mais populações tal como elas existem em um momento ou momentos
dados, sem levar em conta o processo evolutivo que possa estar aconte-
cendo com elas. Ou seja, a metodologia estatística não era delineada
para tomar em consideração os mecanismos de chance a que estão su-
jeitos os fenômenos, quanto a tempo e espaço.
O cenário científico do presente está marcado, segundo Neyman,
por uma visão de um indeterminismo dinâmico, “no sentido de um es-
forço para inventar mecanismos hipotéticos de chance, denominados
métodos estocásticos, que operam sobre várias entidades hipotéticas,
claramente definidas, de tal maneira que as freqiiências resultantes dos
àquelas efe-
vários resultados possíveis correspondam aproximadamente
décadas
tivamente observadas”. De fato, a preocupação nas últimas
ou
tem sido cada vez maior com relação às tentativas de construção
em quase todos os ramos do conhe-
verificação de modelos estocásticos
que em outros,
cimento cientifico, em alguns casos com mais sucesso do
dos verdadeiros me-
porem sempre buscando penetrar na intimidade
explicati dos fenô que se des l e atuam no
canismos
mundo real de cada dia.
1.3 Os termos Estatística e Bioestatística

1589 e
O primeiro uso da palavra Estatística parece datar de
u em um trabalho do historiador italiano Girolomo Ghilini
e militar”.
quando se referiu a uma “ciência civil, política, estatística
sido de-
As expressões “statistic”, “statist” e “statistical” parecem ter
rivados do latim status, com duplo significado: i) estado político e
ii) situação das coisast. A palavra “statist” é usada por Shakespeare,
em 1602, no Hamlet (ato 5, cena 2). Em The Elements of Universal
Erudition, obra de J. F. von Bielfeld, traduzida por W. Hooper, em
três volumes (Londres, 1770), o autor tem um capítulo intitu-
lado “Statistics”, que contém uma definição: “A ciência que
nos ensina qual é a situação política de todos os Estados
modernos do nosso mundo”. Nos anos seguintes, a denomina-
ção foi adotada por vários escritores, notadamente por Sir John Sin-
clair, editor e organizador do primeiro Statistical Account of Scotland,
(em 21 volumes, 1791-99). Em correspondência dirigida ao chefe da
Igreja da Escócia, escrita em 1790, Sinclair diz que “investigações esta-
tísticas, isto é, com relação à população, circunstâncias políticas, pro-
duções do país e outras questões de Estado, têm sido conduzidas am-
plamente na Alemanha”. Statistik, como o termo foi usado pelos auto-
res alemães do século XVIII, (principalmente por Zimmermann) e por
Sir John Sinclair, significava simplesmente a exposição das características
mais importantes de um Estado, o modo de exposição sendo, como via
de regra ocorria na época, predominantemente verbal *.
E dr
A ae E te na dos dados numéricos foram
principalmente dis in E ees o mas

Alémautores
siento esmussdspelos dit
mas cifras ed
fidedignas eram ati,
tes antes
y > écnicas instrumentais de análise eram
. o
* Yule, G. U. e Kendall, M. G., An Introduc,
Charles Griffin & Company Limited, 14.2 ed., 908 The Theory of Statistics,
6
pouco desenvolvidas e imprecisas. De fato, os trabalhos de Graunt e
Petty mostram que o raciocínio de ambos era da melhor qualidade; se
o alcance de suas elucubrações, no que se refere a estudos de população,
mortalidade e tábuas de sobrevivência, foi limitado, isto se deveu prin-
cipalmente à má qualidade dos dados que manipularam. Desde o co-
meço do século XIX houve um aumento paulatino de dados oficiais,
como os quatro censos que se realizaram na Inglaterra de 1821 a 1831
e que forneceram informações razoavelmente completas das popula-
ções totais. Assim, pouco a pouco, afirmações quantitativas foram
substituindo as descrições verbais dos primeiros tempos.
“Estatística” adquiriu então um significado menos amplo e um
pouco mais preciso, isto é, “a exposição das características de um Esta-
do através de métodos numéricos”. Como assinala Kendall, torna-se
difícil dizer em que época a palavra tomou definitivamente este caráter
quantitativo, mas a transição parece ter sido lenta, mesmo após a fun-
dação da Royal Statistical Society em 1834. Os artigos no 1.º volume
do Journal, editado em 1838-39, são, em grande parte, de caráter nu-
mérico, mas a definição oficial não tem referência a método.
Após a primeira mudança no significado da Estatística, outras se
seguiram. De denominação de uma ciência, foi transferida às séries de
números sobre as quais ela operava, de tal forma que se passou a falar
em ísti médicas, ísticas vitais, ísticas marítimas, ou seja,
foi então aplicada a séries de dados numéricos que ocorriam em outras
ciências, tais como Medicina, Saúde Pública, Antropologia e Meteoro-
logia.
Desde então, muita controvérsia tem trazido a tentativa de dar à
Estatística uma definição capaz de cobrir todo o seu campo de ação.
Por exemplo, para Yule e Kendall*, “Estatísticas são dados quantitati-
vos afetados, em grande parte, por uma multiplicidade de causas. Mé-
todos estatísticos são os métodos especialmente adequados para inter-
pretar os dados quantitativos afetados por uma multiplicidade de cau-
sas. Teoria estatística é a exposição dos métodos estatísticos”. Para
R. A. Fisher **, “Estatística é o estudo das populações, das variações
e dos métodos de redução de dados”.
Uma definição abrangente é: “Estatística é um ramo do conhe-
cimento científico que consta de um conjunto de processos que tém
por objeto a observação, a classificação formal e a análise dos fenôme-
nos coletivos ou de massa (finalidade descritiva) e, por fim, investigar
* Yule, G. U. e Kendall, M. G., op. cit. .

** Fisher, R. A. Statistical Methods for Research Workers, Oliver and Boyd,
Edinburgh, 14.2 ed., 1970.
a possibilidade de fazer inferências indutivas válidas a partir dos dados
observados e buscar métodos capazes de permitir esta inferência (fina-
lidade indutiva)”.
Costuma-se dividir a Estatística em Geral ou Metodológica e Apli-
cada*. A Estatistica Geral visa elaborar métodos gerais aplicáveis a
todas as fases do estudo dos fenômenos de massa, desde a coleta dos
dados necessários até a apresentação e interpretação dos resultados. A
Estatistica Matemática é parte da Estatística Geral e tem por finalidade
o estudo das propriedades matemáticas dos fenômenos de massa e a
dedução e demonstração rigorosas dos procedimentos e fórmulas usa-
dos naquela. A Estatística Aplicada é todo ramo do conhecimento cien-
tífico que proceda única ou principalmente por intermédio da metodolo-
gia estatística. Compreende a Demografia, a Biometria, a Econometria,
à Psicometria. a Mecânica estatística, etc. Ainda segundo o Vocabulá-
rio Brasileiro de Estatística, “Bioestatística é a Estatística Aplicada que
tem por objetivo o estudo e a exposição da situação e do movimento
das populações humanas em seus característicos biológicos”.
A palavra foi proposta por Raymond Pearl, em 1923, para subs-
tituir a expressão inglesa usual “vital statistics”.**
Major Greenwood ** informa que o primeiro livro sobre estatística
médica, Elements of Medical Statistics, foi escrito por F. Bisset Hawkins
e impresso em 1829. Para Hawkins, “Estatística Médica é a aplicação
de números para ilustrar a história natural do homem sadio e doente”.
Oito anos após a publicação da obra de Hawkins, aparece um capítulo
intitulado “Estatística Vital: ou as estatísticas de saúde, doença e morte”,
escrito por William Farr, no Statistical Account of the British Empire
(2, 567-601, London, 1837), de McCulloch.
O ano de 1937 assinala o aparecimento da importante obra de Sir
Austin Bradford Hill intitulada Principles of Medical Statistics, na qual
o autor, tratando da aplicação dos métodos estatísticos às ciências mé-
dicas, exerceu e vem exercendo grande importância na educação mé-
dica. por ter conseguido transmitir a importância maior do papel do
raciocínio lógico na investigação científica do que a simples aplicação
de técnicás.
pie M. 5 locatário Brasileiro de Estatística, Universidade de so

'aulo.PaulFaculdade
Sis ISS6 de Filosofia,a, Ciênci:
Ciências e Letras, i n.º 203, Estatística
Boletim ística n.º 3»
** Greenwood, M., “Medical Statistics f », Biometrika, 31:

101-27 (1941), 32: 203-25 (1942) é 33: 1.28 GS). jo Farto EM
Para Greenberg *, “Bioestatística é a ciência que trata com os
planos e métodos de coleta, tabulação e análise de fatos numéricos nas
ciências da vida.
Os métodos estatísticos abrangem as áreas da Estatística Vital, Bio-
metria, Sociometria e Psicometria. O fato de bio e vita significarem am-
bos vida, em grego e latim, respectivamente, explica por que esta igual-
dade literal levou alguns autores a pensarem na igualdade. também
quanto ao objeto, da Bioestatística e da Estatística Vital. Esta última,
para Greenberg, limita-se ao estudo dos dados provenientes dos regis-
tros!de nascimentos e óbitos. Biometria é a ciência que trata da men-
suração da vida e dos processos vitais. A Sociometria cuida da men-
suração da maneira como as pessoas vivem, sua cultura, opiniões e
atitudes, assim como o relacionamento de uns com os outros. A Psico-
metria. abrange a da li do
mental e do comportamento de indivíduos e grupos e seus ; ajustamentos
às mudanças no meio ambiente”.
Para os autores deste livro, Bioestatística é a Estatística aplicada às
ciências da vida.
* Greenberg, B. G., “Basic Principles of Biostatistics”, in Preventive Medicine for

the Doctor in His Comunity, 3.º edição, editado por Hugh R. Leavell and Gurney
Clark, McGraw-Hill, Inc., 5.
sf eim iz
Capítulo 2
Levantamento de dados
2.1 Tipos de levantamento
Levantamento de dados é a pperação de coleta do material básico

para a descrição e post tezior- análise. das características de uma popula:
ção. O tipo de dado a ser levantado e a forma de coletá-lo vão depen-
der de cada investigação e deverão estar contidos no delineamento pro-
posto para cada estudo.
Os levantamentos podem ser classificados em contínuos, periódicos
e ocasionais. Diz-se que um levantamento é contínuo quando os eventos
vão sendo registrados à medida que ocorrem. É exemplo o Registro
Civil dos fatos vitais (óbitos, nascimentos e casamentos); os registros
em cartório são feitos de acordo com leis e decretos que estabelecem
as regras a serem seguidas para o registro de cada evento. Também
são do tipo contínuo o registro de certas doenças, como câncer, han-
seníase, tubérculose e também algumas doenças infecciosas agudas com
finalidade de controle.
Levantamentos periódicos acontecem ciclicamente. Um exemplo é
o recenseamento, feito no Brasil a cada dez anos, sempre precedido
por leis que regulamentam as normas a serem seguidas, incluindo desde
a data e cobertura até os quesitos a serem incluídos e a forma de in-
quiri-los.
Levantamentos «ocasionais | são aqueles realizados sem preocupações
de continui ou peri foi este o caso da
Pesquisa Nacional por Amostra de Domicílios (PNAD), conduzida pelo
Departamento de Estatísticas de População da Fundação Instituto Bra-
sileiro de Geografia e Estatística (IBGE), realizada em 1972, 1973,
1976 e 1978. Tem-se também a Pesquisa Nacional sobre Reprodução
Humana *, conduzida de 1974 a 1976 pelo Centro Brasileiro de Aná-
lise e Planejamento, e que abrange uma amostr a de aproximadamente
4.400 famílias; por meio de um inquérito domiciliar foi feito um le-
* Berquó, Elza S., “A Pesquisa Nacional Sobre Reprodução Humana”, Estudos de

População I, Cebrap, São Paulo, 1977.
n
vantamento das condições sociais c econômicas das famílias e de suas y
estrategias de reprodução.
Quando o investigador, para verificar suas hipóteses de trabalho,
utiliza-se de dados já existentes — arquivados, registrados ou publica-
dos — diz-se que está trabalhando com dados secundários] Assim, se
o investigador interessado em estudar, por exemplo, a fecundidade da
população urbana de São José dos Campos (Estado de São Paulo)
utilizar dados do Censo demográfico de 1970, da PNAD-1972 ou da
Pesquisa Nacional de Reprodução Humana — 1974, estará trabalhan-
do com dados secundários. Entretanto, se ele julgar necessária a reali-
zação de um inquérito, pelo fato de nenhuma das fontes mencionadas
conter certas informações relevantes para seu estudo, então o investi-
a m isto é, dados que são
levantados diretamente na população no momento da investigação.
Até agora, os exemplos citados diziam respeito a levantamentos de

dados existentes, que podem ou não estar registrados em um certo mo-
mento. Há. entretanto, situações nas quais a investigação diz respeito
a um tipo de informação que, antes de ser levantada, precisa ser pro-
vocada. Por exemplo, para se medir a eficácia de uma droga no trata-
mento de certa enfermidade, é preciso aplicar a droga aos doentes da-
quela doença, isto é, tratá-los. Portanto, a informação de que se neces-
sita é provocada, via tratamento. Na avaliação da eficácia de progra-
mas educativos de saúde pública estuda-se o comportamento do grupo
escolhido antes e depois do programa.
2.2 Níveis de mensuração
Um problema básico que se coloca nos levantamentos é o nível

de mensuração das informações a serem levantadas. Isto porque a apli-
cabilidade ou não dos modelos estatísticos a serem utilizados posterior-
mente na análise do material vai depender em grande parte deste as-
pecto.
Nesta ordem de idéias, pode-se dizer que o nível mais elementar de

mensuração consiste na classificação dos indivíduos de uma população
de acordo com uma certa característica, isto é, tenta-se separar os in-
divíduos em grupos, conforme possuam esta ou aquela categoria da
característica em questão. É o que sucede quando a característica estu-
dada é, por exemplo, o sexo, a cor dos olhos, a religião, o estado civil
,Ou a opinião sobre determinado tema. Neste caso, as categorias se, eX-
pressam nominalmente; desde que sejam exaustivas (no sentido
de que
12
dêem conta de todos os indivíduos da população) e mutuamente ex-
as (no sentido de que um mesmo indivíduo da população não
possa possuir simultaneamente duas categorias), têm-se as condições
mínimas necessárias para a aplicação de técnicas estatísticas adequadas.
« Costuma-se dizer nestes casos que a característica em estudo é expressa
segundo uma escala nominal) É claro, portanto, que as operações usuais
da aritmética não podem ser realizadas sobre este tipo de escala. É
importante observar que, às vezes, as categorias em uma escala nominal
são expressas por números, como seria o caso de os doentes de um
hospital estarem classificados segundo os números das enfermarias, isto
j , -.. Neste caso, estes números devem ser vistos como nú-
meros substitutos de nomes, sendo um completo absurdo pensar-se em
calcular a soma, a média, etc. desses dígitos.
O nível de mensuração seguinte consiste em, além de classificar os
indivíduos de uma população de acordo com as categorias de uma ca-
racterística, ordenar essas categorias relativamente ao grau segundo o
qual elas possuem a característica em questão.. Assim, os indivíduos de
uma população podem ser classificados, conforme a escolaridade, em:
“analfabetos, com. curso primário, com curso secundário, com curso co-
legial e com curso superior. Neste caso, as categorias da característica
“escolaridade” estão ordenadas segundo o grau de escolaridade. Outro
exemplo é dado pela classificação de famílias segundo o nível sócio-
econômico em: classe pobre, classe média e classe rica.
Costuma-se dizer, nestes casos, que a característica é medida em
letra Pelos próprios exemplos vê-se que em uma escala ordinal
valem apenas as operações de maior do que ou menor do que. Não são
válidas as operações de adição, subtração, multiplicação e divisão, pelo
fato de que a ordenação não fornece informação sobre a magnitude das
diferenças entre os elementos na escala; ou seja, admite-se que um in-
divíduo que pertença à categoria “com curso secundário” tenha mais
escolaridade do que outro indivíduo que pertença à categoria “sem
curso primário”, porém não se sabe quanto mais. Da mesma forma, e
consegiientemente, não se sabe como se comporta a diferença entre
“curso superior” e “colegial” em relação à diferença entre: “curso se:
cundário” e “curso primário”.
”
Passa-se deste tipo de escala para um nível propriamente dito de
mensuração quando, além da ordenação das categorias de uma carac-
terística, pode-se dizer quanto valem exatamente as diferenças entre
estas categorias. Pode-se dizer, por exemplo, que a diferença entre 30ºC€
e 10ºC é exatamente de 20ºC e é a mesma do que entre 90º e 70ºC,
em uma escala de temperatura. Entretanto, pelo fato de o zero, nesta
escala, não existir naturalmente e ser determinado arbitrariamente, não
13
do
se pode afirmar que 90º€ correspondem a três vezes “mais quente”
esc i
que 3090. Isto quer dizer que a temperatura está medida em
tervalar.
Sempre que seja possível fixar o ponto zero na escala de forma
não arbitrania, comono caso da idade, que é cont: partir do nas-
cimento em qualquer “e lugar, pode-se então realizar, sobre os
valores tomados por estatísticas, todas as operações aritméti s. Diz-se,
nestes casos, que se trata de uma escala de zões. Assim, um indivíduo
com 40 anos tem o dobro da idade daquele com 20 anos. Na prática,
entretanto. mesmo nos casos de escalas intervalares, sempre que seja
possivel definir uma unidade de medida poder-se-á aplicar todas as
operações aritméticas.
De uma escala de um determinado nível pode-se passar para a de
nível imediatamente anterior. O que sucede é que com isto perde-se
precisão na informação. De fato, tendo-se a informação sobre a renda
individual da população de certa comunidade (característica medida
em escala de razão), pode-se sempre expressar essa: mesma informa-
ção em termos das: categorias: renda baixa, renda média e renda alta
(característica medida em escala ordinal). A recíproca às vezes tam-
bém é tentada por investigadores, com o propósito de aplicar mode-
los quantitativos de análise.( De fato, uma característica em escala no-
minal, como é o caso do sexo, por exemplo, pode ser artificialmente
tratada atribuindo-se às duas categorias os dígitos O e 1, respectiva-
mente. É claro que os cuidados na interpretação dos resultados devem
ser extremos.
* É comum emprestar-se a denominação de variável qualitativa às
características medidas em escala nominal ou ordinal, e variável quan-
titativa referindo-se a características medidas em escala “intervalar ou
fe Tazão.JA variável quantitativa pode ser ainda contínua ou discreta,
correspondendo aos conceitos matemáticos de contínuo é discreto.
Quando a variável puder assumir qualquer valor numérico num determi-
nado intervalo de variação, ela será uma variável “contínua. Resultam
geralmente de medições, adotando-se unidádes de medida específicas:
peso, estatura, dosagem de hemoglobina no sangue, concentração de
flúor na água oferecida à população. A interpretação deste tipo de va-
riável leva à noção de valor aproximado, pois não existe um instru-
mento de medida capaz de fornecer precisão absoluta na informação.
Assim, ao se pesar um indivíduo e a balança mostrar 65,50 kg, este
valor, na verdade, é uma aproximação contida entre dois limites reais:
65,455 kg e 65,505 kg. Por outro lado, a variável quantitativa discre-
ta só poderá assumir valores pertencentes a um conjunto-enumerável; os
valores são obtidos por meio de contagem. Se a variável for número de
14 /
filhos por casal, os valores possíveis serão: O filho ou J filho ou 2
filhos ou 3 filhos... O índice CPO, utilizado em Odontologia Sanitária,
é uma yariável discreta.
2.3 Apuração de dados
Executado o levantamento de dados, torna-se necessário passar à

etapa seguinte, a da apuração de dados. Entende-se por apuração o pro-
cesso de determinar o número de constituintes em cada uma das cate-
gorias que se originam ao se classificar uma população de acordo com
os itens perquiridos no levantamento. Chamando-se de fregiiência o
número de indivíduos pertencentes a cada categoria, a apuração visa
determinar as fregiiências das categorias mencionadas.
Em um estudo do obituário segundo a variável sexo, a população
de óbitos será classificada segundo duas categorias: homens e mulheres;
o número de óbitos masculinos será a freqiiência correspondente ao sexo
masculino; analogamente, para os óbitos femininos.
Chama-se distribuição de fregiiências a correspondência entre cate-
gorias ou valores possíveis de uma variável e as fregiiências respectivas,
como se apresentam na tabela 2.1
Tabela 2.1 Número de óbitos, segundo o sexo, de residentes no município de São

Paulo, em 1970.
Sexo Número de óbitos

(variável) (fregiiência)
Masculino 25.754
Feminino 19.300
2
Total 45.054
E === ss
Fonte: São Paulo (Estado) Secretaria de Economia e Planejamento, Departa-
mento de Estatística, 1974. .
Neste exemplo tem-se uma distribuição unidimensional, pois se

refere a apenas uma variável (sexo). Distribuição bidimensional é aque-
la que se refere a duas variáveis (Tabela 2.2).
15
Tabela 2.2 Número e percentagem de mulheres segundo a religião e uso de
métodos anticoncepcionais (MAC), distrito de São Paulo, 1966.
Uso de MAC Alguma vez Nunca Total

N: o % N.º “%
Religião Ne %
Católica praticante | 746 74,2 260 25,8 1.006 100
Católica não-
praticante 1,149 72 339 22,8 1.488 100
Não-católica 100
176 78,6 48 21,4 224
praticante
Não-católica
não-praticante 91 75,8 29 24,2 120 100
Total 2.162 76,2 676 238 2.838 100
Fonte: Berquó, E. et al., 4 Fecundidade em São Paulo — Características Demo-

graficas, Bioiógicas e Sócio-Econômicas, CEBRAP, Editora Brasileira de Ciências,
São Paulo, 1977.
Quando o item classificador ou característica for de natureza qua-

litativa, as distribuições de frequência são chamadas de séries estatísti-
cas. Em Epidemiologia, são de grande interesse as séries históricas ou
temporais e as séries geográficas ou territoriais, respectivamente, refe-
rindo-se às divisões do tempo (meses do ano, dias da semana, ano ca-
lendário) e às divisões das áreas geográficas (municípios, países).
2.3.1 Constituição das categorias de uma característica
. Algumas vezes a constituição das categorias é imediata, já que a

variável apresenta modalidades de individualização espontânea e em pe-
queno número; é o caso de sexo (masculino e feminino), estado civil
(solteiro, casado, viúvo, desquitado). Em oposição, há situações em que
a formação de categorias é mais difícil, devido a:
No complexidade do item classificador, como a causa básica de
5
ii) possibilidade de o indivíduo apresentar-se em mais de uma ca-
tegoria da variável, como em profissão; .
iii) número muito grande de categorias da variável, como em geral
acontece com variáveis quantitativas: idade, peso, estatura.
curdo houver necessidade de grupar categorias de uma
variável
quantitativa em classes, devem ser observados os seguintes aspectos:
16
— “Os
valores reunidos passam a assumir o valor médio do inter-
“valo dede classe; portanto, quanto maior for o tamanho da classe,
maiores serão as possibilidades de distorção na análise estatís-
tica. Para tanto, devem ser feitas classes de pequena amplitude,
o que pode acarretar, porém, número grande de classes. Não
existem critérios rígidos para se estabelecer o número ideal de
classes, podendo-se sugerir 10 a 20 como um número razoável.
— As classes devem ser mutuamente exclusivas, para que não haja
dúvida na localização dos valores da variável na distribuição
(vide tabelas 4.1 e 4.5); as notações correspondentes a esta exi-
gência são exemplificadas com os valores zero e dez:
O —| 10, para significar que o intervalo compreende os valo-
res da variável maiores do que zero (excluído) e
até dez (inclusive);
O |— 10, para significar que compreende os valores da variá-
vel a partir de zero (inclusive) e até dez (exclusi-
ve);
0—1 para significar que compreende os valores da variá-
o
vel maiores do que zero e menores do que dez;

O |—| 10, para significar que compreende os valores da va-
riável a partir de zero (inclusive) e até dez (in-
clusive).
— As classes devem ter limites, fechados ou abertos, definidos;
devem ser evitadas classes do tipo “40 anos e mais”, “menores
de 20 anos”.
— É útil que as classes tenham a mesma amplitude, mas devem
manter os aspectos mais relevantes da distribuição, tal como
antes do agrupamento em classes. Isto leva a situações em que
diferentes amplitudes de classe se impõem, como acontece para
a idade em vários estudos na área biológica.
2.3.2 Métodos de apuração dos dados
A apuração de dados pode se processar de quatro maneiras: ma-

nual, semimecânica, mecânica e eletrônica, em função do número de
indivíduos e de variáveis estudados, complexidade de análise, disponibili-
dade de recursos econômicos e materias.
Apuração manual é aquela feita utilizando-se simplesmente lápis
e papel. Está sujeita a uma série de incorreções, devido a leitura errada,
a)
audição errada, má locação do dado na lista de apuração. Outro ponto
a ser ressaltado é a dificuldade de controle, pois para executá-lo há
necessidade de se repetir toda a operação e, caso após o controle se
chegue a resultados diferentes, surgira a dúvida sobre qual das duas
contagens é a correta.
Para facilitar este tipo de apuração é recomendado o uso de fichas

(figura 2.1). Estas fichas conterão as informações codificadas em re-
giões preestabelecidas. A apuração das fichas, depois de preenchidas,
seria feita separando-se primeiramente os sexos; posteriormente, para
cada sexo, a localização do tumor e depois, sucessivamente, pelas outras
variáveis de interesse. A apuração final seria a simples contagem dos
cartões separados.
! | Número do caso Sexo Idade ao diagnóstico
Nacionalidade Ocupação Residência
Localização do tumor Tipo histológico Tempo de sobrevida
Figura 2.1 Exemplo de ficha (bastante simplificada) para estudo de câncer.
A apuração semimecânica é feita através de um sistema denomina-

do McBee Keysort, apropriado para trabalho com até 10.000 fichas.
As informações são transferidas para um cartão com as margens pre-
viamente perfuradas, com regiões delimitadas de acordo com as modali-
dades das variáveis analisadas (figura 2.2). Cada perfuração é mantida
RELER PR AUG Es
a al.
e eg !
Figura 2.2 Exemplo de cartão McBee.
18
ou transformada em “picote” por um alicate
especial, produzindo um
sistema binário de codificação (picote = sim,
furo = não : picote =
masculino, furo = feminino). A separação das
fichas para a contagem
e obtenção da distribuição de fregiiências é feita
com auxílio de estiletes.
A apuração mecânica, empregada pela primeira
vez no censo dos
Estados Unidos da América em 1880, requer o
uso de equipamento
eletromeçânico que faz separação e contagem de
cartões segundo as va-
riáveis. Os cartões (figura 2.3) são perfurados, verificados
e depois se-
parados em máquinas chamadas classificadoras.
£ á Ee ROSAS SDS escassa setemsrarese à
Eua
aaa PRADOS ADERIR DAL LTNT TDT TATTOO [OERRRRRRERARERES
R
k
eira
RICGUSABA O SETERESEA AEDES TENDAS ERC AR EO DE cm
Figura 2.3 Exemplo de cartão IBM, para apuração mecânica ou eletrônica.
A computação eletrônica utiliza computadores eletrônicos que per-

mitem p de probl pl em alta velocidade. Exi-
ge, como etapas prévias, a codificação dos dados em planilhas especí-
ficas, perfuração de cartões (figura 2.3) ou magnetização de fitas e
execução de programas (conjunto de instruções que conduzem o com-
putador na obtenção das informações necessárias). No final do proces-
samento, listagens ou tabelas são fornecidas, podendo incluir estatísti-
cas calculadas, cabendo ao pesquisador realizar a análise das mesmas.
2.4 Apresentação tabular
Após a apuração, há necessidade de os dados e os resultados obti-

dos a partir daqueles serem dispostos de uma forma ordenada e resumi-
da, a fim de auxiliar o pesquisador na análise dos mesmos e facilitar a
compreensão das conclusões apresentadas ao leitor. Os dados e os re-
sultados são então apresentados na forma de tabelas.
19
Uma tabela deve ser auto-suficiente, isto é, deve ter significado pró-
prio, de modo a prescindir. quando isolada, de consultas ao texto. Para
tanto, algumas sugestões são oferecidas, servindo como orientação ge-
ral.* Assim:
i) Uma tabela possui elementos essenciais e complementares. Os

elementos essenciais são o título, o corpo, o cabeçalho e a coluna indi-
cadora.
— Título é a indicação que, precedendo a tabela, é colocada na
parte superior da mesma. Deve ser preciso, claro e conciso, in-
dicando a natureza do fato estudado (o quê?), as variáveis
escolhidas na análise do fato (como?), o local (onde?) e a
época (quando?) em que o mesmo foi observado.
— Corpo da tabela é o conjunto de linhas e colunas que contêm,
respectivamente, as séries horizontais e verticais de informa-
ções. Casa, cela ou célula é o cruzamento de uma linha com
uma coluna, onde se tem a freqiiência com que a categoria (ou
categorias) aparece.
— Cabeçalho é a parte da tabela em que é designada a natureza
(as categorias, as modalidades da variável) do conteúdo de
cada coluna.
— Coluna indicadora é a parte da tabela em que é designada a
natureza (as categorias, as modalidades da variável) do con-
teúdo de cada linha.
Os elementos complementares de uma tabela são a fonte, as notas

e chamadas.
— Fonte é o indicativo, no rodapé da tabela, da entidade
respon-
sável pela sua organização ou fornecedora dos dados primários.
A razão da presença da fonte não é somente honestidade cien-
tífica, mas também permitir ao leitor a possibilidade de con-
sultar o trabalho original de onde procedem as informações.
— Notas são colocadas no rodapé da tabela para esclarecimento
de ordem geral. São numeradas, podendo-se também usar sím-
bolos gráficos, sendo bastante comum o
asterisco,
ÇCom base nas “Normas de Apresentaçã

p ação Tabular” aprovadas pela XVIII Assem
ps pi ee Conselho Nacional de Estatística,En aicontridas 4
em “Noções de
Meto ia: Normas de Apresentação T dA i ilei! tatística,
jan./junho de 1963, n.º 93/94: 42:48. e
20
— Chamadas, também colocadas no rodapé,
servem para escla-
recer minúcias em relação às casas,
colunas ou linhas. São nu-
meradas, - geralmente, em algarismos
arábicos (também costu-
ma-se usar letras minúsculas ou símbolos
gráficos).
ii) Nenhuma casa da tabela deve ficar em branco, apresentando
sempre um número ou sinal, a saber:
- (hífen), quando o valor numérico é nulo;
-.. (reticência), quando não se dispõe de dado;
? (ponto de interrogação), quando há dúvidas
quanto à exatidão
do valor numérico;
$ (parágrafo), quando o dado retifica informação anteriormente
publicada;
O; 0,0; 0,00 (zero), quando o valor numérico é muito
pequeno
para ser expresso pela unidade utilizada. Se os valores são expres-
sos em números decimais, acrescenta-se o mesmo número
de casas
decimais ao valor zero;
x (letra x), quando o dado for omitido a fim de evitar individua-
lização da informação.
ii) Em publicações que compreendem muitas tabelas, estas devem

ser numeradas em ordem crescente, conforme a ordem de aparecimento.
iv) As tabelas devem ser fechadas no alto e embaixo por linhas
horizontais, não sendo fechadas à direita e à esquerda por linhas verti-
cais. É facultativo o emprego de traços verticais para a separação de
colunas no corpo da tabela.
v) Os totais e subtotais serão destacados.
vi) Deverá ser mantida uniformidade quanto ao número de casas
decimais.
A tabela 2.3, adaptada de Forattini* (com modificação para efeito

didático autorizada), é um exemplo; no presente livro, outras tabelas
mostram a diversidade de apresentação possível, em função das neces-
sidades de comunicação.
* Forattini, O. P. er al., “Estudos ecológicos sobre mosquitos Culicidae no sistema

da Serra
Ser; do Mar, Brasil,2E — Observações no ambiente domiciliar”, Rev. Saúde
Pública, São Paulo, 12:476-96, 1978.
2
Escola
Número e percentagem de insetos capturados em domicílio na março
Tabela 2.3 a Iguape,
Agricola de Iguape, São Paulo, segundo espécie e tipo de captura,
junho e setembro de 1977.
Tipo de captura Tomáii ts a Total

E % N ()
108 6,8 1 1,2 109

Aedes scapularis
191 12,1 12 14,8 203
Anopheles evansae
48 3,0 — — 48
Anopheles triannulatus
105 6,6 21 25,9 126
Culex pipiens quinquefasciatus
61 3,9 5 62 66
Culex (Culex) sp.
160 10,1 5 6,2 165
Culex (Melanoconion) sp.
Mansonia chrysonotum 139 88 13 16,0 152
Mansonia titillans 689 43,7 19 23,5 708
Psorophora confinnis st1* 32 — — 51
Outras espécies? 29 1,8 5 6,2 34
Total 1.581 100 81 100 1.662
Fonte: Forattini, O. P. et. al., “Estudos ecológicos sobre mosquitos Culicidae no
siste! rra do Mar, Brasil, 2 — Observações no ambiente domiciliar”, Rev.
Saúde Públ., São Paulo, 12: 476-96, 1978.
1 30 dias de captura. *Inclui 2 insetos
2 9 dias de captura. capturados quando
3 Aedes serraius deixavam o domicílio.
Aedeomyia squamipennis
Anopheles albitarsis
Anopheles mediopunctatus
Anopheles oswaldoi
Culex lygrus
Culex (Microculex) sp.
Limatus isetosus
Mansonia juxtamansonia
Mansonia venezuelensis
25 Apresentação gráfica
A apresentação dos dados e respectivos resultados de sua análise

pode também ser feita sob a forma de figuras, em geral gráficos ou dia
gramas.
Gráficos devem ser auto-explicativos e de fácil compreensão, de

ência sem comentários inseridos. Devem ser simples, atrair
a aten-
ção do leitor e inspirar confiança.
2
Alguns pontos devem ser respeitados na construção de um gráfico,
a saber:
— o tamanho deve ser adequado à sua publicação em revistas,
periódicos, cartazes ou livros;
— deve ter sempre um título;
— deve ser construído em uma escala que não desfigure os fatos
ou as relações que se deseja destacar
Os gráficos podem ser cartogramas ou diagramas; entende-se
cartograma o mapa geográfico ou topográfico em que as fregiiências
das categorias de uma variável são projetadas nas áreas específicas do
mapa, utilizando-se cores ou traçados cujos significados constam em le-
gendas anexadas às figuras (figura 2.4). Em epidemiologia, os mapas
alfinetados são de grande emprego para apreciar o aparecimento e ex-
pansão de certas moléstias.
Morbidade em 1971-1973
Coefic/100.000 habs.
DO vos ma
DO ese ns
CM ss» ++»
BEE ves» 350
Figura 2.4 Morbidade por meningite meningocócica segundo os distritos sanitá-
Fios no município de São Paulo no período de 1971 a 1973.*
ma
e Iversson, Lygia Busch, Meningite Meningocócica no Município de São Paulo no
Período 1968-1974; Aspectos Epidemiológicos, dissertação de mestrado, Faculdade
de Saúde Pública, USP, 1975.
23
i s são gráficos em que a magnitude das fregiiências é re-
presentada por certa mensuração de uma determinada figura geométrica,
Se a medida utilizada for o comprimento, tem-se o diagrama de orde-
nadas: caso se utilize a área ou superfície da figura, tem-se diagrama
de barras, histograma, setores de círculoe diagramas circulares; quan.
do se usa o volume da figura, obtém-se o estereograma. Na representa-
ção de um diagrama deve ser levada em conta a natureza da variável.
2.5.1 Representação gráfica de variável qualitativa
Neste caso, são comumente utilizados os diagramas de ordenadas

ou diagramas de superfície.
i) Diagrama de ordenadas. Para sua construção é traçada uma
reta horizontal (ou vertical) de sustêntação; a partir de pontos eqiiidis-
tantes na reta, constroem-se perpendiculares cujos comprimentos sejam
proporcionais às fregiiências.
Tabela 2.4 Distribuição percentual da população segundo regiões, Brasil, 1970.
Regiões %
Norte 3,9
Nordeste 30,3
Centro-oeste 55
Sudeste 42,7
Sul 17,6
Total 100
Fonte: Fundação Instituto Brasileiro de Geografia e Estatística, Censo Demográ-

fico, Rio de Janeiro, 1973.
A figura 2.5 mostra o diagrama linear representativo da distribui-

ção da tabela 2.4, Ê ERES
. ji) Diagramas de barras. A mesma distribuição (tabela 2.4) po-
deria ser representada por meio: de um diagrama que levassé em conta
a magnitude da área da figura geométrica, já que a vista repousa melhor
sobre uma superfície do que sobre uma linha. O diagrama de barras éa
representação em que, sobre o eixo horizontal (vertical), em intervalos
apropriados, constroem-se retângulos cujas áreas são proporcionais às
fregiiências das categorias da variável em estudo. Lembrando que A
área do retângulo é o produto da base pela altura, se se fixar O critério
24
população
Y%da
Norte Nordeste Centro- Sudeste Sul

Oeste
Regiões
Figura 2.5 Distribuição percentual da população segundo regiões, Brasil, 1970.

Fonte: Fundação Instituto Brasileiro de Geografia e Estatística, Censo Demo-
gráfico, Rio de Janeiro, 1973.
de dar a mesma base aos diversos retângulos bastará construir

retângu-
los cujas alturas sejam proporcionais às frequências. A figura 2.6 mos-
tra o diagrama de barras correspondente à tabela 2.4.
Importante a ser realçado é o fato de que as ordenadas da figura

2.5 e as barras da figura 2.6 não são ligadas nem justapostas, porque
na maioria das vezes as classes (categorias) das variáveis qualitativas
não apresentam relação de contigiiidade.
iii) Diagrama de círculos. Além do retângulo, outra figura geo-

métrica utilizada é o círculo ou conjunto. de círculos. Lembrando que
a área do círculo é o produto do número irracional
x (31416) pelo
25
% da população
[1]
Norte Nordeste Centro-Oeste Sudeste Sul y
)
Regiões

sráfico, Rio de Janeiro, 1973.
quadrado do raio (r), isto é, C =x 1º, e desde que as áreas dos diver-
sos círculos devem ser proporcionais às magnitudes das fregiiências, isto,
é. C =a f ondea é fator de proporcionalidade, segue-se que:
o : x
af =x ?,ousea,r = V f. Se se chamar v ç dea”, tem-se
r =a'Vf : portanto, os raios dos círculos devem ser proporcionais à |

raiz quadrada das frequências das modalidades da variável. '
Assim, se se quiser representar graficamente a distribuição da ta-
bela 2.4, os raios do círculo deverão ser:
26
Norte: 39 0'= 1,970?
Nordeste: 30,30'
/ = 5,500"
Centro-oeste: V55aº = 2,35aº
Sudeste: V42,7 w = 6,53"
V1760' = 4,200"
A figura 2.7 representa esta distribuição, com q* = 0,22 cm.
Norte O
Eentros (e) (em) 1)
Nordeste
deste Sudeste

gráfico, Rio de Janeiro, 1973.
iv) Diagrama de setores circulares. Outra opção seria através de

setores circulares, na qual se divide a área total de um círculo em
subáreas (setores) proporcionais às frequências.
Lembrando-se que um círculo compreende setores cujas áreas (S)

são o produto do raio (r) pelo tamanho do arco (a), isto é, S=r.a, e
como S deve ser proporcional à fregiiência f, tem-se S=af » ondea é
o fator de proporcionalidade; então:
af=r.a
a= f
| R
Se se chamar > dea”, tem-se a =” f, isto é, Os arcos e os res-

r
Pectivos ângulos centrais dos setores são proporcionais às frequências.
omo a soma dos ângulos centrais de um círculo é igual a 360º, e
sendo F a fregiiência total, tem-se:
360º = q'F
. 360º
ou seja, a” =
2
360º t
mes
“CE
a distribuição da tabela 2.4 será representada na figura
Assim,
2.8 por:
360º
Norte .—
100% x39% = 14º
360º
Nordeste: 100% x 30,3% = 109,1º
3600
-geste:
Centro-oeste 100% x 5,5% = 19,80
3600
Sudeste: 100% x 42,1% = 153,7º
3600
Sul: x 17,6% = 63,4º
100%
Nordeste 30,3%
Norte 3,9%
Sudeste 42,7%
Figura 2.8 Distribuição percentual da população

segundo regiões, Brasil, 1970.
Fonte: Fundação Instituto Brasilei i fsti
gráfico, Rio de Janeiro, 1973. iro de Geografia e Estatística, Censo De: mo-
28
( No caso de se ter distribuições de fregiiências a duas ou mais
variáveis qualitativas, o problema é mais complexo, pois é preciso utili-
zar O estereograma, em que, no lugar de uma reta de sustentação, tem-
se um plano; em lugar de retângulos, desenham-se paralelepípedos
e
a mensuração proporcional à frequência deixa de ser a área
da figura
geométrica para ser o respectivo volume. Com isto os gráficos
serão
construídos em perspectiva, o que dificulta a execução. fara facilitar,
o que se faz é representar as modalidades da distribuição
de uma das
variáveis, para cada um dos valores da outra variável reduz-se, assim,
a um gráfico de barras ou linear.
A distribuição apresentada na tabela 2.5 poderia ser representa-
da sob a forma das figuras 2.9 ou 2.10.
Capital e grandes cidades Restante do país
30 0 0 5 10 15 20
Médicos por 10.000 habs.
Figura 2.9 Número de médicos por 10.000 habitantes em capitais e grandes cida-
des € no restante do território de cinco países da América Latina, anos próximos
le 1970.
Fonte: Organización Pan-Americana de la Salud, Las Condiciones de Salud en
las Américas, 1969/1972 (Publ. Científica n.º 287), 1974.
9
Tabela 2.5 Número de médicos por 10.000 habitantes em capitais e grandes cida-
des e no restante do território de cinco países da América Latina, anos próximos
de 1970
País Capitais e grandes Restante do

cida país
Argentina 24,61 13,3

Bolivia 13,81 25
Colômbia 11,51 1,6
Mexico 22.9º 3,0
Venezuela 72
1 Capitais e cidades com mais de 100.000 habitantes.

2 Capitais e cidades com mais de 500.000 habitantes.
3 Área hsroponHano:
Fon: Organización Pan-Americana de la Salud, Las Riondiclones de Salud en
las António, 1969 — 1972 (Publ. Científica n.º 287),
30
8 =)
=
o
8S 20
s
ze o
Ss
Ezo
õ A
A
a
Argentina Bolívia Colômbia México Venezuela
[ ] copitat é grandes cidades

7 Restante do país
Figura 2.10 Número de médicos por 10.000 habitantes em capitais e grandes cida-
des e no restante do território de cinco países da América Latina, anos próximos
de 1970.
Fonte: Organización Pan-Americana de la Salud, o ponalalanes de Salud en
las Américas, 1969/1572 (Publ. Científica n.º 287),
30
v) Diagrama linear. Foi comentado que no caso das variáveis qua-
litativas não se justapõem os retângulos nem se unem as ordenadas dos
diagramas; há, entretanto, um caso que foge à regra geral,
o das séries
históricas. Nesta eventualidade é lícito unir as extremidades das retas,
tendo-se então
o diagrama linear (figura 2.11), que conduz a uma
interpretação dinâmica do fenômeno estudado.
300
Indice de salário mínimo real
100.
º
1958 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74
Anos
Figura 2.11 Evolução do salário mínimo real em São Paulo, dezembro 1958 a
maio 1975.
Fonte: Camargo, C.P. F. et al. São Paulo 1975, Crescimento e pobreza, Edições
Loyola, São Paulo, 1976.
Deve-se notar que, dependendo do tipo da relação entre as escalas

adotadas nos dois eixos, um gráfico poderá apresentar configurações
diversas, levando a diferentes interpretações para um mesmo fenômeno,
como ilustram as figuras 2.12 e 2.13, onde se poderia aceitar ora um
rápido ora um lento decréscimo da doença, segundo cada figura.
Número de casos
200:
on RnB A
Anos
Figura 2.12 Número de casos da moléstia X, na área Z, 1970/1974 (dados
hipotéticos).
31
Número de casos
200
300
200
100
0
70 n 72 73 74
Número de casos de moléstia X, na área Z, 1970/1974 (dados

Figura 2.13
hipotéticos).
Noza: Escala horizontal exagerada.
Outro ponto a ser ressaltado é que a escala que representa as

fregiiências sempre deve ter seu início — frequência O — na intersecção
dos dois eixos. Algumas vezes, entretanto, a distribuição apresenta fre-
giiências muito elevadas e com pequenas flutuações (tabela 2.6), fican-
do difícil, por questão de escala, um gráfico mostrar tais flutuações de
forma destacada. Este inconveniente pode ser contornado por um arti-
fício chamado “amputação de diagrama” (figuras 2.14 e 2.15): inter-
rompe-se a escala de fregiiências após a origem e cria-se uma nova es-
cala que favoreça a apresentação.
Tabela 2.6 Número de casos da moléstia X, na área Z, 1970/1974 (dados

hipotéticos).
Anos N.º
1970 8.000
1971 7.600
1972 7.200
1973 7.300
1974 7.000
EE
EEE ES e E
Total 37.100
32
8.000
6.000
de casos 5.000
4.000
Número
3.000
2.000
1.000
1970 1971 1972 1973 1974

Anos
Figura 2.14 Número de casos da moléstia X, na área Z, 1970/1974 (dados

hipotéticos).
8.000
7.800
Número de casos
7.600
escala
7.400
7.200
7.000
'Ampa
tação” 4000
1970 1971 1972 1973 1974

Anos
Figura 2.15 Número de casos de moléstia X, na. área Z, 1970/1974 (dados

hipotéticos).
Nota: Com a amputação podem ser melhor apreciadas as flutuações.
33
2.5.2 Representação gráfica de variável quantitativa
Nas di nibuições de fregiiências a uma variável quantitativa

é ne
Sessário distinguir quando esta é discreta ou contínua.
E Nas distribuições discretas. os diagramas mais comumente Usados
são os de ordenadas e os de barras, tal como se fossem variáveis quali-
tativas. Nas distribuições contínuas, entretanto, os gráficos usados são
e poligono de fregiiências e o histograma. Para efeito de representação
ado o sistema de coordenadas cartesianas ortogonais, sendo que
nas abscissas têm-se os valores das classes da variável em estudo (ne-
cessariamente bem definidas) e nas ordenadas, os valores da fregiiên-
cia.
Para construir o polígono de fregiiências, admite-se que as fre-
giiências das classes estão concentradas nos pontos médios dos interva-
los que as definem, isto é, no valor dado pela semi-soma dos dois va-
lores extremos do intervalo. Locados os pontos, estes são ligados entre
si por meio de retas. sendo que, via de regra, o primeiro e o último
deles são ligados ao eixo das abscissas nos pontos correspondentes às
abscissas da metade de classes hipotéticas, imediatamente anterior à
primeira e posterior a última; este procedimento leva ao término da
construção do polígono e determina que a área total delimitada pelo po-
lígono e o eixo das abscissas seja proporcional à fregiiência total da
distribuição. ou seja, 100%, havendo também proporcionalidade entre
áreas parciais, delimitadas por intervalos definidos no eixo das abscissas.
Tabela 2.7 Casos registrados de linfomas, sexo masculino, segundo a idade,

Brasil, 1975.
Idades em anos N.º
0|— 10 97
10 |— 20 128
20 |— 30 97
30 |— 40 92
40 |— 50 88
so |— 60 97
60 |— 70 83
Total* 682 RS
E
* Excluídos os casos com idade ignorada (123) e de pessoas com 70 o anos e
mais (44).
Divisão Na-
Fonte: Brasil (Ministério da Saúde), Registro Nacional de Tumores,
cional de Doenças Crónico-Degenerativas, Rio de Janeiro, 1978.
34
Recomenda-se este tipo de representação pela facilidade
com que per-
mite a visualização do andamento genérico das
fregiiências.
igura 2.16 mostra o polígono de fregiiências
correspond
distribuição da tabela 2.7. 4 En
-8 8E sssss83a8s8
de casos
Número
3 “Do
60 70 so
Anos
ne Ae, Casos registrados de linfomas, sexo masculino, segundo a idade,

ras]
Fonte: Brasil (Ministério da Saúde), Registro Nacional de Tumores, Divisão

Nacional de Doenças Crônico-Degenerativas, Rio de Janeiro, 1978.
O histograma é um diagrama de barras justapostas. Lembrando

que as áreas das barras (colunas) devem ser proporcionais às freqiiên-
cias, no caso de intervalos de classes iguais, as bases dos retângulos são
sempre de mesma amplitude, bastando construir os retângulos com al-
turas proporcionais às fregiiências das classes, como é o caso da tabela
2.7, representada pelá figura 2.17.
Quando a representação gráfica for de uma distribuição de fre-

qiiências de uma variável contínua, apresentada em classes de intervalos
Silerenes, há necessidade do ajuste das apa pois, caso contrá-
o, à je da figura g à frequên-
cia com que ocorre a variável. O ajuste é feito “dividindo-se o número de
casos de cada classe pela amplitude da respectiva classe, obtendo-se
como resultado o “número de casos por unidade de intervalo”. O exem-
plo de tal situação está na tabela 2.8 e as figuras 2.18 e 2.19 repre-
sentam, respectivamente, o polígono de freqiiências e o histograma.
35
casos
de
Número
+ + + + + +
o 10 20 30 40 50 60 70
Anos
Figura 2.17 Casos registrados de linfomas, sexo masculino, segundo a idade,

Brasil, 1975.
Fonte: Brasil (Ministério da Saúde), Registro Nacional de Tumores, Divisão Na-
ã de Doenças Crônico-Degenerativas, Rio de Janeiro, 1978.
Tabela 2.8 Número de casos registrados de linfomas, sexo feminino, segundo a

idade, Brasil, 1975.
BT rRLl o do Ie
1) 2) G) (9=(2)+(3)
Idade em N.º Amplitude do Casos/ano (fregiiência
anos intervalo ajustada)
0— 5 15 5 3,0
si— 2 63 15 42
20 |— so 151 30 5,0
so — 65 79 15 5,3
65 |— 100 s4 35 1,5
otal 362*
* Excluídos casos com idade ignorada.

Fonte: pi (Ministério da S, aúde), Registro Nacional de Tumores, Divisão Na-
cional de Doenças Crônico-Degenerativas, Rio de Janeiro, 1978.
36
Casos por ano de idade
Anos
Figura 2.18 Número de casos registrados de linfomas, sexo feminino, segundo a

Fonte: Brasil (Ministério da Saúde), Registro Nacional de Tumores, Divisão
Na-
Casos por ano de idade
»
w
04 r — — r r 1
O 510 20 30 40 gp 60 70 80 90 100
Anos
Figura 2.19 Número de casos registrados de linfomas, sexo feminino, segundo a

Fonte: Brasil (Ministério da Saúde), Registro Nacional de Tumores, Divisão Na-
3
Outro grafico para representar variável quantitativa é o polígono
de fregiiências acumuladas; neste caso, O interesse não simplesmente
a frequência de um determinado vator ou classe de valores de uma
variável. mas sim o conhecimento da freqiiência total dos valores in.
Tabela 2.9 Distribuição do número de meninas de 4 anos segundo o peso, Santo

André, 1969.
Peso em kg N.º Freqiiência acumulada
no — 140 56 56
140 — 17.0 156 56 + 156= 212
17.0 — 20,0 59 56+ 156+59=271
20.0 — 23,0 2 56+ 156+59+2=273
230 |— 260 1 56+156+59+2+1=274
260 |— 29,0 1 56 +156+59+2+1+1=275
Total 275
Fonte: Dados ainda não publicados, cedidos por Maria Stella Levy.
acumulada
Frequência
25
sssuce a E» —— 20,3%
ÉE. dad
T T T 0%
170 200 230 260 290
as ceems
Peso em kg
156
14,3
Figura 2.20 Distribuição do número de meninas de 4 anos segundo peso, Santo
é, 1969.
Fonte: Dados ainda não publicados, cedidos por Maria Stella Levy.
38
feriores a um fixado, Para a confecção deste diagrama há necessidade
de se somar a freqiiência de cada classe às fregiências das classes que
ap b um totald inado fregiiênci. lado
que j representa o número de vezes em que a variável classificadora as-
sumiu um valor menor do que o extremo superior da classe conside-
rada. O polígono é então construído a partir dos pontos representativos
dos valores das fregiências acumuladas no eixo das ordenadas e o valor
superior de cada intervalo de classe, respectivamente, nas abscissas.
Demarcados Os pontos, estes são ligados entre si, sendo que o primeiro
é unido ao eixo das abscissas no extremo inferior da primeira classe e
o último ponto ao extremo superior da última cJasse, formando-se neste
último segmento, perpendicular ao eixo das abscissas, uma nova escala,
que poderá ser em termos de porcentagem, graduada de O a 100% (ta-
bela 2.9 e figura 2.20). » à 10 % Gio
O gráfico será utilizado nas seguintes situações:
em Conhecer a fregiência, em termos de percentagem, de valores
inferiores a um valor determinado da variável em estudo. Se
o valor for 17 kg, a partir deste ponto, no eixo das abscissas,
constrói-se uma perpendicular que vá de encontro ao polígonó
de fregiências acumuladas e daí traça-se outra perpendicular
à primeira, até encontrar o eixo das percentagens. Lê-se 80,5%
que é a fregiiência relativa (%) com que apareceram os valo-
res inferiores a 17 kg; portanto, há 80,5% das meninas de 4
anos com peso até 17 kg. Outra informação do gráfico, por
exemplo, é a de que 20,3% das meninas pesam até 14 kg.
— Conhecer o valor que define uma dada fregiiência relativa (% ).
Por exemplo, conhecer qual é o peso abaixo do qual se tem
50% da população de meninas de 4 anos (peso mediano).
Parte-se do percentual 50 na escala criada, traçando uma linha
paralela ao eixo das abscissas que vá de encontro ao polígono
de fregiiências acumuladas. Deste ponto, traça-se uma perpen-
dicular que vá de encontro ao eixo das abscissas. O ponto en-
contrado foi 15,6 kg, representando então que 50% das meni-
nas têm peso até 15,6 kg. Outro exemplo, 25% destas meninas
têm peso até 14,3 kg.
2.5.3 Outras representações gráficas
Em algumas situações têm-se distribuições a duas variáveis quan-

titativas, isto é, para cada indivíduo duas variáveis são mensuradas con-
comitantêmente e a representação gráfica será por meio de diagramas
de correlação, também chamados de diagramas de dispersão.
38
A construção é tal que nos eixos são apresentadas as modalidades
das variáveis. uma na abscissa e a outra na ordenada. Cada indivíduo
será representado pelo seu par de coordenadas. As figuras 4.5, 4.6 e
4.7 são exemplos deste tipo de diagramas.
Outras vezes há interesse em representar distribuições mistas atra-
vés de coeficiente *, tal como na tabela 2.10, onde se têm duas variá-
veis. uma qualitativa (sexo) e a outra quantitativa (idade). A represen-
tação gráfica é feita, em geral, fixando-se as modalidades da variável
qualitativa e projetando a distribuição da outra variável, gerando dois
diagramas lineares em um mesmo gráfico (figura 2.21), com uma visão
dinâmica do andamento dos coeficientes, na segiiência das idades.
Tabela 2.10 Coeficientes médios de mortalidade por causas violentas, segundo
sexo e idade, município de São Paulo, 1970/1972 (x 10.000 habitantes).
Ida a Masculino Feminino
o— 1 5,49 3,96
1|— Ss 2,53 1,95
st— 10 2,94 1,27
1 |— 15 4,00 1,56
15 |— 20 9,78 2,94
20 |— 25 13,84 3,26
25|— 30 14,79 327
30 |— 35 15,00 2,82
35|— 40 16,16 3,05
0 |— 50 17,01 3,05
50 |— 60 16,35 411
60 |— 70 19,72 6,32
70 |— 100 30,61 13,20
Total 11,33 3,09
Fonte: Silveira, M. H. & Gotlieb, S. L. D., “Acidentes, envenenamentos e violên-

cias como causa morte nos residentes no município de São Paulo, Brasil”,
Rev. Saúde Pública, São Paulo, 10: 45-55, 1976.
* Coeficiente é uma fregiiência relativa intrínseca a cada modalidade da variável

em estudo e não em relação ao conjunto de todas as modalidades. Para cada
modalidade divide-se o número de indivíduos com a característica de interesse
presente pelo número total de indivíduos (com a característica presente e com a
característica ausente), multiplicando-se por uma base conveniente. Coeficientes
são extensivamente usados em Epidemiologia e Saúde Pública.
40
habs.)
10.000
(x
médios
Coeficientes
Masculino
=——— — Feminino
Anos
Figura 2.21 Coeficientes médios de mortalidade por causas violentas, segundo

Sexo e idade, município de São Paulo, 1970/1972 (x 10.000 habitantes).
Fonte: Silveira, M. H. & Gotlieb, S. L. D., Ei) envenenamentos e violên-
cias como causa de morte nos residentes no município de São Paulo, Brasil”,
Rev. Saúde Pública, São Paulo, 10: 45-55, 1976.
Diagrama semilogarítmico é aquele cuja escala no eixo das abscissas
apresenta uma graduação aritmética, enquanto no eixo das ordenadas à
graduação é logaritmica, isto é, distâncias iguais representam razões
iguais A representação deste gráfico pode ser feita num papel apropria-
do. chamado de papel semilogarítmico ou papel semilog; um detalhe
deste papel é a escala vertical apresentada em ciclos (tabela 2.11,
figura 2.22).
Quando um fenômeno evolui segundo um crescimento geométrico,

a trajetória neste papel é uma linha reta; portanto, é um meio rápido
de averiguar se o tipo do crescimento é ou não geométrico.
A utilização deste tipo de diagrama é recomendada ainda:
— em casos de, em um mesmo gráfico, ter que se representar duas
séries cujas grandezas são muito diferentes entre si; caso se utilizasse
escala aritmética, não se poderia ter uma boa visualização dos fenôme-
nos. que é aprimorada no diagrama semilogarítmico;
— muitas vezes, O interesse não é mostrar mudanças em valores
absolutos. mas sim em valores relativos; no gráfico em escala aritmética
não seria possível.
A distribuição da tabela 2.11 foi representada nas figuras 2.22 e

2.23. Pode ser verificada a vantagem do uso do papel semilogarítmico
quando se comparam as figuras 2.23, escala aritmética, e 2.22, escala
semilogarítmica.
Tabela 2.11 Coeficiente de incidência de câncer do pulmão (x 10.000 habitan-

tes). no sexo masculino, segundo idade, em São Paulo e Alameda (Califórnia,
EU.A.), em 1969.
Idade São Paulo Alameda
25 — 30 16 10
30 — 35 1,4 23
35 |-— 40 L6 11,1
40 |— 45 . 11,4 32,9
4s |— 50 20,7 53,8
50 |— 55 40,3 100,4
ss |— 60 82,5 192,5
60 |-— 65 182,5 252,0
2 >
Fonte: World Health Organization, Cancer Incidence in Five Continents. vol. JE

(IARC Scientific Publ. n.º 15), Lyon, 1976.
42
o
o
EEE
habs.)
10000
(x
incidência
de
Coeficientes
Ri
porre
7
Idade
Figura 2.22 Coeficientes de incidência de câncer do pulmão (x 10.000 habitan-
tes), sexo esculino,; segundo idade, em São Paulo e Alameda (Califórnia,
E.U.A.), em 1969.
Fonte: World Health Organization, Caner incidence in five continents. vol. II
(ARC Scientific Publ. n.º 15), Lyon, 1976.
43
O
habs)
Coeficientes de incidência (x 10000
25 30 35 40 45 50 55 60 65
Idade em anos
— Alameda, EUA.
——— São Paulo.Brasil
Fizura 2.23 Coeficientes de incidência de câncer do pulmão (x 10.000 habitan-

tes. sexo masculino, segundo idade, em São Paulo e Alameda (Califórnia,
EUA). em 1969.
Fonse World Health Organization, Cancer incidence in five continenis. vol. II

(LARC Scientific Publ. n.º 15), Lyon, 1976.
Quando as categorias da variável em estudo se repetem

após um
periodo. como no caso dos dias da semana, os meses
do ano, as horas
do dia. etc.. pode haver interesse em verificar se O conjunto de fregiên-
cias destas categorias apresentam algum padrão de acordo com a orde-
nação das categorias; em Epidemiologia seria o caso do estudo do fe-
nómeno chamado estacionalidade ou sazonabilidade. A figura recomen-
dada é o gráfico polar, que consiste em um círculo com tantos raios
quantas forem as categorias da variável; cada raio terá uma escala de
fregúências com origem no centro do círculo. Locadas as fregiiências
observadas para cada raio, os pontos são unidos; em geral, as fregiên-
clas são médias de observações feitas durante vários períodos. A figura
2.24 é um exemplo em que dois períodos foram mostrados separada-
mente. '
44
e-—— o 1969
oo 1970
Figura 2.24 Número de fraturas (exceto de crânio), segundo o mês de ocor-

rência. Ribeirão Preto, 1969-1970.
* Xavier, C. A. M. & Carvalheiro, J. da R. Incidência de fraturas, exceto de

à no município de Ribeirão Preto, SP (Brasil) nos anos de 1969-1970.
1. Distribuição segundo a causa externa, tempo e lugar de ocorrência. Rev. Saúde
públ., S. Paulo, 12:432-42, 1978.
45
Capítulo 3
Análise descritiva de uma distribuição de
fregiiências a duas variáveis qualitativas
3.1 Estudo da associação em tabelas de 2 x 2
Sejam duas variáveis qualitativas apresentando cada uma apenas

duas modalidades mutuamente exclusivas. Por exemplo, a tabela 3.1
se refere aos resultados obtidos em duzentos exames de fezes, feitos
simultaneamente por dois métodos (“FAUST”e “MIFC”) com a fi-
nalidade de estudar a concordância, no mesmo indivíduo, desses méto-
dos para diagnosticar a presença de Giardia lamblia. Neste caso, trata-
se da classificação dos indivíduos segundo duas variáveis qualitativas
nominais: o resultado do exame pelo método FAUST e o resultado do
exame pelo método MIFC
Z
Nestas condições, diz-se que na tabela 3,1 existe independência,
isto é, ausência de concordância, no mesmo indivíduo, dos dois métodos,
se se verificarem as seguintes condições:
Tabela 3.1 Exames de fezes classificados segundo o método coprológico usado e

o resultado encontrado.
MIFC
+ — Total
FAUST
+ 80 = fy 2=ta 82 = t.
— 3 = MS = fa n8 = £,
Total 83 = ft; n7 = fo 200 = n
Fonte: Berquó, E. et. al., “Notas sobre o diagnóstico das parasitoses intestinais. 1
— Dados comparativos entre os resultados obtidos pelos métodos de 'FAUST” e
'MIFC”, Arquivos Fac. Hig. Saúde Pública, São Paulo, 12: 2, 1958.
47
ou. o que é o mesmo, se
fi. fá fo. fa
fu = fa = Co
Estas relações implicam, naturalmente, as seguintes:
fe fo pe fi. fo
fe. = õ' do que segue: fiz ú
e
fas f fo. fo
e
e . do que segue : bo 22 = n
Ou seja, em termos do exemplo apresentado, independência, signi-

fica que a proporção de positivos revelada pelo MIFC deve ser a mesma
tanto para os indivíduos que foram positivos como para os que foram
negativos pelo FAUST (ou que a proporção de positivos revelada pelo
FAUST deve ser a mesma, tanto para os indivíduos que foram positivos
como para os que foram negativos pelo MIFC).
Quando as condições acima não estiverem satisfeitas, diz-se que
as duas variáveis são associadas. (A teoria da associação dos atributos
ou variáveis qualitativas surgiu com G. Udny Yule, a partir de 1900.)
Esta Ren pode ser positiva ou negativa. ps vez que na tabela
21
3.12 — > E e, consegiientemente, = < qe diz-se que os dois
Ze
métodos estão associados positivamente, isto é, eles em geral concor-
dam quanto aos resultados para um mesmo exame. Caso contrário, se
houvesse predomínio de discordância, dir-se-ia que há associação ne-
gativa.
Genericamente, a questão que se coloca é aquela de, diante de uma
tabela de 2 x 2, como a 3.2, saber se há independência e, se não hou-
ver, conhecer a magnitude e o sinal da associação existente entre as
variáveis A e B. Ou seja, saber se A, está associada positiva ou nega-
tivamente a B;.
Tabela 3.2 Tabela teórica de associação entre as variáveis A e B.

Ora, desde que independência, como foi visto, implica:
E = goal 4,03
far “aco
ton tdo Siad q =
NOS
439
fo. fa sas.
dg = =
A 63,05
fo fo
fo =—
1
então, nada mais natural que, diante de uma tabela de 2 x 2 observada,
verificar se as relações acima estão ou não satisfeitas. Esta verificação,
em termos descritivos, pode ser feita comparando-se a tabela de dados
observados com aquela que se teria caso houvesse independência, isto
é, na qual os valores de fj, fio, fo; € fpo fossem dados pelas relações
acima. Para o presente exemplo da tabela 3.1, a tabela de independên-
cia correspondente se constitui na tabela 3.3.
Tabela 3.3 Valores esperados na tabela 3.1, se houvesse independência.
MIFC
FAUST E = ficas
+ 34,03 47,97 2
- 48,97 69,03 118
Total 83 17 200
Comparando-se as duas tabelas através dos desvios entre os valo-

res tomados nas caselas correspondentes, tem-se:
80 — 34,03 = 45,97
3 — 4897 = — 45,97
2 — 47,97 = — 45,97
115 — 69,03 = 45,97
Intuitivamente, pensar-se-ia em calcular uma média destes desvios

e usá-la como medida do afastamento entre o observado e o esperado,
em caso de independência. Como é fácil verificar, o desvio médio seria
49
nulo. pelo fato de ser nula a soma algébrica dos quatro desvios, Ist
sempre acontecera. uma vez que na tabela 3.3 os totais marginais são
os mesmos da tabela 3.1, isto é, estão fixados pelas condições de
cada problema particular, Levando isto em consideração, Karl Pears a
introduziu uma estatística para medir a referida discrepância, Tepresen-
tada por y (qui — quadrado) e definida por:
e ta?
(fa - feto) fe EN?
(ta — de)
n n
JP ==
pa a
fi. fo
(o 8 (io 8)
n n
De. e 2 o é 2
n
pl Tg Oo
fo. fi; fo. fo
n n
e = [052]
Esta estatística pode ser representada também por
E
onde O representa as fregiiências observadas (tabela 3.1), E representa
as freqiiências esperadas (tabela 3.3) e a somatória é estendida às qua-
tro parcelas correspondentes às caselas da tabela de 2 x 2
É fácil perceber que x? = zero no caso das duas variáveis em
consideração serem independentes, e x* > Ono caso de associação.
Para o exemplo das tabelas 3.1 e 3.2, o valor de x? será dado por:
— (80-34,03)2 n (2-47,97)2 | (348,97)? | (115—69,03)) |
* 34,03 47,97 48,97 69,03
— (459? | (caso (4591? | (SIT
34,03 41,97 48,97 69,03
= 62,099 + 44,053 + 43,154 + 30,613
= 179,919.
* Pearson, K., On the Theory of Contingency and Its Relation to Association and
Nornial Correlation, Draper's Company Research Memoirs, Londres, 1904.
so
Diante deste resultado, pode-se pensar que se está
mais próximo
de uma associação do que de independência entre os dois métodos
co-
prológicos considerados. Por outro
lado, desde que SO = 0,976
é
maior do que 118 0,025, pode-se pensar então em uma possível
associação positiva entre os resultados dos
que x”, pela própria definição, não possui dois métodos. Uma vez
um limite superior, pois
varia de zeroa mais infinito, seu valor, Por si só, não permite aquilatar
nem O grau nem o sinal da associação. Para ilustrar
esta limitação
de x? considerem-se as tabelas 3.4 e 3.5 (contendo
dados hipotéticos),
que apresentam a mesma situação extrema de associação
entre as va-
riáveis A e B, isto é, A; e B; estão associadas positivamente
de forma
perfeita, uma vez que a categoria A, de A só aparece na presença
da
categoria Bide B. A única diferença entre estas duas tabelas reside no
fato de que a tabela 3.5 é obtida multiplicando-se por 10 todas as
fregiências da tabela 3.4 e, no entanto, o valor de x? também passa
de 100 para 1.000.
Tabela 3.4 Dados hipotéticos, mostrando associação. perfeita positiva entre
B »
B, B, Total
A
A 60 — 60
A, — 40 40
Total 60 40 100
x = 100
Tabela 3.5 Dados hipotéticos mostrando associação perfeita positiva entre
B B, Bo Total
A
A, 600 — 600
A, fes 400 400
Total 600 400 1.000
x2 = 1.000
51
Por esta razão, várias tentativas foram feitas no sentido de propor
um coeficiente que fosse igual a zero no caso de independência e atin-
gisse valores bem definidos, positivos ou negativos, no caso de asso-
ciação perfeita, positiva ou negativa, respectivamente.
2 2
Uma alternativa proposta é trabalhar com E = O (phi quadra-
do) ou simplesmente com O = + ea
Por exemplo, em termos de O , às tabelas 3.4 e 3.5 correspon-

dem o mesmo valor:
100 1.000
0=+/—=+/D—=+1,
100 1.000
ou seja. O resolve o problema do limite superior, pois varia entre zero
e a unidade. Todavia, se em lugar da tabela 3.3. se tivesse a tabela
3.6. que ilustra um caso de associação perfeita negativa entre A; e B;,,
ter-se-ia para x* o mesmo valor 100 e, portanto,
o =+/=+1
100
100
Tabela 3.6 Dados hipotéticos mostrando associação perfeita negativa entre
“Bl
A a B, B, Total
|
A; | — 60 60
A, | 40 — “0
Total 40 60 100
* = 100
Este resultado mostra que O é apenas indicador da intensidade
da associação, variando entre zero e a unidade, quando se passa de
independência para associação perfeita; contudo, não dá indicação sobre
o sinal da associação. É claro que o valor de O, acompanhado ou de
1 12
toda a tabela ou de a e de po resume toda a informação de que se
necessita, isto é, magnitude e sinal da associação. Para a tabela 3.1,
52
179,919
por exemplo, O = + “200 = + 0,948; este valor tão pró-
. s
ximo da unidade, e maisa o fato de ques
fi
= 0,976 é maior do que
f
, 2.
= 0,025, mostram que praticamente todos os exames
apresentaram re-
sultados concordantes. Na prática, entretanto,
é pouco operacional a
apresentação. de toda esta informação, principalmente
quando se tem
um número grande de tabelas 2 x 2. Por este motivo,
prefere-se um
coeficiente que sintetize ao mesmo tempo as duas
informações.
O coeficiente de associação de Yule *, definido a seguir,
satisfaz
estes requisitos:
Q = fu fo — fio fo
fu foz + fio fa
fato, para as tabelas 3.4 e 3.5 (casos de associação perfeita

positiva), tem-se, respectivamente:
60 x40) — 0 2.400
Q = (60 x 40) — O =" =+1
(60 x 40) + O 2.400
(600 x 400) — 0 240.000

+1
O = 600 x400) 0 240.000 —
ou seja, Q atinge seu valor máximo + 1 e independe da ordem de
magnitude dos dados.
Para a tabela 3.6, tem-se:
O — (40 x 60)
de E ME AD =-1
isto é, Q atinge o valor — 1 no caso de associação perfeita negativa.
É fácil verificar que, no caso de independência, Q = 0; de fato,
tem-se:
———
* Yule, G. U. e Kendal, M. G., An Introduction to the Theory of Statistics,
Charles Griffin & Co. Limited, 14.2 edição, 1950.
s3
fifa
DA fofo fifo z fo fi
q=—" e P=o
fi. fa x fo. fo g fi. £o E fo. £a
n n n n
Para a tabela 3.1, Q vale:
80x 115 —- 3x2 9.194 N
q= DE DODEI O OD = + o
80 x 115 + 3x2 9.206
Em resumo, a análise da tabela de associação 3.1 pode ser feita
através de:
é = + 179,919
o = + 0,948
QO = + 0,999
Em termos descritivos, Q contém toda a informação de que se ne-
cessita; isto é, mostra que os dois métodos concordam (sinal + de Q)
de maneira quase perfeita (magnitude de Q) O estudo completo da
associação, do ponto de vista de inferência estatística, será visto no ca-
pítulo 17, ou seja, ter-se-á oportunidade de saber se um valor encon-
trado para x poderá ou não ser pensado como tendo ocorrido por
mero acaso.
Antes de terminar esta seção, vale a pena tecer alguns comentários
sobre o xº aqui apresentado.
Em primeiro lugar, é útil saber que x? pode ser mais facilmente
calculado pela fórmula abaixo, que evita o cálculo prévio da tabela
teórica de independência, isto é, por:
2 = (fu foz — fi fon)? mn

fi. fo. £y fo
Em termos da tabela 3.1, tem-se:
> (80 x 115 — 3 x 2)? 200
X = —» 1 — = 179,919
82 x 118 x 83x 117
Em segundo lugar, Cochran *, por razões de ordem teórica, res-
tringe o emprego de x* em tabelas de associação de 2 x 2 aos se-
guintes casos:
caca
for Strengthning the Common x Tests”,
* Cochran, W. G., “Some Methods
Biomerrics, 10, 417-451, 1954.
54
. Sen 2, 40, x? pode ser utilizado, porém será preferível empre-
gar o x? corrigido, x, dado pela fórmula
(| fu foz — fio fos | ->» n

e
fi. fo. £s £o
onde L E foz — fi fo | significa o valor da diferença tomado positi-
vament:
2. Se 20 <n < 40, x? só poderá ser usado se todas as fre-
qiuiências dá tabela esperada (no caso de independência) forem
maiores ou iguais a 5. Em caso contrário, dever-se-á utilizar o
método exato de Fisher *, que será visto no capítulo 17.
- Finalmente, se n < 20, somente o método exato de Fisher
wo
poderá ser empregado.
3.2 Estudo da associação em tabelas de r x s

Suponha-se agora que as duas variáveis qualitativas em estudo
apresentem uma r e a outra s modalidades mutuamente exclusivas.
Nestas condições, as idéias apresentadas na seção anterior podem ser
generalizadas. Para tanto, considere-se a tabela 3.7 de contingência na
qual à variável A corresponde a politomia Ay, Ao, . A, e à variável
B a politomia B;, Bo, ..., B..
Tabela 3.7 Tabela teórica de contingência, para as variáveis A e B.
T
Aê B, B, (êa B; are B | Tot
as |
A, fy fo a fy ... fa | fi,
A, for foo ... É; ihio fos | b.
A, fa fo ... fy Et fis | t.
. . . . . | &
. . . 5 : | a
A, fa fo ... fy sas Es | É,
Total fi fo ... ts vei Es p
É E tes,
Fisher, R. A., iara Methods for Research Workers, Hafner Publishing Co.,
New York, 10.2 'ed., 1948
ss
Quando em uma tabela de contingência de r x s subsiste a igual-
.t
G=*lqmi=12. rej=12..5) des
que os dois atributos ou variáveis A e B são independentes. Caso con-
tránio, A e B estão associados.
Para uma tabela de contingência quadrada, isto é, com r = s,a
idéia intuitiva de associação perfeita é a de que todos os n indivíduos
reriam estar concentrados na diagonal principal (associação perfeita
positiva. tabela 3.8) ou na diagonal secundária (associação perfeita ne-
gauva. tabela 3.9).
Tabela 3.8 Ilustração de associação perfeita positiva entre A e B.
A e B, sus B, a B, Total
A; fis ... “Es ... = | &

a a a é po
A, | o — ses fis seo — | &

é o ' é a
A, | — ... — Es fe f.
>»
Ie mo jm o
Total fi sum ts a fe in
>> DD Dot ow lOOoOoo.
Tab á -
Total
&.
f.
n
O x* proposto anteriormente
passa a ser definido, para
as tabelas
sp ft
do tipo'da 3.7, 3.8 e 3.9, por:
o (is teta
$ =
a fe£s
“Do
e recebe o nome de contingência quadrática.

es o uso de xº em tabelas de r xs está sujeito, por
razões teóricas, às seguintes restrições, devidas a Cochran:
1. Pelo menos 80% das frequências esperadas, no caso de inde-
pendência, isto é,
fe-:*x £, 5 (paratodoi =1,2,... re todo
n
= 1,2,..., s). precisam ser iguais ou maiores que 5 e ne-
ma menor do que a unidade
. Sea condição anterior não for satisfeita, poder-se-á. antes de
o
calcular o x, combinar «modalidades adjacentes da politomia

relativa ao atributo A ou ao atributo B, ou a ambos. a fim de
aumentar o valor das fregiiências esperadas, contanto que isto
não prejudique o estudo que se tem em mente.
3. No caso de 1) não estar satisfeita e 2) não puder ser reali
zada, dever-se-á recorrer ao método exato de Freeman e Hal
ton.*
No caso particular de tabelas de 2 xs, paras > 6, Lewantin **

mostrou que o x* pode ser usado ainda mesmo quando as fregiiências
esperadas forem bem pequenas, da ordem de 0,5 ou 1.
A título de ilustração, foi calculada para os dados da tabela 3.10

a correspondente tabela 3.11 de independência, isto é, a tabela hipo-
tética caso o nível educacional da mãe e a precocidade do óbito infantil
não estivessem associados. Como exemplo, o valor 470,3 foi obtido da
seguinte maneira:
fa. fo 1120 x 942
= 4703.
n 2243
Gérceman, G. H. e Halton, J. H., “Note on an Exact Treatment of Contingency

fine of Fit and Other Problems of Significance”, Biometrika, 38: 141-149,
**Lewantin, R. » “The Roboustness of Homogeneity Tests in 2 x n Tables”, Bio-

metrics, 21: 19-Sa, 1965.
s
O valor da contingência quadrática neste caso é:
(193 — 135,4)? (399 — 373,2)?
= E ca BF
é 135,4 373,2
(167 — 1423)?
Sia e 15,441.
142,3
Tabeia 3.10 Óbitos de menores de S anos classificados segundo três grupos de

ne da criança e o nível de instrução da mãe. Município de São Paulo (1968-
1970
Idade ao | ê
morrer Do 28.º dia at:
Nivel | Ames
.º do
dia 4(exclusive)
ano de idade Dela 4
completos anos | Tora
ue da mãe
Secundário
ou mais 193 89 17 299
Primário
(1 e 2 anos) 399 324 101 824
Nenhum 424 529 167 1.120
Total 1.016 942 285 2.243
Fonte: Puffer, R. R. & Serrano, C. V. Patterns of Mortality in Childhood,

PAHO, 1973.
Tabela 3.11 Independência entre nível educacional da mãe e idade do óbito (a

partir da tabela 3.10).
> Idade ao
= morrer Do 28.º dia até
Nível
deins > e des
.º dia do 1 ano de idade
(exclusive) Decompletos
1a 4an05 | Tora
trução da mãe
s ária
ou mais 135,4 125,6 38,0 299
Primário
(1 e 2 anos) 373,2 346,1 104,7 824
Nenhum 507,4 470,3 142,3 1.120
Total] 1.016 942 285 2.243
58
Da mesma forma que no caso das tabelas de 2 x 2, também para
as tabelas de contingência há interesse em medidas descritivas e sintéti-
cas do grau da associação entre as variáveis A e B. Vários coeficientes
têm sido propostos com esta finalidade.
O coeficiente de contingência de Pearson * definido por
CS q =
se anula no caso de independência, mas não atinge o valor 1 para o
caso de associação perfeita, a não ser para um número infinito de mo-
dalidades dos atributos A e B. No caso particular de r = s = 2,
atinge o valor máximo 0,707 para o caso de associação perfeita. Para
outros valores de r = s, tem-se, no caso de associação perfeita:
r=s= 3 Valor máximo deC 0,816
0,866
VoOJaAunA
0,894
0,913
0,926
0,935
MM
0,943
10 0,949
Daqui fica claro que não tem sentido comparar o valor de C para
uma tabela de contingência de r x s com o de C' para outra tabela de
rxs,comr xresxs.
Para a tabela 3.10, C vale:
/ [75,421
E A UT
2243+75,421 2318,421
que, confrontado ao valor máximo de C, para r = s= 3(0,816),
mostra um fraco grau de associação entre nível educacional da mãe
época do óbito infantil. -
O coeficiente de contingência de Tschuprov, definido por:
é :
=>"
nV/ (1-1)
(6 —D
ou ?
To *AvE- DE. D
* Yule, G. U. e Kendal, M. G., An Introduction tot the Theory of Statistics,
Charles Griffin & Company Limited, 14.2 edição, 1950.
59
também se anula no caso de independência, mas só atinge o limite su-
perior| no caso der =s.
Para a tabela 3 10, tem-se:
15421| = + 75,421 =
T=+ >>>.
v 22483 V G-1) G-1) 2243
x 2
= + v 0,0168 = + 0,130
O coeficiente de Cramér * é definido pori
a dr
=” nxmin(r— 1,s-— 1)
/ x
Wo + nxmin(r— 1,s—1)
onde min (r — 1,s — 1) é igual ao menor dos valores entre (r — 1)

e(s-— 1).
Este coeficiente é o único que tem a vantagem de se anular no
caso de independência e atingir o limite superior 1 no caso de asso-
ciação perfeita, não dependendo para tanto dos valores de r ou s. No
caso particular der = s=2,V = + — ,ouseja,

V = 0.
n
Parar=s,V=T.
Na tabela 3.10,
V=+ RR
2243 xmin (3 — 1,3 — 1)
75,421
= + /55000
2.243 x 2
= +'0,130
resultado igual a T.
Antes de finalizar esta seção, deve ser observado que os três soe
ficientes aqui d da ê e
portanto, a utilização dos mesmos está sujeita às mesmas Testrições
do y.
* Cramér. H., Ea Methods of Statistics, Princeton, Princeton Univer-

sity Press, 19:
60
3.3 Medidas baseadas no conceito de melhor predição da associação
Muito embora o estudo discutido da associação, tanto
em tabelas
de 2x2 como der xs, seja feito na maioria das
vezes através das
medidas tradicionais, definidas anteriormente, existe toda
uma linha de
pensamento, devida principalmente a Goodman e Kruskal *,
baseada
no conceito de “melhor predição” da associação, que se
passará a expor.
As medidas ou coeficientes propostos dentro dessa
linha vão de-
pender do tipo da tabela de contingência considerada, isto
é, se a ta-
bela é ou não simétrica, e do nível de mensuração das duas
variáveis
qualitativas em questão, ou seja, se são nominais ou ordinais.
Uma tabela de contingência é dita assimétrica quando a politomia
correspondente a uma das variáveis precede a outra no sentido de
que
uma variável é considerada como independente e a outra como depen-
dente.
Por exemplo, a tabela 3.12 ilustra esta situação. De fato, o apare-

cimento da rubéola em gestante precede a condição que apresentará o
recém-nascido. Ou seja, o período da gestação no qual a gestante teve
rubéola é a variável independente, e o que se procura, neste tipo de
estudo, é saber até que ponto esta variável vai influenciar O nascituro,
resultando, portanto, em variável dependente a condição do recém-nas-
cido.
Tabela 3.12 Gestantes atacadas por rubéola, classificadas segundo o período de

gestação por ocasião do ataque da doença e a condição do recém-nascido.
Condição do
recém-nascido
Defeituoso Normal Total
Periodo da | (By) (Bo)
gestação
(A)
Até o 3.º mês (A,) 14 36 so

Depois do 3.º mês (A,) 3 s1 s4
Total 17 87 104
Fonte: Bradford Hill A.. Doll R., Golloway T., Hughes J. P., “Virus Disease in
Pregnancy and Congenital Defecis”, Brit. J. Prev. Soc. Med.; 12, 1, 1958.
* Goodman, L. e Kruskal, W. H., “Measures of Association for Cross Classifica.

tions”, Journal of the American Statistical Association, 49, 268, p. 732-754, 1954.
e
Outros exemplos de tabelas assimétricas são dados pelas tabelas
3.13 e 3.14.
a 3.13 Reações dos pacientes hospitalizados e acamados, de 14 a 44 anos,
à intrusão visual no seu espaço pessoal durante o banho no leito, segundo o sexo.
R «B) Indiferente
(B)
Não-indiferente
jo-indiferent
(B,) Total
(A)
Feminino (A,) 17 40 57
Masculino (A,) 32 20 52
Total 49 60 109
Fonte: Carvalho, D. V.. Intrusão Física e Visual no Espaço Pessoal do Paciente

Hospitalizado e Acamado, dissertação de mestrado, Escola de Enfermagem da
Universidade de São Paulo, São Paulo, 1977.
A tabela 3.1, por outro lado, é um exemplo de tabela simétrica,

pois os dois métodos de análise coprológica são usados simultaneamen-
te, sem nenhuma precedência de um com relação ao outro.
3.3.1 - Estatística ). para tabelas assimétricas e atributos nominais

Em uma tabela de contingência como a 3.7, se se quer prever a
que modalidade de B pertence um indivíduo selecionado ao acaso do
total de n indivíduos, a estatística À é definida por:
> [max (6,)) — max (£5)

Ap, =
ist
n — max (f;)
onde max (f.;) representa o maior valor dentre os totais marginais f.1,
fiz, ..., f.s; max (fis) representa o maior valor dentre as fregiên-
cias da linha correspondente a A;; max (f,;) é o maior valor dentre
as fregiiências da linha correspondente a A»; e assim por diante.
r
> [max (f,)] é a soma destes valores máximos.
tel
Nestas condições, A, pode ser interpretada como a proporção de
erro que pode ser eliminada na predição do atributo B, pelo fato de
se levar em conta o conhecimento da classificação dos indivíduos se-
gundo o atríbuto A.
62
63
“LL6] “OTnNA OSS 'SENUAO OP RIRIISUIA RONDA 'JVANIO 'DONUQUOZZ-0ppS “soa
2 sonbpjoIg :auod
— Ojmog OPS w> apopipunoaj y “Hd 'D BIRD “V d'O 'BIRAO “d onbrg
PuSowg Sousuasoo)
o —
8907 9» LsE €6L o! er mos
os nt 8 8 L 6 s try); nO)
st u L € I 9 (ty) eundsa
e
e ot s s L v z (Fy) aueoneid
-OBU QJUBISDIOIA
€or tu 91 6 E s st (Ey) queoneid
jueISdOLId
L6LT s8E LOE 691 sat seI sIz Cy) eugro
, & (a) (vw)
ai e. a «ED O | son omite
moL a
ASpnadE Hot -ouão uaseasT sreuoradoo
UOL SOL
*S96I “med OBS “EISIAMNUS EP EoOd) EU OpEsn [euoldaouonus Olou O 2 OsiSIjoI E Opundos SSIYNA IE DIJAQoI
Assim, por exemplo, para a tabela 3.14, se uma mulher fosse se-
lecionada ao acaso do total de 2.068 mulheres, a chance de ela usar,
por exemplo, o meio anticoncepcional Ogino-Knauss é da ordem de
9,33% (193/2068). Será que o conhecimento da religião de uma
mulher melhora a predição quanto ao tipo de anticoncepcional usado?
Para tanto, calcula-se o valor de Ap. Tem-se:
n = 2068
max(f.;) = 468
max(f;) = 415
max(f;) = 25
max(fy) = 10
max(fy) = 15
max(f;;) = 18
s
> max(f;) = 483
El
=
= 480468 (1515 o o094
2.068 — 468 1.600
ou seja, o conhecimento prévio da religião da mulher praticamente não
melhora a predição quanto ao tipo de anticoncepcional usado, uma vez
que esta melhora é da ordem de 0,94%.
Com referência à tabela 3.13, tem-se:
n = 109
max(f.;) = 60
max(f;;) = 40
max(f,;) = 32
2
> max(fy) = 72
Fl
72 — 60 12
A =—— =| = 0,245
109 — 60 49
mostrando que o conhecimento do sexo do paciente hospitalizado e aca-
mado melhora em 24,5% a predição de sua reação
à intrusão visual
no seu espaço pessoal durante o banho no leito.
A estatística A, será indeterminada se e somente se todos
n indiví-
duos estiverem classificados na mesma modalidade de B; caso contrá-
rio, A, varia entre zero e a unidade, inclusive. à, toma o valor
zero
64
se e somente se o conhecimento de A não melhorar
de B; toma o valor 1 se e somente se em nada a predição
o conhecimento de A especificar
que o indivíduo pertence. Quando
há independência (conforme definid a anteriormente), À, será igual a
zero, mas a recíproca não é sempre verdadeira. De fato, para a tabela
3.12,
= 87 = 87 + ú
"104 — 87
e, no entanto, não há independência, como é fácil
coeficiente de Yule: ver pelo valor do
q = dtHol TS ade
Cqxst + 3x360 079
Caso o problema fosse prever o atributo A levando em conta o

conhecimento do atributo B, à, seria definida, por analogia, como:
[max(h)] — max(&.)
À j=1
mu dÊ-.
n — max(f.)
3.3.2 Estatística À para tabelas simétricas e atributos nominais
Quando nenhum dos dois atributos A e B precede o outro, isto é,

no caso de uma tabela de contingência simétrica, a estatística À assume
a forma:
r s
[max(f;)] + > [max(f)] — max(£,) — max(f.)

A=
1 jl
2n — max(f.;) — max(f..)
assume o valor 1 se e somente se todos os n indivíduos estiverem

distribuídos de tal maneira que em cada linha e em cada coluna da ta-
ela só exista uma cela ocupada. à é igual a zero no caso de independên-
cia, mas a recíproca não é verdadeira. À é indeterminada se todos os n
indivíduos estiverem concentrados em uma única cela.
6s
n = 200
max(f,.) = 118
max(f;)) = 117
max(f;) = 80
max(f;) = 115
E max(ty) = 195
ist
max(f)) = 380
max(fo) = 115
sz max(f;) = 195
FI
195 + 195 — 117 — 118 155
A
2x200— 117 — 118 165
mostrando que o conhecimento de um resultado do exame de fezes por

um dos métodos permite melhorar em 93.9% a predição do resultado
do mesmo exame pelo outro método e vice-versa.
3.3.3 Estatística y para tabelas simétricas e atributos ordinais
Para uma tabela de contingência de r x s em que nenhum dos

dois atributos A e B tem precedência sobre o outro e onde ambos são
de natureza ordinal, a estatística y significa quão mais provável é obter
ordem semelhante do que diferente, nas duas politomias, quando dois
indivíduos são escolhidos ao acaso do total n (dado que não existe
empate).*
Nestas condições, y é definida por:

p= 2ntm 1
1— m
* Escolhidos os indivíduos I e II, se para a variável A observada

goria i for maior do
em I a cate-
que aquela observada em II (AX) > i(A,I)), e para a
Bitiea É ide sm I pe a rea j for maior do que aquela observada
em II [M(B,I) > j(B,II)), se
ou ainda ([i(A,I) < i(A,II j i(BID] 4»
diz-se que se tem ordem semelhante. | < HAD] e DD < ADI)
66
n=L (De, sm z >ja Eu |
= js il
y é indeterminada se todos os n indivíduos estiverem concentrados em

uma única linha ou coluna da tabela; y é igual a + 1 se os indivíduos
estiverem distribuídos apenas pelas caselas correspondentes a (A;, B;)
para i=1, 2, ..., r (tabela 3.8);y é igual a — 1 se os indivíduos
estiverem distribuídos apenas pelas caselas correspondentes a (As
aaa) para i=1,2,...,r (tabela 3.9); y é igual a zero no caso
de independência entre A e B, mas a recíproca não é verdadeira, exceto
parar=s=2.
2
Mm 1 = coz:0 1193(324
! (324 ++ 529
529 + 101 + 16767)
+ 89(101 o1 +
167) + 399(529 + 167) + 324(167)) = 0,2274
73 = a (299? + 824º + 1.120? + 1.016º + 9422 +

(2243)?
+2852 — 1932 — 892 — 172 — 3992 —
— 324º — 1012 — 424º — 529º — 1672) =
= 0,6393
4 + 0,6393 — 1
p = 2x0,2274
+ 0,6393 — 1º 0,2609
1 — 0,6393
Pode-se demonstrar queV/ = O,parar=s=2.
7
Capítulo 4
Análise descritiva de variáveis quantitati-
vas: medidas de posição, de variabilidade,
de assimetria e de achatamento; noções
sobre correlação e regressão
Após a coleta dos dados, os mesmos são apurados de acordo com

os valores de uma ou mais variáveis, dando lugar às distribuições de
fregiências. Assim, ao se estudar um grupo de 40 hipertensos em re-
lação às suas idades, tem-se a distribuição de fregiiências da tabela 4.1.
As tabelas 4.2 e 4.3 apresentam exemplos de distribuições de fregiên-
cias a uma variável quantitativa; nesta última, os valores da variável
apresentam-se dispostos em classes de amplitude igual a 1:/100 ml.
Tabela 4.1. Pacientes com hipertensão, segundo a idade.
Idade em
anos completos Nº Idade N.º
22 1 47 1
27 1 48 1
30 1 so 2
31 1 53 5;
34 1 56 1
35 3 s8 1
36 5 59 z
40 1 60 1
42 1 61 1
43 1 63 1
44 2 6s 3
4s 1 67 2
46 2
Total 40
Fonte: Montenegro, M.R.G., Incidência e Extensão das Lesões de Arteriosclerose

em Aortas e Artérias Coronárias. Estudo baseado em 250 casos, tese de livre-
docência, Faculdade de Medicina, USP, 1962.
69
Tabela 42 Vermes machos de A. Galli, segundo o o comprimento. |
Comprimento Comprimento |
em milimetros Nº em milímetros N.º |
2 3 25 2 |
]
3 2 26 2
14 - 21 1 |
1s - 28 8 |
16 1 29 3 ]
1 3 30 9 |
18 1 31 2 |
19 1 32 8
20 2 33 3 |
2 - 34 3 ]
2 - 35 =
3 1 36 2
24 1 |
Total 58 ;
Fonte: Rocha, U.F., Novas Investigações sobre o Modo de Ação da Fenotiazina.

tese de cátedra, Faculdade de Medicina, USP, 1957.
;
Tabela EA Dosagens de iodo estável unido às proteínas séricas (PBI!27) de
ambos os sexos, com bócio, de cidades do Estado de São Paulo. |
PBI27 (ug/100ml) No
20 |— 30 Ee
30 |— 40 5
40 |— 50 28
50 |— 60 2
60 |— 70 37
7 i— 80 25
80 |— 90 u
90 |— 10,0 7
1,0 |— 11,0 5
Total 144
Fonte: Gandra, Y.R., Contribuição para o Estudo do Bócio Endêmico no Esta-
do de São Paulo, tese de cátedra, Faculdade de Higiene e Saúde Pública, USP,
1964.
A figura 4.1 contém os dados da tabela 4.3 projetados em um

histograma, isto é, cada retângulo tem por base a amplitude de uma
classe e por altura a fregiiência daquela classe. Os mesmos dados en-
contram-se projetados na figura 4.1 segundo um polígono de fregiiên-
cias, isto é, cada ponto tem por abscissa o ponto médio de uma classe
e por ordenada a fregiência daquela classe.
70
”
a
30+
N
ê N
52
8 E!
820 q
e
É 45 N
2 N
10
"
E
5 ;
"
4 N
20 80 10,0 12
pBIt27
(u9/100 ml)
Figura 4.1 Dosagens de iodo estável unido às proteínas séricas (PBI!27) de
escolares de ambos os sexos, com bócio, de cidades do Estado de São Paulo.
Fonte: Gandra, Y. R., Contribuição para o Estudo do Bócio Endêmico no Esta-

do de São Paulo, tese de cátedra, Faculdade de Higiene e Saúde Pública, USP,
1964.
O problema que se apresenta em conexão com estas distribuições
é o de analisá-las no sentido de tentar descrever as suas características
mais importantes.
O método usual de análise de uma distribuição de frequências de
uma variável quantitativa X consiste em definir:
— medidas de posição, também chamadas de tendência central ou
médias;
— medidas de variabilidade ou de dispersão;
— medidas de assimetria;
— medidas de achatamento.
4.1 Medidas de posição ou de tendência central ou médias
Como o próprio nome indica, a medida de tendência central visa

a determinar o centro da distribuição. Esta determinação depende,
n
portanto. da definição de centro da distribuição. Todavia, o centro
de um conjunto de valores não está bem definido e pode ser interpre- !
tado de várias maneiras, cada uma das quais descreve uma proprieda-
de da distribuição, que pode ser razoavelmente chamada de tendência
central
São medidas de tendência central:
média aritmética
mediana
moda
média geométrica
média harmônica
4.1.1 Média aritmética

Dada uma distribuição de fregiiências, chama-se de média aritmé-
tica desta distribuição, e representa-se por X, a soma de todos os valo-
res da variável, dividida pela fregiência total. Por exemplo, conside-
rando-se os dados da tabela 4.1, tem-se:
X = idade em N.º x; f,
anos completos (£)
tvalores x, de X)
2 1 22
27 1 27
30 1 30
31 1 31
3 1 34
35 3 105
36 5 180
“0 1 40
42 1 42
43 1 43
44 2 88
4s 1 45
46 2 92
47 1 47
48 1 48
50 2 100
53 3 159
56 1 56
s8 1 s8
s9 2 118
60 1 60
61 1 6
63 1 63
6s 3 195
67 2 134
Total 4, 1.878
i=
22+27+430+31+...+65+65+65467+67
40 a
E 22x1 + 27x1 + 30x1 +31x1 +34x1 +35x3+36x5+... + 6513 +67x2
40
ou seja, a idade média dos hipertensos é igual a 46 anos (completos).

De maneira geral, ao se ter a seguinte distribuição de fregiiências:
Valores X da Fregiiência Produto

variável X (£) x f
% f x &
x £ Xo fo
Xe fe % fe
k k
Total > f=n 5 x f
Fl il
a média aritmética será:
k k
3a t Du ti
il El
E Es e
n n
2 &
E!
Se os dados da tabela 4.1 estivessem agrupados em classes, como

mostra a tabela 4.4, seria preciso, antes de calcular %, determinar os
pontos médios das classes. Entende-se por ponto médio de uma clas-
se a semi-soma dos dois extremos da classe. Assim, na classe 20 |— 30,
O ponto médio será:
73
20 + 30
x=——— = 25.
a
Tabeia 44 Pacientes com hipertensão segundo a idade em anos completos.
EO
= Idade Ponto médio Número
É de
valores x, de X da classe pRsientes x f
1
22 — 30 25 2 so
30 |— 40 35 q 385
so i— s0 4s 10 450
so i— 60 55 9 495
60 i— 70 65 8 520
Total 40 1.900
Fonte: Montenegro, M. R. G., noite ncia e Extensão de Lesões de Arteriosclerose

em Aortas e Artérias Coronárias. lo Baseado em 250 Casos, tese de livre-
docência; Faculdade de Medicina, use. 1962;
= 1.900/40 = 47 anos e 6 meses ou 47 anos (completos).

Como se vê, este valor não coincide com a idade média verdadei-
ra dos 40 hipertensos, calculada a partir dos dados da tabela 4.1. Isto
se deve ao fato de ter sido suposto, para o cálculo da média aritmética
com os dados da Tabela 4.4, que todos os indivíduos com idades de
uma determinada classe tinham a idade dada pelo ponto médio da clas-
se, o que, em geral, não corresponde à realidade.
De fato, os dois indivíduos com idades na classe 20 |— 30 anos,
por exemplo, passaram a ter idade de 25 anos, quando, na verdade,
pela tabela 4.1, suas idades eram de 22 e 27 anos.
Da própria definição segue que a média aritmética de uma distri-
buição de fregiiências:
— é-.da mesma natureza da variável considerada;

— sempre existe, e quando calculada admite um único valor;
— não pode ser calculada quando os dados estiverem agrupados

em classes e a primeira ou última classe tiverem extremos in-
definidos;
— sofre muito a influência de valores aberrantes.
74
Suponha-se que um aluno, durante um curso, tivesse obtido as
notas 7, 6 e 5, e que à primeira fosse dado um peso 2, à segunda um
peso 3 e à terceira um peso 5. Nestas condições, pode-se pensar numa
distribuição na qual, em lugar das fregiências observadas, ter-se-iam
fregiiências hipotéticas ou pesos, isto é:
ota:
valores x, de X Pesos = p; X P;
7 2 14
6 3 18
5 5 25
Total 10 57
57
A média obtida por este aluno seria: To = 5,7, a qual recebe
o nome de média ponderada.
Propriedades da média aritmética
1. Se aos valores de uma variável X for somada ou subtraída uma

constante c, a média aritmética de X, X ficará acrescida ou diminuí-
da desta constante c.
De fato, seja: y = x + c
Nestas condições,
k k k k
> nt Dwmto)f Satf+Dchf
5. HH - = ist
E im = n n
k k
Du fi + ne Duf
=
E +c=t+c
n n
2.
Se forem multiplicados ou divididos os valores de uma variá-
Vel X por uma constante c, a média aritmética de X, X ficará multipli-
cada ou dividida por esta constante.
75
De fato, seja: y = cx
Nestas condições,
k k k
> y É a (e x) fi > x f
-aln-H LH
Sê
y = n n
H
o)
x
Como uma aplicação das duas propriedades anteriores tem-se o
chamado método rápido para o cálculo da média aritmética, ou co-
Se os valores da variável X forem eqjiidistantes, este método con-

siste ou em substituí-los pelos números 0, 1, 2, 3, ... ou em substituir
um valor de X próximo do centro da distribuição pelo valor zero e os
demais valores de X por:
sura =3, =2, —1,0, 1, 2; 3, css
Seja 4 o valor de X próximo do centro da distribuição e t a ampli-

tude das classes. O método consiste em definir a nova variável:
X-A
Y=—"——
t
Com isto, a média aritmética de Y, pelas propriedades 1 e 2, será:

. E-A
x t
Assim, tomando novamente a tabela 4.4, tem-se:
Idade em anos Ponto médio N.º de x—

1 45
a x da classe i
pacientes y; >—— ytf
E 4
valores:-xp de x & A 10
2 |— 30 25 =? -— 4
30 |— 40 35 1 asso 5H —u
0 |— so 45=A 10 º 0
so |— 60 ss 9 1 2
o |— 70 6s 8 2 16
Total “0 10
| 10
| ==— = 0,25
R=ty+HA
Z= 10x0,25+45=25+45=47,5
= 47 anos e 6 meses, ou 47 anos completos,
! que é exatamente o mesmo valor obtido anteriormente.

Ou seja, o cha-
mado método rápido não introduz nenhuma fonte de erro no cálculo
da média aritmética.
3. A média aritmética é o valor que todas as observações teriam
se fossem todas iguais entre si.
Admita-se que as notas obtidas por um aluno em cinco disciplinas
fossem: 5, 6, 7, 8 e 9. A média aritmética das notas seria:
25S+6+7+8+09
5 7
Portanto, caso ele tivesse obtido, nas cinco disciplinas, notas iguais,
este valor seria 7. Assim,
TrieTL7ET
s = 7.
4. A
soma dos desvios (diferenças) entre os valores da variá-
vel X e a sua média aritmética X é nula, isto é
k
Sw-mh=o0
FI
' De fato,
k k k
Dw-mh=)nt-St=
il El
$. A soma dos quadrados dos desvios entre os valores da variá-

Vel X e a sua média aritmética X é mínima, isto é:
n
ad
k
2 (q — MD fi= mínima
il
Tem-se:
De fato, seja B uma constante arbitrária.
k k
3a -BrR=Dim—D + E BP ti=
= il
k k
=5 mw - Dt + 25 G-—-) &-—B) 6 +
El : =
k k k
ZG-Brh=D ns +35.& — B2 6
El 1 FI
o que mostra que
k k
Sa — Bt => — Rh
FI ei
o sinal de = subsistindo somente no caso de B = X.
6. Suponha-se um conjunto de n observações: formado de r sub-

conjuntos menores, cada um com, ny; observações (j = 1,2. ... 1).
Seja X a média do conjunto total e X, a média do subconjunto j. Nes-
tas condições, demonstra-se que:
k
ny X
mAh +tnRB+.. + nm X El
m+tn +... + mn n
isto é, a média de um conjunto pode ser considerada como a média

ponderada dos subconjuntos componentes.
De fato,
n n4 nytn, é nytn*..n,
3a Bu+» mo... + %
ed RL int Enytm,t tn,+]

n n
= Mb tm +... +n
n
7,8
4.1.2 Mediana
Dada uma distribuição de fregiiências e supondo-se os valores da

variável dispostos em ordem crescente ou decrescente de magnitude, E há
três casos a considerar:
1.º) A variável em estudo é discreta e n é ímpar. Neste caso à
mediana será o valor da variável que ocu; pa a o posto de or. a
dem
Admita-se que o número de casos de certa moléstia nos meses de

janeiro dos últimos 7 anos fosse:
52, 41, 37, 82, 24, 63 e 68.
Ordenados estes valores por ordem crescente, tem-se a seguinte

graduatória:
24, 37, 41, 52, 63, 68, 82.
A mediana neste caso vale:
M = 52 casos,
7+1
valor que ocupa o posto Z = 4.º, na graduatória.
2.º) A variável é discreta e n é par. Neste caso, não existe na

graduatória um valor que ocupe o seu centro, isto é, a me-
diana é indeterminada, pois qualquer ' valor compreendido
n
entre os valores que ocupam os postos a e p pode
2
ser considerado o centro da graduatória.
O problema é resolvido por uma convenção que con-
siste em tomar como mediana da graduatória a a
n
aritmética dos valores que ocupam os postos E e 3
“Considerando o número de casos de certa moléstia nos meses de

jane iro dos 6 últimos anos e ordenando-se os valores, tem-se:
24, 37, 41, 63, 68, 82
a mediana será, por convenção:
a + 63 = 52 casos,
2
ou seja. a média aritmética dos valores que ocupam os postos z =3.ºe
3º) A variável é contínua. Neste caso determina-se a mediana

calculando-se aquele valor da variável que divide a frequên-
cia total n-em duas partes iguais, não se levando em consi-
deração se n é-par ou ímpar. -
e aci-
Na tabela 4.4 a mediana será aquela idade abaixo da qual
jovens
ma da qual existem 20 indivíduos, isto é, 20 indivíduos são mais
e 20 são mais velhos do que aquela idade.
pre-
Desde que há 2 + 11 = 13 indivíduos com menos de 40 anos, é
se ter
ciso incluir 7 dos 10 indivíduos da classe 40 |- 50 anos a fim de
20 indivíduos. Se se imaginar que os 10 indivíduos da classe 40
50 estão nela distribuídos de maneira uniforme, então, desde que a eles
10
correspondem 10 anos, aos 7 indivíduos corresponderão 00”
7 anos, e a mediana será:
M = 40 + 7 = 47 anos, tendo-se usado o processo conhe-
cido como “regra de três”.
A mediana tem interpretação muito simples quando as observações

são diferentes umas das outras, porque ela é tal que o número de obser-
vações com valores maiores do que ela é igual ao número de obser-
com valores menores do que ela. Todavia, quando há valores repetidos,
a sua interpretação não é tão simples. Assim, admitindo como resultado
da aplicação de um teste a -um conjunto de alunos, as seguintes notas:
22,5,5,5,5,7,7,5,8,8,5,
a mediana seria a nota 5 e, no entanto, só existem 2 notas menores e
4 maiores do que 5. Esta desvantagem, unida ao fato da inadequacidade
da sua expressão para o manejo matemático, faz com que, em aná-
lises estatísticas, a mediana seja menos utilizada do que a média aritmé-
tica. No entanto, casos existem nos quais o emprego da mediana faz-se
necessário; assim:
80
— Nos casos em que existem valores aberrantes, pois estes têm
sobre a mediana muito menor influência do que sobre à
média aritmética.
Se na graduatória:
24, 37, 41, 52, 63, 68, 82
em lugar de 82 houvesse 1.000 casos, isto é,

24, 37, 41, 52, 63, 68, 1.000,
o valor da mediana manter-se-ia o mesmo, 52 casos, ao contrário do
do que aconteceria com a média aritmética, que passaria de 52,4 casos
a 183,6 casos.
Estes valores aberrantes aparecem com fregiiência nas variações

sazonais, como se tem oportunidade de estudar em Epidemiologia.
— Nos casos em que na distribuição em estudo a primeira ou
última classe (ou ambas) tenham, respectivamente, o extremo
inferior e o extremo superior indefinidos e o centro da distri-
buição não esteja contido em nenhuma delas. Nestas condições
é possível determinar a mediana, o que não acontece com a
média aritmética.
— A mediana é muito usada em toxicologia, na determinação da
lose que é capaz de matar 50% dos indivíduos, isto é, dose
mediana letal, ou DL 50
Além da mediana que, por definição, divide um conjunto ordenado
de valores em duas partes iguais, existem outras medidas que dividem o
conjunto de valores em 4, 10 e 100 partes iguais. Conquanto estas
* medidas não sejam de tendência central, elas podem ser consideradas
medidas de posição, uma vez que fornecem pontos à esquerda ou à
direita, dos quais são encontradas frações da fregiência total. Esta
é a razão de serem introduzidas, neste capítulo, estas medidas.
Os três quartis são definidos como os valores que dividem o con-
junto ordenado dos valores de X em 4 partes iguais; 25% dos valores
são menores do que o primeiro quartil, que denota-se por Q,; 50%
dos valores caem abaixo do segundo quartil, Q, (mediana), e 75%
dos valores são menores que o terceiro quartil, Qs. O cálculo de um
quartil se faz de maneira análoga ao cálculo de uma mediana, com a
n 3n
diferença de que é necessário contar = valores para se achar Q, e =
para determinar Qs.
81
Decis são valores que dividem o conjunto ordenado dos valores
da variável NX em 10 partes iguais, isto é, 10% das observações caem
abaixo do primeiro decil, etc.
-Percentis são valores que dividem o conjunto ordenado dos valores
de X em 100 partes iguais.
4.1.3 Moda ou norma
Dada uma distribuição de fregiiências, a moda — que se repre-
senta por M, — é o valor da variável que corresponde à frequência
máxima, isto é, é o valor mais frequente, daí o seu nome.
Conquanto o seu significado seja o mais simples possível, a moda
nem sempre existe e nem sempre é única. Quando numa distribuição
existem poucos valores da variável, muito fregiientemente não há va-
lores repetidos, com o que nenhum deles satisfaz à condição de moda.
Se os pesos (em quilos) correspondentes a 9 adultos são:
82, 65, 59, 74, 60, 67, 71 e 73,
estas 9 medidas não definem uma moda.
Por outro lado, a distribuição dos pesos de 15 adultos:
63, 67, 70, 69, 81, 57, 63, 73, 68, 63, 71, 71, 71, 83
possui duas modas, a saber: Mo = 63 quilos e Mo = 71 quilos. Neste
caso a distribuição diz-se bimodal. Será unimodal no caso de apresen-
tar uma só moda e multimodal se apresentar várias modas.
Uma outra limitação ao uso da moda é a sua instabilidade de “um
conjunto de observações para outro.
É interessante notar que a moda pode ser usada como uma me-
dida de tendência central também no caso de a variável considerada ser
De fato, quando se diz que as doenças car-
de natureza qualitativa.
certo ano, isto
díacas constituíram a causa principal de mortalidade em
quer dizer que na distribuição dos óbitos, segundo a causa mortis, às
doenças cardíacas correspondeu um maior número de óbitos, isto é, a
rubrica “doenças cardíacas” é a moda da distribuição.
Em se tratando de distribuições de dados agrupados, isto é, de
classes de valores, a moda pertence à classe de maior fregiiência. Resta,
para re-
todavia, saber qual o valor da classe que deverá ser escolhido
moda, neste
presentar a moda. Relativamente simples, o cálculo da
caso, é dado por:
1
= t —
Me de ti + £
onde L é o extremo inferior da classe em que está
a moda, t é a am-
plitude , desta classe, f, c f, são, r espectivamente, as fregiências
das clas-
ses adjacentes à classe da moda,
Assim, na Tabela 4.4, a moda
está na classe 30 |—— 40, logo,
L=30
t =10
fi=2
fa = 10
e, portanto,
M = 30 + 10x
10
' =30
+ —
+ 10 6
= 30 anos + 1 ano e 8 meses

= 31 anos e 8 meses
= 31 anos completos.
Para finalizar, deve-se chamar a atenção para o fato de que o valor

da moda, em se tratando de dados agrupados, é fortemente afetado
pela
maneira como as classes são constituídas.
4.1.4 Média geométrica
A média geométrica de uma distribuição de frequências, e que se

representa por G, é dada por:
n/ f
G = nt. nb
Aplicando logaritmos:
log O ou PE fadiga me 2 o Ve
n
k
> (log x) fi
i=t
,
n
OU seja, o logaritmo da média geométrica é a média aritmética dos lo-

Baritmos dos valores da variável X.
83
A media g ica é usada princip em p envol-
vendo mudanças proporcionais. Em Demografia, para se estimar a
população de determinada localidade num ano ts, quando se supõe cres-
cimento geométrico entre dois censos, usa-se a fórmula:
t—t
p= pele)" =»
onde P, é a população do primeiro censo, realizado na data to, P; é a

população do 2.º censo, realizado na data ty, € P, é a população que
se quer determinar na data t;.
Se se quiser determinar a população no centro do período t; — to,
isto é, para
. t+t
nº
então
th+t th —t
t—t= 2 t 2
Logo,
= 1
E Dq E » e P, torna-se:
tb — t 2
&
Pyz P
p= P(S) =RVp=
=v PP,
Ou seja, P, é a média geométrica de P, e P;.
4.1.5 Média harmônica
A média harmônica de uma distribuição de fregiiências, que será repre-

sentada por H, é o inverso da média aritmética dos inversos dos va-
lores de X.
84
Assim, para uma distribuição de freglências pode-se escrever:
1 n
H = E
E
1 f
1
> | fi
ist il
n
Esta média, como a média geométrica, só é aplicada a certos tipos
de problemas.
Suponha-se que um carro percorresse os primeiros 10 quilômetros

à razão de 30 quilômetros por hora, e os 10 quilômetros seguintes à
razão de 60 quilômetros por hora *. À primeira vista muitos pensa-
30
riam que a velocidade média seria igual a EE = 45 quilômetros
por hora.
Entretanto, ao se recordar que a velocidade média é definida como
a distância total percorrida pelo tempo gasto no percurso, é fácil perce-
ber que o resultado anterior é incorreto.
À razão de 30 quilômetros por hora, o carro gastou 20 minutos
para percorrer os primeiros 10 quilômetros, e à razão de 60 quilômetros
por hora, gastou 10 minutos. Portanto, o carro percorreu um total
de 20 quilômetros em 20 + 10 = 30 minutos = 0,5 hora, ou seja,
a uma velocidade média de:
20
0,5
— = 40 q quilômetros P por hora
Este resultado teria sido obtido diretamente calculando a média

harmônica entre as duas velocidades, ou seja:
2 2 120
H=D———
E-— E —— = 40 quilômetros
1 1 3 3 por hora
30 60 60
A média harmônica é muito usada em Economia, na construção
dos chamados números índices.
* Freund, J. E., Modern Elementary Statistics, New York, Prentice Hall,

Inc. 1952, pp. 71-73.
8s
4.2 Medidas de variabilidade
ou de dispersão
Sejam A e B duas localidades com a mesma renda média por ha-

bitante. Este simples fato de igualdade das duas médias permite con-
cluir que à situação econômica das duas localidades é a mesma? Evi-
dentemente que não, pois esta igualdade poderia existir mesmo que A
fosse perfeitamente estabilizada no sentido de que todos os seus habi-
tantes tivessem praticamente a mesma renda (igual à renda média por
habitante) e B tivesse uns poucos indivíduos com rendas extraordina-
riamente altas e a maioria com rendas muito baixas. Este simples
exemplo basta para mostrar que o conhecimento da intensidade dos va-
lores assumidos por uma grandeza, isto é, da posição de uma distribui-
ção, não é suficiente para a sua completa caracterização.
O fato de em A todos os indivíduos terem a mesma renda pode
ser traduzido dizendo que em A as rendas não variam de indivíduo
para indivíduo, ou ainda que a distribuição das rendas não apresenta
variabilidade. Analogamente, o fato de em B alguns indivíduos terem
rendas muito elevadas em detrimento da grande maioria, que tem ren-
das muito baixas, pode ser expresso dizendo-se que em B as rendas
variam ou que a distribuição das rendas apresenta variabilidade.
Neste sentido, várias medidas foram propostas, e a seguir serão
estudadas algumas delas.
Este estudo pode ser feito considerando:
i) medidas que se baseiam em apenas alguns valores da distri-
ii) medidas que se baseiam em todos os valores da distribuição.
4.2.1 Medidas que se baseiam em apenas alguns valores da

distribuição Í
Amplitude de variação é a diferença entre os dois valores extremos
da distribuição.
- Evidentemente esta medida é muito precária, pois a amplitude não
dá informe algum a respeito da maneira pela qual os valores se distri-
buem entre os valores extremos. Assim, nos dois conjuntos de valores:
4,6,6,6,8
4,5,6,7,8
a amplitude de variação é a mesma e iguala 8 — 4 = 4e, no entanto,
as dispersões destes dois conjuntos são diferentes. Além disso, os va-
Jores mínimo e máximo, estando muito sujeitos às flutuações de amos-
tras, fazem com que a amplitude da distribuição fique igualmente sujeita
a tais flutuações. Assim, por exemplo, se existir uma série de indivi-
EE cujos pesos oscilam entre 50 e 80 quilos. o aparecimento de um
ico que pese 110 quilos fará a amplitude passar de 30 a 60.
Amplitude semiquartil. Esta medida, que se baseia na posição
ocupada pelos 50% centrais da distribuição, é definida por:
Q=
Q: — Q,
2
onde Q; e Qs são o primeiro e o terceiro quartis.
Esta medida, conquanto se baseie também em apenas dois valores,

apresenta sobre a anterior a vantagem de não estar tão sujeita às flu-
tuações amostrais quanto os valores extremos.
A dispersão poderia ser medida pela amplitude quartil, ou seja,
O; — 'Q:; todavia, a seta por 2 dá a distância média pela qual os
quartis se desviam
4.2.2 Medidas que se baseiam em todos os valores da distribuição

Neste caso, dois são os caminhos propostos para medir a dispersão
de uma distribuição: o primeiro toma como ponto de partida a diferen-
ça dos valores da variável entre si e o segundo parte da diferença entre
cada valor e a média aritmética da distribuição.
As medidas que se baseiam na diferença dos valores da variável
entre si partem do fato de que, se não houvesse variação, todos os
valores da distribuição seriam iguais entre si e, portanto, a diferença
entre eles seria nula. Assim sendo, qualquer diferença não nula entre
dois valores representa um fator de variação. Fazendo, então, a dife-
rença de cada valor x, (i = 1,2,...,n) com os (n-1) restantes,
obtém-se um conjunto de n (n-1) valores, cada um dos quais é um in-
dício de variação.
Desde que a variação média não pode ser obtida pela feitura direta
da média aritmética destes valores, uma vez que a soma deles seria
sempre nula, para contornar esta dificuldade lança-se mão de dois re-
cursos:
1.º) Definir a média aritmética dos módulos (valores absolutos) das

diferenças, que recebe o nome de diferença média simples:
n n
> [mm — |
Elo já
n (n-1)
87
2.º) Definir a média dos quadrados das diferenças, que recebe o no-
me de diferença média quadrática:
n n
3 Sam
lo jeil
on (n-1)
Estas duas medidas são pouco usadas pelo fato de ambas envol-
verem n (n — 1) diferenças, o que mesmo para n não muito grande
equivale a um número grande de diferenças. Assim, numa distribuição
de freqiências com 10 observações diferentes, haveria 10 x 9 = 90
desvios. Além disso, a diferença média simples não é de fácil trata-
mento algébrico.
As medidas que se baseiam na diferença entre cada valor e a mé-
dia' da distribuição partem do fato de que a média aritmética é o valor
que todas as observações teriam se fossem iguais entre si. Uma vez
introduzida a noção de variabilidade, esta propriedade poderia ser ex-
pressa dizendo-se que a média aritmética é o valor que todas as obser-
vações teriam se não houvesse variabilidade. Daí resulta que o desvio
(diferença) de cada observação para a média aritmética representa o
quanto as observações variam com relação à média. Nada mais natu-
ral, portanto, que definir uma medida de variabilidade baseada nestes
desvios.
A primeira idéia foi calcular a média aritmética destes desvios, ou
seja, mais concretamente, se as observações tivessem os valores:
1,2,3,4,5
cuja média é x = 3, calcular-se-iam as diferenças, como mostrado na
tabela 4.5,
Tabela 4.5 Diferenças entre as observações e a respectiva média.
x g—
1 1-3=-2
2 2-3=-1
3 3-3- 0
4 4-3= 1
5 s-3= 2
Total sG-D=0
obtendo-se para a medida de variabilidade:
5 /
a qual indica que na distribuição acima não existe variabilidade.
É fácil ver que esta medida, que se apóia num argumento lógico,
leva a uma informação errônea sobre a variabilidade.
A explicação deste fato reside na quarta propriedade da média
aritmética, que diz que a soma de todos os desvios das observações para
a média aritmética é nula. Por esta razão, a simples média aritmética
dos desvios não pode ser usada como medida de variabilidade.
Ao se atentar para o fato de que a soma dos desvios é sempre
igual a zero, porque a cada desvio positivo corresponde um desvio igual
mas de sinal contrário (ver coluna 2, tabela 4.5), compreende-se que
a situação pode ser contornada calculando-se a média dos módulos dos
desvios. No primeiro caso ter-se-ia:
x (4 — 3) (x — 3?
1 —2 4
2 -—1 1
3 0 o
4 1 1
$ 2 4
Total 0 10
A emo «16
e a medida de variabilidade seria a = 1,2, a qual recebe o nome de
desvio médio, que, por motivos de ordem teórica, quase não é usado.
No caso de usar-se a média dos módulos dos desvios. ter-se-ia:
x (4 — 3) n=—
1 =2 2
2 -1 1
3 õ 0
4 -1 1
s -2 2
Total 0 6
Varância e desvio padrão
A variância (s?) será a média dos quadrados dos desvios, 2 =2
Se se extrair a raiz quadrada da variância, ter-se-á + V2 =1,41

que recebe o nome de desvio padrão.
O desvio padrão que se representa por s é:
k
> (x — E) f
s=+ a = + wvariância
n
é a raiz quadrada positiva da média dos quadrados dos desvios contados
a partir da média aritmética; x,, xo, -.... x« podem ser os valores indi-
viduais da variável X ou os pontos médios das classes.
Esquematicamente:
x f m- (x — 32 (x — WD f
x f m—X GG —3?2 (q — 32 £
x £ x —R (x — D2 (x — R)2 £
x fo x —kX (x — 3)2 Gy — D2£
x fe x —X (x; — 3)2 (x; — 32 fr
k k
Total n= > f za - Dt
j=i is
Retornando à tabela 4.4, as etapas para o cálculo da variância (s?)

PE
ças pipipe (s), lembrando-se que a média aritmética foi igual a
90
Valores
ex
(anos)
anÉ édi
6 GD &
G-B G-3S ag ci
20 |— 30 25 2 — 22,5 506,25 1.012,50

30 |— 40 35 1 — 12,5 156,25 1.718,75
40 |— 50 45 10 -— 25 6,25 62,50
50 |— 60 55 9 + 75 56,25 506,25
60 |— 70 65 8 + 17,5 306,25 2.450,00
Total 40 5.750,00
k
Sm — BD
g ==D
À — O
=D e= RO143,75 Eanos
n 40
s= VS =ãÃvy 143,75=11,99anos
Considerações finais sobre o desvio padrão:

1. A expressão anterior pode ser posta sob uma forma mais cô-
moda para efeito de cálculo, isto é,
k
+ vn to — (Dut)
Fl il
Aplicando-se os dados da tabela 4.4 nesta expressão, onde:
n = 40
k
> x & = 96000
FI
2
k
3x8) = 361000
Es
sn
+ v 40x96.000 — 3.610.000 = 11,99 anos.
“40
* O desvio padrão é uma quantidade essencialmente positiva,
3. O desvio padrão só é nulo se todos os valores da distribuição fo-
rem iguais entre si, isto é, se não houver variabilidade.
4. Se a distribuição de fregiiências considerada se referir não a ya-

lores, mas a classes de valores, o desvio padrão será calculado
usando-se os pontos médios das classes.
S. O desvio padrão pode ser calculado pelo método rápido para o
cômputo da média aritmética. De fato, definindo-se a variável
auxiliar:
e portanto
=ts,
onde s, e s, são, respectivamente, os desvios padrão de X e de Y.
6. O desvio padrão é da mesma natureza da variável X e depende

também de sua magnitude.
Desta última consideração resulta que se se quiser comparar duas

distribuições quanto à variabilidade, deve-se lançar mão de me-
didas de variabilidade relativa, tais como o coeficiente de variação
de Pearson, dado por
s
os —
z
que independe da natureza e magnitude da variável X.
92
% j
Para exemplificar o uso deste ciente, suponha-se que, estu-
dando-se as distribuições de pesos de E ig
Nos, fosse
verificado que ambas têm a mesma variabilidade
(medida através do
desvio padrão) igual a 500 gramas, supondo-se, ainda que os pesos
dos recém-nascidos variaram de 2.200 a 4.800 gramas (com
um peso
médio de 3.500 gramas) enquanto os dos adultos variaram de
40 a 90
quilos (com um peso médio de 60 quilos).
Conquanto em termos absoluto as duas distribuições tenham a
ma variabilidade, é fácil perceber que 500 gramas têm significados
mes-
bem
diferentes nas duas distribuições. De fato, no caso dos recém-nascidos
o coeficiente de variação de Pearson será igual a
V== E
3500 a 0,1429
> = 14,29%
refletindo uma variabilidade relativa muito maior que para os adultos,

onde V vale:
. 50
v = 60000 = 0,0083 = 0,83%
Outra medida relativa de variabilidade é definida em termos da

amplitude semiquartil e da mediana, como segue:
(O — Qu) / 2
M
mas, por simplicidade, é costume usar o ponto médio entre Q, e
Q; em lugar da mediana, e o coeficiente de variação quartil fica definido
por:
Q; = o,
Vo =
O; E Q,
Esta medida de variabilidade relativa é, em geral, usada quando

a tendência central e a variabilidade são medidas em termos dos quartis.
43 Medidas de assimetria
Sejam P, A e P” três pontos dispostos sobre uma reta
P A P
93
Diz-se que P e P” são simétricos em relação a A se A for o ponto
médio do segmento P P, isto é, se as grandezas (P — A) e(P — A)
forem iguais e de sinais contrários.
Diz-se que uma distribuição de freqiiências é simétrica em torno

de um valor A se os pontos simétricos em relação a À tiverem a mes-
ma fregiiência.
Introduzida a noção de simetria, é interessante notar que, numa

distribuição simétrica, a média aritmética, a mediana e a moda coinci-
dem.
Quando do estudo da média aritmética e da mediana, foi visto

que a primeira é mais sujeita à influência de valores aberrantes do que
a segunda. Agora este fato pode ser expresso dizendo-se que, numa
distribuição assimétrica, a mediana deve ter preferência sobre a média
aritmética como medida de posição.
A posição relativa da média aritmética x, mediana M e moda Mo

numa distribuição assimétrica à direita (figura 4.2) é, em geral:
Mo M, X
30%
8
E
8
o 20%
v
E '
2 1
E I
8 I
ê 1
10% !
I
1
I
r
1
1
1
0% ” T : , T = =
! ..
0,00 100,00]300,00 500,00 700,00 900,00 Renda familiar

por mês
X= = 22300 (em Cr$)
M, = 145,00
Im = 190,00
Figura 4.2 Renda mensal de 3.000 famílias do Distrito de São Paulo, 1965.
Fonte: Dados preliminares do Estudo da Reprodução Humana no Distrito de

São Paulo, conduzido pelo Departamento de Estatística Aplicada da Faculdade
de Higiene e Saúde Pública da USP.
e, numa distribuição assimétrica à esquerda (figura 4.3), é

2 MM,
A discrepância entre estas três medidas fornece, portanto, um meio

simples de expressar a assimetria ou falta de simetria de uma distribui-
ção.
95
óbitos
2% —
de
Percantagem
T T T T T T T y
10 20 30 40 50 60 70 8o
Idade (anos completos)
M, = 65 anos
M= 61 anos
X = 60 anos
Fgira é 4.3 Óbitos por câncer do aparelho digestivo, segundo a idade, no muni-
cípio de São Paulo, 1954.
Fonte: Departamento de Estatística do Estado de São Paulo.
Pearson propôs uma medida de assimetria baseada na diferença en-

tre x e M,, dividida por s, a fim de obter um número independente
da natureza da variável, ou seja, um coeficiente, o denominado coefi-
ciente de assimetria de Pearson, dado por
Substituindo-se, nesta expressão, M, pelo valor dado = Pearson

para distribuições assimétricas, ou seja: My = 3 M
3 (x
— M)
sk =
5
Se a distribuição for simétrica, sk = O; se for assimétrica à direi-
ta, sk > O e, finalmente, se for assimétrica à esquerda, sk <
Outra medida de assimetria é dada por:
1 k
TDw- th
El
& = $
a qual será zero se houver simetria, positiva se houver assimetria à

direita e negativa se houver assimetria à esquerda.
4.4. Medidas de achatamento ou “curtose”
A figura 4.4 se refere a um exemplo no qual as

distribuições de
fregiiências foram construídas de modo a terem
a mesma média e o
mesmo desvio padrão e serem simétricas. Contudo,
elas diferem com
relação às suas alturas nas vizinhanças da média,
ou seja, duas distribui-
ções podem ter a mesma média e a mesma
variabilidade e simetria e
diferirem quanto a um novo aspecto, que é o
achatamento ou “curtose”.
—— (1)
megas (2)
Figura 4.4 Distribuições de fregiiências com médias e desvios

padrão iguais.
A soma das quartas potências
dos desvios a partir da média,
em distribuições que apresentam um aspecto
São (1) tende a ser maior do que semelhante ao da distribui-
aquela
qual esta soma pode ser usada como uma da distribuição (2), razão pela
distribuição.
medida deste novo aspecto da
97
A fim de obter uma medida que independa das unidades de me-
dida, esta soma é dividida pela quarta potência do desvio padrão, e
tem-se:
[Mr
Qu — D'f
n
q : (u- 3)? É
Uma distribuição diz-se mesocúrtica, leptocúrtica e platicúrtica

conforme, respectivamente, g = 3,82: > 3€eg <
4.5 Noções de correlação e regressão
Até este momento houve a preocupação de descrever uma distri-

buição de fregiiências de uma única variável quantitativa. Em pesquisas
que envolvem a consideração de duas ou mais variáveis, estas são es-
tudadas também simultaneamente, procurando-se uma possível corre-
lação entre elas, isto é, quer-se saber se as alterações sofridas por
uma das variáveis são acompanhadas por alterações nas outras. No
caso particular de duas variáveis X e Y, procura-se verificar se a au-
mentos (diminuições) em X, por exemplo, correspondem aumentos
(diminuições) em Y; ou se aumentos (diminuições) em X são acom-
panhados de diminuições (aumentos) em Y ou, finalmente, se os au-
mentos (diminuições) em X não estão relacionados com as altera-
ções em Y
Em outras situações, uma das variáveis apresenta um interesse
específico e as restantes são estudadas de modo a fornecer informações
sobre aquela variável em particular; o que se procura, na verdade, é
estabelecer uma relação funcional entre uma das variáveis e as res-
tantes.
4.5.1 Correlação
No caso de X e Y apresentarem variações em um mesmo sentido,

diz-se que entre elas existe correlação positiva; quando as variações
de X e Y são em sentidos contrários, trata-se de correlação negativa;
finalmente, quando a variação de X não está relacionada com a varla-
98
ão de Y, é o caso de não haver correlação. As figuras 4.5, 4.6 e
4.7 ilustram situações diversas de correlação entre duas , ariá-
veis. De fato, a figura 4.5, que se refere à cálculos feitos para he
pulações urbanas dos 21 Estados brasileiros e do Distrito Fed e
mostra que, se o Estado tem uma baixa esperança de vida ao ni E
tem também, em geral, uma baixa proporção da população de 14 anos
ou mais com curso primário completo. Ou seja, estas duas variáveis
estão correlacionadas no mesmo sentido, ambas, na verdade. associ.
das às condições sócio-econômicas das populações. é E
70
é.
Z o
33
é .
8 .
= e
E 50
s2 x e
vs
gó5o
sê e
”
225 40)! = quis
E .
Sã
89
aL
5
sê .
25 01 A
..
.
20 r=+ 08
30 40 E so 70 x
Esperança de vida ao nascer (em anos)
Figura 4.5 Correlação entre a esperança de vida ao nascer e a proporção da

população de 14 anos ou mais com primário completo, para a população urbana
los 21 Estados brasileiros e do Distrito Federal, em 1970.
Fonte: Singer, P. e colaboradores, O Controle Social Através dos Serviços de

Saúde, Forense Universitária, Rio de Janeiro, 1978.
99
A figura 4.6 refere-se à correlação negativa entre os coeficientes
de mortalidade infantil e as percentagens de mães das crianças faleci-
das que tiveram cuidados pré-natal nas 25 áreas dos 15 Projetos da
Investigação Interamericana de Mortalidade na Infância. Nesta figura
vê-se que os valores mais altos do coeficiente de mortalidade infantil
tendem a ocorrer em conjunto com as menores percentagens de mu-
lheres que fregientaram o pré-natal. Em última análise, as duas va-
riáveis estão correlacionadas em sentido contrário.
Coeficiente de mortalidade Infantil (x 1.000 nv.)
“o . .
. .
. .
. -
.
“04 .
E e
081
o
2” “o so Bo 10 X
% de mões com cuidados de pré-natal
Figura 4.6 Coeficientes de mortalidade infantil e percentagem de mães de crian-

ças falecidasque receberam cuidados de pré-natal em 2.
non: Puffer, R. R. e Serrano, C. V., Características de la Mortalidad en la

Washington, D. C., Organización Panamericana
de la Salud, 1973 (OPAS,
Pub Ciens., 226).
100
Na figura 4.7 pode ser apreciada uma situação onde as duas va-
riáveis — Ego de incidência de Câncer depel rá e de próstata,
P: SA Ç
próstata
de
te
câncer
de
de incidência
hab.)
(x 100 000
Coeficiente
2 r=— 001
0 1
24 6 810121416 1820222426283 x
Coeficiente de incidência de câncer de laringe
(x 100 000 hab.)
Figura 4.7 Coeficientes de incidência de câncer de laringe e de próstata (padro-

nizados) em algumas localidades, 1968/1972.
Fonte: Cancer incidence in five continents, vol. HI, IARC; Scientific Publication,
n.º 15, 1976 (adaptado), World Health Organization.
especial importância para o estudo da correlação entre duas

vitiras é a covariância, que mede a variação concomitante dessas
variáveis. Representada por Sy, a covariância entre X e Y é definida
por:
k k
ZQ-Dg-Dt DMyt-nzy
Fl FI
8y = = = E
BIBLIOTECA
FACULDADE DE MEDICINA DE 101
RIBEIRÃO PRETO DA U.S.P.
k k
Dat k=) nt
x il . il
aeZt La]
te J-——s
Para k pares de valores de X e Y, o procedimento para o cálculo
de s,, está ilustrado a seguir:
Vest a Valores
G-—-D G—-D o G—D(W—5)f
dx ey Sh
n & m- o n-—5 G—D
MW —9 6
pec rar
z y2y—Y G—%)
(yo — 7) £
perca pa
»
1
$
o
x H—y G—D (N—)) fr
ko k
Total n=5& SD w-Ds
is Fl
Alguns exemplos numéricos que serão apresentados têm a .finali-

dade de mostrar como se comporta a covariância em face da presença
ou não de correlação entre as variáveis X e Y.
Exemplo de correlação positiva:
x n K—* n—J G-Dy—D

1 3 ai ls 4
2 4 = 1 1
3 5 0 0 0
4 6 1 1 1
$ 1 2 2 4
s=10
102
A covariância neste caso tem sinal positivo.
Exemplo de correlação negativa:
x Yi x—X n—Y G—-D)(y,—)
1 a —2 2 — 4
2 6 —1 1 —1
3 5 o o o
4 4 1 —1 -1
5 3 2 —2 — 4
s=-10
— 10
Sy = o =-—2
A covariância neste caso tem sinal negativo.
Exemplo de não-correlação:
x Yi x — * n—y G-Dyg—)
1 3 —2 — 04 + 0,8
2 4 -—1 + 0,6 — 0,6

3 3 o — 0,4 o
4 4 1 + 0,6 + 0,6
5 3 2 — 0,4 — 08
s=0
A covariância é nula.
Vê-se que a covariância possui um sinal que coincide com o
sentido da correlação.
No exemplo dado para a correlação positiva, pode-se perceber que

entre as duas variáveis existe uma relação linear, isto é, Y = X + 2.
Quanto isto acontece, diz-se que a correlação é perfeita. Portan-
103
to, tem-se nesse exemplo uma correlação positiva perfeita. Do mesmo
modo, no exemplo dado para a correlação negativa pode-se ver que
entre Y e X existe a seguinte relação linear: Y = 8 — X. Portanto,
este é um caso de correlação negativa perfeita.
Conquanto a covariância dê, através de seu sinal, o sentido da

correlação. não pode ser usada por si só como medida sintética e ab-
soluta do grau de correlação entre X e Y, uma vez que é função da
ordem de grandeza das variáveis X e Y e varia, portanto, de menos
infinito a mais infinito. Por outro lado, duas situações apresentando
correlação perfeita positiva (negativa) podem apresentar valores dife-
rentes para a covariância.
Por exemplo: x/12345 Y=X+2

y!34567 Sy=+2
x/12345 Y=2X+1
yi35791 sy =+4
Portanto, a magnitude da covariância não pode por si só medir
o grau de correlação. Pearson introduziu, por isso, um coeficiente que
assume o mesmo valor para os casos-limite de correlação perfeita,
positiva e negativa, o qual é denominado coeficiente de correlação
de Pearson, definido pela expressão:
k
Dx-Dg- 6
r= Sry = Fl o
S& 8% k k .
3a = 36. DS pf
1 Fl
k
Dunt-nzy
Fl
/d /
> x fi — ne > ya fi — ny2
Fl Fi
x k k k
n > yf — Dx f) Dx f)
o. FI 1 E
k k k
A n3, nes - Cs: Hi nº) [n> y2 ft — OS Y e
it ist FI 1
104
A fórmula para o cálculo de r, colocada sob esta última forma, tem
a vantagem de realizar menos divisões, o que melhora a aproximação
no cálculo.
Como os desvios padrão s; e s, são sempre positivos, r mantém
o sinal da covariância. Estudando-o quanto à sua magnitude, tem-se:
a) Caso de correlação perfeita positiva:
2 2
S& =28S%=
4/12345 > +2 a
34567 Sy == DD =
X v2 v2
r será sempre igual a + 1 para a correlação perfeita positiva
b) Caso de correlação perfeita negativa:
d=u8=2
x/1 -— 2
| a
aj
jo
wa
7 SW=-B1=D>DD
“0-1
” VZ VE
Para a correlação perfeita negativa o valor de r será sempre
iguala — 1.
c) Caso de não-correlação:
u[12345 &=2 s = 0,8

y/24342 sy =0 r=0
Vê-se, portanto, que a correlação fica caracterizada pelo coeficien-

te de correlação de Pearson, que varia no intervalo:
-—1 0 +1
Correlação perfeita Não- Correlação perfeita

negativa correlação positiva
Deve-se insistir em que, em estudos de correlação, as variáveis

X e Y são medidas ou observadas simultaneamente para uma mesma
unidade de informação. Assim, no caso da figura 4.5, a unidade de
informação é um Estado da Federação em 1970; trata-se, portanto, de
um conjunto de Estados para os quais se tem a informação sobre X e
Y em um dado momento do tempo.
105
es o Spa * sobre a correlação entre o peso e à altura de
s de 7 anos, do sexo feminino, matriculados em 42 escolas da
rede municipal de ensino de São Paulo, em 1969, as variáveis antro-
pométricas Ne Y foram medidas simultaneamente para cada uma das
unidades de informação, que neste caso seriam constituídas por me-
ninas com as características acima referidas.
A sequência do cálculo da correlação entre as duas variáveis está
exemplificada na tabela 4.6. O valor obtido de r foi igual a + 0,87;
portanto, estão correlacionadas positivamente.
k
3 -DG-D b
Fl 438,80
Sy = - = = + 21,94
E 20
+ 21,94
p= SS =D =+087
Sz Sy 25,22
45.2 Regressão
perfeita
Os exemplos analisados mostram que uma correlação
relação
(positiva ou negativa) entre Xe Y só existe se houver uma
exata-
funcional perfeita, isto é, dado um valor a X, pode-se prever
mente o valor de Y. Quando isto acontece, diz-se que X e Y estão
modelo matemático, ou seja, Y = f (X).
ligados por uma função ou um
Na prática, entretanto, esta situação constitui uma abstração. O
que sucede é que, ao tentar explicar os valores tomados por Y como
decorrentes daqueles correspondentes assumidos por X, através de um
modelo matemático, o pesquisador verifica que entre o valor observado
de Y e o teórico previsto pelo modelo YT há uma diferença, isto é,
um resíduo. Isto é devido, em parte, ao fato de que dificilmente o conhe-
cimento sobre um fenômeno é tão completo a ponto de permitir a in-
clusão em um modelo de todas aquelas variáveis que podem explicar as
alterações em Y. Por outro lado, as observações feitas diretamente sobre
inves-
Y estão sujeitas a erros de mensuração. Por tudo isto, no nível da
tigação empírica, tem lugar um modelo do tipo:
YWr=1(X)+u
o resíduo. Trata-se, portanto, de um modelo estatístico.

onde u mede
doutoramento, Fa-
* Rosenburg, C. P. Merenda Escolar e Crescimento, tese de
culdade de Saúde Pública, USP, 1972.
1N6
*(epeidepe)
107
TL6I “ASN “PoljQNA SPNES Sp opepinoe; “ojuouimIonop ap 259) “ojuaujosa4) 2 4Dj09S DpuaMaW “d “O Tinquesou :MUOA
Oz'680:1 po'cez os'aep oz sec NS =E
PTTeE Th'zo sL'epr t'sI 6L+ I opI vce
+h'szr TULE te'g9 UI T'9+ 1 £EI 9TE
+e'E sto os'p— 8T— st+ I ozI o'gz
+o'ce sto [A 8's— st+ I 91 o'gz
Pre es 9e'pt 9 ET+ I ser sz
vo'pg 68 vast v6 LI+ I rEI TLT
v'p 68 vL'E uz LI+ 1 vet ULT
vOLT 1 tis Ts TI+ 1 LT 997
+90 A! s80— 80— TI+ I ri 99
voo sto 90'0+ vo so+ I ti o'9z
voo 60'0 or'o+ vo €o+ I ti 8'st
+8'p 60'0 99'0— cc €'0— I +zl Tsu
+rI 60 veto— TI L'o— I ELI s'yz
+90 180 t'o so— 60— 1 NI 9'pz
v8L Iy'8 ts st— 6— I 6LL 9
vet sul o€'EL g€— se— I si o
+8'09 I8'91 sete 8L— Vy— I vIL vIZ
voou I891 ser so1— Vp— 1 u vz
sue tos 9WOLI + 9IT— tvol— z HI voz
FA Sexto) HAM 4-4 Ya) Y 4 x
E * (wo) emiy (3%) od
*(ogôejosioo É Jogo eIed ojnojgo ap erougnbas uIoo) 6961 “ojneg ogs 9)
(sejoosa zy) ouisuo op jediorunm ºPol EU sopenoLem “ourmuios oxos op “sour 4 op E iujõas ep
a 2 oa ' Er Po
O modelo estatístico mais simples é aquele que expressa Y como
função linear de X. isto é, dados n pares de valores (xy, e
(us Yr). admite-se que:
w=a+Bx+u
onde 3 é o coeficiente angular e a o coeficiente linear.

O modelo acima diz-se regressão linear simples de Y em X. Nestes
termos, 8 é o coeficiente de regressão de Y em X ou simplesmente coe-
ficiente de regressão. Uma vez que a e 8 são desconhecidos, o primeiro
passo para resolver o problema proposto — prever um valor de Y
para um dado valor de X — consiste em estimar estas duas quanti-
dades. Isto é conseguido através do ajuste, aos dados empíricos, da reta:
fi=a+ by
onde $, é um estimador de yT e a e b são estimadores,* respectiva-
mente, de a e B.
do-se por e; o desvio entre um valor observado y, e um
valor pec fr, isto é, e = yy — 9 a e b são determinados de tal
n
maneira que seja mínima a quantidade: x e2, ou seja, a e b são
=1
os valores que minimizam a soma de quadrados:
n n
DSw-Mr=5m- (+ by)P&
Ei il
Demonstra-se que a solução deste problema pelo método dos mí-

nimos quadrados adotado é dada por:
a=y-—bz
n n
DSG -Dya-D E > xt — ny
1 i=l
b= =
n n
3 — *)2 £ > xif, — nã
o pressões “estimar”, “estimativa” e “estimador” serão explicados no capí-

19.
108
Com isto, os valores de 9, podem ser calculados pela reta ajustada.
A figura 4.8 mostra, esquematicamente, os modelos considerados.
4
, Di
Yi
Fda =0+ a fx, +u. +
O gui = ui
Figura 4.8 Reta teórica e reta ajustada da regressão de Y em X.
Vale a pena observar que o coeficiente de regressão de Y em

X,
da reta ajustada, b, não seria o mesmo se se tratasse
da regressão de
X em Y. Denotando-se por b' o coeficiente da reta de regressão ajus-
tada de X em Y, ter-se-ia:
n
Gy -—? &
= 1
Day - ps
it
Neste ponto reside uma das diferenças entre a correlação e a re-
gressão, pois para o coeficiente de correlação existe simetria, isto é,
a entre X e Y é a mesma que entre Y e X.
Lembrando-se a definição de r, pode-se escrever:
r=4E
Sy
Daqui é fácil perceber que, se não houver correlação entre X e

Y, isto é, ser = 0, então: b = 0, isto é, a reta de regressão de Y
em X é paralela ao eixo dos X.
Pode-se demonstrar que o quadrado do coeficiente de correlação,

12, em termos do modelo ajustado, pode ser expresso da seguinte ma-
neira:
Za -nº&
i=l variação “explicada” pela regressão ajustada
= n o variação total
Din — nº 6
i=l
isto é, r? mede a proporção de variação total de Y, que é explicada

através do ajuste do modelo linear. Para um número fixo n de obser-
vações, quanto melhor for o ajuste dos dados tanto maior será o valor
de r?. Portanto, r? pode ser vista como uma medida descritiva da qua-
lidade do ajuste obtido, recebendo o nome de coeficiente de determi-
nação.
Outra maneira de se aquilatar a qualidade do ajuste de uma reta

aos dados observados é através do coeficiente de variação, definido por:
E n
/ Sw - 4)?
isl
y
De fato, esta quantidade compara a variação dos valores de Y em
torno da reta ajustada Y com o valor médio de Y, fornecendo uma
medida relativa do ajuste. Este ajuste será tanto melhor quanto menor
for o valor do coeficiente de variação CV.
Exemplo
No estudo de Cain e Belk* que se refere à quantidade de assi-
milação de glucose injetada por via intravenosa em pacientes hospitali-
zados (tabela 4.7), caso se pretendesse ajustar uma reta, ter-se-ia a
seguinte seguência**.
Tabela 4.7 Quantidade de glucose injetada (via endovenosa) (X) e glucose retida
(Y) em gramas por quilo de peso por hora, em 18 pacientes hospitalizados.
Número do caso Glucose injetada (X) Glucose retida (Y)

1 0,073 0,072
2 0,159 0,154
3 0,222 0,217
4 0,390 0,290
5 0,463 0,458
6 0,512 0,500
7 0,753 0,686
8 0,926 0,832
9 1,130 0,820
10 1,160 1,040
“ 1,193 0,871
12 1,301 1,065
13 1,323 1,132
14 1,460 1,430
15 1,590 1,440
16 1,824 1,307
17 1,960 1,953
18 2,216 1,565
Total 18,655 15,832
Fonte: Cain, J. C. e Belk, W., “The Assimilation Rate of Intravenously
Glucose in Hospital Patients, Am. J. Med. Sciences, v. 203, n.º 3, Injected
1942.
Esses dados, projetados num gráfico, dariam o aspecto seguinte:
* Cain, J. C. e Belk, W., “The Assimilation Rate of Intravenously

Glucose in Hospital Patients,
Injected
Am. J. Med. Sciences, v. 203, n.º 3, 1942.
** Não se considerou no exemplo a situação em qu
deveria passar pela origem (para x = 0 le a reta obrigatoriamente
tem-se y = 0)
m
20 e
A =0,0462+0,8041 x;
Glicose retirada (g/kg)
0,04 T T T T
0.0 0,4 0,8 1,2 36 20 24
Glicose injetada (g/kg)
E a tabela 4.8 mostra os passos para o cálculo.

n= 18
= 18,655 15832
= = 1,0364 7= = 0,8796
18 18
> uy—nRy
b= E < 22,0588 — 18x1, ,
8 x 1,0364 x 0,8796 = 0,8041
n 26,3606 — 18 x 1,03642
3x -nz
Fl
a=y-bz
a = 0,8796 — 0,8041 x 1,0364 = 0,0462
donde,
fi = 0,0462 + 0,8041 x,
112
n3
: . y Te!
eesorzee = (1450) S rrogtar81 == ! 4 $ 909E'9T ==, ;X &
o89pE om
6LTS'E sá s'€ a É
€goL'1 ' oLtE'
orxeé
ObRE'T
968TT 9ELO'T, es ã
8.80% sproizX ré á
guri
9.641 vIgTI:' £osL'I 4
cost
SER tel É 97691E
98sL'0 '
poci
+01 par
91801 9spE'L
Se90
pesa : 69LTT
' Tzo90 É
9915'0 90LH'0 ISO
us
ogst'o oosT'oj Izov'o
pa
' 8607'0 i
TETO 1hg0'0 E
zevo'o ILvo'o DO
spzo'o LETO'O oo
Es00'0 ts00'0 €s00'0a
Hx
:A o 1
A x
“Lp “joqe ep sopep so ted ejos eun op ojsnfe( o eied sossed Sp DJqoi
Capítulo 5
Noções sobre a teoria das probabilidades
Os estudos apresentados nos capítulos anteriores

incidiram sobre
a finalidade descritiva, isto é, visaram descrever as características de
amostras efetivamente observadas. A partir de agora, passa-se ao estudo
da inferência ou indução estatística, isto é, generalizar para o universo
ou população correspondente as conclusões obtidas a partir da amostra.
Neste sentido, o cálculo das probabilidades é fundamental, razão por que
se passará a apresentar algumas noções básicas sobre a teoria das pro-
babilidades.
Esta teoria, que presentemente é um importante ramo da matemá-
tica pura, teve um começo bastante modesto. Suas raízes vêm de uma
simples teoria matemática dos jogos de azar iniciada em 1654,
quando o jogador De Mêre propôs ao matemático Pascal suas
célebres perguntas a respeito dos jogos de azar. Desde então,
a teoria das probabilidades percorreu um vasto inho.
longa evolução, o próprio conceito de probabilidade — de que
todos têm uma idéia intuitiva como medida da atitude de dúvida
do espírito humano diante de acontecimentos que podem ou não se rea-
lizar — passou por diversas fases. Igualmente, o campo de aplicação
da teoria sofreu ampliações notáveis; como teoria que se ocupava, de
início, com dados, lances de moedas, retiradas de cartas, sorteios loté-
ricos, etc., passou ela, pouco a pouco, a constituir o fundamento da
estatística, da atuária e outros ramos do conhecimento.
O motivo desta considerável extensão do domínio aplicativo en-
contra sua explicação no que se segue. Havia sido observado que em
todos os jogos habituais com dados, cartas, etc., a frequência de fixado
resultado de um jogo parecia acumular-se nas vizinhanças de algum
valor definido quando o jogo era repetido um grande número de vezes
e a tentativa de explicar fatos desta natureza foi, como se aludiu, a causa
imediata da origem e primeiros desenvolvimentos da teoria matemática
da probabilidade, nas mãos de Pascal, Fermat, Huygens e James Ber-
noulli. Mais tarde, o mesmo tipo de regularidade foi verificado com
dados demográficos de vários tipos. Gradualmente, o campo de obser-
vação do referido fato empírico — conhecido pela denominação de
115
“estabilidade das frequências relativas em longa série de observações”
— foi-se alargando a ponto de hoje se poder considerá-la uma carac-
tenstica geral dos “experimentos casuais” realizados sob condições uni-
formes.
observações”, mas
Ao se analisar não mais “uma longa série de
“uma observação”, a situação é bem diferente.
as
E sabido que há fenômenos em que Os conhecimentos sobre
de predições
leis que os governam são de molde a justificar a feitura acon-
Assim
exatas quanto ao resultado de cada observação individual.
do sol visíveis em um
tece. por exemplo, no caso do número de eclipses
por cálculos de
determinado observatório num certo ano, quando,
Na grande
astronomia, pode-se predizer o valor do referido número. sufici
maioria dos casos, o heci não é
indivi-
preciso para permitir predições exatas quanto às manifestações
exemplo, no caso
duais de um dado fenômeno. Esta é a situação, por
será cara
de um experimento consistente em lançar ao ar uma moeda:
ou coroa?
Isto ocorre em razão do fato de que, numa segiiência de repetições

do mesmo experimento, o resultado varia de uma observação para outra
de uma forma tão irregular, que frustra qualquer tentativa de predição.
Este estado de coisas permanece, ainda que se tenha o máximo cuidado
em controlar todas as possíveis circunstâncias relevantes para o resul-
tado do experimento; assim, se no primeiro lance resultou cara e no
seguinte se tenta dar à moeda exatamente o mesmo estado inicial de
movimento, não é possível assegurar, no lance sucessivo, que a moeda
cairá com a face “cara” voltada para cima. Mesmo que se tentasse
construir uma máquina para lançar a moeda com regularidade máxima,
o resultado flutuaria ainda de um modo incontrolável de lance para
lance; a explicação disto é que regularidade máxima não significa regu-
laridade perfeita; efetivamente, por maiores que sejam os esforços ten-
dentes a aumentar a precisão do mecanismo para a homogeneidade do
lançamento, praticamente só é possível atingir uma certa aproximação e
dentro dos limites desta sempre haverá espaço para vários estados ini-
ciais. Ora, posto que variações do estado inicial, ainda que extrema-
mente diminutas, devem ter uma influência dominante no resultado,
compreende-se por que uma exata predição é praticamente impossível.
Pois bem, fenômenos como o acima mencionado, nos quais, mal-
lo todos os esforços para controlar as circunstâncias relevantes, não
é possível prever com exatidão o resultado das manifestações indivi-
duais, recebem o nome de fenômenos casuais. É claro que com isto “ca-
sualidade” não foi definida, mas apenas descrita.
116
Aliás, não parece mesmo possível dar uma definição precisa do
que se entende por “acaso”, título pomposo,
para a palavra “ignorância”. Assim sendo, deixa-se de parte esta
ques-
tão, substituindo-a pela mais proveitosa de dar alguns exemplos de
grandes e importantes grupos de experimentos casuais.
Nesta ordem de
idéias, começa-se por dizer que, segundo as teorias biológicas moder-
nas, o fenômeno da hereditariedade mostra, em importantes aspectos,
uma marcante analogia com os jogos de azar. As combinações que
se
dão no processo de fertilização parecem ser reguladas por um meca-
nismo relativamente semelhante ao que preside o lançamento de uma
moeda. Como no caso da moeda, variações extremamente diminutas na
posição inicial e no movimento dos gametas podem produzir grandes
diferenças nas propriedades dos descendentes; em conformidade com
isto, encontra-se, por exemplo, com relação. ao sexo dos descendentes,
a mesma impossibilidade da predição e as mesmas “flutuações casuais”
do caso da moeda.
Também no campo antropométrico e econômico encontram-se fe-
nômenos, como a altura de animais ou o preço de mercadorias, em que
a situação parece ser em muito análoga à dos exemplos precedentes;
as leis que governam estes fenômenos não são, num ou noutro caso,
suficientemente conhecidas, e mesmo que fossem conhecidas em exten-
são maior do que a atual, a estrutura de cada caso é tão complicada que
uma predição da manifestação individual apareceria ainda praticamente
impossível; consegiientemente, as observações mostram, nestes casos, a
mesma espécie de irregularidade casual.
Finalmente, é fato cediço que, a despeito de todas as precauções
tomadas por um observador a fim de tornar tão uniformes quanto
possíveis as condições relevantes externas durante uma série de medidas
de uma constante física, as sucessivas mensurações originam, em geral,
resultados distintos. Este fenômeno é comumente adjudicado a um com-
plexo de pequenos fatores perturbadores, de natureza mais ou menos
indeterminada, que atuam num ou noutro sentido e que combinam os
seus efeitos em um certo “erro” total afetando cada medida particular:
O montante deste erro flutua de uma observação a outra de um modo
errático que torna impossível predizer o resultado de uma dada medida.
Considerações semelhantes aplicam-se ao caso de flutuações de quali-
dade de produtos manufaturados; pequenas e incontroláveis variações
no processo de produção e na qualidade das matérias-primas combinam
seus efeitos e produzem flutuações no resultado final.
Porém, seja qual for o mecanismo explicativo — pequenas varia-
ções no estado inicial, o caráter complexo das leis que governam os fe-
nômenos ou a ação incontrolável de pequenos fatores perturbadores —,
o que importa na individualização dos fenômenos casuais é o caráter
97
errático das flutuações encontradas em seqiiências de resultados obtidos
essencialmente sob as mesmas condições, e consequentemente a impos-
sibilidade de predição exata de suas manifestações individuais.
8.1 Noções elementares sobre a teoria dos conjuntos
Para a introdução do conceito de probabilidade, torna-se necessá-

ria a consideração da teoria dos conjuntos. Por esta razão, far-se-á
aqui uma breve recapitulação de alguns aspectos desta teoria.
Conjunto é um conceito primitivo, isto é, aceito sem definição,
uma vez que na Matemática não se dispõe de conceitos anteriores sobre
os quais basear sua definição. Até fins do século XIX e começo do sé-
culo XX, esta dificuldade foi contornada pelos matemáticos tratando
os conjuntos intuitivamente. Na concepção moderna, os conjuntos podem
ter elementos ou membros.
Um conjunto está bem definido se existir um critério mediante o
qual seja possível, dado um elemento qualquer, dizer se ele pertence
ou não ao conjunto. São bem definidos: o conjunto dos números pares;
o conjunto dos hospitais de uma região; o conjunto dos pesos de recém-
nascidos num certo ano, numa localidade. Como exemplo de conjuntos
não bem definidos, pode-se citar o conjunto dos indivíduos de uma
população que sofrerão pelo menos um acidente no ano de 1980; o con-
junto de crianças que nascerão com malformações congênitas daqui a
10 meses.
Dado um conjunto S qualquer, seja P uma propriedade definida

sobre S. Esta propriedade determina uma partição de S em dois outros
conjuntos, a saber: o conjunto dos elementos de S que possuem a pro-
priedade P e o conjunto dos elementos de S que não possuem a pro-
priedade P. Assim:
i) seja S o conjunto dos pesos de recém-nascidos em certo ano
numa localidade e P a propriedade ter peso maior do que três quilos;
ii) seja S o conjunto dos hospitais de certa localidade e P a
propriedade ter menos do que 300 leitos;
iii) seja S o conjunto das crianças menores de 5 anos e P a
propriedade ter feito o serviço militar.
Nesta última situação, vê-se que a partição acima referida não
se efetua. Deveria, portanto, ser considerado como exceção da regra
geral. Todavia, a fim de preservar a validade da regra geral, estende-se
a noção de conjunto, afirmando que a propriedade P, nesse caso, efetua
a partição de S em duas partes, a saber:
118
a) o conjunto que não possui elementos (que é º conjunto dos
elementos que satisfazem P), isto é, o conjunto das crianças menores
de cinco anos que fizeram o serviço militar, que se chama de conjunto
vazio e indica-se por O; . .
b) o próprio conjunto S (que é o conjunto que não satisfaz à
propriedade P).
Um conjunto A está contido em um conjunto B, ou, equivalente-
mente, um conjunto B contém um conjunto A, ou ainda, A é um sub-
conjunto de B, se todos os elementos de A pertencerem a B.
Em símbolos:
ACB
O conjunto dos hospitais de uma região com menos de 300 leitos

é um subconjunto do conjunto de todos os hospitais daquela região. O
conjunto das gestantes de uma comunidade que tiveram rubéola durante
a gravidez é um subconjunto do conjunto de todas as gestantes daquela
comunidade.
O conjunto vazio P é subconjunto de qualquer conjunto.
Dois conjuntos A e B são iguaisse A cBeBCA.
Dado um conjunto A C S, o conjunto dos elementos de S que

não pertencem a A é chamado conjunto complementar, ou simplesmen-
te complementar de A em relação a S. O complementar de A em rela-
ção a S será indicado por A., ou simplesmente A, quando não houver
dúvida em relação a que conjunto o complementar está sendo consi-
derado.
Seja S o conjunto dos hospitais de certa região e A o conjunto
de hospitais desta região com menos de 300 leitos. A será, portanto, o
conjunto dos hospitais com 300 ou mais leitos.
Dados dois conjuntos A e B, chama-se reunião ou soma de A com
B o conjunto dos elementos que pertencem a A ou B. Tal conjunto será
denotado por (A U B).
; Dados dois conjuntos A e B, chama-se interseção ou produto dos
conjuntos A e B o conjunto dos elementos que pertencem a A e B.
Tal conjunto será denotado por (A N B).
Seja:
A = conjunto dos nascimentos do sexo masculino, ocorridos em
certa localidade num determinado ano;
B = conjunto dos nascimentos de cor branca ocorridos na mes-
ma localidade no mesmo ano.
n9
Nestas condições:
A U B = conjunto dos nascimentos masculinos ou brancos,
ocorridos naquela localidade naquele ano.
N B = conjunto dos nascimentos masculinos e brancos,
A
ocorridos naquela localidade naquele ano.
Se dois conjuntos A e B forem tais que A N B = O, então
A e B são chamados conjuntos disjuntos.
que auxiliam
A figura 5.1 mostra os chamados diagramas de Venn
no entendimento de operações sobre conjuntos.
Figura 5.1 Diagramas de Venn para ilustrar operações sobre conjuntos.
5.2 Conjunto de todos os resultados possíveis de um experimento

Já se viu que os resultados individuais de um experimento não
podem ser previstos com exatidão. No entanto, é possível caracterizar
o conjunto de todos os resultados possíveis de um experimento, cha-
mado S.
As possíveis segiências dos sexos dos recém-nascidos, em três nas-
cimentos consecutivos ocorridos durante uma hora em certo hospital,
denotando-se por M masculino e F feminino, definem o seguintes con-
junto S:
120
o (eo MMF, MEM, FMM
MFF, FFM, FMF, FFF |
Suponha-se um experimento que consistisse em medir
à altura de
um indivíduo e que esta altura pudesse variar desde 0,5 até
2 metros.
Chamando-se de X a altura de um indivíduo, o conjunto de todos os re-
sultados possíveis do experimento seria o conjunto de todos os valores
do intervalo de 0,5 a 2 metros, isto é,
S = (Valores de X, para 0,5 < x < 2)
O conjunto S de todos os resultados possíveis de um experimento
será denominado espaço amostral do experimento.
5.3 Eventos
Qualquer subconjunto do espaço amostral será denominado even-

to. Os eventos que correspondem aos pontos de S são denominados
eventos elementares. Associados ao espaço amostral S existem infinitos
eventos.
Suponha-se duas urnas contendo, cada uma, quatro bolas numera-

das de 1 a 4. Considere-se o experimento que consiste em retirar, ao
acaso, uma bola de cada urna. O espaço amostral deste experimento
será constituído pelo conjunto de pontos:
1,1 12 1,3 1,4

J 21 22 2,3 2,4
S= da1 32 33 34
41 42 4,3 44
onde o primeiro número de cada dupla se refere ao número da bola que
pode ser extraída da primeira urna, referindo-se o segundo à segunda
urna.
São eventos:
i) “A soma do número de pontos é ímpar.” De fato, esta proprie-
dade define o subconjunto de S.
1,2 1,4
21 23
32 34
41 43
121
ii) “A bola extraída da primeira uma contém o número dois.”
2a 22 23 24
Suponha-se um experimento conduzido com a finalidade de se
conhecer a eficiência de um tratamento na cura de certa doença. Para
tanto, três doentes foram tratados com a referida droga. O espaço amos-
tral S é dado por:
Cc, cc ce, ce
Ss =
ce Cc CE CC
onde C e C representam curado e não-curado, respectivamente.
São eventos:
i) “Obter duas curas.” De fato, isto leva ao subconjunto de S
tcc, cce, ctc)
ii) “Obter quatro curas.” De fato, isto leva ao conjunto vazio que
é um subconjunto de S. Este evento é denominado evento impossível.
iii) “Obter qualquer número de curas.” De fato, isto leva ao pró-
prio conjunto S. Este evento é chamado o evento certo.
Dois eventos A e B são ditos mutuamente exclusivos se a ocorrên-

cia de um excluir a ocorrência do outro, isto é, se (A NB) = O
. Desde que eventos são subconjuntos do conjunto S, pode-se a eles
aplicar os conceitos já introduzidos de reunião, interseção e comple-
mento. Para tanto, considere-se o experimento que consiste em extrair
uma bola de cada uma de duas urnas contendo quatro bolas numeradas
delas.
Sejam:
A = a soma do número de pontos é par:
B = o número de pontos obtidos na primeira bola é 2.
Nestas condições:
i) A U B é um evento, pois é o subconjunto de S:
1,1 1,3 21 2,2 2,3 24
AUB =
31 33 42 44
ii) A N B é um evento, pois o conjunto A.B é o subconjunto de S:
AnB = (22 24]

iii) À é um evento, pois define o conjunto
1,2 1,4 21 2,3
32 34 44 43 S- A-À
que é um subconjunto de S.
iv) B é um evento, pois é o subconjunto de S:
= 11 12 13 14 a
B= (31 32 33 34 S- dg: BD
41 42 43 44
5.4 Variável aleatória
Variável aleatória é qualquer função de número real que esteja de-

finida no espaço amostral.
No caso da extração de duas bolas, cada uma de uma uma con-
tendo quatro bolas, a “soma do número de pontos” é uma variável alea-
tória, pois:oseu campo de definição é o espaço amostral e o seu campo
de valores é o conjunto dos números naturais 2,3, ...., 8.
aleató-
No caso das curas, o “número de curados” é uma variável
espaço amostral e o
ria, pois o campo de definição desta função é o
0,1,2,3.
seu campo de valores é o conjunto dos inteiros
Deve-se observar que um particular valor fixado de uma variável
aleatória é um evento em S.
5.5 Probabilidade
para cada evento E
Diz-se que S é um espaço probabilístico se,
propriedades:
em S, existir um núm-ro P(E) com as seguintes
1. P(E) 20
2. P(S) = 1
(E, N E) = 0,
3. Se E, e Es são dois eventos em S, com
então P(E; U E») = P(Ej) + P(E:)
123
Qualquer função P(E) satisfazendo as propriedades acima, defini-
da sobre eventos E de S. é chamada probabilidade do evento E.
Estes axiomas são suficientes se S contiver um número finito de
elementos. Caso contrário, algumas extensões tornam-se necessárias, mas.
pelo fato de pressuporem conhecimento da teoria da medida, deixarão
de ser apresentadas neste livro.
Dos três axiomas acima referidos podem-se deduzir alguns teore-
mas, que são apresentados a seguir.
Teorema 1:
“Se E, c Es, então, P(E;) < P(E,).”
De fato, pode-se escrever:

E =EU (ENE)
e desde que
E n (ENE) =O
aplicando-se o 3.º axioma vem:

P(E:) = PIE; U (E N E] = P(Ej) + P(E, N E)
Mas, desde que pelo 1.º axioma
P(E. N Ej) > 0, tem-se
P(E>) > P(E)).
Teorema 2:
“Para qualquer evento E de S, P(E) < 1.”

De fato, desde que
Ecs
pelo teorema 1, tem-se:
P(E) < P(S)
Mas pelo 1.º axioma, P(S) = 1, logo
P(E) <1
124
Teorema 3:
“P(E) = 1 — P(E)”
De fato,
P(S) = P(E U E)
Mas, desde que
ENE=o0
então, pelo 3.º axioma, tem-se:
P(E U E) = P(E) + P(E)
isto é,
P(S) = P(E) + P(E)
portanto:
P(E) = 1 — P(E)
Teorema 4:
“P(O) = 0º
Uma vez que (0) =S

então: '
P(D) = PS) =1
Pelo teorema 3, segue que:
P(O) =1-P(D)
Teorema 5:
“Para quaisquer dois eventos E eE-ems,

— P(E, 0 E)”
P(E; U E.) = P(E;) + P(Es)
125
Teorema 6:
“Se E,, Es, ..., E, são k eventos tais que

EnE=o
(para i = j. ambos variando de 1 a k),
então:
k
ME UE U... UE) =>PE)

i=1
A construção da teoria até aqui proposta, como toda parte da Ma-

temática, foi feita a partir de certas noções primitivas (sobre conjuntos)
e de certas afirmações. denominadas axiomas, sobre as propriedades e
relações existentes entre estas noções. Partindo-se das noções primitivas
foram introduzidos novos conceitos, e a partir dos axiomas, por pro-
cessos lógicos. foram deduzidos os teoremas. Assim foi edificada a teo-
ria modema ou axiomática das probabilidades por Kolmogorov, em 1933.
Todavia, a teoria não diz nada sobre como atribuir a um evento
um número real do intervalo [0, 1] que corresponda à sua probabilidade.
Além do mais, sendo S um conjunto finito, com eventos elementares
E,, E», ..., Ex, qualquer combinação de números reais não negativos
Fi, Fo; -.., Tx, tais que
k
> =1
FL
n=PE), i=1,2,..
satisfaz aos três axiomas.
A questão está, portanto, em escolher, para cada problema parti-

cular, 15, Fo, ..., x. Em muitos casos, a própria natureza do
problema
sugere a escolha dessas quantidades. Por exemplo, no caso do lança-
mento de uma moeda considerada “simétrica”, não existe,
a priori,
nenhuma razão para se supor que a face cara seja mais “provável”
que a face coroa; portanto, uma escolha natural seria:
1
e a
1
4
Analogamente, há situações em que ou as opried: fsi
objetos
capazes
em estudo ou a maneira como o Gipetiano E realiado e
de propor uma escolha para os valores de 1, 13, ad og The
Assim, se o espaço amostral finito S contém n
eve: tares,
e se E é um evento em S, contendo m (m < n)
e E
E» -..,
para i » Emj, ambos
(com Evariando
= E deU EU... U Ee En E =0
1 a m), se o sistema físico em consi-
deração for tal que se possa admitir simetria no sentido de que
n=n=... =p =—
então, pelo teorema 6:

m m 1
PE) => PME) =5 =

= El
Quando este for o caso, o cálculo da probabilidade associada a um
evento E se resume na enumeração do número de elementos de S e de
E, respectivamente.
Considere-se, por exemplo, o experimento que consiste em extrair,
ao acaso, uma bola de uma urna contendo duas bolas amarelas e quatro
brancas. Os resultados possíveis são seis, ou seja, o espaço amostral S
contém seis eventos elementares. Se E for o evento “extração de uma
Su-
bola amarela”, então E contém dois eventos elementares, E; e E,.
pondo-se que a extração seja feita de forma a não favorecer nenhuma
das seis possibilidades, então,
1
h === =n4=I <=
e, portanto,
1 1 21
PB) = PE) +PEB) = +76 3
= 2
Ou seja, neste caso, n = 6em
até certo ponto, a pressuposição
É importante observar que se, é aceitável (o que aliás
de os casos possíveis serem igualmente prováveis
domínio dos jogos de azar, onde
explica a razão de sua formulação) no
s são, a priori, perfeita mente concebíveis, O mesmo não
os resultado
referido domínio. Muito trabalho foi
acontece quando se se afasta do
ar estas dificuldades e introduzir
então devotado a tentativas de sobrepuj
de Laplace.
modificações na definição clássica
127
Uma maneira empírica de se conseguir uma aproximação ao valor
da probabilidade de um evento E consiste em realizar um experimento
n vezes e considerar a frequência relativa de ocorrência do evemto E,
isto é, se o evento E ocorrer m vezes entre as n realizações do expe-
rimento, considerar a razão m/n como o valor aproximado de P(E).
A despeito do comportamento irregular dos resultados individuais, já se
viu que os resultados médios de longa segiiência de experimentos casuais
apresentam uma regularidade marcante que se denomina de “estabilidade
das frequências relativas em longas sequências de experimento ou regula-
ridade. estatística”
Ou seja, à medida que n cresce, tendendo a infi-
nito, esta frequência relativa = deverá tender a P(E). Portanto, =n
poderá ser considerada uma medida empírica de P(E), satisfazendo,
como é fácil verificar, aos três axiomas básicos já formulados. Esta in-
terpretação é conhecida como interpretação fregiiencial da probabili-
dade.
546 Probabilidade condicional

Uma família de eventos E;, Es, ..., Em, com
E nE=O0 paraixj
EUEU... UE =S
é dita uma partição
do espaço amostral S.
- O espaço amostral S pode estar sujeito a outra partição pela fa-

mília de eventos F,, Fo, ..., F, com
ENnF=0
FRUFU... UFK=S
A
Nestas O
condições, pode-sese | demonstrar que os eventos (E; N F;)5
também constituem uma partição do espaço amostral S.
A probabilidade P(E, N F),parai = 1,...,mej=1,2,...,
n, é denominada probabilidade conjunta dos eventos E, e F,.
É fácil ver que

n
Jenm=E
Ea
128
De fato:
n
VJenm=ENGRUEU...VE)=ENS=E
FI
Analogamente,
m
U (E N Bj) = F;
FI
Portanto, pelo teorema 6, segue que
a n
2dJEnmo=En E PE)
FI a
que é a probabilidade marginal do evento E.
A probabilidade marginal do evento F; é dada por:
mM m
PdJ)entmo) => PEN E) = PE
Fl FI
Denomina-se probabilidade condicional de F;, dado E;, e deno-

ta-se por P(F;IE;), a probabilidade do evento F,, dado que o evento
E, tenha ocorrido. Por definição:
P(F, N E)
P(F;|
(F;1Ej) =>" PE) , »P
para P(E;)
* 0.
Dois eventos E, e F; são ditos independentes se:

P(E n F) = P(E). P(F;), para P(E;) = 0;
como também
P(E n F) = P(E) . P(BIE)
tem-se
P(E9 . P(BIE;) = P(E) . P(F9,
o que implica
P(FIE) = P(F)
isto é. independência entre É e E, significa que a probabilidade de ocor-
rência de F, não depende da ocorrência ou não de E;.
S6.1 Fórmula
de Bayes
Seca quado E, E», . , Em tal que P(E;) = 0,

parai = 1, me seja F um evento; então
EN ELF NE. FNE
é uma partição de F tal que:
P(P) = õ P(F n E) E? P(E) . P(FIE;)

Fl
que constitui a fórmula da probabilidade total.

Pela definição de probabilidade condicional pode-se escrever: !
PCELIP) = P(E
(Ex N F Dn P(E;)
(E:) . P(FIE;
CFIE;) |
P(F) P(F)
— PES . PCFIES
m
> PCE9 . P(FIE)
FI
| que é a conhecida fórmula de Bayes.

Admitam-se os seguintes eventos:
E, : ter uma certa enfermidade
E = E, : não ter essa enfermidade
F : apresentar reação positiva em um teste laboratorial, para à
referida enfermidade
E
gador dizer que há
o valor P(E/) ermit a um 1 nvesti acaso desta popu-
== 0,20 permite do ao
de probabilidade de um indivíduo toma:
20%
lação ter à enfermidade.
do a um
mesmo indivíduo foi submeti
Admita-se agora que este possível usar à fór-
tou reação positiva. É
teste laboratorial e apresen de ter a en-
Bayes € obter P(E,IF) , isto é, a probabilidade
mula de
positiva para a doença.
fermidade dado que houve reação
P(E;) . P(FIE;)
PEIP = SE). PIE) + PES. PFIEO
o. 0,20 x 0,60 = OA S oas
* 0,20 x 0,60 + 0,80 x 0,30 036 ”
de que a reação foi po-
Este resultado mostra que o conhecimento
de que um indivíduo sele-
sitiva permite dizer com maior probabilida
enfermidade em questão
cionado ao acaso de uma população tenha a
o grau inicial de in-
(P(EIIF) = 0,33 > P(E;)) = 0,20), ou seja,
certeza diminuiu.
aplica-
Em Epidemiologia, o chamado valor de predição * é uma
ção direta do teorema de Bayes.
cg
* Vecchio, cerThomas J., - “Predicti
Popalátio “Predictive Value of a Single Diagnostic Test i
o do ce he New England Journal of Medicine, 274 (21): LULA a
131
Capítulo 6
Amostragem *
Amostragem é o ato de obter uma amostra de uma população,

podendo-se definir população como um conjunto de elementos, cada
um deles apresentando uma ou mais características em comum. Amos-
tra é. simplesmente. uma parte da população.
O lev por . quando parado com o le-
vantamento total. apresenta certas “vantagens:
i) custo menor:
ii) resultado em menor tempo;
iii) objetivos mais amplos;
iv) dados mais fidedignos.
Há situações em que a amostragem se impõe. Assim, pode-se ter
o caso de a população de estudo ser muito grande, sendo impraticável
o levantamento total. Em casos em que o processo de investigação das
características de cada elemento for destrutivo (teste de resistência de
materiais. por exemplo). só tem sentido trabalhar-se com amostras.
Há também os problemas de ordem ética: novas drogas, vacinas, técni-
cas cirúrgicas devem ser testadas inicialmente em amostras, antes de
seu uso amplo na população. Tem-se ainda a situação em que a po-
pulação de estudo é hipotética e a amostra é a parte real desta popu-
lação; é o caso típico de experimentação.
6.1 Etapas de um levantamento

por amostragem
Quer a amostragem seja feita dentro de um laboratório (por exem-
plo, para selecionar ratos que serão usados em um experimento sobre
agentes cancerígenos). quer a amostragem seja feita sobre a popula-
ção geral (por exemplo, para obter informações sobre aspectos da fer-
tilidade de mulheres moradoras em uma grande cidade, como São Pau-
lo), existem etapas que devem ser seguidas, intimamente ligadas aos
* aa
elaboração deste capítulo foi baseada nos trabalhos de Eunice Pinho de Castro
e
Curso de Amostragem. Departamento de Epidemiologia da Faculdade de Saúde
Pública. impressão de 1964 (mimeografado). loções de
tulo 5. in Bioestaiística, por Elza Berquó. do então Departamento de Estatística
Aplicada da Faculdade de Saúde Pública, impressão de 1969 (mimeografado).
133
squisa científica. Tais itens serão co-
principios de metodologia de pesqui
mentados. com linguagem mais dirigid a a levantamentos objetivando es-
timar parâmetros de populações reais de le seres
se humanos; tais comentá-
situação em que se requeira
rios. todavia, são aplicáveis a qualquer
ajustes, basicamente de forma
amostragem, bastando para isso pequenos
e não de conteúdo.
por amostragem são:
As principais etapas de um levantamento
clareza, a fim de evitar
i) Explicitação dos objetivos com bastante
devendo ficar bem
dúvidas posteriores ou mesmo esquecimentos,
definida qual a unidade elementar (elemento) ou unidade de
análise a ser trabalhada.
ii) Definição da população a ser amostrada.

como no caso
Em certas situações isto pode ser relativamente fácil,
crianças que
de se desejar tomar uma amostra de uma população de
uma
estejam matriculadas e frequentando certo grupo escolar. Ter-se-ia
situação mais complexa para se estudar gestantes que procuram centros
de saúde para fazer pré-natal.
ii) Escolha das variáveis a serem observadas em cada unidade
de análise.
Deve ser verificado se todos os dados que vão ser coligidos são
relevantes para a pesquisa e se nenhum dado relevante foi omitido.
Existe uma tendência, particularmente ao se trabalhar com populações
humanas, usando questionário, de se fazer muitas perguntas, um grande
número das quais nunca são analisadas; questionários longos, em geral,
levam a diminuir a qualidade da resposta.
iv) Especificação do grau de precisão desejado.
Os resultados de levantamento por amostragem são sujeitos a in-
certeza, devido a erros de medida e ao fato de apenas parte da popula-
ção ser examinada. O grau de incerteza pode ser reduzido tomando-se
amostras maiores e empregando-se melhores técnicas ou aparelhos de
Y) Escolha dos instrumentos de medida e da forma de abordagem.

Em caso de inquéritos sobre
se nutrição, » por exemplo, poderá á haver
escolha entre observação única ou observação durante sete dias; em
estudos antropométricos será decidido o tipo de balança, calibrador e
Road aparelhos a serem usados. Questionários podem
próprio indivíduoÉ ou serem aplicados a cada ser preenchidos
indivíduo por um
134
vi) Escolha da unidade amostral, que ida como a menor
parte distinta e identificável pd
a ra as de
meração e sorteio da amostra. . em
Uma unidade amostral pode ser o ij
(criança, cobaia, cidade, trecho de Po RE pj ir mi bm
tos (classe de escola, ninhada, estado, conjunto de trechos continuados
de estrada). As unidades amostrais devem cobrir toda a população e
não podem apresentar transvariação, ou seja, um elemento de estudo
não pode pertencer ao mesmo tempo a mais de uma unidade amostral
A relação, lista ou mapa contendo todas as unidades amostrais dá-se o
nome de sistema de referência ou fundamentos da pesquisa.
vii) Execução de prova experimental, prova-piloto ou pré-teste.

Nesta etapa é feito um verdadeiro ensaio do trabalho a ser desen-
volvido, sendo testados os instrumentos de medida, questionários, pes-
soal de campo, a sistemática proposta, a reação da população. Orienta
os reajustes necessários e pode dar informações valiosas sobre possível
duração e custo da pesquisa e indicações da variabilidade do fenômeno
pesquisado, o que permite calcular melhor o tamanho da amostra.
viii) Seleção da amostra, após decidido qual deve ser o respectivo
tamanho.
Esta seleção deve ser feita, de preferência, por meio de sorteio
do tipo lotérico.
6.2 Tipos
de amostragem
é probabilística quando cada unidade amostral na
Aamostragem
população tem uma probabilidade conhecida e diferente de zero de per-
De outra forma, é dita não-pr:
a amostragem
tencer à amostra.
lística.
população de dez
Admita-se, por exemplo. que seja definida deumaalunos, desejando-se
grupos escolares. cada qual com certo número escolares; se o pesquisa-
de tamanho igual a cinco grupos
uma amostra A,B.C, 1),
dor decidiu simplesmente escolher os grupos escolares É possível, no entanto (e
ter-se-ia uma amostragem não-probabilística.
o número de alunos de
mesmo desejável). que o investigador obtenha obtenção das cinco escolas,
cada grupo escolar e faça um sorteio para proporcionalmente
cada escola tendo uma probabilidad e de ser sorteada
a, ilustrada
ao seu número de alunos; será uma amostragem probabilística serão dis-
pela tabela 6.1. Os processos de amostragem probabilístic
cutidos no item 6.3.
135
m probabilística.
Tabela 6.1 Exemplo de possibilidades de uma amostrage
Unidade amostral n.º
Grupo Escolar Número de Alunos Probabilidade
AA Cm 2/50 Ê
B 200 2/50 2
c 400 4/50 3
D 300 3/50 4
E 1.000 10/50 5
E 1.000 10/50 6
G 700 7/50 7
H 400 4/50 8
1 200 2/50 9
600 6/50 10
J
Tu so 0 1 0
Ê
A amostragem não-probabilística pode prejudicar sensivelmente a

validade externa de um estudo, pois muitos fatores podem influir na
escolha de um unidade amostral para pertencer à amostra, prejudicando
sua representatividade em relação à população. Mesmo assim, existem
situações em que ela é usada, havendo então interesse em se conhecer
algumas formas de amostragem não-probabilística:
i) por voluntários, que é bastante usada em ensaios clínicos para
teste de novos medicamentos;
intencional, quando as unidades que compõem a amostra são
-E:
escolhidas pelo pesquisador; é usada na verificação de polui-

ção de praias;
iii) por acesso mais fácil, em que as unidades são escolhidas por
estarem em melhores condições de acessibilidade. Veja-se, por
exemplo, o caso em que se defina para estudo todo o conjunto
de habitantes de-uma área rural, tendo o domicílio como uni-
dade amostral; se o entrevistador escolher os dez primeiros
domicílios do seu caminho, teremos este tipo de amostragem,
tendo sido desconsideradas as outras unidades amostrais que
também pertencem à população.
6.3 Amostragem probabilística

6.3.1 Amostragem casual simples sem reposição
. É um processo bastante utilizado, principalmente pela sua simpli-

cidade; nele, cada unidade amostral, aní tes da tomada da amostra, tem
136
igual probabilidade de pertencer a ela. Seja uma população composta
de N unidades amostrais, da qual se deseja uma amostra de tamanho
n; as unidades amostrais são numeradas em segúência 1, 2, ..., Ne,
entre estes N números, sorteiam-se n, cujas unidades amostrais corres-
pondentes constituirão a amostra; antes do sorteio, cada unidade tem a
n
probabilidade = de pertencer à amostra.
Voltando ao exemplo de obtenção de uma amostra de tamanho

n = 5 na população de N = 10 grupos escolares, agora sem levar em
consideração a quantidade de alunos, um esquema bem simples consis-
tirá em dar a cada grupo escolar (unidade amostral) um número, como
mostra a tabela 6.1; em um saco de pano colocam-se dez fichas do
mesmo formato, tamanho, textura, peso, espessura, etc., com os núme-
ros 1, 2, ... 10. Depois de devidamente misturadas tiram-se cinco fi-
chas, cujos números indicarão quais os grupos escolares que comporão
a amostra. Sejam as fichas 2, 3, 6, 9 e 10 as sorteadas; então, os grupos
escolares B, C, F, Ie J são os que constituirão a amostra. Antes do
5
sorteio, cada grupo escolar tinha o = 0,5 = 50% de probabilidade
de pertencer à amostra.
Se, durante o sorteio, unidades amostrais já sorteadas puderem ser
novantente sorteadas, sendo representadas uma, duas ou mais vezes na
amostra, ter-se-á a chamada amostragem casual simples com reposição.
Em geral, dá-se preferência ao tipo de amostragem casual simples
sem reposição, principalmente quando se trata de populações com re-
duzido número de unidades amostrais.
6.3.2 Amostragem casual simples estratificada — partilha

proporcional
s (ou
Muitas vezes uma população é composta de subpopulaçõe
entre as uni-
estratos) bem definidos, havendo maior homogeneidade
amos-
dades amostrais dentro de cada estrato do que entre as unidades
ica, são
trais de estratos diferentes. Sexo, idade, condição sócio-econôm
estratos devem ser levados em
exemplos típicos. Nestas condições, tais
cada um deles
consideração e o sorteio da amostra deve ser feito em
independentemente; daí o nome de amostragem estratificada.
é aquele em
Um caso muito importante da amostragem estratificada
sejam representadas
s
que o pesquisador deseja que as subpopulaçõe à po-
na amostra com a mesma proporcionalidade com que compõem
137
pulação total. Trata-se da situação denominada amostragem casual sim-
ples estratificada com partilha proporcional, ou simplesmente amostra-
gem com partilha proporcional.
Se uma população é composta de h estratos, definindo-se:
N = tamanho da população
N, = tamanho de cada estrato populacional
n = tamanho total da amostra
m = tamanho da amostra do estrato h,
nos Nº ||
tem-se a partilha proporcional se
No
ou seja, se o tamanho nm, da amostra do estrato h, for |
Na a
=n.—=N.—
me NO “ON
Isto é, para se obter o tamanho da amostra em cada estrato ou
subpopulação basta sa o tamanho total da amostra n pelo
fator de proporcionalidade = com que a subpopulaçãoé representada

na população. A tabela 6.2 apresenta um exemplo numérico, onde a
população composta de N = 500 unidades amostrais foi dividida em
três estratos para obtenção de uma amostra de tamanho total n = 40. |
Tabela 6.2 Exemplo de amostragem casual simples estratificada com partilha

proporcional.
b = estrato N, = tamanho n, = tamanho Relação

do estrato h na da amostra do hn DM
população estrato h = Es
N n
1 N, = 50 m= 4 0,1
2 N, = 150 nm =12 03
3 N; = 300 ns = 0,6
Co a o ua ta IM
Total N = 500 n =40 Relação
n
— = 0,08
N
138
A amostra ny do primeiro estrato foi calculada como m = 40x Ea se
5 00
amostra n; do segundo estrato, » como n, o = 40 40x-—
150
500 * ? amostra do
terceiro estrato foi calculada como n; = 40 x fe
É claro que os mesmos resultados são obtidos se o tamanho de
cada estrato Ny é multiplicado pelo fator de proporcionalidade z

N
que há entre a amostra total e a população total; neste 'caso
n
= 0,08 e m = 50x 0,08
N
no = 150 x 0,08
ns = 300 x 0,08.
6.3.3 Amostragem sistemática

É possível utilizar uma ordenação natural de indivíduos, pron-
tuários, quarteirões de uma cidade, para este outro tipo de amostragem.
de-
Sendo N o total de unidades amostrais e n o tamanho da amostra
sejada, define-se a quantidade — = k, a que se dá o nome de intervalo

n
um número inteiro, faz-se
de amostragem; admitindo-se que k seja
co, podendo ser obtido,
então um sorteio entre os números 1, 2,
início casual. Nestas condi-
por exemplo, o valor i, que será chamado
a amostra fica selecionada, sendo
ções, com apenas este sorteio, toda
tenham recebido os seguintes nú-
composta das unidades amostrais que
:
meros (ou ocupem a posição correspondente)
À
i+k
1 EK
i+ (n-1D)k.
Para uma população de tamanho N = 32, numerad. a segiiencial-
mente de 1 a 32, e amostra de tamanho n = 8, tem-se k =4.
O início casual i deve ser sorteado entre 1, 2, 3 e 4; admita-se
que tenha sido i = 3
A amostra fica constituída das unidades amostrais de número (ou
ordei m):
33 +4=73+8=11;3+ 12=ãh15;
3+16=19;3+20=23;3+24=27,;3+28=31.
Pode ser visto que o mesmo resultado seria obtido somando-se
sucessivamente o intervalo de amostragem k = 4 a cada número obtido
imediatamente antes:
33 +4=7;7+4=11,11+4=15,15+4=ãh19;
19+4=23;23+4=27,277+4=31.
Para k não-inteiro, o processo é semelhante, com a necessidade de
se considerar as casas decimais de forma cumulativa, mas desprezan-
do-as para definir o número de cada unidade sorteada.
Assim, se N = 32en = 7, ter-se-á k = 4,5714.
O início casual i deverá então ser sorteado entre 0,0001 e 4,5714;

admita-se que tenha sido i = 1,2587. A amostra fica constituída das
unidades amostrais de números:
1.º) 1,2587, isto é, 1
2.º) 1,2587 + 4,5714 5,8301, isto é, 5
3.º) 5,8301 + 4,5714 10.4015, isto é, 10
4.º) 10,4015 + 4,5714 14,9729, isto é, 14
5.º) 14,9729 + 4,5714 19,5443, isto é, 19
6.º) 19,5443 + 4,5714 24,1157, isto é, 24
7.º) 24,1157 + 4,5714
PA
28,6871, isto é, 28
- Ao se optar pelo processo sistemático, deve-se
verificar se a ordenação das unidades amostrais não ter o cuidado de
cidade, com certa característica se repetindo apresenta periodi-
fato poderia possibilitar uma má representatiemvidade
intervalos iguais; este
da
outro lado, se na população houver estratos é estes forem amostra. Por
amostragem sistemática ordenados, a
conduzirá, automaticamente, a uma
porcional. partilha pro-
.
A amostragem sistemática é muito útil quando
se trata de amos-
trar uma população que vai se completando
portanto, em um certo momento ainda não temao longo do tempo e que,
todos os seus elementos
140
ou unidades amostrais. Por exempl
sobre os óbitos registrados duitáfito E e mo fazer um estudo
a apr, po-
de-se esperar que termine o ano para começar
se se tiver uma boa estimativa do número total de óbit eng ni
ser registrados naquele ano, pode-se calcular o valor de À sab us
manho desejado da amostra e iniciar o sorteio na amostra
ri
a partir do primeiro mês do ano, dando prosseguimento ea ent ã
obtenção da amostra. A a vantagem desta estratégia é economia
pesquisa pode começar imediatamente. le tetem-
po, no sentido de que
Outra vantagem neste tipo de estudo reside no f:
ele envolve perguntas às: famílias dos falecidos, ter ca ne
ano termine pode espaçar demasiado as datas do óbito e da entrevista.
introduzindo no estudo vícios devidos a problemas de memória. ,
6.3.4 Amostragem por conglomerados
Chama-se conglomerado a um conjunto de unidades elementares

da população. Se as unidades amostrais definidas na população, para
efeito do sorteio para obtenção da amostra, foram conglomerados, ter-
se-á uma amostragem por conglomerados.
Seja o objetivo de uma pesquisa estimar o consumo médio diário
de proteína por pessoa residente em uma área urbana; a população de
estudo será o conjunto de pessoas que residem naquela área e a unida-
de elementar ou de análise será cada pessoa. Se for decidida a realiza-
ção de amostragem por conglomerados, será possível definir-se como
conglomerado o quarteirão ou o domicílio. O sorteio será análogo aos
processos anteriores, após a numeração de cada conglomerado.
visuali-
Na amostragem por conglomerados, cada conglomerado é
será tanto
zado como uma espécie de miniatura da população; portanto,
melhor quanto maior a heterogeneidade dentro de cada conglomerado.
Assim, estará sendo proporcionada maior representatividade da
não é possível a obtenção
população. Ela é extremamente útil quando
elementares, o que não
de sistema de referência contendo as unidades
como unidade amostral. O
permite usar a própria unidade elementar
para estudo de popula-
uso de grupos escolares como conglomerados
ções infantis é um exemplo típico.
é a amos-
Um caso particular de amostragem por conglomerado
a área ocupada pela população em
tragem por áreas, quando se divide como unidade ns a
estudo em várias partes, tomando cada uma
de uma cidade como
utilização de quarteirões ou bairros ou subdistritoscategoria.
nesta
unidades amostrais pode ser compreendida
141
AS Amostragem
por etapa dupla (ou estágio duplo)
É uma modificação da amostragem por conglomerado. Numa pri-
meira etapa são selecionados conglomerados, chamados então unidades
amostrais de primeiro estágio (ou unidades primárias); não se dese-
jando usar todos os elementos que constituem cada conglomerado sor-
teado. passa-se a uma segunda etapa, que consiste em sortear, dentro de
cada conglomerado já selecionado, as chamadas unidades amostrais de
stágio (ou unidades secundárias), que vão constituir a amos-
esso pode ser generalizado para vários estágios, ou seja, para
uma amostragem por etapas múltiplas.
6.3.6 Amostragem multifásica
É aquela em que há uma segiência no processo de amostragem

a partir da amostra inicial, de tal forma que cada amostra desta se-
quência é uma subamostra da amostra anterior. Em cada fase as uni-
dades amostrais são as mesmas (ao contrário da amostragem por eta-
pas múltiplas), diferindo de fase para fase os atributos ou características
estudados.
Assim, na amostra da fase um, de tamanho ni, pode-se estudar a
variável peso; na amostra da fase dois, de tamanho ne, logicâmente
menor que n;, seria definida a característica capacidade
vital; numa
terceira fase ter-se-ia a amostra de tamanho ns (menor do
que ns) para
se estudar ainda reflexos motores; e assim por diante. É interessante
notar que, como em cada fase a subamostra é
tomada a partir da
amostra anterior, Os indivíduos que compõem a última
subamostra serão
examinados para todas as variáveis
em estudo.
64 Precisã
Um processo de amostragem
E ora
, ns
pode gerar várias possíveis amostras,
das quais somente uma é utilizada. Cada uma destas possíveis amostras
más Festa an que seria encontrada se todas as possíveis amos-

pato sem observadas é medida pelo Tespectivo
desvio padrão do esti-
mador proposto. A precisão de um processo de amostragem
inverso é dada pelo
deste desvio padrão; assim, quanto menor a variabilidade em
142
torno da média das possíveis amostras, maior a precisão. Em geral, au-
mentando-se O tamanho da amostra, aumenta-se a precisão. As estimati-
vas obtidas por meio de amostragem sem reposição são mais precisas
do que as obtidas com reposição.
6.5 Vício
Chama-se vício, viés ou tendenciosidade a diferença entre a média

que seria obtida de todas as possíveis amostras (seção 6.4) e o ver-
dadeiro valor do parâmetro populacional em estudo. A figura 6.1 ilus-
tra a situação.
Média das Valor

possíveis verdadeiro
amostras do parâmetro
Vício
ara
++ +arara HHuu +4 4+
DE,
Estimativas das
várias possíveis
amostras
Figura 6.1 Esquema ilustrativo de vício de amostragem.
Tem sido verificado que a amostragem é viciada quando o pro-

cesso é o intencional, pois o ato de escolha das unidades amostrais
estará inevitavelmente influenciado por tendências, preferências e fato-
Tes subjetivos pessoais diversos. É claro que os outros processos não
probabilísticos também têm grande possibilidade de levar a resultados
tendenciosos.
Há vícios que são, no entanto, alheios ao tipo de amostragem;
entre eles está o causado por ausência
de resposta.
6.5.1 Ausência de resposta

á Chamar-se-á ausência de resposta a qualquer falha na obtenção
ens dados de alguma
de ausência unidade aplicáveis
de resposta, da amostra selecionada. Tem-se como as.
em pesquisas em populações hu-
anas em que se use questionário:
143
1) unidades não encontradas;
responder;
m) o entrevistado não sabe
incapacitado para responder;
ud o entrevistado é fisicamente
se recusa inflexivelmente a responder;
IV) o entrevistado
tempo
fica ausente durante todo o
V) a pessoa a ser entrevistada
para o trabalho de campo.
disponível
da população que não responde
Quando as características da parte fato
responde, não haverá vício pelo
não diferem daquelas da parte que
Entretanto, com as verifica-
de alguma parte da amostra não responder.
constatado que as unidades da parte
ções que tém sido feitas, tem sido respondem.
diferem daquelas que
da população que não respondem
das unidades que respon-
Quando há diferença entre as características
de a amostra apresentar casos
dem e das que não respondem, o fato
vício.
de ausência de resposta introduzirá
os quais ten-
Há vários modos de remediar a ausência de resposta,
causado. São eles:
tam eliminar ou pelo menos diminuir o vício por ela
repasses (com ou sem técnica melhorada)
substituição
i .
Repasses
Uma técnica padronizada consiste em estabelecer o número de re-
passes ou retornos que devem ser feitos às unidades que não forneceram
respostas, antes de abandi a unidade selecionada pela “impossibili
dade de estabelecer contato”. Nestes repasses usa-se a mesma técnica
ou uma técnica melhorada de obtenção dos dados. Quando não é possí-
vel aplicar o repasse a todas as unidades não respondentes, aplica-se a
uma subamostra desta parte que não respondeu.
Reposição
Consiste em acrescentar, aos endereços do atual levantamento, en-
dereços de casos de ausência de resposta de levantamento ou levanta-
de antes anteriores. porém recentes, nos quais o processo
ge oi Ih: sses end: são ch A, A,
dedo reposição e são utilizados
suas levaria : Pp par. a repor
po! os as ênci de respo sta
casos de ausência s
mn 9 uso eficaz do processo de substituição, requer-se a seguinte

âqueles do: Oslevantamento
casos de ausência
G de e resposta devem ser semelhan!
hantes
sição. O período de nto anterior cujos endereços são dados para repo-
fodo de tempo decorrido desde o levantamento anterior 20
144
U
atual deve ser suficientemente pequeno, de modo que a maior
E parte dos
casos de ausência de resposta do levantamento anterior não se tenham
mudado ou não tenham alterado completamente seus hábitos.
Este processo de reposição é particularmente bem adaptado para
o que freq duzem | proces-
sos de amostragem semelhantes. sea
Substituição
Consiste em substituir os casos de não-resposta, em geral por vizi-
nhos, ou por nova amostra de tamanho igual ao número de ausências
de resposta. Entretanto, em geral é um engano supor que com isto se
está eliminando ou diminuindo o vício, pois as novas unidades que
respondem assemelham-se mais às unidades originais que já responde-
ram do que àquelas que não respondem.

A amostragem probabilística pressupõe algum tipo de sorteio do
tipo lotérico. Existem, todavia, tabelas apropriadas que substituem tal
procedimento, chamadas tabelas de números casuais. São um conjunto
já de forma alea-
de números, dispostos em colunas e linhas, distribuídos
tória. A seleção da amostra é feita a partir de uma entrada também
primeira unidade
aleatória (por sorteio) na tabela, para escolha da
predeterminado por
amostral sorteada, seguindo-se então um percurso
Na publicação de
linha ou coluna para obtenção das outras unidades.
de números casuais; pode-se
Severo e Bussab * encontra-se uma tabela
citar ainda a tabela de Fisher e Yates **.
e para o qual se faz
O processo em que se usa sorteio lotérico
amostral só é aplicável a popu-
corresponder um número a cada unidade população
da
lações onde se possa identificar cada unidade amostral e enume-
com um número. Isto só é aplicável em populações praticament
com um número finito
ráveis. portanto efetivamente existentes (reais),
população não seja enumerável, a
de elementos. Em casos em que à
de tomada de amostra que se
orientação é a de definir um método
s que se pretende investigar na
acredite independente das propriedade ou desfavo-
seja incapaz de favorecer
população. isto é, um método que determinad a manifestação da proprie-
recer a freqiência na amostra de
dade que se quer investigar.
“ Bussab, W. O. e Pereira, 1. S. € Tábuas de Estatística e Matemática Ed.

Brasiliense, São Paulo, 1974.
Estatisticas para Pesquisa em Biologi
** Fisher, R. A. & Yates. F.. Tabelas
Medicina e Agricultura. Editora Polígono, São Paulo, 1971.
145
Capítulo 7
Delineamento de pesquisa
Uma característica fundamental do método científico é o fato de,

a partirÉ de hipóteses,
cê
deduzir: consegiiências, as quais devem
z
ser testadas o
empiricamente para serem corroboradas ou rejeitadas.
Na fase empírica da pesquisa científica a Estatística tem papel
relevante, atuando na coleta de dados e na sua descrição e análise.
Nos capítulos anteriores foram apresentadas e discutidas técnicas para
descrever as características das distribuições empíricas de acordo com
os diferentes níveis de mensuração das variáveis em estudo. O capí-
tulo sobre amostragem teve por finalidade propor algumas técnicas
de coleta de dados que procuram garantir a validade externa de uma
pesquisa. Os capítulos seguintes apresentarão técnicas estatísticas para
a análise de situações específicas, para responder a perguntas implícitas
ou explícitas em hipóteses científicas, transformadas em hipóteses es-
tatísticas ou de trabalho para operacionalização.
O presente capítulo tem por. finalidade mostrar delineamentos
que explorem as potencialidades dos modelos estatísticos empregados,
provendo a validade interna da pesquisa proposta.
7.1 Considerações sobre a relação causa-efeito
O pesquisador está em constante busca de causas que expliquem

o acontecimento de fenômenos observáveis. De forma esquemática
bem simples, poder-se-ia propor o seguinte modelo simbólico genérico,
orientador do trabalho científico:
X => Y, que se lê “a presença de X implica o aparecimento de
Y”. A partir daí é proposta uma pesquisa que utiliza dados empíricos
com o fim de corroborar (ou negar) tal afirmativa.
quantita-
Operacionalmente X e Y são variáveis qualitativas ou
tivas; para efeitos práticos, X é chamada de variável independente e
Y de variável depend sendo X ante e Y consegiiente no
tempo. Após a realização de uma pesquisa em condições ideais, seria
147
possível ter-se a resposta para a pergunta “X é causa de Y?”, sob
uma das formas: “X é causa de Y” ou “X não é causa de Y”. Na
pratca, devido à complexidade do mundo real, ainda que X fosse
causa de Y. é impossivel este tipo de resposta determinística; deve-se,
portanto, ficar satisfeito com respostas probabilísticas, obtidas através
de métodos estatísticos.
E importante ter em mente que a simples presença inicial de X
com aparecimento posterior de Y não é razão suficiente para se con-
cluir que X é a causa de Y, pois Y poderia acontecer independente-
mente de X, simplesmente como decorrência da possível presença de
outras va: is T, U, V, Z, etc., intervindo na relação X, Y.
O delincamento de uma pesquisa leva em consideração estes fatos,
permitindo ao pesquisador isolar, de maneira favorável ao seu traba-
lho e a futuras conclusões, a relação entre X e Y. Em trabalhos ex-
perimentais. em condições ideais de laboratório, isto é feito através
de controle e casualização Em pesquisas não-experimentais, o obje-
tivo é elaborar projetos que se aproximem ao máximo de condições
experimentais.
7.2 Experimento; controle; casualização
Em um experimento, as condições são determinadas pelo pesqui-

sador. que comandará as ações sobre as variáveis independentes, atra-
vés de controle e casualização. O controle é exercido tanto sobre a
variável que está sob escrutínio direto, isto é, X, como sobre outras
variáveis independentes, T, U, por exemplo, que sabe-se, de antemão,
poderem ter alguma ação sobre a resposta Y. A casualização é feita
para que outras variáveis independentes, V, Z, por exemplo, que, não
estando sob controle imediato do investigador, possam ter seus valores
distribuídos de forma não-intencional entre os grupos submetidos ao
experimento.
Já foi dito que a simples presença inicial de X e o posterior
aparecimento de Y não implicam obrigatoriamente que X causou Y,
pois Y poderia ter acontecido sem a ocorrência de X. Em um ex-
perimento, portanto, existe a necessidade de haver pelo menos dois
grupos amostrais de indivíduos. Um grupo, chamado grupo experimen-
tal, será constituído de elementos apresentando características bem
definidas, aos quais se administra o fator X. Outro grupo, chamado
grupo controle, será constituído de elgmentos que apresentem exata-
mente as mesmas características do grupo anterior, mas aos quais não
se administra X, ou seja, serão mantidos durante todo o experimento
na condição que pode ser designada por —X.
148
A variável T (e/ou outras) deve ser controlada, possivelmente
através de estratificação prévia. Assim, de antemão são separadas as
unidades amostrais do tipo T e do tipo —T, para que os grupos expe-
rimental e controle guardem proporcionalidade igual quanto a esta ca-
racterística.
A administração ou não do fator X a cada unidade amostral. im-

plicando a formação dos grupos experimental e controle. deve ser feita
aleatoriamente, por processo de sorteio. Esta casualização evita que
fatores subjetivos, inerentes à condição humana do investigador, pos-
sam influenciar na alocação de indivíduos, quer no grupo controle. quer
no grupo experimental, além de resolver o problema da distribuição
dos fatores não-controláveis pelo cientista, V e Z, por exemplo.
Ao se encerrar o experimento, Y será observada nos grupos con-
trole e experimental. Para Y qualitativa, se X for a causa de Y (e —X
não for causa de Y), espera-se que no grupo experimental a propor-
ção de indivíduos com o efeito positivo para Y seja maior do que no
grupo controle. Para variável Y quantitativa, se X for causa de in-
cremento de Y (e —X não incrementar Y), espera-se que no grupo
experimental a média de Y seja maior do que no grupo controle.
Suponha-se, por exemplo, um experimento visando verificar, em
cobaias, o efeito Y de um tratamento X sobre determinada enfer-
midade.
Teoricamente, os dois grupos do experimento deveriam ser cons-
tituídos do mesmo número de animais igualmente enfermos, em tudo
idênticos, isto é, quanto ao sexo, à idade, ao peso, aos ascendentes, etc.
Enfim, o ideal seria igualdade total dos animais quanto a todos os fa-
tores ou variáveis Z, V, T, ... que pudessem vir a interferir na avalia-
ção do tratamento X. Nestas condições, o tratamento X seria aplicado
ao grupo experimental e deixaria de ser dado ao grupo controle.
Na prática, devido ao fato de que, via de regra, o pesquisador
não conhece todas as variáveis que possam ser relevantes para o estudo
em causa, o que se faz é distribuir um conjunto de, digamos, 2n animais
enfermos, de forma aleatória. em dois grupos de n animais cada um:
O experimental que receberá X e o controle que receberá —X (isto é,
não receberá X). Com este procedimento de casualização, espera-se que,
em média, os animais nos dois grupos tenham a mesma idade, o mesmo
Peso, a mesma proporção de machos, etc.
Esquematicamente, ao final do experimento, para os 2n animais,
ter-se-ia:
149
Grupo experimental Grupo controle
Animais inicialmente Animais inicialmente
doentes € doentes e
raras o não-tratados (—X)
pa 1
| 2 | 2
| e lyx . Y-x
pe :
ES n
de animais cura-
onde yx € Y-x representam, respectivamente, O número
controle).
dos no grupo tratado (experimental) e no grupo não-tratado(
x : : Yx
é, e
A comparação estatística das proporções de curas, isto
com JE dará indicações sobre a eficácia ou não do tratamento X.

n
Suponha-se, agora, que o pesquisador suspeitasse que a resposta
de um animal enfermo ao tratamento estivesse relacionada ao sexo do
animal. Neste caso, um delineamento poderia consistir na estratificação
prévia dos animais enfermos segundo o sexo, em cada um dos grupos.
n n
Ou seja, idealmente z machos e Z fêmeas enfermos deveriam ser co-
locados tanto no grupo experimental quanto no controle. Esquemati-

camente, designando-se por T o sexo masculino e —T o sexo feminino,
ter-se-ia:
Grupo experimental Grupo controle

Anímais inicialmente Animais inicialmente
tes entes e
tratados (X) não-tratados (—X)
trm
pec
Bee tom
—T: Fêmeas
onde yxt» Yx-m» Y-xt € Y-x-r representam, respectivamente, os números
de machos tratados e curados, de fêmeas tratadas é curadas, de ma-
chos não-tratados e curados e de fêmeas não-tratadas e curadas. A
- ua Yxr =:
comparação estatística de 72 OM E dará indicações sobre a efi-
/ n,
cácia ou não do tratamento X para os machos; analogamente, para
po POr sua vez, a comparação ais
n72 om E
as fêmeas, > compara-se BT 0/2”
Jxr Tn/2Yexr com Yx-r>

—1/2
J-x-r edi ção sobre a pos-
dará indica
i enç as
difer >>
sível interação entre tratamento e sexo.
Os delineamentos podem ir-se tornando cada vez mais complexos,
à medida que se procura explicitar, nas comparações estatísticas, o
efeito sobre Y de um conjunto de variáveis independentes. Qualquer
que seja o grau de complexidade, porém, deve ser notado que a ex-
perimentação tem sempre a característica de comparação controle-ex-
perimental, em situação antes-depois.
7.3 Estudos não-experimentais

Não é sempre que a corroboração ou a rejeição de hipóteses cien-
tíficas pode ser feita através de experimentos. Há áreas do conheci-
mento humano, inclusive, em que a realização de ensaios experimentais
Epidemiologia
não é comum, podendo-se mencionar, por exemplo, a
e as Ciências Sociais.
Podem ser mencionados três tipos de estudos não-experimentais
acom-
bastante usados em Epidemiologia. O primeiro, chamadofoi descrito no
tal como
panhamento de coorte, imita um experimento A
item 7.2, havendo a situação antes-depois, experimental-controle. con-
e há pouco ou nenhum
diferença fundamental é que não há sorteio
seres humanos) no grupo
trole para a alocação dos indivíduos (sempre
controle e no grupo experimental. Esta alocação já foi decidida a
ou não, espontanea-
priori pelos próprios indivíduos, conscientemente
de que o fumo é um
mente ou não. Veja-se, por exemplo, à hipótese
Para testá-la, Doll e
fator de risco na gênese do câncer do pulmão.
formados de mé-
Hill* formaram dois grupos, experimental e controle,
dicos ingleses que não tinham câncer. O grupo experimental ficou
o grupo controle daqueles
composto daqueles que já fumavam (X) e
to Smoking: Ten Years” Observa

* Doll, R. e Hill, A. B., “Mortality in Relation 30/05/1964.
tions of British Doctors”, British Medical Journal, 1: 1.460-1.467,
181
não
que não fumavam (—X), fator sobre o qual os pesquisadores
acompanhada desde
exerceram nenhum controle. Esta coorte tem sido
então para verificar que proporção fica doente de câncer de puto
em cada grupo. A esta forma de delineamento dá-se o Home e estudo
longitudinal, podendo ser prospectivo ou retrospectivo *. .
pesquisa de
O segundo tipo de estudo, extensivamente usado em
caráter etiológico em Epidemiologia, é o chamado estudo GoareiniralE,
que é da forma longitudinal retrospectiva. Nesta situação; além de
não haver sorteio. não há nenhum controle sobre as variáveis admitidas
como independentes, inclusive porque o que caracteriza este" tipo de es-
tudo é uma situação depois-antes. Ou seja, os grupos para análise da
variável dependente são formados a partir desta variável dependente,
não o efeito;
a partir da condição de os indivíduos já apresentarem ou
ao conjunto com o efeito presente dá-se o nome de casos CY) e ao
daí é que se
conjunto sem o efeito chama-se controles (—Y). A partir
passada de ca-
estuda a variável independente, buscando-se, na história
causa, x.
da um dos indivíduos, a presença ou não do fator suposto como
Voltando aos estudos de câncer do pulmão e fumo, este tipo de deli-
neamento partiria de dois grupos — um composto de indivíduos re-
centemente diagnosticados como tendo câncer do pulmão (Y) e outro
sem esta doença (—Y) — e procuraria, na história pregressa dos com-
ponentes dos dois grupos, antecedentes sobre o uso de fumo, classifican-
do-os então, quanto ao fator X, em fumantes e não-fumantes. A compara-
ção entre as proporções de fumantes entre os doentes e de fumantes
entre os não-doentes dará indicações a respeito do fumo na gênese
do câncer do pulmão.
Uma terceira modalidade de estudo é aquela que representa um
corte no tempo, quando as variáveis de interesse são medidas simul-
taneamente; não há a preocupação de nova mensuração, passado certo
tempo, para verificar relações de causa e efeito, ou seja, não existe
a situação antes-depois. O interesse, em geral, é em fazer estimativas
de parâmetros populacionais e observar possíveis associações e correla-
ções entre X e Y. Trata-se de delineamento de tipo transversal, em
oposição a longitudinal. Vale notar que um estudo longitudinal pode
ser construído a partir de dois ou mais estudos transversais.
] 74 Considerações finais
É importante ter em mente que a análise estatística e o delinea-

mento de uma pesquisa estão intimamente ligados. Pode-se dizer que,
*ú As explicações
e ções dos dos termos
ter coorte, , caso-controle, , retrospectivo, prospectivo,
i i lon-
gitudinal e transversal São expostas com bastante propriedade a capítulo 3 doe
livro Epidemiology, Principles and Methods, de MacMahon
e Pugh.
149
se muitas vezes uma análise malfeita põe a perder um bom delinea-
mento, é bastante difícil qualquer tipo de análise estatística remediar
um delineamento malfeito.
Sobre possíveis vantagens de estudos experimentais em relação a

estudos não-experimentais, é necessário assinalar que existem situações
em que é impossível se propor um experimento, algumas vezes por
razões de ordem ética, outras simplesmente por razões de ordem técnica.
É verdade que as relações de causa e efeito são mais consubstan-
ciadas quando testadas através de experimentação; deve-se lembrar
contudo, que em experimentos há sempre o risco de artificialidade ga
nhando-se em validade interna, mas às custas, às vezes, da validade
externa. Na verdade, o progresso científico é feito por ambas as vias,
dependendo ainda (e talvez principalmente) de pesquisadores capazes
de formular hipóteses a serem testadas, experimentalmente ou não.
Discussão mais ampla sobre delineamento de pesquisa deve ser
procurada em textos referentes a Filosofia e Metodologia da Ciência,
delineamento de experimentos, ensaios clínicos, Epidemiologia, etc.
Sugere-se, por exemplo, Hegenberg 2, os capítulos 15 a 17 e 20 a 22
de Kerlinger ?, os capítulos 1 e 2 de Kempthorne º, Byar e colaborado-
rest, os capítulos 3 e 11 a 13 de MacMahon>, os capítulos 8 a 10 de
Lilienfeld º, os capítulos 6 a 10 de Forattini * e ainda os livros de Susser 8
e de Rosenberg.”
Introdução à Filosofia da Ciência,

1 Hegenberg, Leônidas, Explicações Científicas; Paul
Editora Pedagógica e Universitária Ltda., São O, 1974.
Research, Wins-
Holt, Rinehart and
2 Kerlinger, F. N., Foundations of Behavioral
ton, Inc., New York,
of Experiments, John Wiley & Sons,
O., The Design and Analysis
3 Kempthorne,
p , Some ce
Inc., New York, 1952. Some
on
4 Byar, D. P. et al., “Randomized Clinical Trials: Perspectives 8, 1976.
The eds undof Medicina, 295, n. 2: 74-80; July
Journal
Ideas”,
F., Epidemiology; Principles and Methods, Little,
5 MacMahon, B. e Pugh, T.
.
Brown and Company, Boston, 1970.
Oxford University Press, New
8 Lilienfeld, A., Foundations of Epidemiology,
York, 1976. o
Editora Edgard Blicher Ltda., São Paulo,
i pesado O. P., Epidemiologia Geral,
in the Health Sciences; Concepts and Strategies in
8 Susser, M., Causal Thinking 1973. .
iversity Press, New York, Cul-
Epidemiol,
E Lie da Vunálise do Levantamento de Dados, Editora
trix, São Paulo, 1976.
153
ea
CR
Capítulo 8
Distribuição binomial
81 A distribuição
Introduzidas as noções fundamentais sobre a teoria das probabili-
dades, pode-se passar às chamadas distribuições de probabilidades.
Neste capítulo será estudada a distribuição binomial.
Para sua construção, será considerado um experimento E, consis-
tente em jogar um certo número de moedas e em especificar quais os
eventos possíveis de acontecer, quanto ao aparecimento de cara ou
coroa, bem como o valor das probabilidades associadas a estes eventos.
Admita-se que no lançamento de uma moeda só haja dois eventos
possíveis, mutuamente exclusivos: sair cara (evento K), sair coroa
even-
(evento C). Admita-se, ainda, que a probabilidade de se obter o
1 de o evento
to cara seja Es = 0,5, o que implica a probabilidade
1 P(K) = 0,5 e P(C)

coroa também ser = 0,5. Explicitamente,
de uma
= 0,5. Se no experimento proposto forem utilizadas mais pro-
características, e o
moeda, todas elas deverão ter exatamente estas
.
cesso de lançamento não alterará tais propriedades
“Lançament o de uma moeda” e defina-
Seja o experimento E:
“Número de vezes que sai cara”. Neste
se a variável aleatória X:
pode assumir os valores O ou
experimento E, a variável aleatória X só
respectivame nte aos eventos sair coroa (C) ou
1, que correspondem es as-
sair cara (K). Neste caso é imediato o cálculo das probabilidad
es do parágrafo an-
sociadas a tais eventos, com base nas pressuposiçõ
= 1) = 0,5.
terior, ou seja, P(X = 0) = 0,5 e P(X
“Lançamento de 4 moedas”. A
Seja agora, o experimento E,:
cara/coroa,
tabela 8.1 mostra todas as possibilidades de combinações
e os valores correspondentes
os eventos que estas combinações originam
da variável aleatória X: “Número de vezes que sai cara”.
155
to de 4 moedas.
Tabeis 81 Resultados possíveis no lançamen
sigam quam Valor de a
o Moeda n.º te (número le vezes
Ppaibiiiado 3a Evento que sai K)
O aaa e id Ha ER a
; Cccc K e 4€ o
CcccKk
» cckc IK e 3€ !
2% ck cc
2d Kk Cccc
3a cCCkK
CkkcC
- kk Cc 2K e 2C 2
ad ck CkK
3 Kk CKC
E Kk C CK
“a Kk K K €
“+ Kk kKk CK 3K e 1C 3
“ K CKK
4d CKKK
5 Kk K K K 4K e 0€ 4
Utilizando as regras do produto para eventos independentes e da

adição para eventos mutuamente exclusivos, é possível calcular as pro-
babilidades associadas aos valores de X, da tabela 8.1.
A probabilidade de X = O é obtida pelo conhecimento de que
este valor de X acontece no caso do evento “OK e 4C”, ou seja, “sair
coroa na 1.2 moeda e sair coroa na 2.3 moeda e sair coroa na 3.2 moe-
da e sair coroa na 4.2 moeda!” Sabe-se que sair coroa tem probabili-
dade 0,5; como os resultados das quatro moedas são independentes
entre si, a probabilidade final do evento em questão, “OK e 4C”,
vale
0,0625 = 0,5 x 0,5 x 0,5 x 0,5.
Para o cálculo da probabilidade de X = 1, deve-se trabalhar
com o evento “IK e 3C”. A tabela 8.1 mostra que há quatro pos-
sibilidades de sua Ocorrência a 2b, 2c, 2d). Para cada uma dessas
Fr a F le independênci
= tados leva tam-
bém ao valor 0,0625; mas, como o evento “IK e
aconteça a forma 2a, ou a forma 2b, ou a forma 3C” ocorre quer
2c, ou a forma
2d, e elas são mutuameni
te exclusivas, a regra da soma manda efetuar
à adição 0,0625 + 0,0625 + 0,0625 + 0,0625, ou, o que é o mesmo,
efetuar o produto 4 x 0,0625,
evento de 0,25.
obtendo-se a probabilidade final para este
156
As probabilidades dos outros valores de X podem ser calculadas
de forma análoga. A tabela 8.2 apresenta os resultados do experi-
mento E, de forma completa. A notação usada e a disposição dos
símbolos têm por finalidade permitir uma fácil memorização. Permi-
tem, também generalizar a formulação para um experimento E de tama-
nho qualquer, sem restrições quanto à simetria das probabilidades dos
eventos mutuamente exclusivos.
Tabela 8.2 Distribuição de probabilidades binomial no lançamento de moedas.
X. Evento P(X = x)
0 OK e 4€ 0,0625 = 1X 0,5º x 0,54! = Ipºaqt
1 IK e 3€ 0,2500 = 4 X 0,51 x 0,53 = 4plq?
2 2K e 2C 03750 = 6 x 0,52 x 0,52? = 6p2q?
3 3K e IC 0,2500 = 4 X 0,583 x 0,51! = 4p3q!
4 4K e 0C 0,0625 = 1 X 0,5! x 0,50 = Iptq”
Total 1
n = número de moedas = 4
p = probabilidade de K = P(K) =
q = 1-p = probabilidade de C = P(C
A tabela 8.2 mostra que o cálculo da probabilidade de cada pos-

sível valor de X, num experimento de tamanho n, é obtido por um
produto que tem três fatores: o primeiro fator é um número que indica
de quantas formas, mutuamente exclusivas, é possível obter o evento
que origina X; o segundo fator (p) é a probabilidade com que a va-
riável aleatória X pode acontecer de maneira favorável; o terceiro
fator (q) é o complemento desta probabilidade. Os expoentes de p
são os valores de x e os expoentes de q são os valores n-X.
Os números que correspondem ao primeiro fator são calculados
!
fórmula — | onde o símbolo ! significa fatorial *.
pela
x! (n—x)!
e que se representa por b!, é

* O fatorial de um número b inteiro e positivo,
desde a unidade até b, isto é,
igual ao produto de todos.os inteiros consecutivos
bl=1x2xXx3x4X00 Xb
x
1, por convenção.
' esa
individuais toma-
quepa =(2)- combinações de n
x!(n—s)! x
157
Assim, na tabela 8.2 tem-se:
gás 4 é 1x2x3x4
014 1x1x2x3x4
qe 4 E 1x2x3x4
113! 1x1x2x3
e 4! 1x2x3x4
242! 1x2x1x2
resulta-
Generalizando: Seja E um experimento com apenas dois
e exclusivos; seja
dos possíveis, S (sucesso) e F (fracasso), mutuament
q = I-pa probabilidade de
p a probabilidade de ocorrência de Se
repetido n vezes de forma
ocorrência de F; se o experimento E for
valores p e q, a
independente, em cada vez mantendo-se os mesmos
Forma generalizada da distribuição binomial.
Tabela 8.3
X = número de sucessos P(X ==)
0 o! po q
on!
1 a pl
U(n—1)! e q
2 a qu
2U(n—2)!
é ————— ds as ms
xt(n— x)! q
n nto E
n! 0!
esq Rua O a Saes
Metas.
n 1
Total = o
RR A, Maitaoo É =
158
probabilidade da variável aleatória discreta X = número x de vezes
que S pode ocorrer é obtida através da seguinte expressão:
n!
P(X
( = x) =>".
a nDo! P p'q”, i
4 » que caracteriza a distri-
buição binomial, cuja notação abreviada pode ser B (n; p).

A soma que aparece ao pé da coluna de probabilidade é justa-
mente a notação referente ao desenvolvimento do binômio [p — ql
o que explica o porquê da denominação de distribuição binomial de
probabilidades, ou simplesmente distribuição binomial, para a entidade
estatística que está sendo estudada
Para gerar uma distribuição binomial é necessário definir apenas
duas quantidades, como indica aliás a notação abreviada B(n;p). Estas
duas quantidades, n e p, que caracterizam cada distribuição de forma
exata, são chamadas parâmetros desta distribuição.
8.2 Análise da distribuição binomial

8.2.1 Média aritmética
Demonstra-se que na B(n;p) a média aritmética teórica da va-
riável aleatória X = número de sucessos, e que se representará por m”,
é dada por m = np
Este resultado pode ser verificado, por exemplo, para a B (4;0,5)
apresentada na tabela 8 2, referente ao lançamento de quatro moedas,
onde X = número de caras. A tabela 8.4 indica de forma explícita o
cálculo da média aritmética da distribuição da tabela 8.2. Utilizando-
se dos conhecimentos anteriores do capítulo 4, obtém-se:
2,0000
m = ——— * 2 com e np = 4x0,5
Tabela 84 Cálculo da média aritmética da distribuição binomial B (4;0,5).

x PAX =) x. PX=9).
TO os 0,00
1 0.2500 9,25
2 0.3750 e
3 0,2500 É
4 0,0625 +
z ; 2,00
i j as P(X=x) atuam
a xf, ou seja,
Observe-se que x.P(X =x) equivale s observadas no cálculo
em uma distribuição teórica como as frequência
ão empírica.
da média aritmética de uma distribuiç
8.2.2 Desvio padrão

O desvio padrão teórico da variável
Demonstra-se que na B(n;p)
& * é dado por
X que será representado por
o=v npq-
usando ainda o exem-
A tabela 8.5 faz a verificação deste fato,
Obtém-se
plo B(4;0,5) das tabelas 8.2 e 8.4.
Vo= icara=Vnpq = 4x0,5x0,5 = 1 cara

o=
B (4;0,5).
Tabela 8.5 Cálculo do desvio padrão da distribuição binomial
P(X=2) x-m (x—m)? (x—m)2. P(X=x)

x
0,0625 4 4.0,0625 = 0,25

0
1 0,2500 1 1.0,2500 = 0,25
2 0,3750 0 0.0,3750 = 0,00
3 0,2500 1 1.0,2500 = 0,25
4 0,0625 4 4.0,0625 = 0,25
Total 1 1,00
8.23 Assimetria
Demonstra-se que o coeficiente de assimetria ara a distribuição

binomial B (n;p) é dado por: E ê
n = =4"?
VTpq
É fácil verificar, que ); = O para p=q=s isto é, a distribui-
É pis 9 valor den. A tabela 8.6 ilustra este
+ B(10/0,5), B(15;0,5) e B(20;0,5) são todas
Ponha e
simétricas.
-U sa-se o 'fsímbolo q e não s por tratar-se
de um resultado teórico.
160
Para q > presulta py; > 0e, portanto, a distribuição será assi-
métrica à direita. Para q 5 ou nq > 5.
8.2.4 Achatamento ou “curtose”
O coeficiente de achatamento ), é dado por:

1-6 pq
vo + 3
npq
A distribuição será:
mesocúrtica se y» = 3, isto é, se pq = 1/6
leptocúrtica se y2 > 3, isto é, se pq < 1/6
platicúrtica se y» < 3, isto é, se pq > 1/6
8.2.5 Máximo da distribuição
A binomial terá dois máximos, isto é, será uma distribuição bimo-

dal, se np + p for um número inteiro. Em caso contrário, terá um
só máximo. No caso particular de p = q = 1/2, se n for ímpar ha-
verá dois máximos, e um só máximo caso n seja par.
Na tabela 8.6, que se refere ao caso de p='q=0,5, para n=10
e 20, as distribuições correspondentes apresentam um só máximo. Para
n = 10 o máximo se dá em correspondência a X = 5 e vale P(X=5)
= 24,609%; paran = 20, P(X=10) = 17,620% é o valor máximo
da distribuição. Finalmente, para n = 15 há dois máximos, P(X=7)
= 19,638% e P(X = 8) = 19,638%.
8.3 Tabelas
As probabilidades individuais dos valores de X da distribuição bi-
nomial, bem como a sua soma acumulada, encontram-se tabeladas, o
que muito facilita o manuseio da distribuição *
* Tables of the Binomial Probabiliry Distribution. Department of Commerce,

National Bureau Standards, Government Printing Office. 1949, 387 p. tabs. (NBS
Applied Mathematics Series n.º 6), Washington D.C.
Romig, H. G., 50-100 Binomial Tables, New York, 1953.
Severo e Bussab. op. cit.
t61
84 Distribuição
da variável proporção de sucessos
Há ocasiões em que se torna mais interessante ou conveniente tra-
.
2X que variai de O a 1, ou com a va
balhar com a variável aleatória 7,
filivdi E 100)% — proporção de sucessos —, que varia de 0% a
100%.
i ili
pode facilitar bastante a represen! tação 1grá-
dessa variável
o enunciado
ficada inibição quando n é muito grande e também
de certos problemas.
a variável seja
É claro que as probabilidades são as mesmas, quer
n é fixo para
X, x quer seja xn quer seja (É 100)%, uma vez que
cada situação.
A média e o desvio padrão da variável aleatória x são dados
respectivamente por:
média = p
desvio padrão = VA
Para a variável aleatória percentagem de sucessos, tem-se:

média = (p 100)%
desvio padrão = (V BE 100)

o %
n
Os coeficientes de simetria e achatamento, evidentemente, não se
alteram. Os pontos de máximo passam de X para EX A tabela 87
ilustra estas situações para as variáveis aleatórias X e x
Zxemplos de aplicações da distribuição binomial
1 — Admita-se que a probabilidade que um prematuro

turo pesando
de 1.500 a 2.000 gramas tem de sobreviver às primeiras 120 horas.
162
quando devidamente tratado, seja da ordem de 80%. Nestas condi-
ções, num grupo de 10 prematuros (todos com peso de 1.500 a 2.000
gramas e devidamente tratados), a variável X = número de sobrevi-
ventes é B(10;0,80), ou seja, tem distribuição binomial com p =
0,80 en = 10. Portanto, a probabilidade de que x prematuros sobre-
vivam às 120 primeiras horas é dada por:
10!
PX=1)
( ) = >———
* (10-50)! (0,80) ' (0,20) Pee
paraX = 0,1,2,...,10
1.1 — Assim, a probabilidade de que ô prematuros sobrevivam (ou

4 não sobrevivam) é dada por:
101!
PA = a (0,80)º (0,20)! = 0,0881 = 8,81%
1.2 — A probabilidade de que no máximo 6 prematuros sobre-

vivam (ou um mínimo de 4 não subrevivam) é dada por uma soma
de probabilidades:
P(X=00ulou20u30u40u5ou6) = 0,121 = 12,1%
1.3 — O número médio esperado de sobreviventes é np=10x0,80

= 8 prematuros com um desvio padrão de V npq = 1,6
= 1,265 prematuros.
2 — O problema acima pode ser enunciado de forma diferente,
usando-se como variável de estudo a “proporção de sobreviventes”.
Desta forma, tem-se.
2.1 — A probabilidade de que 60% de prematuros sobrevivam
é dada por:
10!
P( no % = 60%) =gal (0,80)º (0,20)* = 0,0881 = 8,81%
so-
2.2 — A probabilidade de que no máximo 60% de prematuros é
(ou uma proporção mínima de 40% não sobrevivam)
brevivam
dada por:
X 100 ou 40% ou 50% ou
P( % = 0% ou 10% ou 20% ou 30%
n
60%) = 0,121 = 12,1%
— ão média esperada de sobreviventes é (p 100)%
= a = =
80% de prematuros, com um desvio padrão de
= (0,80 x 100)%
(J m 100)% = 12,65% de prematuros.

n
3 — Sabendo-se que 70% da população foi vacinada, contra va-
ivíduos destat população, a variável
ríola, se se tomar ao acaso 20 indi
binoi mial com parâmetros
X = número de vacinados terá distribuição
n=20ep = 0,70, ou seja, B(20;0,70).
os 20 tenham
Assim, a probabilidade de que 14 indivíduos dentre
sido vacinados é
P(X=14) = e (0,70)14 (0,30)º = 0,1916 = 19,16%

141 6!
4 — Em um grupo escolar, 10% das crianças não têm cárie den-
tal. Um dentista foi designado para trabalhar durante certo tempo nesta
escola e autorizado a sortear 15 crianças para possível tratamento. Qual
a probabilidade de o dentista ter de tratar dos 15 alunos (devido a todos
eles terem cárie)?
Trata-se de uma B(15;0,10), onde X = número de crianças sem
cárie dental. O evento “15 alunos terem cárie” corresponde a X = 0.
Portanto,
15! = 20,59%
P(X=0) = KH (0,10)º (0,90)15 = 0,9015 = 0,2050
41 = É interessante notar que o número médio esperado de crian-

5 cárie dental
ças sem é m = np = 15 '
x 0,10 = 1,5»5 cricrianças, com
desvio padrão o = y npq = 1,16 crianças, obviamente valores que
não podem acontecer no caso concreto. O que se deve enfatizar é que
tais valores são abstrações matemáticas, perfeitamente válidas, que po-
dem e devem ser empregadas para vários fins estatísticos com aplicações
práticas.
o Em todos os exemplos apresentados houve dois pontos comuns,
que a Distribuição Binominal
o4 . et : .
Para cada um dos n indivíduos observados, só um de dois
sem ana exclusivos era possível acontecer: sucesso (o
E Fic): fracas a O indivíduo está vacinado, a criança não tem
árie);
diúádo, ac asso (otdoprematuro
eloa: não sobrevive, 4 o indiví ão fo) foi va-
ivíduo não
164
2.º) Para cada um dos n indivíduos observados, a probabilida-
de individual de sucesso é a mesma:
i) para os dez prematuros observados, a probabilidade

de so-
brevivência é 0,80 para o 1.º, para 0 2.º, ..., para o 10.º prematuro;
ii) considerados os 20 indivíduos da população que sofrem a

vacinação, a probabilidade de estar vacinado é 0,70 para o 1.9, para o
2.º, ..., para o 20.º indivíduo;
iii) cada uma das 15 crianças sorteadas no grupo escolar tem a

probabilidade de 0,10 de não ter cárie.
1. Considere-se o seguinte problema: Uma uma contém 6 bolas

brancas e 4 pretas. Pretende-se retirar ao acaso uma amostra de 2
bolas da urna e define-se a seguinte variável aleatória; X = número de
bolas brancas na amostra. Nestas condições, os valores possíveis de X
são: O, 1 ou 2, com as seguintes probabilidades caso haja reposição da
primeira bola na urna antes da extração da segunda bola:
P(X=0)gy = L,t=(2
0 To ig) (0,4)? 2 (0,6) o
ego = dad
P(X=1) To * 10 + ytatof?
To x 1 (2) (0,4)! 1 (0,6) (0,67
=
P(X=2) .s
= o do6/2(2) (0,4)º (6,0) 2
Mas isto nada mais é do que uma B(2:0,6), ou seja, o fato de

haver reposição mantém constante a composição da urna, isto é, a
proporção de bolas brancas (e consegientemente de bolas pretas) na
urna é sempre a mesma e, portanto, a probabilidade de sair bola bran-
ca é sempre a mesma em toda repetição do experimento que consiste
em extrair bola após bola da urna.
Todavia, se não houvesse reposição de uma bola antes da extra-
extração a
ção seguinte, a composição da urna se alteraria de uma
não seria sem-
outra, e, portanto, a probabilidade de sair bola branca
tó5
experimento. Neste caso as proba-
re a mesma cm cada repetição do
x seriam:
bilidades associadas aos valores de
(5) (8) 4 3. 12
PX=0) =" =x =
É A Ago
PX=D=" “10"9 “109 90
2
(4
px=?mi qu NESO
alo) q O6 O 5 30o
Rioed) (10 10*o9 90
2
Como se vê, esta soma é igual à unidade, isto é, trata-se de uma
distribuição de probabilidades.
Genericamente, se na urna houvesse N; bolas brancas e N. = N
— N, bolas pretas, a probabilidade de em uma amostra de tamanho n,
sem reposição, se ter X=x bolas brancas seria dada por:
P(X=x)=
E G=H
(5) parax = 0,1,...,Ni
n
Esta distribuição é d inada

a dictrik ição hipergeométrica e de-
pende de dois parâmetros p = a n. Pode-se demonstrar que, para
p fixo, a hipergeométrica converge para a binomial, à medida que N

cresce (ver tabela 8.8).
. A diferença entre a distribuição hipergeométrica e a binomial re-
side no fato de que a primeira é gerada a partir de um universo finito
com N elementos, enquanto a binomial se refere a um universo que
ou é infinito ou é tornado sempre inalterado pelo fato de haver sempre
reposição na amostragem.
166
2. Demonstra-se também que para p fixo, à medida '
i i i ? »
para a distribui que n cresce in-
definidamente, a binomial converge
p normal, como
ribuição
será visto no próximo capítulo.
3. Finalmente, se p for função
E de n, , à medilida :
tribuição de Poisson, também chamada lei d los pequenos números ou

do evento raro.
Figura 8.1 Diagramas de ordenadas da distribuição binomial para alguns valores
9% p = 0,001
n = 100
Probabilidade em %
a3
Probabilidade em %
Probabilidade em %
Probabilidade em %
x
121314 15161718
º 5 67891
167
mar
se
5o
44 15 16 17 18 19 20 21 22 23 24 25 26 27.28 2930 X
Tia
RU
a»
e
01234567891011 121314 15X

OO ay cos'o s (tom) om
0050 o1 L9v'o Ryu ouod
0 0 ED v6T a ss10 85% cuosprlonsa
Tino4 peta Eav0 GL 005'0 s “IPoW
99T'p vEL'O ,
STOS9T oss:o T 000'T or
or P9T'6 L99%0 ot 860'0
OZ9'LT oos'o 6 LL60 006'0 6
81091 ost'o 6 PLTISI 009'0 8
8E9i6T ves'o 8 S6E'y oos'o
ELOTI oop'0 8 00L'0 L
L 8E9'6T L9v'0 L 6IL'TI
GEL ose'o sos'oz 009'0 9
969'€ oor'o 9 PLT'ST copio 9
cEE'O s 609'pz 0os'o s
6LHT osz'o ç +91 '6 y
v 991 L9T'O y sos'oz oor'o
tov'o 00z'o 6IL'II 00£'o €
soT'o osT'O € 68ET 007'0 €
ozE'o cET'O t s6r'p 00z'o t
s10'0 0oT'o t ooT'o I
oso'o 1 94o'o L90'0 E LL6O
zoo'o 860'0 000'0 0
000'0 000'0 0 £00'0 000'0 0
dE, Ea “
(%) x x (%) x x
(%) x x (x = x)d SI2AJSSOd SSJOTEA
d SIGAISSOd SOJOJEA (x = xd SIDAISSOÁ SOJOTEA
(«=x
q=u st=Uu or=u
“a ap SaojeA sojuaragp 7 = d exed % 2 X SeLIOITE SIAFIEA SEP TEIOUIQ OBÍMQINSIT
Tt
98 DJ2GDI
(vpom) own sp ojuod 060 [4 oro oo oso ovo oro oro aro
“ub—d eso E 190 950 svo veo exo ao 100
ud +d seo ss'o o 990 sso wo eco wo wo
bdghyid —b)= “sue “3200 v80- 1y0- svo- ero- o ero sto wo vão
M/bdA = omsped ousa sé0o sro serio ssvo sro ssto svro gar'o seo
d =p 060 oso oro 090 oso ovo ogo oro oro
6=* g=x L=* 9=* s=* p= c== =x 1=* (vom)
ompeyiu ap omod
068 o8L oro os's os ore oz oTr oro b— da
066 3) or 09'9 os's or'y ce oc ori d+da
vso— uvo- sto- ero- o ero suo uo voo DdgA/(d-b)= uu ooo
seo UI spt ss est sst srt ST s6o — DgA = ogped ousa
6 8 . 9 5 r £ z 1 da = pm
moL O0000L 000001 COOL 00000! 000001 o00'0ot 000'001 o00'001 000001 rmoL
ot =u/x eoepe Leror sus sos'o eso oro'o oo0'0 ooo ooo'o o=z
060 =ux rise ever Lora 1e0'p u6o sro vIoo 0000 ooo “es
ogo = u/x ILE'6L 6610€ aee E60TI secr 2901 soro 1000 0000 s ==
Oro = u/x orL's eeroT Es9'9T sor Iz 6ILTT uwor º oo6o 6Lo 000% “=x
oro = u/x 9 sos's mro'oz z8o'st sosoz errTr Lo Isso voo 9 =x
oso = u/x erro vs zeror s90'oz sos'vz a90'0z zeror us. evro 5 =*
oro = u/x voo Isso 9L9t€ er sos'oz zeo'sz z10'0z soss 9a »=*
oco =uv/x 0000 sLoo oo6o uver eu esriz cesoz ceroz orL's ==
ato = v/x ooo'o Lodo spr'o 2901 secr som Leer 6sr0E tes =
oro = um ooo ooo'o voo esvo uso rey 9or'z1 vresgz vorse 1 ==
ovo = x 0000 ooo oo0'o oroo seoo soyo sus aero esetve o ==
DR a GC
(+)
x <a «Sa «Ba uSOg RE] “ba
)
50
(9%) (6)
GOI UT e
meaprod MJOPA qo =d 0=4 oro=d o
E — Dw—— >> ——
“4 vp saJOruA MMIDASSJIP O OS = U WIVÁ 0/X & X UNIR MOAPNA SUP IORDOUM OrSmMnNa (4 maças eS
N=20 N=50 N = 100 N = 1000
nomial para
X P(X=>)
e P(X=x)
. P(X=x)
% P(X=x
já ) = e
p=0Sen=10
0 0,000 0,032 0,059 0,093 0,098

1 0,054 0,497 0,724 0,950 0,977
2 1,096 3,159 3,799 4,337 4,395
3 7,194 10,763 11,310 11,683 11,719
4 23,869 21,809 21,141 20,569 20,508
5 34,372 27,480 25,933 24,733 24,609
6 23,869 21,809 21,141 20,569 20,508
7 7,194 10,763 11,310 11,683 11,719
8 1,096 3,159 3,799 4,337 4,395
9 0,054 0,497 0,724 0,950 0,977
10 0,000 0,032 0,059 0,093 0,098
1m
Capítulo 9
Distribuição normal
9.1 A distribuição
A distribuição normal foi primeiramente encontrada em 1733, por
De Moivre, em conexão com sua discussão da forma limitante da dis-
tribuição binomial tratada no capítulo anterior.
j Ao que parece, a descoberta de De Moivre passou desapercebida,
e só muito mais tarde a distribuição normal foi redescoberta por Gauss,
em 1812. Gauss e Laplace trataram a função normal em conexão com
seu trabalho sobre a teoria dos erros de observação. Laplace estabele-
ceu pela primeira vez, embora de maneira incompleta, o teorema do li-
mite central (que será visto adiante neste capítulo) e fez um grande
número de importantes aplicações da distribuição normal a várias ques-
tões na teoria de probabilidades.
Sob a influência dos grandes trabalhos de Gauss e Laplace, foi
tido como um axioma, por um tempo mais ou menos longo, que todas
as distribuições estatísticas se aproximariam da normal como uma forma
ideal limitante se se pudesse dispor de um número muito grande de
observações suficientemente precisas. O desvio de qualquer variável
aleatória de sua média era olhado como um “erro”, sujeito à lei dos
erros, expressa pela distribuição normal.
Conquanto este ponto de vista fosse realmente exagerado e tivesse
sido consideravelmente modificado, é inegável que em um grande nú-
mero de importantes aplicações práticas encontram-se distribuições que
são ao menos aproximadamente normais.
É o caso, por exemplo, da variável antropométrica — peso ao
nascer — que or zada com o objetivo de introduzir a distribuição
normal.
A tabela 9.1 contém os pesos de recém-nascidos, com intervalos
de classe de 400 gramas. A Eu 9.1 é º histograma correspondente,
sobre o qual se desenhou o respectivo polígono de fe E de
se esperar que com um número muito maior de recém-nascit los, e tra-
balhando-se com intervalos de classe cada vez menores, à linha poli-
173
gonal se aproxime mais e mais de uma linha contínua e a representa-
ção gráfica da distribuição de pesos se aproxime da curva que aparece
na figura 9.2. Esta curva em forma de sino nada mais é do que a re-
presentação gráfica da função matemática dada por:
(x—m)?
1 20?
eg
=——5= +
e que se denomina distribuição normal.
Na (1)
x = constante numérica = 3,1416
e = constante numérica = 2,718
m = constante paramétrica, representa a média aritmética da
distribuição
“ = constante paramétrica, representa o desvio padrão da dis-
tribuição
x = variável aleatória que é representada no eixo das abscissas
f(x)= ordenada correspondente a cada valor de x.
Tabela 9.1 Pesos de recém-nascidos americanos do sexo masculino e de

cor branca.
gramas o Percentagem
tee em Ne x acumulada
E 5.700
10 |— 6. 99,9
To 96 WO ————
Média aritmética x 3447 g
Desvio padrão s 633 &
ADEa A
174
500 900 1.30 1.700 2100 2500 2900 2300 3700 4100 4500 4900 5300 5.700 6100 6500 Gramas
Figura 9.1 Histograma correspondente à distribuição de freqiências da tabela

9.1, com sobreposição do respectivo polígono de freqiiências suavizado.
São características da distribuição normal:
1 — o campo de variação
de x é de — o a + o;
2 — a distribuição é simétrica em torno de m; y = O;

3 — a mediana da distribuição é, portanto, igual a m;
17s
4 too)
T ——>
m=34479 X (peso em gramas)
Figura 9.2 Representação gráfica para um número muito grande de pesos de

recém-nascidos, com intervalos de classe bastante pequenos, m representa a média.
4 — o máximo da distribuição é atingido para x = me o valor

1
da ordenada máxima é ——— ;
ov2m
5 — a distribuição possui dois pontos de inflexão, que são:
1
(m-0), —>— | nto;
1
[m º 55 [ ov2re
6 — a distribuição é mesocúrtica, isto é, Y = 3;

7 — a curva normal é assintótica em relação ao eixo das abscissas,
isto é, as caudas da curva não tocam nunca o eixo dos x;
8 — a área total sob a curva normal é igual à unidade, ou 100%;
9 — a área sob a curva, compreendida entre
e (m (m — o)
+ o), é igual a 2/3 da área total, isto é, vale aproximadamente 689%;
10 — a área sob a curva, compreendida entre (m — 1,96 0) e
(m + 1,96 0), é igual a 95%;
11 — a área sob a curva, compreendida entre (m —
2,58 0) e
(m + 2,58 0), é igual a 99%;
12 — para efeitos práticos considera-se que a área sob a curva,
compreendida entre (m — 30) e (m + 3), é igual a 100%. Isto
equivale a admitir para fins práticos que a amplitude máxima de varia-
ção de x é igual a 6 o.
176
i'
1
1
i
I
1
1
'
l
I
1
1
I
I
1
1'
t
1
———»—— + 1
Do m-2580 m-1960 m-0 m = média
Figura 9.3 Caracterização gráfica da distribuição normal.
As áreas sob a curva podem ser entendidas como medidas de pro-

babilidade. Assim, a área total sob a curva, já vista na propriedade
n.º 8 como sendo 1, significa que há 100% de probabilidade de um
valor x pertencente à população de estudo ser encontrado entre — %
e + «o; pela 9.2 propriedade, a probabilidade de um valor x da dis-
tribunal estar entre m-ce m + o vale 2/3, ou 68%.
Na aplicação da curva normal para estudos do mundo real, ao
se admitir que uma população tem distribuição normal, as áreas também
representam a proporção de indivíduos que a população contém entre
os valores especificados. Há ainda necessidade de se conhecer mais rela-
ções entre áreas e valores diversos de x, além das já mencionadas, para
distribuições ou populações com média m e desvios padrão « quaisquer.
9.2. Tabelas da distribuição normal
Uma vez que a distribuição normal depende de dois parâmetros,

m eo, é fácil compreender que o cálculo de uma área na curva normal
vai depender dos valores que m e o assumem em cada caso particular.
fos-
Ou seja, deveriam existir tantas tabelas da curva normal quantas
tabelas.
sem as possíveis combinações de valores de m eo, isto é, infinitas
Por este motivo, todas as vezes que se quer utilizar tabelas da curva
à distribuição normal
normal, passa-se da distribuição normal comum
reduzida ou padronizada, que nada mais é do que uma distribuição
normal para a qual m = 0 e o = 1. Esta passagem é feita através
de uma transformação linear de variáveis do tipo:
1m
x
a ais
onde z pode ser interpretado, simplesmente, como quantos desvios

padrão o valor de x está afastado da média m.
Nestas condições. demonstra-se que a variável aleatória Z terá dis
tribução normal com média igual a zero e desvio padrão igual à uni.
dade, isto é,
Zz- N(O;1)
ou seja
MI
(2) f(z) -—+— e
v2z
que é a equação matemática da distribuição normal reduzida.

A tabela 9.4, reproduzida de Bussab e Severo, apresenta as áreas
idas entre a média m e um valor especificado de Z para uma
normal reduzida.
Exemplos
de como usar a tabela 9.4
1 — Seja a variável X = altura de indivíduos adultos, com distri-

buição aproximadamente normal, com média m = 1,65 m e desvio
padrão c = 0,09 m. Ou seja, X — N(1,65:0,09).
1.1 — É possível calcular a proporção de indivíduos desta po-
pulação que mede entre 1,65 m e 1,80 m, ou seja, entre a média da
distribuição e 1,80 m. Para isso basta transformar o específico valor.
x = 1,80 m em um específico valor z, usando a relaçad z= — e /
> b
1,80 — 1,65 0,15 Cemenaremas
>>— = = 1,67. 4/
0,09 9
Indo agora à tabela 9.4, em correspondência ao valor z = 1,67,
encontra-se 0,4525, que corresponde à área compreendida entre O €
1.67 para uma curva N(0;1) e, também, à área compreendida entre
1,65 e 1.80 para uma curva N(1,65:0,09), representada pela região
A da figura 9.4. Ou seja, na população em estudo, 45,25% de indiví-
duos medem de 1.65 m a 1,80 m.
1.2 — Calcular a percentagem de indivíduos que têm 1,80 m ou
mais de altura corresponde a verificar qual o valor da área achuleada
da mesma figura 9.4. Como a área total da curva é 1, a área à direita
178
45,25%
da média é 0,5. Já se viu que da média até 1,80 m se encontra
da população, ou, o que é o mesmo, a área vale 0,4525. Basta, portanto,
calcular a área complementar, fazendo-se, simplesmente, 0.5 — 0,4525
= 0,0475. Isto significa que a percentagem de indivíduos com altura
1,80 m ou mais é 4,75%. ou, em outras palavras, a probabilidade de
um indivíduo, tomado ao acaso da população considerada, ter altura
igual ou maior do que 1,80 m vale 0,0475.
“
11 04525
1
LA
1
!! E
m= 165 1,80 E
o = 0,09
m=0 167 z
s=1
Figura 94 Determinação de uma área em correspondência a um valor especí-

fico de x.
1.3 — Qual a probabilidade de um indivíduo sorteado ao acaso

desta população ter 1,54 m ou menos? Esta probabilidade é dada pela
redu-
área achuleada da figura 9.5. Calculando-se o valor da variável z
zida, tem-se:
| z=D[———
1,54 — 1,65
0,09
=
— 011
0,09
= — 1,22.
que
Aqui deve-se notar que o valor de z é negativo, o que significa
com
se está trabalhando na metade esquerda da curva normal, ou seja,
do que a média. O cálculo das áreas, porém, não
valores menores
apresenta dificuldades, pois, como a curva é simétrica, as áreas a serem
calculadas do lado esquerdo têm correspondência exata à direita. Assim,
trabalha-se na tabela com o valor positivo de Z.
Em correspondência ao valor z = 1,22 encontra-se 0,3888, que é
a área da região B da figura 9.5. Subtraindo este valor de 0,5 encontra-
se 0,5 — 0,3888 = 0,1112 ou 11,12%, que é a área procurada.
ea
BIBLIOTECA no
FACULDADE Ve MEDICINA DE
RE MCSEPa SD OR
Portanto, a probabilidade de se obter um indivíduo de altura 1,54 m
ou menos é 11,12%.
1.4'— Se se quiser conhecer a probabilidade de um indivíduo ter

altura compreendida entre 1,54 m e 1,80 m basta somar 0,3888 e
0,4825, obtendo-se 0,8413. Ou seja, 84,13% de indivíduos de uma
população com média 1,65 m e desvio padrão 0,09 m mede de 1,54
m a 1,80 m.
93 p-======—E..—
1.65
0,09
z=1,22 m=0
c=1
Figura 9.5 Determinação de uma área em correspondência a um valor fixado de x.
Nos problemas de 1.1 a 1.4 a situação proposta foi a de determinar

a área dado certo valor de x. O inverso também é possível, ou seja,
conhecida certa área da curva normal determinar o valor ou valores de x
que delimitam esta área. São os exemplos 1.5 e 1.6, para a população
referida em 1, e figuras 9.6 e 9.7.
1.5 — Sabendo-se que a área A, limitada à esquerda pelo valor

1.65 m, é de 39%, qual o valor de x que a limita à direita (fi-
gura 9.6)?
O valor de z que corresponde à quantidade 0,3888 (a mais pró-
xima de 0,39) é 1,22. Usando-se a equação z = + mas agora,

com x sendo a quantidade desconhecida, tem-se
x — 1,65
1,22 =
0,09
m=165 ?= ”
o = 0,09
m=0 1,22=2z =
c=1
Figura 9.6 Determinação de um valor de x em correspondência a uma área

especificada.
x = 1,65 + (1,22 x 0,09) = 1,76 m, que é o valor procurado.

A interpretação prática desta situação é que entre 1,65 m e 1,76 m
encontram-se 39% dos indivíduos da população. É instrutivo compa-
rar este problema com os de números 1.3 e 1.4.
1.6 — Na figura 9.7, a área achuleada B vale 0,14, ou seja,

existe uma determinada altura x tal que 14% da população é menor do
que ela (ou, o que é o mesmo, 86% da população tem altura maior
do que x). Para se achar esta altura específica, usa-se mais uma vez
a equação da normal reduzida, lembrando, todavia, que agora z é ne-
gativo, pois se está à esquerda da média.
Como B é uma área no extremo da curva, tem-se primeiro que

determinar a área C, limitada pela média:
C=05-— 0,14 =õ036 ez=- 1,08.
Portanto,
x -— 1,65
— 1,08 =———
0,09
x = 1,65 — (1,08 x 0,09) = 1,65 — 0,10 = 1,55 m é a altura
procurada.
É possível dizer que há 14% de probabilidade de se ter altura
menor do que 1,55 m na população.
181
8g
os
“3
z=-—108 m 0 z
1
Hy
Figura 9.7 Determinação de um valor de x em correspondência

a uma área
fixada.
2 — Usando-se a população de recém-nascidos da tabela 9.1 como

exemplo. passa-se a admitir, agora, que a variável aleatória X = peso
de recém-nascidos é N(3.447 g; 633 g). Cálculos semelhantes aos do
exemplo 1 mostram que os resultados teóricos e empíricos são razoa-
velmente aproximados.
2.1 — Em uma N(3.447; 633) a probabilidade de se encontrar
valores maiores do que 4.500 é achada a seguir:
x-m 4.500 — 3.447
z= = 1,67
o 633
Na tabela 9.4, a área que corresponde a z = 1,67 é 0,4525, por-
tanto P (X>4.500) = 0,5 — 0,4525 = 0,0475. Ou seja, há 4,75%
de probabilidade de pesos maiores do que 4.500 g para uma distribui-
ção absolutamente normal. Os dados empíricos dizem que a propor-
ção observada foi 4,18%.
2.2 — Como na distribuição N(0;1), 5,82% estão à esquerda
de — 1,57, numa N(3.447; 633), 5,82% estão à esquerda de 2.453
£ De fato,
x — 3.447
-157= as
x = 3447 — (1,57x 633) = 3.447 — 994 = 2453 6.
182
Pode-se comparar este resultado com a tabela 9.1 e vê-se uma
aproximação muito boa, pois 5,83% da população de recém-nascidos
pesam menos que 2.500 g.
9.3. Distribuição amostral de médias
Seja uma população de fichas numeradas segundo uma distribuição
normal po média m = 500 e desvio padrão o = 100; X — N(500;
100). A partir desta população são tomadas 156 amostras casuais de
tamanho n = 10, com o cuidado de Tepor cada amostra antes da toma-
da da amostra seguinte. Em cada uma é calculada a média aritmética
x e a distribuição observada destas médias amostrais encontra-se na
tabela 9.2,
Calculando-se a média aritmética e o desvio padrão desta distri-
buição de fregiiências, encontra-se, respectivamente:
k
at Dm fi
= EF - 8480 gy s=-/E
Fl 36
k 156 x É
f 2h
Fl
FI
Tabela 9.2 Valores de X em 156 amostras casuais de tamanho n = 10 tomadas
de uma população N (500: 100).
Percentagem de
Valores de X Nénero. de fnsóetrão Percentagem
405 |— 420 1 0,64 0,64

420 |— 435 4 2,56 320
435 |— 450 5 321 64
450 |— 465 9 5,17 12,18
465 |— 480 16 10,26 Ra
480 |— 495 29 18,59 «1,03
495 |— 510 31 19,87 60,90
510 |— 525 2 14,10 75,00
s2s | sao 20 12,82 87,82
540 |— sss 8 5,13 92,95
5ss |— 570 3 1,92 94,87
s70 |— s8s 6 3,85 98,72
s8s |— 600 2 1,28 100,00
Total 156 100

Como se ve, o valor observado de x, isto é, 503, é um valor apro-
xumado da verdadeira media da população, m = 500. Analogamente
Ss = 36 ec um valor aproximado de
o
sat e ai
vm va 10
Por outro lado. projetando-se em um gráfico a distribuição obser-
vada de X. como mostra a figura 9.8, o histograma obtido faz pensar
numa distribuição aproximadamente normal.
to)
8
420 450 480 510 540 570 600

Figura 9.8 Histograma correspondente à distribuição empírica de X referente aos
dados da tabela 9.2.
Estes fatos nada mais são do que a verificação empírica do se-

guinte teorema, de extrema importância para as técnicas estatísticas a
serem desenvolvidas mais à frente:
“Se de uma população com distribuição normal, com média m e
desvio padrão o, forem tomadas todas as possíveis amostras casuais
= tamanho n e, em cada uma delas, for determinada a média
, então a distribuição de X (dita distribuição amostral da média)
necó normal com média m e desvio padrão o ”
n
As discrepâncias obtidas no sentido da distribuição de X ser apro-

ximadamente normal com média e desvio padrão aproximadamente
iguaisame o
n
a
» É comum denominar o desvio padrão da distribuição amostral de médias de
erro padrão da média.
184
respectivamente devem-se ao fato de se terem tomado apenas 156 amos-
tras de tamanho 10 e não todas as amostras possíveis. A aproximação
melhora quando se tomam mais amostras ou aumenta-se n.
É importante observar que quando não se pode supor, como no
teorema anterior, que a população tem distribuição normal, utiliza-se
o chamado teorema do limite central.
“Se de uma população com média m e desvio padrão o, ambos
finitos, se tomam todas as possíveis amostras casuais de tamanho n e,
em cada uma delas, se determina a média x, então a distribuição amos-
tral de X se aproxima da distribuição normal com média m e desvio
padrão
n
à medida que n for grande.”
Exemplos
3.1 — Seja X: N(1,65;0,09). A distribuição amostral de mé-
= 0,
dias baseadas em amostras de tamanho 81 será X — N(1,65; =) =
V 81
N (1,65;0,01). Este conhecimento permite calcular a probabilidade de
se encontrar uma média amostral que tenha valores entre 1,65 m e
1,80 m. ,
O raciocínio é o mesmo utilizado no exemplo 1.1, fazendo-se as
devidas modificações por se tratar, agora, de uma distribuição de mé-
dias amostrais X e não mais de valores individuais x.
X — ms x-m
Z=E———— =—>——
O.
RE180 a— 165 015 |

0,01 0,01
Este resultado diz que é praticamente certo uma amostra de 81
indivíduos ter média amostral X entre 1,65 e 1,80 m, se a distribuição
da variável X for N(1,65:0,09).
3.2 — Seja X: N(3.450;630), X representando peso de recém-
nascidos em gramas. Que proporção de amostras de tamanho n = 9 é
menor do que 3.240 gramas?
Para a solução deve-se inicialmente determinar a distribuição amos-
630
tral de x, que será N(3.450; VD) = N(3.450;210). Usando-se então
18>
Lo
a tabela 9.4 da normal reduzida, tem-se
— 3.240 — 3.450 — — 210 = 1.
210 210
z =—1 corresponde a uma área interna de 0,3413. Portanto, deve-
se fazer 0.5 — 0,3413 = 0,1587, ou seja, 15,87% das amostras têm
média X 3.240 gramas ou menos.
3.3 — A distribuição da variável discreta CPO = “número de
dentes cariados por criança, na idade de 10 anos, residente em São
Paulo”. não tem distribuição normal.* Ao se trabalhar com amostras
de grupos de indivíduos, à medida que o tamanho da amostra n
aumenta, é de se supor que a distribuição da variável aleatória CPO =
“número médio de dentes cariados por pessoa”, tenda à distribuição
normal
Tabela 9.3 Número, percentagem e percentagem acumulada de crianças de 10

anos de acordo com o CPO observado, São Paulo, 1968/1969.
cro Nº % Percentagem
. acumulada
0 12 545 545
1 10 455 10,00
2 14 6,36 16:36
3 29 13,19 29,55
4 7 34,09 3,
5 16 7,21 70,91
6 29 13,19 84,10
7 14 6,36 90,46
8 8 3,64 94,10
9 4 1,82 95,92
10 3 1,36 97,28
nu 2 0,91 98,19
2 2 0,91 99,10
B -— 99,10
14 = 99,10
15 1 0,45 99,55
16 1 0,45 100,
Total 220 100,00
Fonte: Souza, J. M. P., Indice CPOD, Índice de Ataque, Número de Dentes

Irrompidos — Comportumento em Escolares do Município de São Paulo, tese de
doutoramento, Faculdade de Saúde Pública, USP, 1970.
* Souza. J. M. P., Índice CPOD, Índice de Ataque, Número de Dentes Irrompidos

— Comportamento em Escolares do Município de S. Paulo, tese de doutoramento,
aculdade de Saúde Pública, USP, 1970.
A tabela 9.3 mostra uma distribuição de CPO para a idade de
10 anos, em crianças da capital de São Paulo. Poder-se-ia escrever CPO:
DN (4,47;2,53). A tomada de quantidade muito grande de amostras de
tamanho 36, por exemplo, deve produzir uma distribuição CPO apro-
ximadamente N(4,47;0,42).
94 Papel de curva normal
Um procedimento rápido para se ter uma idéia visual de se a dis-

tribuição de uma variável aleatória é aproximadamente normal é a pro-
jeção dos dados no chamado “papel de curva normal”, representado na
figura 9.9. Nesta, no eixo das abscissas projetam-se os valores da variá-
vel e no das ordenadas (%) as percentagens acumuladas correspon-
dentes. Na figura 9.9 encontram-se projetados os dados relativos à
distribuição empírica de médias da tabela 9.2. Assim, até o valor 420
de X tem-se 0,6% da fregiiência total, até o valor 435, 3,2%, e assim
por diante.
No papel de curva normal, quando os pontos projetados apresen-
tam uma tendência linear, isto é, se dispõem sobre uma linha reta, isto
está indicando que a distribuição da variável em estudo pode ser pen-
sada como aproximadamente normal.
A explicação de o fato da linearidade traduzir normalidade reside na
maneira como é construído este papel. De fato, sobre o primeiro eixo
das ordenadas, que está indicado porZ (variável reduzida), a escala é
aritmética, como o é a do eixo das abscissas, X. Desde que na curva
normal entre x e y existe a relação de tipo linear
. x-m
z= o
é claro que, se em correspondência a um valor de x se pudesse calcu-
lar o de z e se projetasse neste papel, o gráfico resultante seria uma
linha reta. Aproveitando-se desta idéia, construiu-se o segundo eixo das
ordenadas indicado por %, isto é, das probabilidades acumuladas da
curva normal reduzida, isto é, com média igual a zero e desvio padrão
igual a um, da seguinte maneira: para cada valor de z no eixo de Z,
coloca-se em correspondência no eixo de % a probabilidade de se
obter, na curva normal, um valor menor do que aquele. Por exemplo,
para z = 0, corresponde % = 50% na tabela da curva normal;
para z = 0,5, a probabilidade de se obter na curva normal valores
menores do que 0,5 vale 70%, e assim sucessivamente. Portanto, a
187
%, a probabili
cada valor no eixo dosX corresponde um no eixo de
dade de valores menores do que aquele fixado z. Isto explica por a
que
a escala sobre o eixo de % não é aritmética.
Depois destas considerações, é claro que quando se projeta no ei
de X os valores da variável em estudo e nos de % as freqiiências
acumuladas em percentagens, se a distribuição de X for normal ou os
ximadamente normal, o gráfico correspondente será aproximadamente
uma linha reta.
As figuras 9.10 e 9.11 completam o exemplo, projetando sobre
um papel de curva normal uma distribuição sabidamente não normal
aquela da tabela 9.3,-da variável aleatória CPO e a distribuição de
pesos da tabela 9.1 que já se viu ser bastante aproximada da normal.
2%
Papel de curva normal
480 510 540 570 600

420 450
distribuição da tabela 9.2, onde

Valores de x
Verificação da normalidade da
Fi
-— N 9.9(500;32).
figura
189
.* Papel ce turva noctmai
a,
PSA
Valcres de x
|
Pigura 9.10 Verificação ds não-normalidade
da distribuição da tabela 9.3, onde
CPO — Nº (4,412,53).
2% Papel de curva normar
500 1.300 2.100 2.900 3.700 4.500 5.300 6.100

Valores de x
Figura 9.11 Verificação da normalidade da distribuição da tabela 9.1, onde
X— N (3.450;630).
Tetete 0a mora! reduto Aires toda de 62 2e sob cora pecnal
edema 7 N6DSO Produbeniados
pias que p= PO 2 < é
e
Lord - SEGUNDA DECIMAL DE 3, = e
teira
7 8 9 gs
02790 OMS 03586 29
06749 OTIS? 07535 o
10642 11026 11409 o2
1&s31 14803 15173 03
18082 18439 18793 os
21566 21904 22240 os
4857 2517] os
27935 28230 28524 o
OTBS 31057 31327 os
33398 3 64 33891 os
35993 36214 10
3 38100 38298 4
39796 39973 40147 12
a1466 S1621 4177; 13
“2922 43056 45189 14
8179 s4295 15
ss25s 45352 45449 16
s6164 46246 46327 17
46926 46595 47062 18
47558 47615 47670 19
48077 4812 169 20
“8500 48537 48574 2
= as679 48840 48870 48899 22
2 «s983 491 49134 49158 23
z «24 49324 49343 49361 24
2s ANIS 49396 ADI 49430 49446 49461 49477 49452 49506 45920 2s
2 aosco a9sT3 s9s8s 49598 as 621 49632 4964 26
y aos a96TE AMGES 49693 49702 4911 49720 49728 49736 27
2 SIS 9760 AM6T ANTIA SS78B1 aME8 4 49801 49807 28
zs SBIS 4985 4931 4986 498] 49846 49851 49856 49861 29
e a986o 49874 ses 49886 «9889 19900 30
31 49906 49910 49913 49916 49918 49921 49924 49926 49929 31
32 2955] AS 49936 49958 2 49944 49946 49948 49950 32
33 49552 s59S3 49955 49957 49958 4960 49961 49962 49964 49965 33
E s9966 29968 ss969 4991 AMT 49973 49974 49975 49976 34
as es som «918 49981 49981 49982 49983 49983 3s
36 see 9985 sS0AS ADO 49086 49987 s90987 49985 49988 49989 36
37 459 4990 aB90 49900 49991 49052 49992 49992 49992 49992 38
32 55 903 9003 as004 49008 49004 a9094 49095 49995 49995 37
39 SS 49905 4906 49906 49996 49906 49906 dé 49997 39
«s SE 5 8957 48087 49907 49997 49998 49508 49998 49908 so
s AB SONO SONO SONO 50000 50000 S0000 50000 50000 50000 as
[oO emacs IDO DD pai
teia e SEGUNDA E TERCEIRA DECIMAIS DE Z, teira e
decimat
Es Sol 2 as us ss 6 q Bs ss decimal
de
is gi To T .s SÃws.
Moss 00558 00997 01396 01795 02193 02989 03387 03784 Ed
P=0 uti GUS OIL OSS OSIGA O61S9 0655) Gee 55 G9O o1
08121 08512 08901 71 10068 10450 10834 11218 11600 oz
st 12362 12781 139 13495 13871 14244 14617 14988 15358 03
1576 u 6s: NIB 17545 1 1826 18970 DA
1552 19672 221 20568 20712 21055 21396 21735 22073 22408
pm vem 2a 29 2277 25016 25333 25647 os06
2620 26ST] 26883 21186 21488 27I86 28083 2837] 28669 91
226 2953 29814 30094 30072 30921 31152 31461 og
SN77 990 32252 3251 32767 33001 33273 3352 337169 34013 os
Pos
qa —— ESos E Bos sos Oos 35 Sr ss 95
Fome: fee. Joé Bonde da Camo A, Wilton de Oliveira, Tábuas de Estatística e Matemática, São Paulo:
Beasdicose 194 p 9.
192
Capítulo 10
Teste de hipóteses
10.1 Considerações básicas
A fim de introduzir a noção do que seja um teste de hipóteses, é

apresentada, a seguir, uma situação que, embora bastante simplificada,
representa uma esquematização de problemas reais.
Admita-se que uma droga P tenha, com relação a certa doença,
uma eficiência conhecida E», medida pela proporção de curas, da ordem
de 50%, isto é, Ep = 50%.
Admita-se, ainda, que certo laboratório esteja “interessado em lan-
çar no mercado uma nova droga N cuja eficiência, com relação à mes-
ma doença, fosse Ex, esperada ser superior a Ep. Antes, porém, do
lançamento definitivo no mercado da droga N, o laboratório pretende
testar a sua eficiência contra a eficiência da droga P, e só no caso de
N ser realmente superior a P é que esse laboratório está disposto a
abandonar a produção de P e passar, então, a produzir N.
Estatisticamente falando, o problema do laboratório é testar a hi-
Pótese de que ambas as drogas têm a mesma eficiência contra a hipó-
tese de que a droga N é mais eficiente do que a P. A primeira hipótese
€, em geral, chamada hipótese de nulidade (porque diz que a diferença
Clio
clsiências
duaj É soro) & rapsaiada pos Hj ca segunda é char
mada hipótese alternativa e representada por Há. Tem-se, portanto:
Ho : Ex = E
H: Ex > E
ou
Ho : Ex = 50%
H : Ex > 50%
A fim de testar Ho contra Hi, O seguinte

experimento é proposto:
*S daqueles
tomar já tratados
uma amostra de indivíduos
pela apresentando as mesmas pe
droga padrão, incluindo forma e gravi
193
da doença. submeté-los à droga N e, ao fim de certo tempo (o mesmo
que tem sido usado com a droga padrão), verificar a eficiência E,
na amostra considerada. A partir do valor Ex observado, uma decisão
podera ser tomada. entre duas po: íveis, a saber: a primeira consistente
em dizer que E, pode ser considerada como igual a Er, isto é, aceitar
Ha. e a segunda consistente em dizer que Ex pode ser considerada como
maior do que E». isto é, rejeitar Ho e aceitar Hi.
Suponha-se que Ho seja realmente verdadeira. Se for tomada a
primeira decisão (aceitar Hç), não se estará cometendo, evidente.
mente. nenhum erro. Se for tomada a segunda decisão (rejeitar Ho),
comete-se um erro, consistente em rejeitar H, quando H, é verdadeira,
Este erro é o erro dé primeira espécie, ou erra-tipo 1 do teste, cuja pro-
babilidade de ocorrência É representada pora. «A probabilidade de se
rejeitar H, quando ela for verdadeira, isto é, a, é o nível de significância
do teste. :
Suponha-se, agora, que realmente H, seja verdadeira, isto é, H,
seja falsa. Se for tomada a primeira decisão (aceitar Hç), comete-se
evidentemente um erro. consistente em aceitar H, quando H, é falsa.
Este erro é o erro de segunda espécie, ou erro tipo IT, cuja probabilida-
de de ocorrência se representa por f.
Esquematicamente, tem-se:
Verdade
Ho H,
Decisão
Erro É de segunda
Bl À pede, ou=
do tipo II = Aceitar Ho (1
H Não há erro
jeitar H,) quando H, é falsa
(H, é verdadeira).
Erro de primeira espécie, ou

H do tipo I = Rejeitar Hg (acei- E .
1 tar H,) quando H, é verda | Não há erro
deira (H, é falsa). Lo 4 Of dies
Qual destes dois erros é o mais importante depende de cada

pro-
blema. É óbvio que o ideal seria tornar ambos estes erros tão peque-
nos quanto possível. Todavia, reduzir um deles redunda, como será
visto. em aumentar o outro, A fixação das probabilidades destes erros
é antes um problema do pesquisador interessado em testar H, contra H,
do que um problema de estatística. Em geral, estar-se-á trabalhando com
testes para os quais o à é fixo e o B é o menor possível.
194
10.2 O teste de hipóteses
Feitas estas considerações, suponha-se que o laboratório estabele-
ce, antes da realização do experimento, conduzido com a finalidade de
testar H, contra H;, que aceitará a nova droga N como superior à
padrão P somente se N, quando aplicada ao grupo de pacientes, apre-
sentar um resultado “difícil” de ser obtido se a sua eficiência fosse de
apenas 509%, isto é, fosse apenas um resultado “pouco provável” para
uma droga de eficiência de 50%.
Para efeito de ilustração, “pouco provável” pode sgr pensado co-
mo associado a resultados cuja probabilidade de ocorrência, quando cal-
culada a partir do valor 50%, fosse de 0,05 ou menos. Nestas condi-
ções, o laboratório estará decidido a rejeitar H, toda vez que ocorrerem
resultados que se afastem da eficiência especificada em H, na direção
de H,, de tal maneira que a sua probabilidade de ocorrência, sob Ho,
ou de resultados ainda mais afastados, fosse de 0,05 ou menos. Isto,
em outras palavras, significa que o laboratório estaria disposto a errar
em 5% dos casos, rejeitando H, quando H, fosse verdadeira, isto é,
fixaria a = 0.05 ou 5%, em porcentagem.
O laboratório conduz o experimento em uma amostra de 10 pa-
cientes. e a droga N cura 9 pacientes, isto é, Ex = 90%. Nas condi-
ções acima, este resultado leva a aceitar ou a rejeitar H? A fim de
se responder a esta pergunta, é preciso calcular a probabilidade de se
obter 9 ou 10 curados numa amostra de 10 pacientes se a droga N
fosse tão eficiente quanto a droga P, isto é, saber com que probabilida-
de a droga padrão, que é 50% eficiente, curaria 9 ou 10 indivíduos
numa amostra de 10.
De um ponto de vista abstrato, é o mesmo que verificar qual a
probabilidade de obter 9 ou 10 caras no lançamento de dez moedas,
utilizando-se, portanto, a distribuição binomial. Como pode ser visto
na tabela 10.1, esta probabilidade é igual a 1,075% (= 0,01075).
Isto quer dizer que se Ex = 50%, em 10 pacientes a probabilida-

de de N curar 9 ou 10 seria de apenas 1,075%.
Ora, de acordo com o critério fixado pelo laboratório, desde que

L075% < 5%, ocorreu um resultado “pouco provável” para um me-
Sicamento de mesma eficiência que P. Assim, N é mais eficiente do que
P. Rejeita-se H, ao nível de 5% e diz-se que o resultado obtido é
significante ao nível de 5%, isto é, a eficiência de 90% difere signifi-
Cantemente de 50%, o que explica por que o teste de hipóteses
é tam-
bém chamado teste de significância.
155
Tabeia 10.7 Distribuição binomial para p = 0,50 e n = 10.
X = número de curados P (x) em %
JAM
»
ew
>o
*
11,719
Região de [ à = 5,40% ( 4 95
(=5%) das) 1,075%
vo
1
Total 100,00
Resumindo, o teste de significância constou do seguinte:

1.º) Formulação de H, e de H;.
2.º) Fixação de a.
3.º) Tomada de uma amostra de tamanho n e observação de Ex.
4.º) Cálculo da probabilidade de obter, em uma amostra de ta-
manho n, aquele valor Ex observado ou valores mais afasta-
dos de Ex, no sentido especificado em H;, se H, fosse ver-
deira.
5.º) Comparação desta probabilidade com a. Se ela for menor
do que a, rejeita-se H,, e se for maior do que a, aceita-
se Ho.
Suponha-se que na amostra de 10 pacientes tratados com a nova
droga N apenas 7 tivessem sido curados. Pela tabela 10.1, a probabili-
dade de 7 ou mais curados vale 17,189% (= 11,719% + 4,395%
+ 0,977% + 0,098%), resultado que é maior do que « = 5%.
De acordo com o critério fixado, não há evidência em favor de Hj, isto
é, o laboratório aceita Ho.
Note-se que este mesmo teste de significância poderia ser visto
dentro da seguinte segiência, equivalente à mostrada anteriormente.
1.º) Formulação de H, e de H,.
2.º) Fixação de a e consegiente determinação dos valores de X
que levam à aceitação de H,; tais valores de X definem a chamada re-
196
gião de aceitação de Ho. Automaticamente também fica definida a região
de rejeição.
3.º) Tomada de amostra de tamanho n e observação de X.
4.º) Comparação do resultado com a região de aceitação. Se
o
x observado corresponder a um dos valores de X da região de aceitação,
aceita-se Ho; caso contrário, rejeita-se Ho.
Assim, o valor observado 7 levaria, como anteriormente, à aceita-
ção de H,, como mostra a tabela 10.1.
Se Ho for falsa, de acordo com o exposto anteriormente, estar-se-á
cometendo um erro da segunda espécie, cuja probabilidade de acontecer,
antes de realizado o experimento, é B. A tabela 10.2 apresenta o valor
de se H; especificasse o valor 60% para Ew, isto é,
H, : Ex = 60%;
neste caso, o valor de É seria 83,271% (para um a = 5,470%).

O valor de depende de qual o valor fixado para a e qual o ver-
dadeiro Ey. Fixado a, na distribuição correspondente a H, ficam de-
terminados os valores de X que levam a rejeitar esta hipótese de nulida-
de e automaticamente aceitar H,; é a chamada região de rejeição de
Ho. Na distribuição correspondente a Hi, para um especificado valor
Ex, a soma das probabilidades associadas aos valores de X da região
de aceitação de H, fornece o valor B. Para H, : Ex = 60%, coma
=5,47%, o valor de B seria 83,271%, como mostra a tabela 10.2.
Tabela 10.2 Distribuição binomial para p = 0,60 en = 10.
Seus ul X = número de curados P(x) em %
o 0,010
1 0,157
Região de 2 1,062
de He 5
á 146 | 271% = 6
20,066
é 25,082
7 21,499
cosRegião
de Ho
de
E
10
ua0,605
100
197
Deve-se observar que, para a e n fixos, o valor de À, isto é, a pro-
habilidade de aceitar Ho quando Hg é falsa, diminui à medida que E
se afasta de S0%.
Chama-se poder de um teste ao valor de (1 — B), que nada mais

é do que a probabilidade de rejeitar H, quando H, é falsa e a hipótese
verdadeira é H.. O poder mede, portanto, a probabilidade que um teste
tem de revelar a falsidade da hipótese testada H, quando a verdadeira
hipótese é H,. Está associado à região de rejeição de Ho.
Em termos de poder, a tabela 10.3 mostra que o poder do teste

proposto para testar H, : Ex = 50% contra H,: Ex > 50% aumenta
à medida que os valores de Ex se afastam de 50%.
Tabela 10.3 Valores de B ede 1 — B para o teste de Ho : Ey = Ep = 50%

contra H, : Ey > 50%, quando n = 10,4 = 5% (a rigor 5,470%) segundo
diferentes valores de Es.
Ex Bem % I-Bem %
60% 83,2710 16,7290

70% 61,7218 38,2782
80% 32,2201 67,7799
90% 7,019: 92,9808
Se o nível de significância adotado pelo laboratório tivesse sido

“del %, isto é, a 1%, tanto o aparecimento de 7 ou menos, como
o de 8 curados, na amostra de tamanho 10, teria levado à aceitação de
H,. Os valores de , bem como os correspondentes de 1 — B, para o
caso em questão, acham-se na tabela 10.4.
Tabela 10.4 Valor de ) e de 1 — 5 para o teste de Ho : Ey = Ep = 50%

contra H, : E, > 80% quando n = 10, a «= 1% (a rigor 1,075%), segundo
diferentes valores de Ey.
Es Bem % I- Bem %
60% 95,3640 4,6360

70% 85,0692 14,9308
80% 62,4191 37,5809
90% 26,3902 73,6098
198
A comparação das tabelas 10.3 e 10.4 mostra que os valores de
B na tabela 10.4 são maiores do que os seus correspondentes na tabela
10.3. Em outras palavras, num teste de hipótese, para n fixo, 8 aumen-
ta à medida que a diminui.
Outro ponto que merece especial atenção
é aquele salientado na
tabela 10.5, ou seja, para valores fixados de a e de E, (em H;) o
poder do teste aumenta à medida que o tamanho da amostra cresce.
Tabela 10.5 Valores de Be de 1 — B para o teste de H : Ex = E = 50%

contra H, : Ex = 60% sendo q = 5% para diferentes valores de n.
Valor de a mais
n próximo de 5% Bem z Eres F
10 55 83,3 16,7
15 59 78,3 21,7
20 57 75,0 250
25 54 16 21,4
30 49 70,9 29,1
35 45 69,4 30,6
40 4,0 68,3 31,7
Deve-se notar que os exemplos até agora apresentados se

referiram a testes para os quais H, especificou valores para a eficiên-
cia maiores do que o proposto em H,, into é, Ex > Ep. o que levou
a definir a região de rejeição de H, na cauda superior da distribuição
binomial (x = 8,9 ou 10 curados, por exemplo). Se, entretanto, H;
fosse Ex < Ep, trabalhar-se-ia com a cauda inferior da binomial.
Em ambos estes casos, diz-se que o teste de significância é mo-
nocaudal ou unilateral. Se, ao contrário, H, estabelecesse que Ex = Ep.
então trabalhar-se-ia com ambas as caudas e o teste seria dito bicaudal
ou bilateral.
10.3 Curva característica operacional
Quando se projeta num gráfico os valores de 5 como função de

E, para a e n fixos, obtém-se uma curva denominada curva caracteris-
tica operacional (ou, abreviadamente, OC), neste caso para as hipóte-
ses Ex = 0,50,H,: Ex > 0,50. A figura 10.1 mostra a curva
ica operacional para testes bicaudais. Como se vê, o teste mo-
nocaudal é, para n e a fixos, mais poderoso do que o bicaudal.
199
B = Probabilidade de bicaudal
! aceitar H, quando H, é — — — monucaudal
Figura 10.1 Curva característica operacional (OC).
A figura 10.2 apresenta, para as mesmas hipóteses mas para

a = 10%, três curvas OC, a saber, para n = 10, 20 e 48. Como se
vê, para um a fixado, ) aumenta à medida que n diminui.
As curvas características operacionais são muito importantes por-
que permitem calcular rapidamente, num teste de hipóteses, o tamanho
B = Probabilidade de
aceitar H, quando H, é
verdadeira
0,50 0,65 Ex
Figura 102 Curvas características operacionais para diferentes n.
da amostra. De fato, para um a fixado, basta que o pesquisador espe-

cifique Ex efeele obterá 9 tamanho da amostra, satisfazendo às con-
dições impostas. Assim, na figura 10.2, para a = 0,10 e B = 0,20 se
Ex = 0,65, n será aproximadamente igual a 48.
10.4 Observações sobre os testes de hipóteses
A medida que testes de hipóteses forem sendo apresentados nos ca-
pítulos que se seguem, com referência a hipóteses específicas, deve ir
ficando cada vez mais clara a idéia de que se trata apenas de regras
de decisão. Mesmo correndo o risco de repetir o óbvio, vale a pena
insistir, neste momento, em que um teste de hipótese não prova e nem
desprova hipóteses, no sentido matemático do termo, isto é, de uma
demonstração.
A verificação de uma hipótese significa a tomada de observações
e a aceitação ou não de que as observações poderiam ter provindo de
uma população especificada pela referida hipótese que se quer testar.
É neste sentido que deve ser pensado um teste de hipóteses.
A teoria dos testes de hipóteses é devida a Jerzy Neyman e Egon
Pearson e data de 1935.
Em muitos problemas práticos aparecem situações em que o in-
vestigador precisa decidir por uma hipótese dentre um conjunto de vá-
rias hipóteses, isto é, vê-se frente a um problema que, em termos esta-
tísticos, significa escolher entre Ho, H;, H,, ......
ara tanto, as idéias aqui apresentadas teriam que ser generaliza-
das, e a metodologia estatística correspondente recebe o nome de “teo-
ria das decisões”.
10.5 Representatividade da amostra

Finalmente, é importante observar que a amostra dos indivíduos
a serem submetidos a tratamento é um elemento de uma população hi-
potética, constituída de todos os doentes de determinada enfermidade,
existentes e por existir. Por outro lado, o tratamento aplicado à amostra
de doentes modificaa condição dos indivíduos, que agora já são “doen-
tes tratados”, para os quais não existe também a população correspon-
dente, uma vez que só o grupo amostral de doentes recebeu o referido
tratamento. Por esta razão, a amostra não pode ser selecionada a partir
de uma população de indivíduos cadastrados com uma probabilidade
conhecida. Isto acontece, via de regra, em experimentação. Por este
motivo o que se faz é formar um grupo de indivíduos tão representati-
vos quanto possível daqueles da população para a qual se pretende
inferir as conclusões obtidas a partir da amostra. Assim, no caso pre-
sente, os indivíduos da amostra devem sofrer da mesma enfermidade,
com o mesmo grau de gravidade, medido através de diagnóstico pa-
dronizado, e apresentarem homogeneidade quanto a todos os fatores
Televantes para a indução que se tem em vista. O tratamento aplicado
deve ser o mesmo para todos os indivíduos, que deverão ser acompa-
nhados durante o mesmo período de tempo ao cabo do qual se verificará
à “cura” ou “não-cura”.
201
Capítulo 11
Teste de uma proporção populacional
11.1 O valor de p a ser considerado

O presente caso consiste em pôr à prova hipóteses a respeito de
determinada proporção p. Parece indispensável, inicialmente, considerar
em que se fundamenta a determinação do valor de p. Pode ser uma
probabilidade a priori ou a posteriori, ou ainda um valor originado de
considerações de ordem prática, específicas para o problema em causa.
Uma probabilidade a priori é a que se deduz, teoricamente,
partindo de certas pressuposições (hipóteses) acerca da natureza
do fenômeno considerado. As probabilidades a priori são encontradas
especialmente em física teórica, bem como na teoria dos jogos de azar.
Nos domínios da genética, são também comuns problemas que envol-
vem probabilidades a priori, impostas ao pesquisador pela admissão
dos princípios mendelianos.
Em contraposição, uma probabilidade a posteriori é a que se de-
termina partindo do estudo do comportamento das frequências relativas
que um evento apresenta nas várias realizações do experimento. Como
tal, uma probabilidade a posteriori está sujeita às flutuações casuais, e
só no caso das fregiiências relativas serem baseadas em um número su-
ficientemente grande de observações é que ela adquire uma estabilidade
que permite considerá-la como um único valor. Não há, talvez, um
setor do conhecimento em que não se tenha de considerar, a todo mo-
mento, probabilidades a posteriori, uma vez que é da observação dos
fenômenos, em sua ocorrência espontânea ou experimentalmente pro-
vocada, que decorre a maior soma de conhecimentos a respeito do mun-
do exterior. Como exemplo, pode-se recorrer à determinação do coefi-
ciente de fatalidade para certa doença; tal coeficiente é, obviamente,
uma estimativa da probabilidade de morte atribuível a cada paciente
acometido por tal enfermidade.
Finalmente, casos há em que nem existe um substrato teórico capaz
de validar, aprioristicamente, uma probabilidade, nem se dispõe de in-
formações pregressas que permitam seu estabelecimento a posteriori;
apenas certas peculiaridades do problema em foco podem conduzir o
203
pesquisador à fixação, muitas vezes arbitrária, de um valor para sua
requisitos.
probabilidade, que satisfaça a determinados
de p, pode-se
Feitas estas considerações a respeito da natureza
passar à apresentação do problema inicialmente proposto, através de
de situações em que ele surge. ,
alguns exemplos
Assim, suponh que um pesquisador esteja essado em veri-
ficar o papel do cloranfenicol na terapêutica da febre titóide, expresso
pela percentagem de curas. À primeira vista, o experimento a realizar
tratamento
deveria incluir dois grupos de pacientes, um recebendo o
seria anotado o valor
e outro não; no grupo recebendo O cloranfenicol
p; de curas e no grupo sem tratamento O valor ps, para a devida com-
da
paração. Entretanto, as evidências de ordem laboratorial em favor
eficiência do antibiótico em causa tornariam este tipo de planejamento
absolutamente antiético, pois, ao privar o paciente do recurso terapêuti-
co. ele estaria consciente da possibilidade de assim reduzir as suas pro-
babilidades de cura. Esta é uma situação em que a escolha de uma
probabilidade a posteriori, baseada em resultados prévios, para a cura
sem o novo medicamento, digamos p, acaba por se impor. Isto ocorre
ainda que se reconheçam todas as debilidades que resultam da compa-
ração dos resultados agora obtidos com os que foram fornecidos pela
experiência prévia, diante da impossibilidade prática de reprodução
fiel de todas as circunstâncias que rodearam esses casos. Naturalmente,
o pesquisador procurará reduzir ao mínimo a possibilidade de que o
grupo experimental difira sensivelmente do conjunto de casos previa-
mente considerados para o estabelecimento da probabilidade de cura
sem o remédio, conjunto esse que precisa ser suficientemente numeroso,
em face do que já foi antes discutido.
Um exemplo de probabilidade a priori poderia ser dado com o
caso de um pesquisador que desejasse verificar se todos os nascimentos
de gêmeos resultam da fertilização de dois ovos distintos, isto é, se
todos estes gêmeos são do tipo dizigótico. Se isto for verdade, ele po-
derá esperar que, entre o total de pares de gêmeos, uma proporção
igual a 1/2 apresente indivíduos de sexos diferentes, isto é, p = 1/2.
A observação da sucessão de nascimentos gêmeos, na população em
que se está estudando o fenômeno, permitirá a apreciação da proporção
com que, entre eles, se verificam pares com sexos diferentes, possibili-
tando a confirmação ou não do valor a priori proposto para Pp.
11.2 Teste das hipóteses H:p, =p
H:p <p
No tratamento da leucemia, os medicamentos são muito agressivos,
podendo ter efeitos colaterais indesejáveis. Assim, além de se procurar
na
drogas cada vez mais eficientes, há também interesse em drogas de
eficiência semelhante às já em uso, mas com menor grau de efeitos
adversos.
Suponha-se que as drogas usuais para leucemia provoquem efeitos
colaterais em 60% dos pacientes, ou seja, p = 0,60. Um laboratório
consegue eliminar de certo medicamento um radical acetil e com isto
supõe estar diante de uma nova droga com o mesmo poder de cura mas
com menor atividade indesejável. O laboratório espera, portanto, que a
proporção Pn de indivíduos com efeitos adversos (fracassos) tratados
com a nova droga seja menor do que a proporção p.
Está-se diante de uma situação em que o valor p foi escolhido
a posteriori, e o teste de hipóteses a ser conduzido é da forma
Ho :P =P
H:P <p
ou, substituindo p pelo seu valor conhecido p = 0,60,
Ho: Pr = 0,60
H,: Pa < 0,60
O laboratório iniciará a fabricação em escala comercial da nova

droga se aceitar a hipótese H). Para isso é proposto um ensaio clínico,
em que um número n = 20 de doentes é submetido ao novo trata-
mento, respeitando-se todos os aspectos éticos inerentes a este tipo de
experimentação.
Estabelecidas as hipóteses e determinado o tamanho da amostra,
há a necessidade de se estabelecer o critério de decisão, ou seja, qual o
ver-
tamanho dea. Um a = 1% significaria que, se a nova droga na
de
dade fosse tão adversa quanto as outras, haveria uma probabilidade
apenas 1% de o laboratório obter um resultado favorável à hipótese
novo medicamento.
H,, passando a fabricar desnecessariamente um
conduzir a
Um nível de significância tão rigoroso, no entanto, poderia
valores altos de fp.
Um valor de alto significa que, se a nova droga for realmente
de esta qualidade não
menos agressiva, haverá uma grande probabilidade
de ser fabricado. Neste
ser detectada, e um medicamento útil deixaria e
importante
caso particular de terapêutica de câncer, este fato é muito o
em conta.
tem, necessariamente, de ser levado
a = 15%. A distri-
Assim, foi fixado um nível de significância que
buição de probabilidades a ser usada é a binomial, admitindo-se
cada paciente tratado só pode ter uma dentre duas possíveis reações:
sucesso = sem efeito adverso,

fracasso = com efeito adverso.
205
Os parâmetros são n = 20 e p = 0,60, sendo a variável obser-
vada X = número de pacientes com efeito adverso, ou seja, número
de fracassos.
A tabela 11.1 apresenta a distribuição de probabilidades de uma
B(20:0.00) e as regiões que correspondem à rejeição e à aceitação
de H. Note-se que neste caso quanto menor O valor de x maior
a compatibilidade com a hipótese Hi; a determinação do maior valor
de x que pertence à região de rejeição de Hç é feita ao se somarem as
probabilidades a partir de x = O até se alcançar o valor mais próximo
do nivel de significância proposto a = 15%.
Ainda na tabela 11.1 têm-se os valores de 8 (e automaticamente
o valor do poder do teste), a partir das distribuições de probabilidades
que correspondem a algumas possibilidades de Hj : pr < O
Tabela 11.1 Distribuições de probabilidades, regiões de aceitação de Hy e de H,,

para o teste H, : p, = 0,60; H, : Pp < 0,60, para n = 20, e algumas especi-
ficações de valores de p, compatíveis com H,.
P (X = x), em porcentagem
x Pa = 0.60 Pp = 0,50 Pn = 0,40 Pa = 0,30

(%) (%) (%) (%)
.0 00 0,0 00 0,1
=a 0.0 0,0 00 0,7
sa 0.0 0,0 03 28
2 3 00 01 12 12
õ 4 00 | a= 0.5 | poderdo 3,5 | poderdo 13,0 lpoder do
2 5 01 [127% 1.5 | teste= 75 [teste= 17,9 [teste=
26
o 7
05
15 74
8% [on
[812%
qua | Lis
66 | 156%
qa
164
fico
[952%
É 8 3,5 12.0 18,1 11,4
9 7.1 16,0 16,0 6,5
= 10 117 17,6 11,7 3,1)
= 160 16,0 7,1 12
$ 12 181 12,0 3,5 0,4
Z 13 166 7,4 1,5 0,1
És 124 371 | B= 05 | p= 00 |p=
85 7,5 1,5 [ 58,8% 0,1 ( 24,4% 0,0 [4,8%
o 16 3,5 0,5 0,0 0,0
“od 12 0,1 0,0 0,0
é 18 03 0,0 0,0 0,0
$ 19 0,0 9,0 0,0 0,0
a
20 0,0POE
9,0 0,0 ES 0,0
aaa
a
o
9
Realizado o ensaio clínico, a hipótese H, será rejeitada e aceita
H, se 9 ou menos pacientes apresentarem efeitos adversos pela minis-
tração da droga sem O radical acetil, ou,o que é o mesmo, se 45%
ou menos dos vinte pacientes forem considerados fracassos.
Exemplos
1 — Para as mesmas condições acima, se o nível de significância
fosse exatamente 2,1%, ter-se-iam as seguintes situações no-
vas:
i) região de rejeição de H;: x = 0oulou20u30ou4
ou 5 ou 6 ou 7;
ii) poder do teste para p, = 0,50 : 13,2%
Pa = 0,40: 41,5%
Pa = 0,30 : 77,3%
2 — O número . médio esperado, m, de pacientes com efeitos
adversos depende do verdadeiro valor p, da droga. Para
pi = 0,60, m = 12;
Pr = 0,50, m = 10;
Pn 0,40, m = 8;e
Pp = 0,30,m = 6.
3 — Admite-se 15% como sendo percentagem razoável de cesa-

rianas em uma maternidade, devendo, ainda, estas opera-
ções ocorrerem de forma independente. A fim de verificar se
determinado hospital não estaria ultrapassando tal valor, o
órgão fiscalizador construiu as seguintes hipóteses a serem
testadas a um nível de, aproximadamente, S% de signifi-
cância:
Ho: pe = 0,15
H,: pe > 0,15
onde pç é a proporção de cesarianas.
gia SA observada foi X = número de cesarianas. A quanti-

uma semana sorteada
entre Observada de partos foi 13, ocorridos A emtabela 11.2 mostra à dis-
tribuia 52 semanas do ano da fiscalização.
estando
assinalad de probabilidades paraa respectiva B(13 ; 0,15).
por exe às as regiões de aceitação de H, e de Hj. Uma observação,
nidad, mplo, de 6 partos por cesariana levaria a considerar a mater-
“ como fora, dos limites aceitos.
207
Tabela 21.2 Distribuição binomial BCI3 ; 0,15).
E ss 5 1
X = número de cesarianas P(X) em
Turn idea td fem e
º 12,09
3g 1 27.14
Er 2 29.37
38o 3 19,00
PAES 4 838
= 5 2,66
8 6 0,63
7 ou
ê 8 0,02
8 9 0,00 | a= 3,42%
E 10 0,00 | (valor mais próximo de 5%)
E u 0,00
E 12 0,00
ê 13 0,00
Total 100
11.3. Teste de uma proporção usando a aproximação normal
Já foi visto que a distribuição binomial é sempre simétrica para

Pp = 0,50 e que para p »* 0,50 a simetria depende do produto np
ou nq. Na situação de se poder admitir simetria, a distribuição normal
poderá ser usada como uma aproximação para a binomial e, neste
caso. tanto melhor a aproximação quanto maior for n. Como já foi
referido no capítulo 9, pelo teorema de De Moivre, para n suficiente-
mente grande a distribuição binomial B(n ; p) se aproxima de uma
distribuição normal com m = npe o = v npq, isto é, N(np ; Vnpq).
Retomando a ilustração anterior sobre o tratamento da leucemia,
suponha-se queo pesquisador desejasse usar a distribuição normal para
o teste dos efeitos colaterais do medicamento.
Para tanto, determinaria os parâmetros da distribuição normal que,
neste caso, tomariam os valores:
média = m = np = 20x 0,60 = 12 casos
desvio padrão = 0 = v npq = V 20 x 0,60 x 0,40 = 2,2 casos
O teste de hipóteses
H :p = 0,60
Hi: p< 0,60
ara um & = 15%, , usando-se a N(12 . ; 2,2), consistiri jei
contrário
H. toda vez(verque ocorresse
tg E um valor x < 9,712 e aceitar Ho em oa
Este valor x que limita as regiões dê
itação e rejeição de enomina-sé
aceitaç; j E Xoritico? Sendo
=m+ o
Xorítico Za
onde 2, é O valor Z da distribuição Z — N 0;1
(0;1) que deixa
é uma pro-
babilidade a à sua direita.
15%
9,712 Aceitação de H, x = número de

m=12 pacientes com
qc=22 reações adversas
+
— 1,04 m=0 z= 30
c=1 =
Figura 11.1 Distribuição binomial aproximada pela normal.
Suponha-se que no ensaio clínico tivessem ocorrido 10 fracassos

(reações adversas).
. Utilizando-se o teste de hipóteses exato, isto é, através da distri-
buição binomial (tabela 11.1), a hipótese H, seria aceita, uma vez
que o valor x = 10 está na região de aceitação de Ho. Utilizando-se o
teste de hipóteses aproximado, isto é, através da distribuição normal
(figura 11.1), a hipótese H, seria também aceita para a = 15%, uma
Vez que x = 10 é maior do que 9,712. .
. Suponha-se, por outro lado, que o número de fracassos no ensaio ,
clínico tivesse sido igual a 9. De acordo com o teste exato, à hipótese
o Seria rejeitada: Analogamente, utilizando-se o teste aproximado
(como se vê na figura 11.1), o valor x = 9 pertence à região de re-
Jeição de Ho.
Vale a pena observar que, para um « fixado, o teste aproximado

g
Pode ser feito ou comparando-se diretamente o valor X observado, e-
notado x, com o valor x crítico
209
ou. calculando-se o valor z, em correspondência ao x observado,
x —m
onde Z = —
e comparando-se comz |. =-— za
De fato, se x = 9, ou compara-se 9 com

x = -— 104x2,2 + 12 = 9,712
crítico
ou calcula-se
9 -— 12
=>DD— = - 1,36
a 22
e compara-se com
z = — 1,04
crítico
Analogamente, se x, = 10, ou compara-se 10 com
Xorítico — 9,712
ou calcula-se
10 — 12
dq = === = 0,91
2a
e compara-se com E ctio = — 1,04.
O raciocínio poderia ter sido feito também da seguinte maneira:

sunondo-se que o resultado do ensaio clínico tivesse sido 9 fracassos,
o pesquisador poderia ter perguntado: qual é a probabilidade de, em
uma distribuição normal, obter para x no máximo o valor 9? Ora,
passando-se à variável reduzida, tem-se:
9 — 12
= — 1,36
2,2
. Indo-se à tabela da distribuição normal reduzida, encontra-se que
a área à esquerda do valor — 1,36 vale 8,69%, ou seja, a probabili-
dade de x tomar valores menores ou iguais a 9 na distribuição normal
é igual a 8.69%. Uma vez que o nível de significância fixado
foi 15%,
rejeita-se então H,.
210
11.4 Correção para continuidade
Muito embora o teste de uma proporção, aproximado pela distri

buição normal, tenha levado à mesma conclusão (em termos = eição
ou de aceitação de Ho) atingida pelo teste exato (binomial ) do axemo
plo exposto nota-se que os valores críticos, para um a fixado no dos
testes são diferentes. De fato foi igual a 9,712 o valor crítico, a ível
de 15%, dado pela distribuição normal em confronto com o sor 9
fornecido pela binomial. Ou, se se quiser pensar em termos de robabi
lidades, a probabilidade de no máximo 9 fracassos é igual a 12 To la
binomial e a 8,69% pela normal. A razão desta discrepância Feside
fato de que a distribuição binomial é uma distribuição discreta de e
babilidades, isto é, a variável X só pode assumir os valores O, 1. 2 Ê
n, enquanto a distribuição normal é uma distribuição contínua.
Por isso, antes de se utilizar a distribuição normal como uma aproxi-
mação da distribuição binomial é preciso que se faça uma correção nos
valores de x.
Esta correção consiste em imaginar que a variável número de su-
cessos é o ponto médio de uma classe fictícia de amplitude unitária.
Assim, x = 9 sucessos deve ser pensada como o ponto médio da classe
85 — 9,5, x = 10 como o ponto médio da classe 9,5 — 10.5 e assim
por diante.
Isto corresponde a substituir, no gráfico da binomial, as ordenadas
representativas das probabilidades por retângulos de base unitária e
altura igual à ordenada correspondente; é uma substituição de diagrama
linear por histograma, como mostra a figura 11.2. Este procedimento
é denominado correção para continuidade.
Isto posto, torna-se claro que, quando se calculou na distribuição
normal a área à esquerda do valor x = 9, deixou-se de lado uma área
que devia ter sido adicionada, ou seja, compreendida entre 9e9,5.
6
1 1
85 95 105 11,5 125 135 14,5 155 165
75
Figura 11.2 Ilustração gráfica do procedimento para a correção de continuidade.

2n
o =22
Aplicando-se a correção descrita, tem-se

1
(Ko +>)Z ) - m
o o
9 +05 — 12
= — 114
É 22
Indo-se, agora, à tabela da normal reduzida, encontra-se que a
área à esquerda de —1,14 é igual a 12,7%, valor igual à probabilidade
correspondente na distribuição binomial.
Resumindo o que foi dito, o teste de uma proporção utilizando-se
a distribuição normal será feito com a correção para continuidade, co-
mo segue:
Se H:P =P
H:P>P,
o valor de z corrigido será:

1 t
Go — 5) -m (x-— >)
— np
$ = o 2
º vnpq
Neste caso,
sez >z jeita-: H
Zrítico * Teleita-se
e se Zo <z us? aceita-:

ta-se Ho.
Se H:p =p
1: Po 2 anão » aceita-se Ho.
Capítulo 12
Teste de uma média populacional
12.1 O desvio padrão da população é conhecido
12.1.1 O teste E: mp =m
H:mp <m
Suponha-se que um pesquisador estivesse interessado
em investigar
se uma certa doença reduz a taxa de albumina no sangue, isto
é, se
os portadores desta doença têm, em média, taxa de albumina menor
do que a taxa média dos indivíduos sãos. Em indivíduos sãos as taxas
de albumina se distribuem segundo uma curva aproximadamente nor-
mal, com média m = 4,0 g/100 cc e desvio padrão o = 0,6 g/100
cc. Se for admitido que as taxas dos doentes também se distribuem se-
gundo uma curva normal (ou aproximadamente normal) com a mesma
variabilidade da distribuição dos sãos, então, chamando-se de my a taxa
média da população de enfermos, o pesquisador quer, em última análise,
testar as hipóteses:
H:me =m
H,:me<m,ou
H :mp = 4,0
Hr: me < 40
O investigador aceita rejeitar H,, quando Ho for verdadeira, em até
5% das vezes, isto é, se a população de doentes tiver a mesma taxa
média dos sãos, ele está disposto, em apenas 5% das vezes, à dizer que
os doentes têm taxa média inferior à dos sãos. Ou seja, ele escolheu
&= 0,05.
se preocupe
Por outro lado, suponha-se que o pesquisador não
em concluir peste que H, é verdadeira quando a taxa sa
que 40, mas ad aa o
da população de enfermos for menor do quer
taxa for igual a 3,7, ele
que 3,7 g/100 cc. No entanto, se esta Em
detectá-la com 90% de probabilidade. outras palavras, o pesqui-
215
4,0 quando
sador está disposto a dizer que a taxa média dos doentes é
das vezes, isto é,
na realidade ela é igual a 3,7, em apenas 10%
cc.
B = 10% das vezes, isto é, B = 0,10 se me = 3,7 g/100
Com estas informações, a primeira pergunta do investigador é:
quantos pacientes devo considerar para a feitura do teste de H, contra
H,, isto é, que tamanho deve ter a amostra? A fim de responder a
esta pergunta, serão usadas as curvas características operacionais (OC),
introduzidas no capítulo 8. As figuras 12.4, 12.5, 12.6 e 12.7 repre-
sentam as OC para os testes de uma média, onde 12.4 e 12.5 referem-
se a testes bicaudais para a de 0,05 e 0,01, respectivamnte. As figuras
12.6 e 12.7 são para testes monocaudais com a de 0,05 e 0,01, res-
pectivamente. A diferença entre estas curvas € aquelas apresentadas no
capítulo 10 reside no fato de que, agora, O eixo das abscissas refere-se
aos valores de
jm
— me |
d od DE 4
onde d pode ser interpretado como quantos desvios padrão se deseja
detectar entre a média da população estudada e a média da população
de referência.
Desde que o teste em apreço é monocaudal e «a = 0,05, será usada
a figura 12.6. Para tanto, calcula-se d:
a = 40 — 37 03 + os
0,6 06
Em correspondência a d = 0,5 no eixo das abscissas, e 5 = 0,10
no eixo das ordenadas, tem-se n = 34. Ou seja, o número mínimo
de pacientes para a realização do teste de H, contra H,, nas condições
fixadas, é 34.
Entre sua população de doentes, o pesquisador sorteia uma amos-

tra de 34 pacientes e, determinando a taxa de albumina em cada um
deles, encontra uma taxa média igual a 3,8, isto é, X = 3,8 g/100 cc.
Para. decidir entre H, e H,, com base neste valor amostral -en-
contrado, será aplicado o primeiro teorema do capítulo 9.
Pelo teorema, ao se tomar todas as possíveis amostras de
34
tamanho
de uma população normal (ou aproximadamente normal) com
média m = 4,0 e desvio padrão o = 0,6, a distribuição amostral de
x será normal (ou aproximadamente normal) com média 4,0 e erro
216
0,6
E" dão 57 Portanto, se H, for verdadeira,
: a variável aleatória Xe
x
cas 0,6
será in média 4,0 e erro padrão VJ e a variável reduzida
ê quase BoE
cen PEA uz mo NO(0;1)
51).
V34
Com isto a realização do teste de H, contra H, consiste em definir,

na curva normal reduzida, as regiões de rejeição e de aceitação de Ho.
Se o valor observado de z, que será denotado por z,, onde z, = Ho me
for localizado na região de rejeição de Hc, rejeita-se Ho. Aceita-se H,

em caso contrário.
Desde que o teste em apreço é monocaudal e a = 0,05, a região
de rejeição de H, é definida pelos valores de z menores ou iguais a
— 1,64 = Z co * COMO mostra a figura 12.1, estando também re-
presentada a curva que corresponde à distribuição sob a hipótese H;.
Figura 12.1 Teste de uma média.
No problema considerado, o valor observado de z foi igual a:
3,8 — — 0,20
zZ% = 40 MM. 2,0
0,10 0,10
a qual é menor do que — 1,64. De acordo com a regra estabelecida,

esde que o valor zo caiu na região de rejeição de Ho, rejeita-se Ho.
217
Isto é. o pesquisador conclui que a taxa média de albumina dos doentes
é menor do que a dos indivíduos sãos.
Para um teste bicaudal, a determinação do tamanho da amostra

é feita utilizando-se ainda
d= im —E mel
e as figuras 12.4 e 12.5, conforme o valor de a for 5% ou 1%, respec-

tivamente. O teste de hipóteses bicaudal H; : me = m,H/:me zm
para a = 5%. seria feito comparando-se o valor observado z, com os
valores críticosz =— 1,96ez | = +1,96.S — 1,96 <z,
rítico crítico
< 1.96, aceita-se Ho. Se z; < — 1,96 0u z, > 1,96, rejeita-se Ho.
12.1.2 Cálculo
de n sem uso das OC
Como foi visto, as figuras 12.4, 12.5, 12.6 e 12.7 permitem a

determinação do tamanho da amostra apenas nos casos de a ser igual
a 5% ou 1%. Conquanto estes sejam os valores mais comuns dea,
situações ocorrem em que o pesquisador quer determinar n em corres-
pondéncia a outros níveis de significância. Nestes casos deverá recorrer
à seguinte fórmula, se o teste for bicaudal:
( Ez + E
n=
d?
onde Zagéo valor de z na tabela da distribuição normal reduzida que
tem à sua direita 4) da área total; Zg é o valor de z que tem à sua

direita 5 da área total.
No caso do teste ser monocaudal, n será dado por:
(Za + Zp )2
na > & 1
onde Z; é o valor de z que tem à sua direita a da área total, e b

já foi definido acima.
218
No problema da taxa de albumina, o teste era monocaudal, à =
5%, B = 10% ed = 0,5. Portanto, z, = 1,64 e zp= 1,28.
Substituindo-se na fórmula acima tem-se

(1,64 + 1,28)2
= 34,11
(0,5)? á
isto é, aproximadamente 34 pacientes, o que concorda com o valor de
n obtido anteriormente a partir da OC.
12.13 O caso geral
Genericamente. pode-se esquematizar o procedimento de um teste

de média com desvio padrão conhecido da seguinte maneira:
i) existe uma população P com média m e desvio padrão o co-
nhecidos;
ii) existe uma outra população Ps, com o mesmo desvio padrão
o e média my, média esta que está sendo investigada;
iii) o pesquisador deve estabelecer suas hipóteses a serem testadas;
para H, : me = m, há três alternativas possíveis:
H :me> mo H:mp<m,o *m.

Hj: mM u
iv) é definido um nível de significância a, o número de desvios

padrão d entre mp e m a serem detectados e com que probabilidade
do teste
a diferença d, se houver, será detectada; isto é, fixa-se o poder
(1 — B) e, automaticamente,;
v) o tamanho n da amostra é calculado, ou usando curva OC ou
usando a fórmula aproximada;
vi) o pesquisador sorteia uma amostra de tamanho n em sua po-

X em estudo, em
pulação Ps, faz as mensurações devidas da variável
cada indivíduo da amostra, e calcula a média amostral Xo;
partir
vii) & é comparado com o valor X crítico, que é obtido a
da equação
x
ã crítico
.
ietítião z ; isto é,
219
Rortico = (Es 07) +m
Zico T 2a para a hipótese H, : me > m, ou
onde 47 cuco F — Za para a hipótese H; : me < m, ou
Coauco E 7a, e-2a, , para a hipótese H, : me = m, onde

zaé o valor de Z — N(0;1) que deixa uma probabilidade a à sua
direita e z, deixa L eo =-L;

% 2 Ryan"
viii) a hipótese H, será rejeitada se:
L> E uai , para a hipótese H, : me > m, ou
ko < Ru * Para à hipótese H; : mp <m, ou

z X x z , segundo a cauda da distribuição
ke > Xorítico Ou cãos Eerítico ses S
para a hipótese H, : my É m.
As alternativas para vii e para viii são:

vii') é calculado o valor z, segundo a equação
zm
=—>— e comparado com o z
crítico
;
x
viii) a hipótese H, será rejeitada se
%o > Zoíico * Para à hipótese H, : me > m, ou
Z < — Zosico * Para a hipótese H, : me <m,ou
>z ouz<z , para

a hipótese Hj : ms =* M-
crítico crítico
onde Za é definido como anteriormente, com o sinal usado conve-

co
nientemente, segundo a cauda da distribuição.

Exemplos
1 — Em recém-nascidos sadios a concentração de CO. plasmá-

tico em volumes por 100 cc tem distribuição aproximadamente normal
com média m = 55 vol/100 cc e desvio padrão o = 7 vol/100 cc.
Um pesquisador está interessado em saber se em recém-nascidos por-
tadores de fibrose pulmonar a concentração média de CO» plasmático
m, é maior do que m. Ele estabelece os seguintes critérios para deter-
minação do tamanho da amostra e execução do devido teste de hipó-
teses:
a) sea concentração média de CO» plasmático para os portadores
de fibrose for 55, o pesquisador aceita a probabilidade de 1% em dizer
erroneamente que a concentração é maior;
b) se houver uma diferença para mais correspondente a 1 desvio
padrão, ele deseja correr o risco de dizer erroneamente que não há
diferença somente com 20% de probabilidade.
Nestas condições. tem-se

Ho: mp = 55
Ho: mp > 55
a=1%:b=20%;d=1;n=ãt1O.
Suponha-se que, em sua amostra, o pesquisador encontrou a média
amostral x = DS ant a & = 58 vol/100 cc. Então

58-55 à =233
%= 7 1,36 que, comparado com 0Z = “01 =2,
v 10
maior do que 55,
mostra que o valor % = 58 não é significantemente s, de que a
O que permite levar à conclusão, em termos populacionai
média my é igual a m.
no sangue tem dis-

. 2 — Em indivíduos sadios, a taxa de fósforo
tribuição aproximadamente normal com média m = 3 mg/100 cc e
mg/100 cc. Com o objetivo de saber se no ar-
desvio padrão o = 0,6 um pesquisador
tritismo esta taxa média era alterada para 3,3 mg/100,
sua hipótese ao nível de
tomou uma amostra de 36 doentes e testou %, = 3,12 mg/ 100.
5% de significância; observou na amostra a média
221
O teste pode ser resumido da seguinte forma:
H : ma,= 3 mg/100 ce.
H, : m > 3 mg/100 cc.
a =005:d=0,5S;n=õ36;B =õ0,10;0X=ãõO0,1mg/100c
x = 1,64 x 0,1 + 3 = 3,16 mg/100 cc.
crítico
Como a média amostral X, foi menor do que a média crítica x
crítico
(3,12 < 3,16), a hipótese de nulidade é aceita.
12.2 O desvio padrão da população é desconhecido
12.2.1 O estimador s
O teste de uma média populacional apresentado na secção ante-

rior baseou-se na pressuposição de que a variabilidade da distribuição
das taxas dos doentes era a mesma que a dos sãos, isto é, 0,6 g/100 cc.
Entretanto, na prática, nem sempre esta pressuposição é verdadei-
ra, e a variabilidade o da ditribuição dos doentes é desconhecida e
precisa ser estimada a partir da amostra.
Por razões teóricas, o estimador de o a ser usado é dado por
k
> GG — 3)? &
FI
a,= d
onde o símbolo /N significa estimador, notando-se ainda o deno-
minador n — 1.
Quando n for grande, a variável
z-m
a
Yn
será aproximadamente normal, com média zero e desvio padrão igual
a um. ou seja, t equivale a Z — N (0;1), para amostras grandes.
Mas quando n for pequeno, a variável t terá distribuição denomi-
nada distribuição t de “Student",* com (n-1) graus de liberdade, isto
É, ta-s.
* “Student”. pseudônimo de W. S. Gosset, que introduziu pela primeira vez esta

distribuição na Estatística.
222
1222 A distribuição t; tabelas e curvas OC
A curva representativa da distribuição t tem

curva normal, sendo simétrica em torno da de ddpeispdaçado
achatada (figura 12.2). A distribuição t está tabelada em função de
seu único parâmetro, que é o número de graus de liberdade (n-1) e
sua equação é da forma
E
r(E + ")
2 e —EH
LD) E (1 + e)
er)
= constante nú
= parâmetro da distribuição = número d de graus de
liberdade > O
x = constante 3,1416
Ir = função gama, que, para números inteiros, apresenta a seguinte
relação: TP (g) = (g-1)
A tabela 12.1 mostra no seu corpo valores de t correspondentes a
algumas combinações de graus de liberdade e probabilidades resultan-
tes da soma de áreas das extremidades da distribuição. Assim, por
exemplo, para 11 graus de liberdade, a área compreendida entre — 1,796
e +1,796 vale 90%, sendo de 5% cada uma das áreas compreendidas
entre — x e —1,796 e entre +1,796 e + o.
ou rva normal
curva +
Dc ai
Figura 12.2 Comparação entre as distribuições normal e t.
a infinitos graus à h-
Note-se que, para a linha correspondente normal.
berdade, os valores de t são os mesmos da distribuição
t, ao contrário da
É importante frisar que a tabela da distribuição
distribuição normal, tabela as áreas somadas das duas caudas. Assim,
Ro es
para um teste monocaudal ao nível dea, O t crítico
teste bicaudal, a
deve ser procurado na coluna de p = 2a. Para um
coluna a ser usada é a dep =.
223
As figuras 12.8, 12.9, 12.10 e 12.11 são
as curvas ca Facterísticas
operacionais (OC) para determinação do tamanho
da amostra
de teste t. Como o desvio padrão o é desconhecid
o, d não é pri
mente “calculavel”, mas o princípio para sua determinaçã
o é o Eni
isto e, d é a quantidade de desvios padrão contida
entre as duas médio”
12.23 OtestetH,:mp=m
H:mp<m
Seja a mesma pesquisa proposta no início do capítulo, com as

mesmas especificações,
m = 40,2 = 5%; B= 10%;d = 0,5; o desconhecido.
O tamanho da amostra é determinado usando a figura 12.10 e é

igual a 36. O estimador s de o é calculado nesta amostra, na qual tam-
bém se calcula a média amostral %. Basta, então, obter o valor t, a par-
- x —m
tir da equação tp = ——— € compará-lo com o respectivo valor t
vn
crítico da distribuição t de “Student” em procedimento análogo ao efe-
tuado na seção inicial deste capítulo.
Suponha-se que na amostra foram observados % = 3,8 g/100 cc
es = 0,9g/100cc. Entãot, = ——— = ——— = —- 1,33.
v 36
Este valor deve ser comparado com o t crítico para n-1 = 35
graus de liberdade e p = 2a = 10%. Como a tabela não apresenta
valores para este número de graus de liberdade, toma-se a linha corres-
pondente a g = 40. Tem-se, então, t =— 1,684. Como t, > t
crítico crítico
a hipótese H, é aceita.
Exemplos *
1 — Um valor médio aceitável para nível de vitamina A sérica é
30 mg/100 ml de sangue. Uma investigadora estudou, entre outras ob-
servações, se a taxa média de vitamina A sérica entre migrantes em
* Exemplos 1 e 2 adaptados de Roncada, Maria José, Níveis Séricos de Viana

A e Caroteno nos Migrantes em Trânsito pelo CETREN, na Capital do q
dl São Paulo. tese de doutoramento, Faculdade de Saúde Pública, USP, 1972.
224
trânsito
menor dopelaque Central de Triagem e Encaminhamento de São Paulo era
a aceitável, em mulheres de 15
fosse igual ao nível aceitável, a investigadora a 19 anos. Se esta taxa
que não era, no máximo com 5% de
estava disposta a dizer
probabilidade. Se a taxa estivesse
afastada 0,4 o para menos, seria importante detectar esta diferença
probabilidade igual ou maior do com
que 90%. Foi pressuposta distribuição
normal para a variável X = nível
individual de vitamina A em mg/ml
de sangue, não sendo conhecida
sua variabilidade. O teste de hipótese
foi assim conduzido:
a) Ho: me = 30 mg/ml
H, : me < 30 mg/ml
= 0,05; 1-f (poder do teste) = 0,90
B = 0,10;d = 0,4;n = 67
b) Na amostra foi encontrada a média x, = 25,1 mg/100 ml e o

desvio padrão s = 12,4 mg/100 ml.
&-m 251-30
c) Foi calculado t, = =-—-3,24
s 12,4
vn v.67
Este valor foi comparado com o t crítico para n-1 = 66 graus
de liberdade, que limita 5% de probabilidades à sua esquerda; t crítico
= -1,67.
d) Como t; < Estão (—3,24 <—1,67), a hipótese H, foi re-

jeitada. A autora pôde chegar à conclusão de que, em média, o nível
sérico de vitamina A em migrantes que passam pela CETREN é menor
do que aquele dado como aceitável.
2 — No mesmo estudo, foram observadas as taxas de caroteno

sérico em ug/100 mi de sangue. Admite-se que um nível aceitável
seja 75 4g/100 ml e seria importante detectar uma possível diferença
para menos também de 0,4 o, mas com um nível de significância de
«= 1%. Dado que foram examinadas as mesmas 67 mulheres, o teste
Tespectivo teve as seguintes características:
a) H,: mp = 75 4g/100 ml
H, : me < 75 ug/100 ml
a=1%;d=04n=õ67
b) Os valores de, d e n determinam o valor de f, que foi apro-
ximadamente 20%; ou seja, se o nível médio na população de mi-
Erantes fosse realmente menor do que o aceitável, esta diferença seria
detectada com 80% de probabilidade.
225
€) Na amestra foi encontrad = 72,76
= 34,9 m2/100 ml; portanto, o Ed
72.76 -—75
= = — 0,53
34,9
(6
d) Como o valor crítico de t é aproximadamente —2,38, a hi-

pótese H, é aceita, dizendo-se que a diferença para menos encontra-
da não é significativa, ao nível de 19%.
e) O procedimento acima pode ser representado graficamente co-

mo mostra a figura 12.3.
727% 75 = 4/100 ml
Figura 12.3 Correspondência entre X e t no teste Ho : mg = 75 8/10 ml

H, : mg < 75 n8/100 ml.
3 — O limite de tolerância para o chumbo foi estabelecido em

0,20 mg/m* em ambientes fechados. Com o intúito de saber se em
superior ã0
média de chumbo era
determinada indústria a concentração
limite tolerável, o seguinte teste foi formulado:
226
a) As hipóteses foram
Ho : mp = 0,20 mg/m:
H, : mp > 0,20 mg/m?

com um « = 10%.
Uma amostra de 10 determinações foi t
tomada, encontrando-se os
seguintes valores, em mg/m3:
0,14 0,20 0,17
0,18 0,22
026 024 025 025 02.
Não foi especificado d, não sendo possívei, então, obter f.
b) A média amostral encontrada foi
O18 + 0,22 +... +023 214

=D Sp 0214 mem;
10
o desvio padrão foi s =
(us — 0,214)? + (0,22 — 0,214)2 + ... + (0,23 = 0,214)*

10 -1
/ 0,01444
= “0 = 0,040 mg/m*
c) Calculando-se t;, =
0,214 — 0,20
gel = 1,107
0,040
v 10
à = 10%, que
eSto
1,383. ser comparado com o t crítico para 9g.1.e
) r<t (1,107 < 1,383), o que permite

aceitar Ho
crítico
227
Figura 12.4 Curvas OC para diferentes valores de n para o teste normal bicaudal
e para um nível de significância q = 0,05.
o 1 » 3
Figura 12.5 Curvas OC para diferentes valores de n para o teste normal bicaudal
e para um nível de significância a=os
Grubls, F. E. and Weaver, Cc. L.
fronte e fig. 124 — 12.11: Ferris, C. D,
“Ope: racteristics for the: Common Statistical Tests of Significance”.
In air of Mathematical Statistics, v. 17 (1946), pp. 178-197.
228
É
ã
8
$
B = Probabil
-100 — 050 o 050 1,00 1.50 200 250 300
Figura 12.6 Curvas OC para diferentes valores de n para o teste normal mono-
caudal e para um nível de significância q = 0,05.
de de aceitar H,
B = Proba
- 100 — 0,50 o
Curvas OC para diferentes jiló de n para o teste normal mono-

Figura e12.7
caudal para um nível de significância x =
Probabilidade de semitar HM,
Figura 12.8 Curvas OC para is valores de n para o teste t bicaudal e

para um nível de significância q =
É
E
5
E
$£
g
E
zg
ã
06 08 10 1214 16 18 20 22 24 26 28 30 32
O 02 04
d
ê: j le
de n para o téste de tbicaudal
Figura 12.9 Curvas OC par a diferentes valores
a = 0,01.
para um nível de ae nificância
“2n
B = Probabilidade de aceitar H,
ás; 5
4
l
-06-04-02 O 0204 0608 10 1,214 16 18 20 22 24 26 28 30 32

d
Fira 12.10 Curvas OC para diferentes valores de n para o teste t monocaudal

e para um nível de significância q =
Probabilidade de aceitar Ho
p=
w Ny
08 06 0402 0 02 0405 081012 14 16 18 20 22 24 26 28 30 32

d
Fi
sta 12.11 Curvas OC para diferentes valores de n para O testo + monocaudal
um nível de ignificância a = 0,01.
2
do "EISNO SP LONA “QUSAG 9 CBINUVO OP 0195 950 “eiproa :uog
a
= vLoo
:
E
uso
ê$
se
ã&
E o
Ea
esso
E
“ vago
vaso
a
vaso
úÉ
ê
a
gsu
4
aa
yTú
“;
:
$:
;:,
: . ovo ovo oro vo =d
*
d-1m (à =) do S0b qui 1 0 VOO MOVA co MPMAS OP 1 OMG Et PA Í a
e
e
Capítulo 13
Comparação entre as médias de duas
populações
São bastante comuns as ocasiões em que se têm duas populações

e se deseja comparar suas médias, não havendo algum valor previa-
mente conhecido que sirva de referência, como foi mostrado no capítulo
anterior.
Pode-se distinguir, então, duas situações, que levam a diferentes
procedimentos quanto à condução dos respectivos testes de hipóteses:
a) as duas populações não são correlacionadas, ou seja, não têm
elementos em comum: comparação entre população masculina e femi-
nina, entre doentes e sadios, entre cidades diferentes;
b) as duas populações são 1 i A. com as a,
sendo feitas no mesmo indivíduo em duas situações ou condições dife-
rentes, ou em um par de indivíduos com condição comum: comparação
de resultados antes/depois de algum tratamento, comparação de órgãos
pares (olhos, pulmões, membros), observações de resultados quando
houve emparelhamento prévio.

não-correlatas
13.11 Os desvios padrão das populações são conhecidos
Suponha-se que se esteja interessado em comparar a taxa de iodo

no sangue de indivíduos normais do sexo masculino com a de indivíduos
do sexo feminino, respectivamente m; e mo. Admita-se que
normais
as respectivas distribuições sejam aproximadamente normais, com des-
Vios padrão o, e oa.
O teste H:m =m
será conduzido utilizando-se O seguinte

H, : m; x mo
teorema:
“
Seja P, 1 uma édi m, e desvio! padrãoE 0;
ã normal com média
população
Sejaj P» uma Poputaç
população normal com média m» e desvio padrão 0a.
233
Para P, e P. não correlatas, se de P, se tomar todas as possíveis
amostras de tamanho n, e se calcular, em cada amostra, a res-
pectira media amostral &y, e se de P, se tomar todas as possíveis
amostras de tamanho n; e se calcular, em cada amostra, a res-
pectiva média amastral x. pode-se, então, definir uma nova va-
riavel X, — Xu. que também terá distribuição normal, com média
o? 0,2
m =m - me desvio padrão O = a + na
”
o; G2
da seja R—-R-N(Mm-—my +)
Este teorema faz o teste da diferença de duas médias recair no
este de uma média, utilizando-se então a variável reduzida
G& — E) — (Mm — me) Gy — Ro

z = E -
o q q + 0,2
ny x Do ny Do
para a tomada de decisão, reescrevendo-se as hipóteses como

H:m —m =0
H:m —m < 0.
mm — mo |
Fixados
a ep e d=
NV o2+ o
os tamanhos das amostras n = n; = no são obtidos na devida curva

OC (figuras 12.4 e 12.5). Assim, para « = 1%, 6 = 10% ed =
0.7. a figura 12.5 indica n = n, = n: = 40, ou seja, deve ser sor-
teada uma amostra de 40 homens e de 4 mulheres.
Suponha-se quê 0, = 1,1 ug/100 cc e o; 2,0 aa cc e
x = 6,8 ug/100 cc.
que nas amostras se encontre x, = 5,9 ug/100 cce X,
= — 249
valor que está na região de aceitação de H,; conclui-se, portanto, que à

taxa média de iodo no sangue é estatisticamente a mesma para homens
e mulheres. A figura 13.1 ilustra a situação de forma completa, in-
234
P,
p
ms
a =14
q =20
> DD» ——
m=m-m, Hu o)
o= 19 + zo?
40 Eau
H,
Ho
a
m-m=0-02-09
5 m-M=0 4-& m-m=o0+
02
— 2,49
T
— 2,58
Figura 13.1 OtesteH,:m —m =0

H:m-—-m O
EM eadvy
* Como d = 0,7, tem-se | m, —
mo | = 07 X 036 = 025.
cluindo o teorema, devendo-se notar que há curvas representativas da
hipótese H,. colocadas à direita e à esquerda daquela correspondente a
H.. pois o teste é bicaudal. A área que corresponde a 8 é marcada em
cada uma das curvas.
131.3 porém
Os desvios padrão das populações são desconhecidos,
supostamente iguais
Quando os desvios padrão das populações não são conhecidos,

caso muito comum na prática, há necessidade de estimá-los a partir dos
dados amostrais.
Admitindo-se que. nas populações o desvio padrão 0; seja igual ao
desvio padrão o, ambos iguais a um valor comum o (6 = O =0),
os dois valores amostrais s; e s» podem ser usados para obter uma
estimativa de o, fazendo-se uma média ponderada, com os graus de
liberdade de cada amostra como pesos.
Tem-se então:
- & — »&) - & — &)
jr Ty mB
[OL
DD n>
& — &) o GG — =) .
fee (144) ai
ee td
O estimador proposto para o é:
= m-Ds2+(m-—1)s?
m>-l+n-—1 =
Q— Dsi+(m— Ds
1 +tm-—-2
onde o símbolo A indica que no lugar do parâmetro populacional será

usado um valor amostral, ou seja, será feita uma sf .
O teste é então conduzido de forma análoga ao anterior, não
se usando mais, todavia, a distribuição normal, mas, sim, a distribuição
236
t,amostrais
com (m Xi,+ Xz,na Si— € 2) graus de liberdade. Assim. à partir dos valores
sa e tp (no lugar de 2,) comparando-
com o valor t crítico da tabela, para o nível de significã
os devidos graus de liberdade: j
entsapéia Elentindo
G — X)o
t=
[ED m u w is
Er: E =
Para a determinação prévia dos tamanhos n, e n, das amostras,
podem ser usadas as curvas OC para testes t (figuras 12.8 a 12.11).
Fixados a, 8e d, onded = im
—— — 2!
me | Im
LM
Tm — é
1+ 6 20 com
trado um valor de n: demonstra-se que os tamanhos das amostras de-
n+1
vem ser n; =n lo = 2
Seja. então, a comparação entre as taxas médias de iodo em ho-

mens e mulheres, admitindo-se desconhecidas as variabilidades de am-
bas as distribuições. Estabelecidas as hipóteses H,:m, — m. = O
H:m —-m =0,
paraa = 1%, 8 = 10% e d = 0,6. a curva OC da figura 12.9
7+1
indica n = 47; portanto, n = no = =24
2
Suponha-se que, sorteados os indivíduos das duas amostras. os va-
lores encontrados tenham sido os seguintes:
& 5.9 ug/100 cc : % = 6.8 ug/100 ce

Si 1,3 »g/100 ce = 1,7 ug/100 ce
Tem-se, então,
59 — 6,8
ess Dea
(23 x 1,32) + (23x 1,7) 1
24 +24 -2 124; 24
- 0,9 09 206
a . 0,190 Il
(E sbre ) x 0,083 /
46
237
O valor —2.064 é maior do que o valor crítico —2,704 de t
para aproximadamente 46 graus de liberdade. é à = 0,01; assim, a
hipótese H, é aceita. A figura 13.2 ilustra o procedimento.
T T
— 2,704 + 2,704 “og. |

t
[
Figura 13.2 Oteste H;:m, — m + O
H,:m, — m, & O para O desconhecido.
|
|
13.14 Os desvios padrão das populações são desconhecidos, porém |

|
supostamente desiguais |
Se, ao se comparar duas populações quanto às suas médias, com

variabilidades desconhecidas, não for possível admitir-se a igualdade
das variabilidades, os desvios padrão amostrais não poderão ser agrega-
dos em um valor médio, devendo ser usados isoladamente,
O teste de hipóteses é conduzido de maneira análoga, modifican-
do-se a equação referente a to e o número de graus de liberdade.
Tem-se, então,
(GH — Ro
t =
si2 2
Dn Do
que deve ser comparado com um t crítico, para o valor de a específi-

cado e para g graus de liberdade, onde
238
= (8) (E) — 2, segundo Welch.*
mM E
+
m+1 n+1
Exemplos
1 — Em sua tese de doutoramento,
Andrade +* Procurou verifi-
car, entre outros fatos, se a dosagem média de lipídi. os em tecido pla-
centário de ratas no 21.º dia de prenhez era maior do que em rat:
20.º dia. No experimento foram usadas vinte
rats, metade das quis
foi sorteada para sacrifício no 20.º dia de prenhez, enquanto a oia
metade foi sacrificada no 21.º dia, para os devidos exames. O pesqui-
sador estabeleceu um nível de significância de 5%, para uma diferença
em desvios padrão a ser detectada de d = 0,6; a variabilidade, supos-
tamente igual nas duas populações, era desconhecida, devendo ser esti-
mada nas amostras.
i) Nestas condições tem-se:

H : mo = mo Ma — mo = 0
ou
H : mo > mo Mo. — Mo > O
“=5S%;d =0,6;n=hno=ãmn= 10 usando-seacurva OC
correspondente à figura 12.10, verifica-se que, para as condições aci-
n
ma, tem-se 8 = 20%, pois 10 = “n=20-1=ã19
oy e
alor crítico de t para o teste éé t. sítico: = 1,734;
+734;
mg/100g
ii) as dosagens de lipídios nas vinte ratas foram, em
de tecido placentário:
20.0 dia — 721,43 71429 72127 71667 11724
725,81 729,41 722,22 717,24
734,38
Xo = 722,60 Sw = 422123 So = 6,5017
Sera Different
a
a or let,ulati B. L. : “The generalization oito,

CR
24:28-38Pt
of “Student's” problias :
1i»/Sndrade,
ando arianos Antonio Suzart, e 4a Ailvidade Lisossômica e o Teor de
Relação Entre
are invad
iPídios na Placenta Fetal da Rata Durante O Período Funcional, tese à? doutora-
mento, Escola Paulista de Medicina, 1975.
239
21º dia — 737,50 74500 760,00 770,83 75111
742.86 761,67 75439 749,09 74074
Km = 751,32 sm = 1102211 sy = 10,4986
Obtém-se, para a estatística to, O valor
751,32 — 722,60
= =
Pe x 110,2211) + (9 x 42,2723) ( 1 1
10 + 10 —2 10 + 10 )
t; é maior do que 1,734, o que leva a rejeitar Ho; ou seja, pode-se

dizer que a concentração de lipídios no tecido placentário é maior em
ratas no 21.º dia de prenhez do que em ratas no 20.º dia;
ii) a figura 13.3 ilustra o procedimento do teste em questão.
H, H,
Ma — mo = ma —my=20d 2872 *e
7,345
o A
0 1,734 tag.
Figura 13.3 Teste de duas médias do exemplo 1
240
2 — Em trabalho de livre-docência, Yunes * desejou testar, entre
outras, a hipótese de que recém-nascidos de peso normal
(> 2.500 g)
têm perímetro cefálico em média maior do que recém-nascidos de baixo
peso (< 2.500 g), à um nível de 10% de significância. Foram obser-
vadas 301 crianças de menos de 2.500 g e 220 de 2.500 g ou mais e O
perímetro cefálico medido em cm, não sendo conhecidas as variabilida-
des populacionais, admitindo-se, inclusive, poderem ser diferentes.
Nas amostras, O autor encontrou
Rxopeso 3053em So E 54756 crê
Epeso norma * 2388 em ema T 21025 cm?
A estatística t, foi calculada, resultando
33,88 — 30,53 3,35
Ga e 20
0,1666
/ 5,4756 is 2,1025
301 220
O valor t; = 20,11 indica diferença estatisticamente significante

-ao nível de 10%, pois o valor crítico de t é, praticamente, 1,282. O
número g de graus de liberdade é
[E 2uoas | 2
=—
301
+ 220
= -2= 508.
E (atos?
301, ”220
= fe en
302 221
13.1.5 Considerações sobre tamanhos das amostras e sobre

correspondência entre valores de d.
i) Ao se fazer teste de hipóteses sobre as médias de duas popula-

ções, os tamanhos das amostras n = nº = n, obtidos utilizando-se
as curvas operacionais OC, têm por finalidade assegurar um valor
Para um d e um a especificados. Em certas situações não há possibili-
dade de se obter o número suficiente de indivíduos para se completar a
Gs
* Yunes,
; . João. . Principais
incipais Características Médico-Sociais
Características Med Soc do Recém-Nascido de
Baixo Peso, tese de livre-docência, Faculdade de Medicina da USP. 1975.
241
quantidade n de uma das amostras, apesar de ser possível a ol
de um numero maior do que n para à outra amostra; nesta situação o
pesquisador estará interessado em saber qual o tamanho da amostra
maior que pode compensar a amostra menor, a fim de manter o mesmo
vakr de 5. para dea especificados anteriormente. Isto é possível
através da relação
n Mm Ns
Costa E
2 mn + m
Sen = 20, ideal seria n, = 20e mn: = 20. Se for possível obter
apenas 16 indivíduos para n; (Mm = 16), então n, deverá ser 27 indiví-
duos, pois
» 16. ms e, então,
2 16 + m
160
=— = 27.
nd
ii) a quantidade d para uso das curvas OC, no teste com desvios
padrão conhecidos, é definida como
ma — me |
Vo+ 07
d=
que, no caso de o;? ser igual a 032, fica
d
jm
= E — me ,
para o teste com desvios padrão desconhecidos, porém supostamente

iguais, a quantidade d é definida como
d= pm — mo]
20
Vê-se, portanto, que tais quantidades não são exatamente as mes

mas. É fácil fazer a correspondência entre elas, chamando a primeira
de d ; e a segunda de À raaisa y tem-se que
So conhecião, * v2 = à (o gesconhecido) Ed
d = Eco desconhecido, x2=d x 1,4142

( O conhecido) v2 (O desconhecido)
242
= Áro contecião, 2 sia:
5 =d
ou À q gesconhecido,
ora de fr dido
um e de 4 =
teste usando distribuição L-será d=08x
Pgnadiça É
É sie entenda sd e nes co songs

desde E
populaçõ 1
132 Teste de hipóteses para as médias de duas
Suponha-se que um pesquisador estivesse interessado em estudar
o efeito de certa dieta alimentar sobre o aumento de peso em indivíduos
adultos normais.
depois de certo tempo do emprego da dieta. Nestas condições, o pro-

blema do pesquisador pode ser posto como o de testar a hipótese de
nulidade H, : mz = m, contra H, : m» > m.
Para tanto, uma amostra de n adultos normais seria tomada e os
seus pesos determinados antes da aplicação da dieta e algum tempo
depois da sua administração. :
O fato de o mesmo indivíduo ser usado duas vezes introduz uma
correlação, isto é, o peso atingido depois da dieta pode depender, até
certo ponto, do peso inicial do indivíduo.
or esta razão, este problema não pode ser tratado da maneira
usual vista quando do estudo de populações não-correlatas. Em expe-
rimentação, esta dificuldade aparece quando se está diante de experimen-
tos do tipo conhecido por antes e depois do tratamento, ou quando se
estão comparando dois métodos distintos de contagens ou medidas onde,
para melhor aquilatar a eficácia de certo método, o mesmo indivíduo
é usado nas duas amostras. sa x =
Uma maneira de contornar esta dificuldade é introduzir uma variá-
vel auxiliar D, definida, para cada indivíduo, por:
dieta
D = peso depois da dieta — peso antes da
ma
deto
aumen peso
popula-
Com isto as duas populações de pesos passam a uma só
de D. Se a distribuição de
São de aumentos de ES So é, de valores normal, pode-se demons-
pesos puder ser considerada aproximadamente normal, com média
trar que a distribuição de D é aproximadamente
Mo = m, — m, e desvio padrão
243
q= Vo +0;3 — 204
e o;? são, respectivamente, as variâncias das populações de

onde c,?,
pesos antes e depois da dieta e 0); é a covariância entre os pesos antes
e depois da dieta. º
Portanto, chamando-se de D a média baseada em uma amostra de
tamanho n. de acordo com o teorema do capítulo 9, D terá distribui-
ção norma! (ou aproximadamente normal) com média = my é erro
padrão = ==.
vn
Ou seja, a variável reduzida
D — mo
z= Tg
vn
um.
será normal com média zero e desvio padrão igual a
Em termos da nova variável, as hipóteses H, e H, tornam-se:
H.o:m = 0
Ho:m >0
as quais. agora, dizem respeito apenas a um média populacional. Re-
cai-se. portanto, no caso do teste de uma média populacional, analisa-
do no capítulo 12. Como, em geral, 0; e O; são desconhecidos, Op será
também desconhecido e precisará ser estimado por
k =
> -— DJ f
i=1
Rir d
com o que z será substituído por
D-m
t= Eu sp
*p
vn
a qual, sob a veracidade de H,, terá distribuição t de “Student”, com
(n — 1) graus de liberdade.
Admita-se que o pesquisador fixasse a em 5% e que desejasse,
detectar. com 90% de probabilidade, um aumento relativo de peso de
O.Ro isto é. 5 = 10% para d = 0,8. Indo com estes valores à figura
[2 1 encontra-se n = 15.
244
Suponha-se que o pesquisador tenha tomado 15 adultos e reali-
zado o experimento, encontrando os dados da tabela 13.1.
Tabela 13.1 Pesos antes e depois do experimento.

do Peso em quilos Peso em qui
Nº i E los D = aumento
indivíduo antes da dieta após a dieta de peso
Rai 54 ss 4
2 61 6s 4
3 50 52 2
4 74 3 4
5 80 82 2
5 62 60 3
7 58 s8 0
8 55 56 1
9 49 53 4
10 63 8 0
" 67 68 1
1 70 72 2
13 7 72 1
14 75 79 4
15 66 72 6
Então,
— 26
D = E = 1,73 kg
s = 212 kg
Substituindo estes valores, tem-se:
1,73
tb = = 3,16
2,12
vas -
Indo à tabela de t para a = 0,05 e 14 graus de liberdade, encon-
tra-se o valor 1,761. Desde que t > 1,761, rejeita-se Ho, isto é, a
dieta empregada, aumenta, em média, o peso dos indivíduos.
Exemplo
Em tese de livre-docência, Raia * testou a hipótese de a possibili-
dade da quantidade de proteínas totais no plasma, depois de operação
de descompressão portal seletiva em portadores de esquistossomose man-
sônica, ser diferente da quantidade antes da operação; foi escolhido um
nível de 5% de significância, com uma amostra de 17 pacientes. As
suas hipóteses foram:
* Raia, Silvano, Descompressão Portal Seletiva na Esquistossomose Mansônica,

tese de livre-docência, Faculdade de Medicina da USP, 1978.
245
-— m =
: - antes º
H Mjepois m antes Mepois
E epois
= m ante 0
Bar Mago Dantes
a=S&:n= 7 pacientes (17 pares de observações); não houve

especificação de d, não sendo possível calcular B; O valor crítico de t,
para 16 graus de liberdade, é | 2,12]: 05 resultados observados foram,
em gramas de proteínas totais por cento de plasma, os seguintes:
>
Caso n.º Antes Depois Diferença (D)
O
1 6,9 6,9 0
4 7,8 8,6 — 0,8
5 6,6 8,7 —21
6 59 7,3 —14
8 78 78 0
9 64 82 —18
10 8,8 9,3 — 0,
q 73 73 0
2 8,0 76 0,4
13 8,6 7,8 08
14 77 1,6 0,1
15 79 78 0,1
16 87 81 0,6
1 58 6,8 —10
18 92 8,3 0,9
19 9,3 10,2 —0,9
2 8,9 9,1 —02
= 7,14 8,08 — 0,34
Sp 0,88
0,21
'D
Calculando-se t,, tem-se
MMA BOB 054 = de Ho-

0,88 “o — 1,62, que indica aceitação
v 17
Capítulo 14
Teste de uma variância populacional
: Em capítulosos anteriores, os ; testes eram referentes aa hipóteses

hipó
medidas de posição. Neste capítulo e no seguinte
sob
serão read
testes de hipóteses sobre medidas de variabilidade.
14.1 A distribuição X,,.,,
Em certas situações poderá haver interesse em verificar se deter-

minada população tem uma variabilidade específica, ou seja, se o desvio
padrão o desta população é igual a um certo valor ox, utilizando uma
amostra para este fim. Sabendo-se que a variável
2
E (x -— =)
é o estimador de o e que s? = T
=
é o estimador de o?, o devido teste de hipóteses é feito utilizando o

seguinte teorema:
“Seja uma população com distribuição normal de média m e desvio

padrão o (variância = 02), isto é, X — (m; 0). Se desta população
se obtiver um número infinito de amostras de tamanho n, calculando-se
as quantidades X e s? em cada amostra, a variável aleatória

a =o e
j eráE distribuição
da .
Xa 9º OU seja, o Ds O Xa-1y onde
x (n=1) lê “qui quadrado com n —1 graus de liberdade” e é uma

distribuição estatística definida pela equação
1 82 8
tQ)=—— o? e?
2 5 r(8)g
2 =
247
onde
E = constante paramétrica = número de graus de liberdade
> 0
e = constante numérica = 2,718
T = função gama, já definida anteriormente.
A distribuição x? tem como média o número de graus de liberdade,

m = g.e desvio padrão o = v 2g, sendo seu coeficiente de assimetria
V 2 .
= — € o coeficiente de curtose = 3 + 8
vg
A tabela 14.1 apresenta valores da variável x? que deixam à sua
direita valores especificados de área p para possíveis graus de liber-
dade (g).
14.2 Oteste H :oc=o

H:cxo
Se um pesquisador supuser que sua população de estudo tem como

desvio padrão o; = 9, ele pode, por exemplo, estabelecer um nível de
10% de significância para o devido teste e resolver trabalhar com uma
amostra de tamanho n = 20.
Admitindo-se que nesta amostra ele obtenha o valor s, = 7, basta
M- Ds? (20 -1)7 — 19x49

= 11,494,
o? 92 81
Como o teste é bicaudal, a região de aceitação de H, está com-

preendida entre os valores 10,117 < x < 30,144, que limitam uma
área de 90%; assim sendo, a hipótese H, deve ser aceita, concluindo-se
que s = 7 pode ser aceito como uma simples variação casual do ver-
dadeiro valor. o = 9
A figura 14.1 ilustra o teste executado. O estudo do erro de segun-
da espécie e o valor de sua probabilidade ) está fora do escopo deste
livro.
Exemplos
Suponha-se que o desvio padrão de concentração de chumbo tole-

rável ambientes fechados seja de 0,025 mg/m?, sendo indesejável
248
11,494
Figura 14.1 O teste Hoy E

09, para à = 10% e 19 graus de liberdade.
variabilidade maior. Se em uma indústria for de interesse testar esta

hipótese, deve ser definido o nível de significância (seja a = 10%)
e estabelecido o número de observações a serem' tomadas (seja n =
10). Tem-se, então,
H : o = 0,025 mg/m?
H, :o> 0,025 mg/m'.
Se as dez determinações de chumbo no ar forem aquelas do terceiro
exemplo do capítulo 12 (0,18 — 0,22 — 0,14 — 0,20 — 0,17 —
0,26 — 0,24 — 0,25 — 0,25 — 0,23) e se se admitir distribuição
normal, então
x = 0,214 mg/m?
So = 0,040 mg/m?
ss = 0,0016 (mg/m?)”
Nestas condições:
tm 60 8X 008 S ogos,
o 0,000625
(n— 1) a alor críti
Uma vez que 01 tem distribuição x; e o valor crítico
para a = 10% é 14,684, então, como 23,04 é maior do que 14,684,
à hipótese H, é rejeitada.
249
OSC Otstt DOG JUS SC VILIO UU VO LO O O aa
GEISE I9bTE OEEBT LLSbL SLOTT B9L6L BOLLI PLSSI OSTMI s
LTOVE N6ETE OEELT Lh9ET BEST 6€681 BT69I Ly8B'pl S9StEL 8
TIGTE GIEOE 9EE9T GILTL EOLOT PILBI ISI9L STbl GLBT Lt
uosp gsg'u seB'Be E9S'SE SOLTE bT6L DEEST TOLIT OTB6] TOULI GLESI GOMEL B6NTI| VT
ozots PlE'bh 99STY TS9LE T8EPE SL9OE ULIBT LEEPT LOBO OP68L ELH9L NISPI LOST] PESIL| ST
6LNIS 086 — OLT'OY SIPE 96I'EE ESSGT 96OLT LEEET Eb66] T9OBI 6S9SI BPBEL TÓGIL 9SBOL| dT
siL'sy BE9Tp 896'8€ TLI'SE LOO'TE 6Tb'Bt BIOT LEETL IZO61 LBILI SPB'PI I60EL EGTIL 96NOL] EL
aos 68Tob — 6S9LE PesiEr EIBÍOE TOELT G6EGPT LEEIT TONBL PIE9L IhO'PI BEETI OONOL TyS'6 uv
L6L'9p Toc EME'9E IL9TE SING ILIOT SBT LECOT T8ILI Shb'SI ObTEL I6STI SI66 | L68'8 KR
ste'sp 99SLE OTO'SE OIyIE TIpBL SEO'ST SLLTT LEE6I 999 BLSPI Emil Isso! LET 098 o
T61'9€ LB9'CE PhIOE 4OTILT 006 ET 689IT BEEBI TSESL SILEL IS9TI LINOL L9S'8 EE9'L 6
soB'pg 9rE'TE 69B'Bt 686ST O9LTT 10907 BEELI Obb'bl LSBTI S9BO1 O6E6 9O6L SIOL 81
60PEE S660€ L8SLT 69LPT SINIT NIS'61 BEE9L TESEL TOOTI SBO0L TLIB SST'L 8op'9 u
000'T€ cE9'6T 96T'9T TYS'ET sobr BIM'BI BECSI peotl TSNIT ZIE6 T96L vIS9 TIBS 91
8LS'0€ 6sT'Bt 966'Pt LOE'TT WE'6l TUELT GEEPI III LOCOL Losig INTL S86s [44 st
TpI'6z ELB'9T se9Et OIT ISI8I TU] GECEL IZHOL L9b6 O6LIL ILS'9 89E'S 099'%p +
Be9LT Lost TETT TIB6I S8691 GLS] OPETI 966 PESB THOL TO8S S9L'p LoW'p a!
LIT'9T pSO'pz QTO It 6pS'BI TIBSI NOPI ObEIIL PEO'6 LOBIL POES OTUS BLr'y ILS'E t
sui INT SL9'61 SLULI TE9PI G68TI IPEOL ShI'B 6869 8Ls's SLS'p — 609'€ eso'E H
6oT'ET I9TIZ LOE'B1 L86S1 Tr'cl IBLTIL ThE'6 LTL 6LIO so8p — Op6'E 6s0'€ 8sst ot
99917 6961 61691 4B9bT TU] 9901 cpE's c6E9 OBE'S B9r'y sTEE Test 880T 6
060'07 89181 LOS'ST T9EEI OO TT peso phEiL LTS'S vOSP O6hE fELT TEOT 9p9'T 8
sLy'81 Ta9'91 L90'p1 LIO'TI €OB'6 csc'g 9pE'9 IL9p TUBE CeBIT L9NT O P9ST 6EUI l
tis! €EO'ST Testi sy9or ess'g TETL BbE's siste OLOE vOTT segt ver uso 9
980's1 8eE'cl ULOIT 9ETI6 68TiL 490'9 IsEp — O00!€ ebeT OI9T AM! tsLio +ss'o s
Ler 899'TI 884'6 6LL'L 6865 8L8p — LSEE Set 6b9T 4901 TIL'O evo L6T'o +
svETI LEB'6 SIB'L 15T'9 top s99€ 99ET pepil soo't vesio — TSEO s8ro SINO f
oIT'6 vi8'L 166'5 su9'p 6IT'E sort 98ET EILO 9ph'o tz io coTO pOPOO Tozo'o t
seg'g tvs WB 90LT vo vLo'I ssPo BPI'O TH BSIOIO E6EO0O BTNO'O LSIsO'O 1
to'o vo so oro oco os'o 0L'0 o8'o 060 s6'0 86'0 660 |g É
>
uwn vid | Y Op seojua
250
Oprpsogi sop CO SUN
Pp antas Sp wo d opupiiqugosd
“XONMQuIa 1ºp1 vpoqui
ya “Joustaq 2100]
omed 's Jasnaa Jouonioa, remos à Pupo “ontojota meto esmbras P pind soon FoJaGP "A TRA
LiE'TI szroo! sec 96 TES'06 LTs's8 suL6L vEE' (69
T6L'601 NTO RO ost'ss 80€! €8 ILS'LL
BST'LOI 9T9'56 S96'58 Pev'sl
9IL'+OL LITEO sL9'E8 9LT'EL
I8€'18 0€9'9L STNIL TEL SECI9 Levis ger 8» Ler
991'TO1 To8'06 ESG'98
oss'pg Tao! 6L L6€1"PL TL689 cr s9 sec! ss Iyg%os esp'op 669! 6€
6LE'88 L6L'8p 969'ph
0s6's8 10T'T8
SI8'6L ss6'9p LEGTP
EIStER
TULL 96h79 Lisp egrIp
69018 Igter EEP'GE LEv'9E 9pT IE
IZO'sL zes'6o tur'so ter'oo LT8'9s SECIS 607'9p
9I9'BL
PELI9L EI9TL sos'L9 L9N' (e PoT'Bs EUL rs seco» ELE'py LIZ AA 689'LE +oL VE LOL'6T
ILI'S9 E66' ss ozpicr
0E8'T9!
18h09
SSL'9E LST'PE S9L'0€ dhI'BT EBE'ST
907'99 tos pal'ss 9sp'6p tera secTy
9Ep09 6SL'SS 69tLr s9T'py SEE'6E Teve SpE'TE 150'67 60s'9T segieT
1699 EPELT
svoith LES'0E
TIG'6E SEL'BT EP9'ST
S6L'LE 8EG'9T TSGEL
LBv'os ses'uy 99p'BE S99'sE 9EETE ELELT 8hI'sT ILUTT tLooz EBL'LI
Levo aep'es v6l'9p
Capítulo 15
Comparação de variâncias de
k populações independentes
Pode-se destacar duas situações em que se propõe a verificação da

igualdade da dispersão de mais de uma população:
i) previamente a um teste de hipóteses de duas ou mais médias,
com a comparação dos desvios padrão sendo, então, auxiliar para este
outro teste;
ii) quando há interesse de se estudar as variabilidades de per si,
independentemente dos valores médios. Esta situação pode ser exem-
plificada com a comparação de resultados esportivos, onde atletas mas-
culinos certamente terão resultados médios maiores que atletas femini-
nos; um possível interesse seria o de verificar se as variabilidades em
torno das médias são as mesmas nos dois sexos, o que indicaria, talvez,
condições uniformes de treinamento.
Ao se comparar desvios padrão (ou variâncias) de populações
independentes, a situação mais simples é aquela em que somente duas
populações estão sendo estudadas, das quais se tomam amostras para
o devido teste de hipóteses, não importando se os tamanhos destas
amostras são iguais ou diferentes.
Se a comparação estiver sendo feita entre mais de duas popula-
ções, tem-se um método se os tamanhos das amostras forem os mes-
mos e outro se forem desiguais.
Em todas as situações, existe a pressuposição básica de que as po-
pulações seguem uma distribuição normal.
15.1 O teste de hipóteses H, : O = 02 . A distribuição F.
H:0o =02
Para o teste acima toma-se uma amostra de tamanho n, da popu-

lação P, e uma amostra de tamanho n: da população P.. Em cada uma
destas amostras é calculada a variância (s;? e s.2); faz-se então o
253
si? so? a : É
quociente F, = E ; (ou RE que indicará se os dois desvios padrão
são dif s ou não (costur colocar no numera-
dor a maior variância). O valor observado da variável F, deve se
comparado com o valor crítico obtido em tabelas referentes à chamada
distnbuição F, que é caracterizada pelos números de graus de liberdade
a i ss
(g) do numerador (n,—1) e do denominador (n2—1); ou seja, +
so?
- F
(nm — 1, ng —1).
Isto porque, se se tomar duas variáveis aleatórias independentes,
cada uma delas com distribuição x?, dividir-se cada uma delas pelos
graus de liberdade respectivos e depois se efetuar o quociente, tem-se
uma nova variável, com tal distribuição F.
Ou seja,
MD Eisê. Es
(m-—1) . X 2 (m=1) + (n=1
(m—1) E
(ne—1) so? (m—1, n2—1)

ese me: E —
(=D) x 2 (n,—2) a -1
(no—1)
A distribuição F é definida pela equação
(+45) 8 B g-2 — B+&
onde
tr 8 o FF? (gta) ?
& = constante paramétrica = número de graus de liberdade do

numerador > 0 .
constante paramétrica = número de graus de liberdade do
1
”
denominador > O
Tr = função gama, já definida.
Esta distribuição tem média m = a , para g,>2 e desvio padrão

8—
0= 28 (gta?)
(Bi +82) ara >4
V gs (m—2)7 (gam4)| PIB 2 É
254
Cate?) V 8 (go —4) :
e coeficiente de assimetria = » B&:>6.
(8-6) V Bi FB 2
As tabelas respectivas são as de números 15.1-1,15.2,15.3
15.2, 15.3 ,15.
15.5 e 15.6; os valores de F que aparecem
no corpo das bed a
aqueles que limitam à sua direita áreas de 0,1%, 0,5%, 1%, 2,5%
5% e 10% respectivamente, para g, e g, graus de liberdade. | ;
Suponha-se, então, que se queira comparar a variabilidad
i
em determinado treinamento para salto horizontal, entre Sc Ea
sexo masculino e feminino da região Norte do Brasil *. Estabelecidas
as hipóteses, admita-se um nível de significância a = 5% e amostras n
= 16 atletas masculinos e no = 13 atletas femininos. Efetuados os
exercícios, que são medidos em metros, obtém-se s;2 = 1,83 m? para
1,83
os homens e s;? = 0,25 m? para as mulheres. Obtém-se F =
0,25
= 7,32; como o teste é bicaudal, o valor crítico deve ser procurado
na tabela 15.4 para > no cruzamento correspondente à coluna de
15 graus de liberdade e à linha de 12 graus de liberdade, onde se

encontra 3,18. Como 7,32 é maior do que 3,18, rejeita-se H, e
dizer que a variabilidade dos resultados é diferente para homens e mu-
lheres. A figura 15.1 ilustra o teste apresentado.
Ho
yW
CR
V
Figura 151 Oteste H,:0; =0

od 0*
. O valor 0,34 ã F(88)
é obtido pela relação Ê ' no caso 2,96
M. M. e Mol
vei P. R: . Graniz,Graniz, Congress Kiss,inM. A.
abro
Dados dede E Barbanti, V.;FieldOliveira,
** Dados Tests, XXI World of Sports Medicine,
JEBS 76. Track and
Brasília, 1978.
255
15.2. O teste de hipóteses para mais de duas variabilidades
populacionais
15.2.1 Amostras de tamanhos iguais

Quando for necessário verificar a igualdade simultânea de mais
de duas variâncias populacionais e houver possibilidade da obtenção de
amostras de mesmo tamanho n, pode ser usado um teste proposto por
Cochran *.
Sejam as hipóteses H : =0? = 0; = = 0
H : existe pelo menos um o? diferente.
Obtidas as variâncias amostrais s;?, so, ..., sx?, basta calcular a
estatística
o maior dos s;? à
Cc=-—————— e comparar o resultado com o valor crítico
k
a
FI
para o a escolhido, na tabela apropriada (15.7 ou 15.8), para k po-
pulações e g = n—1 graus de liberdade. Se C, > € o rejeita-se H,,
critic
pois pelo menos aquela variância 0;? é maior do que as outras:
Com o fim de ilustrar a aplicação do teste descrito, sejam três po-
pulações cujas médias serão comparadas através de análise de va-
riância **. A fim de verificar a condição de homocedasticidade (varia-
bilidades iguais) a um nível de 5% de significância, as variâncias amos-
trais são calculadas e se obtém s;? = 2,07 g?,s2 = 7,12 gºes? =
3,25 gº, cada amostra sendo composta de 10 indivíduos. Calculando-
se C,. obtém-se:
= 7,12 7,12
ia 207 + 7,12 + 3,25 12,44 áitaa.
Na tabela 15.7, para 5% de significância, k = 3 ece = 9 graus
de liberdade, tem-se C. = 0,6167. Como 0,5723 é menor do
rítico
que 0.6167, a hipótese H, é aceita, ou seja, as três variabilidades são
estatisticamente iguais, podendo-se, então, prosseguir com a análise de
variância.
* Cochran, W. G., The Distribution of the Largest of a Set of Estimated Va-

riances as a Fraction of Their Totals”. Annals of Eugenics. Il: 47, 1941.
* O método de análise de variância será apresentado no capítulo 16.
256
15.2.2 Amostras de tamanhos diferentes
Esta situa
situação
é a mais comum naa prática, e
, a c ompar: ã
variâncias é feita através do teste de hipóteses idealizado
ano
o rn Sul, Sudeste,
o jam sendo treinados
deseje saber se, para valores de “salto sobre banco”,
as variabilidades
dos resultados são semelhantes.** Propõe-se, assim, o teste
Ho = 0? = 0 =0P = o;
H, : pelo menos um o? é diferente
estabelecendo-se um nível de significância de 1%.
Os atletas submetem-se aos treinos
a e os resultados são os seguin-
tes, em metros quadrados e metros lineares:
resultados
Região n g s
Sul (1) 33 29,38 SA

Sudeste (2) 42 30,89 5,6
Centro-oeste (3) 13 13,47 37
Nordeste (4) 36 29,74 55
Norte (5) 25 26,68 52
Bartlett propõe para o teste de homogeneidade de variâncias (ho-

mocedasticidade) a estatística:
2 M
1I+A
que tem distribuição aproximadamente x , onde

1
k
M= [(.-omej-(Dim- D ms)
FI
k
> = 1) sê
2 = is
n.. —k
o o” io
a Barton, M. S., “Properties of Sufficiency and td Teu”, Proceedings of
e Royal Society, Serie A, vol. 160, n.º 901, 18-5-1937. i
A., op. cit.
** Barbanti, V.; Oliveira, P. R.; Graniz, M. M. e Molin Kiss, M.
257
Rs
A a1 1
5) E ess1
E 3(k-—1) (E Ss
& = k-1
im x = logaritmo natural de x* .
= tamanho da amostra da população i
rosa
-. = soma dos n;
= número de amostras
Efetuando-se os cálculos para esta particular situação, obtém-se:

M = [(149-5) Ins) — [[32 In 29,38] + [41 In 30,89] +
+ [12 In 13,47] + [35 In 29,74] + [24 In 26,68]) =
= 144 X 3,3365 — 477,5746 = 2,8814

(32x29,38) +(41x30,89) +(12x13,47) + (35x29,74) + (24x26,68)
= = 28,1216
149-5
LL 1,1 1 1
AD3x4132
|ls 41
> +04
12 35
4>24 0 149
——— — 5
|= 0,0169
28814
n=4
'
B = [DÍ
1+0,0169
= 283 35
B, deve ser comparado com o valor crítico da tabela para g = 4
graus de liberdade. Vê-se que B, = 2,8335 é menor do que 13,277,
aceitando-se, assim, H, e concluindo-se que as variabilidades de resul-
tados do treinamento “salto sobre banco” são iguais para atletas mas-
culinos das cinco regiões.
É importante se saber que o teste de homogeneidade de variância
de Bartlett é pouco robusto, sendo bastante afetada sua confiabilidade
quando as distribuições se afastam da normalidade.
Exemplos
Ns Yunes **, em sua tese de livre-docência, desejava testar a hi-
pótese de que o perímetro cefálico médio de recém-nascidos de peso
normal era maior do que o de recém-nascidos de baixo peso. A fim de
decidir por qual dos testes t o autor deveria optar, foi testada, pre-
* Logaritmo de x na base e que pode ser calculado a partir do logaritmo na

base 10 (logy, X) pela igualdade : In x = 2,3026 logy X.
Yunes. João. op. cit.
258
viamente, a hipótese de 301
igualdade de desvios padrão, a um
crianças de baixo peso na
ní
5% de significância. As
variância amostral s;? = 5,48 cm, enquanto as 220 crianças de
peso normal apresentavam uma variância amostral sº = 2,10 , cm? 5
asim, 5,48
E = 210 = 2,610; este valor deve ser comparado
com
F(300,219) crítico para 2,5% . Como a tabela não apresenta esta possi-
bilidade, a comparação pode ser feita com o valor F( <,x ). ou mesmo
F(120,120), que são, respectivamente, 1 e 1,43, rejeitando-se H, em
ambas as situações. Desta forma, o autor foi levado a usar o teste t para
diferenças entre duas médias populacionais com desvios padrão desco-
nhecidos e diferentes.
2 — Em dissertação de mestrado, Rosa* necessitava comparar
três programas educacionais de escovação, incluindo o grupo-controle,
através da média do índice gengival. Prévia à análise de variância re-
querida, foi construído e efetuado o teste de homocedasticidade, ao
nível de 1%. As hipóteses foram
Ho) = 02 =ãa?
H, : há pelo menos um o? diferente.
Os tamanhos das amostras eram 43, 43 e 35, indicando o teste
de Bartlett. As variâncias amostrais obtidas foram s? = 0,121;
ss? = 0,0225; s;? = 0,0289, conduzindo ao seguinte resultado.
2,4358
= = 0,020642
118
M =[118 x (—3,8804)) — [[42 x (—4,4145)] +[42 x (—3,7942)]+
+ [34 x (—3,5439)]) = — 457,8872 + 465,2580 = 7,3708
A = Sa
1
ge dg À es a = 0,011426
6 | 42 42 34 118
&=2 B = ars =7,2875

1+0,011426 .
A comparação de 7,2875 é feita com )2» críticoufdade
para 1%das encontrado
variâncias
Na tabela e 14.1, ou seja, 9,21. Portanto, a homoge
É aceita a análise de variância pode ser efetuada.
nada OS Antonio Galvão Fortuna, Efeitos do Tem: po de Escovação Supervisio-

Idade Por Professores Sobre as Condições Gengivais d
le Escolares Com 10 Anos de
“de, dissertação de mestrado, Faculdade de Saúde
Pública da USP, 1978.
259
“SIPUIQUIVO “SSSLg “APUÇ SM Te SS0tsTUL EXINAWO(M “foprvH “OQ "H 9 BOMES SH “1 TOA 'SUPPISUDIS 40) S2QUI DyLISUCIG 2P 004
“4 9P JOPEUNHOLSP OP 2 JOPEISNU OP SPepsoQM Sp SEIS SO ojusureansodsas “ureuatadas 28 a !3 apag
OL Sri 991 vel 661 eri
assse
6 98 TE sit TEL oprE
asa
SLT UM 0% ee BEE asE
Tl 66 SIE OE gre GSE x
SET ME QE LE us 99% s
LGT vie TE spe 6s€ pre
SUE ME sec Esc age 28 n
E
se TE gre EE BLE To
ge ut Bs vie see cor =
Me vs OE 9 o» siy E
“
ist age vc 66E pp rr a
LE VEL OU sy OEr syy x
SEL or Sir cer apr op a
Mr cr 6» vp OL» gp a
Mo ur vp Op s6r OrS
or uy vor or's sTs ws e
Ler vis OS Lys E9% gls a
vs 6 95 €6% 609 su a
os 9 sE9 259 q99 são a
7) ves vol
“MOTO SP IBN 08d 9 MONO SMOLRA 17 ejagay
&
“MEPUQUIRO “Siad “AMIN O TE cSPNLL ERINOmOrA “ASfuTH “O “H ? SORMAG SH '1 TOA “TUDpTIOIS 40/ FIO PyLISMOIG 2 Opemposdon s
|
mos mm o
|
a
mo Mo sr a E: ME UE ME UE WE ur og -
E
MTO om ui oÉ uix o:
ui
o
io me
sá
ne
E
me
t ),
dm
I9E
que
mw
see a
:
Et so
1
[ê
EO SE mr or or ar or or re ace ae ag ut
GARRAS
so ui MST e qr cg 10% str re
,
[É
é st let mp e [É
“ D “
et e vt ut wi vw. 19€ or ue se E
sr or s
EA voc srr er | &
O mr qr uz um uu om sr ue ee q ec o op
DE O ui ui uz we x or ue oe sue are Sor Ser se n
ss ”z ut | E
CU: Ux wise
e se
so
se
sie
sue
ve
ser
ee
se
or
ore
ue
IgE
sé
voe
10%
mr
ay
tr
de,
19%
soy “
oo ut ur we Ut mé ze ot E sr 6 0% 0 Ly, dy n
x
uz eo INE re ice ore ese gue es voo ap ver o gy e
ua ss one ore ore ore osE Bye 98 co» vt, ser nr gr EXA s
st ox me Ter we I9E
Ne UE SC me soc pre
19g€
ELE
se
TE
LG
Op
sr
Lxr
sr
dep
cer
Up
sr
op
au
16
us.
Kg ua
MT UM E PSC O GE SME LOP sor mr qo ig Sp LOS LES
vm. sse are ue aee 96% sr str e, or ur ser eos ss ass
sre sue use us Ly ur ur or rop er ver sos sTs srs ss
oc. 10» ur er cer er
oO mr so sp Lp
es,
98
uv
sos
16%
pos
ss
us
os
vos
ses
gos
Ts
sas
aus
Oo
ws
29
s se ser Lev us us us us 99 ses Les o 0€9 vso 89 |
es os we us ts eus ess 9 9 ws vs 9 eso ErL LL |
ses 909 so 69 ora 0s'9 199 189 OL ITL PEL os'L A s6L cs
so SIL TEL tL EsL s9L SUL L6L srs ses 158 ess 688 9V'6 6
e 006 T'6 W6 96 16 656 186 eo sTor 6E01 Lsor 6L01 1 9
vii su orzi est 991 sui 061 srer secr 291 Luc 96€I ot Is'et vérI
TEL LG IS6 LG 6861 COM LNOL voz OLOL L607 II seiz cr Le gpa
erir ser sizr ret Li ui
S66! S661 S661 S66L S661 S66L
eu
W66L
soey
V66L
6ctr
W6G
69Ep
W66
ese
W66L
err
VO6L
er
WE
ver
EG
6Esy
E66L
SST SET ESTST BHIST MOST ObóT SEBPT OLMT ir WIZ I6OML SUGET SILE LEPET 9506
= ou o o or n o st u o 6 8 t 9 5
“SO 9P IRMA OE 4 2P SONS SAJOTEA ES] DJqUL
a ;
UAINOWOIG “AopuvH" "O 'H 2 VON "SH LIOA “SUDJINSDIS 40f S2IQDL DYMIZMOIg SP Oprnpolday
“Ssoad “AFUN) SW) VE FONSNAL
4 9P JOPRUIWOUS OP & JOPRISMNU OP SPupIDQy OP SUB SO “ojuouvansadsos *umussados E8 o 18 apuo
“SBPuQuIVO
1 E voz BIT TEL ISTO vt os me ele Sp
1º 981 sé 67 DETO Ly 997 67 96 ape SG 6LP
Lo to TIL SET OST E tm SGT TUE SE Ely 86%
to Ol 6 uz 997 O8T 66% TUE 6TE eme IEP BIS
to GET LT oLT MET 86% Le OE LHE tr IS% ES
cet MT ot em LT od ore cce os€ vor psp ams
SET WT TST SET 067º tO€ eme SEE ESE Lo» Usp sys
BET LMT O SST BrT EST 90€ te GEE SE Tp Op Gps
wi OT Bs 99% IST 96% OE Ce qe 6 dr pop eso
SPT PET TT OL SBT 667 EI te ore ME a sp Ss
or BT 99% plz 68 OE LHE see ONE LE ur uv 19%
VSTO TT OT LT C6% LM TE Ipe PoE ILE 7» LP 995
et U9T SLT CMT 867 TIE STE spe GRE LE ter q US
Pot UT OM SBT EO LINE IE€ ISE poe IgE Lv Lp BL
OT BUT OT DOT 60! EE LEE 9SE OLE LHE e» vor Ses
EA to TEL OM src OE erE ee UE v6E osp OS €6S
vêr Tt OE OE EUE LEE IS€ WE PRE OP e» 605 109
6 co SOC ONE ICE PE SE BYE ele GE Op up BIS US
E E BNE 9TE IME SE GMC BLE eme top Op uv es ES
eve co GUE LET TSE LE OE 68€ or bp TEM e us 99
ue co EPE ISEC OE ONE voc cor Pr err rp vs 9 ISO
€ to GRE OPC TRE GOL Op 61 oc» rp Top WS ds OL
E co BLUE GRE OP Op OEh GEP osp pop Tap ws s6s €69
Co POE TOM OP sUr Oh dep EMP vir cp LOS es 9 MTL
Po Str CEP pr 98 Wr sap dé ss OS GS ss s59 SSL
ro SP CLP BP 96 INS SUS SES Ls Ss 8 wo 669 tos
so OS SUS SE Z5S UNS 186 165 co Bio LES OL 6 98
165º 665 109 919 TES LS T99 TL9 vo 669 GIL sa svB SS6
MIL CUL MEL OfL 96 Tl Lol B6L os ST8 Ly sus BL6 TO!
Go 6 LG 656 TU6 686 SOOL SINO 6TOL SOL LOL sem SOT LTC
SEC VEL G6E 2OP OUPL LEMI SSL 99 Ol B6L IZSI eós1 6991 0081
IPT OST ON GU LM SOLT CULT SELL GRIT LL I6LE Ut PG TO
LV66 LV66 966 Sr66 EP66 2P66 OP66 666 | LEGO DEG6 CEGO sT66 L66 0066
LMtO NOT SELO GO LSD 9019 9509 TOS TH NTOS 6585
- ou o o oc nr o s u o 6 8º L 9 5 r € t da!
ES RRR CR
“AI OP TOU OR dd 0P PONHO BMOINA S51 magos
“,
262
ORPLQUIVO “BSS “ATUM SM) IM SOSISNA] MAISON “AopunH O “H 9 VOAM “8 “A 'LIOA nDpNNDIS 40 FoNGDL PyNIMUOIg SP OprNpOsÍTM
263
set I Mto ER DN SOZ INT GU Gu UE À
us || ou
e A! TRL pel SOT 9t qUL OE 68 ELE sus
sta vol 907 LIT Luz EL WE 1% pec sis | o
ogt ee LOm BIT 6UT GET SPT EST cre WE ws | o
ver tor ore dev ar IST LST so su 65% “ss | 0€
961 foz NT UT erz est 68% LM ess | 6
set sor EXT VET srt sst INT 69% 195 | 8
ot tom SET EL Lht Let 69% eos | LL
co so BIT GET ht 68% s9% LT Ss |
so ui OCT IPT ISTO A9T ET ST eos | st
sor SIT CET url ps voz OLZ az us | ve
voz it Biz SET Uri LST U9T ELT IEL sus | €
BOT MT Izz sez OST O OLL 9LT vet eus |
ue sz sue wi EST pot LT OB 187 tes | 1
DK ez PT LST BOT UT vBT 67 85 |
ore cer IST To um um se 967 us | 6
set se OST U9T UT LBT 6% TO€ 86s | 81
ter vz TT UM TRL q6% 86% 90 voo | LL
ser Is Bt 6LT GR 66% SOE TIE o | 9
9h 6st LT BT 967 90E TIC QUE o | st
sse use vez so SO SKE ZE 6uE ose 99€ oe9 | vt
99% Blz 56% SOE SKE SUE IEE GEE OE LLE wo | e
eu 167 LE BE SUE LEE pre TSE LE GE ss9 |
vet 90'€ EUE EEE EPE ESEC GSE 99€ sec vor us |
PIE UE WE TSE TE UE BE SE Lv vip v69 | Ot
see sme IS€ LE UE LE 96 Op Or te» ap mL | 6
A dp OP Ob OEP DEP Eb so» ur 1s. | 8
or sur tE% LP LSb LP OLP TP 06h ts és L08 | L
06» 96h TOS Ls LS LES Ops qSs 095 us 665 188 | 9
Lo TO 89 EE EMO 59 299 899 9L9 869 SIL es TOOL | S
18 98 Ihg 98 998 sLg veis 068 868 Os 9E6 sor que |
OGEl Séc G6EL 4OPI LNPLO SUBI DEPLO ThPL Lobi pstpI ELI B8bI vO91 PPiLI| E
OS'6E GN6E BOL LPGE PGE OP6E ShGE EMGE IDE OD6E GE6E LEIGE EEE OE6E o0'6€ Is'8E] Z
sioL POL OO! 9001 I00 TL66 IE66 Gh6 LOL6 DR EE L9S6 TBM6 ILE6 SIT6 N668 TP S66L ELM 1
3
eo o 09 o o€ vm o st u ot 6 8 L 9 5 , £ t r
ss 3
“96S'T OP IPAJU OU «OP SONHO SMOJVA HST DAQUI
wnse=a
ter est sua vet 107 ot Wi os ot
ext 194 EB Tot 60 ut ti 897 Lot
A Est or EU or ut st ut LT srE
si rs E z BIT SET MET spt ver trt
eo 68 so UT RETO ut Est tt te
os st 061 oz mto ser ent ss es eee
ua ue 161 ti Tt 9ET ser as s6t ver
ur es EeL Ez TETO LET 97 dst 96t SEE
se om sé1 sit uz Gt Lt 65% es Ler
um un 961 att vET ot 6h 09% 667 6rE
eo sur ser uz sz 1 ore
181 81 oz ut mz voe te TE
ve set Et oz pr 99% sor me
181 E set tr 6 Bor LE LrE
061 sé1 su sz Ist ut orE 6rE
€61 8e1 ret srt est vez ente use
L61 oz vz ist Bs uz ore sgE
tz ser ss 9 18 ot 6sE
m: Ne uz 6sT 997 s8T vt ex
uz 91 sz voz uz 06 eve ese
sa ur est ou a 96% ver pie
st ot 097 ut EST co RE IRE
mz sz sa SBT 67 nt eve mt
su sur sex 10% UE Out ss ag
eso ur 167 ue MNE UE €é€ we or
su sr ao mc sue umc ave are UE Sep
1 1o€ sue me ONE BE GU MRE Lp hp
ue ore Ls ELE 6LE LE Le ur ser ver
ore vue oo» sty Nr ar ser er Le PIS
or er 89 ur, se» só» sos eus ws es
es 165 voo so” 919 so 34 ss res
a es ve ses 68 POR 106 TO BUG 556
ee eve tre LEG SEG EE6L 0E'61 st6 t6t 0061
ces TU ser ee Bo OMI TOM SWZ USIT S'661
o o or o u o 6 8 e 2 s , ç t vinda
“a ——— "865 90 ja 08 q SP VOS MORRA (51 pagos
SPHQUIRO “ENSAA CATIA OQ) TO SOJA UypNSWOIG
“Aajue “O TH O VOtIVAA (8H PT OM “remppmoas 10f toNgOL PqiIoMONA SP OprmpoNdaM
o a Ru . À 91
sm mr ma PELO MOTO OE o
E ao 661 CUT SET or
si SEL om 991 Per s o: ei st o
so
MT tw
os m
em ua E OT OT q wi o
un E SOT MT att órz o
aa 1 a out E zo aos s
e
So es 1 st um E TO tos n
o ORI ami or OET ist ua
em 18 E sor To st x
e os er es so Wi est s
Su cast am mo SBN I6I ore cr est n
st es a 68 tel ut PET sst e
is e 19 E 061 té K SET OST u
sa SA] ent Tél s61 PIO RT
Vi em sm BL P6L 961 OT STT O
SET
MET ss
Ust
x
Tt
SL est om IST 967 61 erro um or st
E cet a6l 00 OT tt tri a
Sto ur sa 961 007 OT TI ET mt or
Ur ser sa 661 tor 90 vil UT Ore us
E vw 907 Go Wo NT orar
om em gm sor orz z 1X Gt use qr
Sei SEL 061 ox mz z 9$t LT
061 961 SIT 6tt z É 197 at
007 tz NT str 99% RT
so nº tt UT to us
sur mt ser ur 18 tor
ter der ot sz vw ur
eme st use LON out
tl br 067 7 ste opE
te drE uv é ur ar
sue sue oce toe ver sor Ur Gp er
vs sus us Eus vs LES ES Grs gps
sro Lr6 Ih6 606 SEG Sto Pó 96 006
909 LT 09 6109 9865 VOLS ERSS OSS os6p
o or o o o nr o st u o 6 8 uk 9 s r £ z
au,
“SOU SP IBAJU OU 4 9P SOMIO SMOJPA O'S] vjqui
%oa=a
o o E) 0 o 0 o 0 o o 0 0 0 0| &
EBO00 OZIOO S9IOO BIZOO 990 GLTOO TETO TIEOO LEEOIO ILEOIO 61b00 s6Poo TENOO 86600 | OT
L9100 PEZOO DILOO LIPOO Lób00 OTSOO TSSOO E8SOO £T900 TB90O S9LOO S6800 IEITO LELIO| 09
os too LvEoio zopoio S6S0O EILOO SPLOO OSLOO LTOSO L8800 89600 T8ONO 6STIO ILSTIO OLETIO| Ob
tetOO LSPOO 0900 ILLOO 1Z600 85600 ZOONO I9ONO LEIIO LETIO LLEIO E6SIO OB6IO 67670 | 0€
LIPOO L9SOO EPLOO ZP600 ELLIO O9LIO 9IZIO 9BTIO PLEIO EóPIO 9S9IO LOGIO PSETIO PEPEO| PT
DOSON SL90IO 6L80)0 BONO EOEIIO LSEIO TTbliO OSHO TO9LIO SELIO IZ6IO sOZTO SOLTO Fosco] OZ
L990'0 68800 PhITO 6ZPNO ILIIO SELIO SIBIO LIGIO PEOZO S6ITO 61bZO 8SLTO ELO 60LH0| SI
EEROO DONO EObIO LELIO OTTO S60TO LBITO 66ZTO GELO PZ9TIO OBBTO PITEO PZ6LO OIbSO| TI
O0ON'O BOFIO SS9NO ZEOTO ESETO GEMTO IPSTO 999TO ETBTO 6TOLO TIEEO EELEO OSbhio OZO90 | OI
UTDO 9prO OZBIO GTTTO BOSTO 6S9TO BILTO IO6TO L9OEO 98TEO PBSEO LTObO sLLHO s8e90 | 6
OSTIO DIVIO TTTO TIPTO GUTO TOTO EPOLO SBIEO TIEEO SOSEO OL6EO LLEPIO LSISO 86L90| 8
|
EERIO ALITO OSLTO PSIEO GSTEO PBEEO SESE'O ITLEO PL6EO LOEHO OO8PO ZI9SO ILTL'O
6TIO 19190 89820
OB6L0 PBIDIO LhbriO cosvO Izeso
we
L99LO GITO TINTO SEIEO B9SEO TRICO LISEO
EISTO II0EO SP9LO BIIPO IbZhO LSEHO PISPO ESLHO S9OSO IbbS'O IS6SO SEB9O TIPSO|
O00TO |
OOSTO EGO OTLEO 99EPO PRRPO LIOSO SLISO S9ESO BOSSO SÓBSO L8T9O IPO 61900
CCO IEOPO BPLPO 9IPSO STONO L9I9O FEESO OES9O ILL9O ILOLIO LSPLIO LL6LO 60L80 £
00050 EIRSO TO99O IDELO ORBLO OIOBO GSIRO TEERO PESS'O TLLSO LSO6'0 TOE60 OSL6O SS660 | T
vpupoitulis op 45 PP |oaju O nuud *UNIYIOD PP 9189 O VVd SOM saJojrA, Es di $
“LP6I
267
“JIOA MON “SU “ÁUNÁUIOO NOO8 IH-MBLDI CSICARO CSAjDUy [DONSPDIS JO ONbjupõoL 'SHICAR “AA “IN SURQUOSIA “O :21404
iG rá cosa gcaça cs
o o o 0 0 0 o o o o o o
E8OOO STIOO BLIOO ZPZOO TOLO 9IEOU PELOO LSEOIO LBEOIO GZH00 6800 s8s00 es100 st 9 oz
L9N0O SPTOO PrEOO 19PO0 LISO POS0O STO 89900 TTLOO 96LOO TOV6O G9ONO ILEIO IsITO| 09
ST0'% Foo EOSOO 89900 9IBOO ESBOO BOBO LS60)0 EEOIO SELIO IBTIO BOSITO SIGIO Op67o| Op
geo der00 8$90'0 L9BOO PSOIO MONO LSINO TETIO LTEIO PSHIO SESIO ELGIO TIPTO TE9EO| O€
LIPOO S6s00 OIB00 O9ONO ESTIO SEEIO SOPIO S6PIO BO9NO GSLIO UL6I'O S6ZTO IL8TIO Lezr'o| 4z
00500 60400 09600 BPZIO TOSIO L9SIO 9P9IO BPLICO LLBICO BbOTO BETTO PSITIO LOTE 66LP0| OT
L9900 PE60O ISTIO ZI9NIO BIGIO ZOOTO POLITO BTTTO BETO EOSTIO TEBTIO LIEEO 690P0 LeLSO| SI
EES0O LSINO SESIO 9610 OZETO 6IPTO SESTIO OBITO I98TO G60LO STPLO 6I6LO ISLHO gTs9O| TI
00010 9LEIO TISIO LOTTO POLTO LISTO SP6TO GOLO SOLTO TLSLO PE6LO 69PPO gSESO SLILO| OL
MINO IZSIO TOGO PISTO OS6TO L9OEO LOZEO BLECO TOLO OLSCO ISTHO OIsHO LISO prsL'O| 6
OSTIO OOLIO PIZTO 6LLTO BPTEO ELEEO TTSEO POLEO TE6LO Giro LToro cocso tsISO spoLo| 8
6TrIO 6T6IO POPTO SOIEO 9I9EO ISLEO IIGEO SOIPO Lhth'O 6S9P0 OBOSO S89SO Pp990 9LEZO| L
L99VO 6TTTO BSBTO 6TSEO PROMO GLrho Iobr'o sogro 99840 S6Is'o SE9S'O BST9O BITLO gza80| 9
O00T'O HPITO Istr'O POOPO LO9PO PS8h'O LEOSO GSTS'O ESSO SLBSO 6TL9O LS690 SELO 6L760| S
DOSTIO ISTEO LSOMO PB8PO ESSO TOLSO L68SO 6TINO OIP9O I9LIHO TITLO PISLO Eh9SO 9,960] +
fEEEO OLEO ESISO 65090 EPL9O TI6N0 LOILO SrELO 9O9LO LE6LO SEcgO IEB8O ETP60 EE660| E
000S'0 79090 L9OLIO 6h6L'O GESSO PLOSO LT88O SB680 TLIGO ELE6O 9ES6O P6L6O 05660 66660] Z
oo Ph 9€ 91 o1 6 8 L 9 s t E t 1
erUponUSIS OP %I OP J2AU O tIRd “ULIYDOD PP 9JSaj O EILd SODIII SSIOJBA SS] DJIGPI
Capítulo 16
Comparação de médias de k populações
independentes — Análise de variância a
um critério de classificação
Em muitos experimentos, o pesquisador se defronta com a situação

de comparar mais de duas populações simultaneamente. Rosa *. em
seu estudo sobre efeitos de escovação supervisionada, tinha três grupos
na fase inicial do trabalho (grupo controle, experimental 1 e experimen-
tal 2), devendo testar a hipótese de nulidade de que as três médias: do
índice gengival eram iguais contra a hipótese alternativa de que pelo
menos uma das médias era diferente. Ou seja,
H : me = Mez = mn
H, : pelo menos uma média é diferente.
Trata-se de uma situação que corresponde à extensão do teste t
de “Student” e cuja solução será inicialmente apresentada de maneira
formal, sendo conhecida como análise de variância.
16.1 A análise de variância

P,, Po, ..., Ps populações independentes, com distribuição
Sejam
normal, com médias, respectivamente, mi, Ma, --. Mk € mesma va-
riância 02.
estas k populações têm ou
O problema proposto é o de saber se
de significância pré-fixa-
não médias iguais, isto é, testar, a um nível
do a, a hipótese de nulidade
H:m=m=.. = mM
contra a hipótese alternativa

—— Supervisionada
“Rosa. Antonio Galvão Fortuna, Efeitos do Tempo de Escovação Idade,
por Professores sobre as Condições Gengivais de Escolares com 10 Anos de
dissertação de mestrado, Faculdade de Saúde Pública da USP, 1978.
269
Para tanto, amostras casuais simples de a Di, No,
são tomadas, respectivamente, de P,, Po, ... - Os valores. hi â
variável 4 em estudo tomam nas referidas Es serão assim repre.
sen! E
casaria a Co ue ma
Amostra da Amostra Amostra a da Amostra
população P, população P, população P, população P,
EE ae aa quai E eme mi a TT
XW Xa1 X X
Xp X '
%s Xoa
. . . .
- . se .
. . ... . ... a
Xy Xo3 X5 %g
. . . .
. . . .
. . . .
Xa, Xom, Km, Xm,
Nestas condições, o valor genérico da observação de ordem j

G = 1,2... m) da amostra tomada de P, (i = 1,2, k),
isto é, xy, vai depender da média m, da população e de um fator de
flutuação da amostragem que se denota por Es; OU seja:
xy =m + ey
Designando-se as médias amostrais correspondentes às . nostras !

das k populações, respectivamente, por
do,
é Ra ni Rs My;
pode-se escrever:
3Ft
ni;
x =——
, paai = 1,2,...k
n;
isto é, %. é a média aritmética da amostra de n, observações tomada

da população P,.
Analogamente, pode-se definir a variabilidade dentro de cada amos-
tra, baseada nos desvios das observações dentro daquela amostra em
torno da sua média, ou seja;
270
m h;
> (uy = Bs s Gy — W)2; anal
ja j=1
Tu — 8); xo -=*%)
ja
ou genericamente para a amostra da população P:
o — &.)?
1
Portanto, uma medida que leve em conta, de forma sintética, aa

variabilidade dentro das amostras será dada pela soma de q
k Ni
> > (xy — &)?
el el
que se representará por Q» e se denominará variação dentro das amos-
tras, ou simplesmente variação dentro (convencionalmente variação
dentro de tratamentos):
ni
2 Xj — &.)?
Em
Imagine-se, agora, as
n=m+tn+... +n +... + m observações
como formando
um conjunto único, isto é, uma amostra global de tamanho n:
X1 X pm X aee Xa
Xp Xo cu. Xp 0. Xy
Xs ... Xj ce Xj
* . .
. E é
. * .
X, In, e Mn, eee x, ho,
mn
Nestas condições, pode-se definir a média geral do coní
observações como: ' BID 8
k Mj
3 Xy
. E Do
cobsisasiidinisino
z..
E fácil verificar que esta média geral nada mais é do que a média
ponderada das médias amostrais X,., Xv, -.. Xv, , tendo os tamanhos
das amostras n;, Ny, ..., Ny respectivamente, como os pesos na pon-
deração, ou seja:
k
> mk
tel
£. =
n
A variabilidade das n observações da amostra global em torno de
sua média geral X.. será dada pela soma de quadrados:
k ed
> Dm -—R.)
ic sei
] que se representará por Q e se denominará variação total
k nj
0=5 > (ay — 3.)
FI
Pode-se demonstrar que a diferença OQ — Q», que se representará

por O;, é igual à seguinte soma de quadrados:
k
Q=Pm(m x.)
il
Como se vê, Q, mede a variabilidade produzida pelo afastamento

entre as médias amostrais X,,, X»,, .. Xx. e a média geral X.. , sendo,
por isto. denominada variação entre as médias, ou simplesmente va-
riação entre (convencionalmente variação entre tratamentas).
272
Portanto, O = O + Q,
k nó k
us Dmú-EP=Taua-zy 4
sto Sa í=1
k M
+ õ, aq = E)?
ie] =
O significado destas variações é básico para o entendimento da

sobre a igual e
construção do teste de hipóteses a ser proposto
Idade
médias my, Mm, -- -, My das k populações P,, P,, ..., P,
De fato, com relação à variação dentro, demonstra-se que:
Q, tem distribuição o? x2u-x, (O — 0º xn+),
e, portanto, o valor médio esperado de Q, é 0? (n-k), ou seja, o valor
esperado de E é o*. Isio quer dizer que“E que recebe o nome de
quadrado médio dentro, é um estimador não viciado de o? — variân-

cia dentro de cada uma das k populações em estudo. Mais explicita-
mente, o procedimento de amostragem adotado estaria garantindo que
e refletisse, nas amostras, tão somente o efeito de as observações nas k
populações ap uma certa variabilidade 0º.

Por outro lado, demonstra-se também que, se a hipótese H, for
verdadeira, Q, tem distribuição o? xk4 e, portanto, o valor médio

Q
esperado de Q;, é 0? (k-1), ou seja, o valor esperado de = é 02.
Isto quer dizer que E. que recebe o nome de quadrado médio

entre, é também um estimador não-viciado de o? no caso de H ser
verdadeira. Este fato fica claro se se pensar que, sendo H,
S K populações tornam-se idênticas, uma vez que O que 2s
Sra terem médias m;, me, ... my diferentes.
E amostraissz.X., Xo, --.» A Xe
Sendo idênti icas, as médias x
É s, só diferem entre si e.
"espectivamente aquelas médias populacionai
28
portanto, de X.. devido às flutuações de amostragem, expressas por o2
Por outro lado, se H, não for verdadeira, o valor esperado
do quadrado
1 :
médio entre, =" será igual a
1 k
St» mm — m)?
k
mm
E is
onde m = E
Q O
Portanto, nada mais natural do que o confronto de EI com —
- n-k
para a realização do teste de H, contra H,.
Se H, for verdadeira, o valor teórico esperado para = será

Q. .
o? e, para a” será o?; logo, o quociente dos valores esperados destes
quadrados médios será igual a 1.
Se H, não for verdadeira, o valor teórico esperado para
aEi será o? +
1 k
2 mn (m — m)?
.
epara
Q;
ni será 02;
logo. o quociente dos valores esperados destes quadrados médios será

igual a
k
3 mn (m — m)?
i=l
1 +
o? (k-1)
e. portanto. maior do que 1.

Pode-se demonstrar que
0:41
O./n-k
274
vã veraci: dade de
Ho,
: tem distrib
Istribu
ui ição F com k-
fiber dade. Nestas condiç le nk graus de
ões, o teste de H, contra
H consiste em calcu-
jar o valor observado de
J Q,/k-1
Q,/n-k
e compará-lo ao valor crítico de F para
dade, ao nível a fixado. Se F, (GK-1) e (n-k) graus de liber-
> E auático Tejeita-se H,.
SeF, <F
aceita-se Ho. crítico
O fato do teste de H, contra H, se basear na comparaçã
quociente, entre duas variânci o, por
as que represen
da variância total, justifica o nome de análise tam uma decomposição
de variância, apesar de
as hipóteses se referirem a médias.
16.2 Quadro-resumo de uma análise de variância
Os resultados de uma análise de variância costumam ser expostos

através de um quadro, que resume as operações efetuadas, com indi-
cação dos valores encontrados das somas de quadrados Q, Qi,
e Q»,
dos respectivos graus de liberdade e quadrados médios, além da
esta-
tística F; observada e do valor crítico F para o nível de significância
observado, sendo útil, ainda, a indicação de significância ou não.
Este quadro de referência é apresentado a seguir, mostrando as
fórmulas a serem empregadas para o trabalho algébrico. Na situação de
uma análise com dados concretos, é claro que só se colocarão no quadro
os resultados finais, como será mostrado nos exemplos.
Fonte de Graus de Somas de quadrados Quadrados F, observado

variação liberdade - médios (É crítico a)
Entre trata- k 4 Ch q q
mentos k—1 Q = 2 n (&,—R..)2 Quk— TT
Dentro dos ni ((Fa, (k — 1

> Gu-H)? Qn-k q)
Mr
tratamentos n—k Q =
HãEl jj=1
Eú
k ni
Total > (ag. significante?
n-1 0 0=5
>. il j=l
Md
275
Exemplos
. Retornando à pesquisa de Rosa, têm-se três populações, cujas mé-

dias verdadeiras my, Mys e m. do índice gengival serão comparadas
simultaneamente, usando-se para tanto os resultados observados em
amostras. As hipóteses a serem testadas já foram apresentadas; cha-
mando o grupo experimental E, de 1, o grupo E» de 2 e o grupo con-
trole de 3, tem-se
Ho: m = me = nm ER:
Cada sexo foi estudado separadamente, estabelecendo-se o nível
de significância a = 5%. No sexo masculino foram os seguintes os ta-
manhos das amostras : m = 22, n» = 26 en; = 18, que somam n
= 66. Os valores individuais do índice gengival observado (x;) e as
médias de cada grupo amostral são apresentados na tabela 16.1, en-
quanto que a tabela 16.2 é o quadro com os resultados finais da res-
pectiva análise de variância.
Tabela 16.1 Valores individuais do índice gengival, em meninos de 10 anos, se-

gundo grupo de estudo, Campinas, 1976-77.
Amostra da Amostra da Amostra da

população P, população P, população P,
X Xo3 Xa
038 0,54 0,38 0,35 0,12 0,68

0,38 0,50 0,00 0,30 0,25 0,45
0,30 0,25 0,00 0.10 0,25 0,83
0,31 0,67 0,33 0,35 0,30 0,37
0,29 0,38 0,35 0,25 0,56 0,45
0,42 0,17 0,25 0,65 0,12 0,85
0,75 0,42 0,30 0,90 0,30 0,29
0,56 0,42 0,25 0,67 0,65 0,43
053 0,21 0,38 0,13 041 0,10
0,60 0,31 0,60 0,46
0,50 0,50 0,29 0,38
0,56 0,08
035 0,31
no = 26 = 18
XX, = 0,3450 Z, = 04117
Fonte: Rosa, Antonio Galvão Fortuna, Efeitos do Tempo de Escovação Super.
Anos
visionada por Professores sobre as Condições Gengivais de Escolares com 10
de Idade, dissertação de mestrado, Faculdade de Saúde Pública da USP, 1978.
276
Tabela 16.2 Análise de variância referente aos dados da tabela 16.1.
—————— = E E,
Fonte de Graus de Somas de alndos ” FR
jação liberdade juad E auOs 'o Observado
ia —
Entre trata-
CO Std médico (6265: 5%)
mentos 0,0909 0,0455 1,1788
Dentro dos
tratamentos 63 2,4312 0,0386 (= 3,90)
Total é E 2,521 Não-significante
Comparando-se o valor observado F, = 1,1788 com o valor F na

distribuição respectiva para 2 e 63 graus de liberdade, ao nível de 5%
de significância, pode-se concluir que as médias populacionais m;,, mo
e ms, no sexo masculino, são estatisticamente iguais, isto é, no início da
pesquisa os meninos foram distribuídos para cada grupo de forma a
permitir afirmar que diferenças posteriores nas médias seriam devidas
aos tratamentos e não a diferenças nas condições iniciais.
Os resultados para o sexo feminino estão apresentados nas tabelas
16.3 e 16.4, permitindo, também, a mesma conclusão.
Tabela 16.3 Valores individuais do índice gengival, em meninas de 10 anos, se-

gundo grupo de estudo, Campinas, 1976-77.
Amostra da Amostra da . Amostra da

população P, população P, população Ps
X5 Xo; Xoy
0,20 0,17 0,85 0,55 0,25 0,50
012 0,25 0,46 0,85 030 0,16
0,56 0,45 0,25 0,59 025 0,34
0,63 0,68 0,17 0,46 09,00 0,50
0.00 0,30 0,00 0,70 025 0,40
0,33 0,38 0,21 0,38 0,20 0,54
031 0,17 0,40 0,42 015 0,18
0,35 0,00 0,40 021 0,12 0,58
9,71 0,00 0,41 0,00 020 0,54
0,42 0,00 012 0,10
9,50 0,50 0,05
%. = 0,2729
Fonte:
ic ]
Rosa, » Antoni io Galvãoã Fortuna, Efeitos
i do
Te Tempo de Escovação Supervi-
deuade por Professores sobre as Condições Gengivais de Escolares com EE Anos
€ Idade, dissertação de mestrado, Faculdade de Saúde Pública da USP, 1978.
271
Tabela 16.4 Análise de variância referente aos dados da tabela 16.3.
Fonte de “Graus de Soma de Quadrados E observado

variação liberdade quadrados médios ER 658)
2,58; 5%)
Entre trata
mentos 2 0,1752 0,0876 1,8920
Dentro dos (= 3,93)
tratamentos ss 2,6857 0,0463
Total 60 2,8609 Não significante
i) As figuras 16.1 e 16.2 mostram, respectivamente, as distribui-

ções empíricas do índice gengival em meninos e meninas de 10 anos
de idade. Os histogramas correspondentes dão uma idéia sobre a forma
da distribuição, dada a pressuposição de normalidade necessária à rea-
204 —
184
164
4.
número de crianças
5
N
00 01 02 03 04 05 06 07 08 09 10
o
Índice gengival
Figura 16.1 Distribuição empírica do índice gengival em meninos de 10 anos

antes do início da pesquisa.
278
lização da análise de variância, Técnicas estatísticas adequa nt i
tem a avaliação prévia do ajuste entre dados Pinça
buições” teóricas, para a aceitação ou não desta pressuposi istri-
posição, como
mencionado no capítulo 9.
Para a discussão sobre em que os desvios
em Telação à normal
de e a não-homocedasticidade podem afetar a análise de ida-
variância (a
figura 16.2 sugere esta situação) deve ser consultada
bibliografia espe-
cífica *.
º Em EN
crianças
de
número
00 01 02 03 04 05 06 07 08 09 10
Índice gengival
Figura 16.2 Distribuição empírica do índice gengival em meninas de 10 anos,

antes do início da pesquisa.
: the t Tests”,D
au, C., Bulletin,
“The Effects of Assumptions Underlying
Psychological
alo
LVII: of 49-62,
Violations
1960.
2719
Capítulo 17
Testes de hipóteses em tabelas de
2x2ederxs
17.1 Testes de associação
No capítulo 3 foram introduzidas várias medidas descritivas de uma

possível associação entre duas variáveis qualitativas, ou atributos, tanto
para o caso de tabelas de 2 x 2 como de r x s. Naquela oportunidade
foi chamada a atenção para o fato de que o valor assumido pela con-
tingência quadrática x? quando satisfeitas as condições de sua aplica-
bilidade seria interpretado posteriormente, em termos probabilísticos.
A isto se propõe esta seção. Aqui será tratado o teste da hipótese de
nulidade:
Ho: há independência entre as duas variáveis, contra a hipótese
alternativa
H;: há associação entre as duas variáveis.
Para a realização do teste de Ho contra H, será fundamental o co-
nhecimento da distribuição amostral da estatística x em amostras de
tamanho n, provenientes de uma população onde exista independência
entre as duas variáveis, ou seja, para a qual seja verdadeira a hipó-
tese Ho.
Demonstra-se que esta distribuição é x? com (r—1) . (s—1) graus
de liberdade.
O teste de H, contra H, será realizado, portanto, definindo-se,
nesta distribuição, para um nível de significância a fixado e a hipótese
alternativa H,, as regiões de rejeição e de aceitação de Ho.
Para o exemplo da tabela 3.1, que se referia ao estudo da concor-
dância entre dois métodos coprológicos para positividade da Giardia
lamblia, a distribuição a ser usada para O teste de hipóteses será x? com
(2-1) (2-1) = 1 grau de liberdade. Suponha-se a = 5%. Nestas
condições, indo-se à tabela da distribuição x?, obtém-se, em correspon-
dência a 1 grau de liberdade e « = 0,05, o valor crítico de x igual
ax crítico 3,841. A região de rejeição e a de aceitação de Hy estão
assinaladas na figura 17.1. Uma vez que o valor observado de y? foi
281
Região de
3,841
rejeição de Ho
Figura 17.1 Distribuição y? para um grau de liberdade.
x = 179,919, rejeita-se Ho. Em outras palavras, ao nível de 5% aceita-

se a associação entre os dois métodos. Uma vez que o coeficiente de
associação de Yule teve sinal positivo, conclui-se pela concordância entre
os dois métodos.
O teste de associação, em tabelas de 2 x 2, pode ser feito também
fevando-se em ideração que tatística V x tem distribuição
normal com média igual a zero e desvio padrão igual à unidade. Por-
tanto, desde que o teste é bicaudal, pois a hipótese H, estabelece a exis-
tência de uma associação que tanto pode ser positiva como negativa,
os valores críticos na distribuição normal são — 1,96 e + 1,96, para
um a de 5%. Comparando-se o valor observado V 179,919 = 13,413
com 1,96, rejeita-se Ho.
No caso ilustrado na tabela 3.10, em que se tratava de saber se
havia associação entre o nível de instrução da mãe e a precocidade do
crianças menores de cinco anos, em São Paulo, durante O
óbito de
período 1968 — 1970, as hipóteses podem ser assim formuladas:
282
Ho : há
óbitoindependência entre nívelde de5 inst; O da mãe e idade
de crianças menores « do
: há associação entre nível de instruçã ei a
Br de crianças menores de 5 anos da mãe e idade do óbito
Fixando-se em 1% o valor dea, a tabela da distribuicã de
correspondência a (3-1) (3-1) = 4 graus de liberdade, fome Po bar au
crítico de 13,277. Na figura 17.2 está assinalada a região de rejeição
de Ho. Uma vez queo valor Observado de y para a tabela 3.10 foi
igual a 75,421, ele caiu na região de rejeição
1%, há associação entre O nível de
instruçãode daHo. mãe
Logo,e aao nível &de
idade
óbito das crianças menores: de 5 anos.
Hx?
13,277 Região de
rejeição de Ho
Figura 17.2 Distribuição y2 para 4 graus de liberdade.
Com a finalidade de ilustrar o prosseguimento da análise de uma

tabela de contingência, após um teste de hipóteses que mostrou ser
significante a associação entre dois atributos, apresentar-se-á um exem-
Plo mais simples que permite localizar quais as categorias de uma poli-
tomia que estão associadas a categorias da outra politomia.
Os dados da tabela 17.1 foram obtidos com o objetivo de se estu-
dar a possível influência do tipo de união marital sobre o comporta-
mento da mulher quanto à prática do aborto.
Neste caso, as hipóteses testadas foram:
Ho : A prática do aborto não está relacionada ao tipo de união.
H; : A prática do aborto está relacionada ao tipo de união.
283
Tabela 17.1 Distribuição das mulheres com e sem aborto provocado
tipo de união marital, São Paulo, 1965. *SeBundo o
Tipo de Total
união
Civil e religiosa
Só civil
Só religiosa ou livre
Total 2.583
Fonte: Milanesi, M. L., Aborto Provocado: Estudo Retrospectivo em Mulheres

Não-Solteiras, de 15 a 49 Anos, Residentes no Distrito de São Paulo, em 1965,
tese de doutoramento, Faculdade de Saúde Pública da USP, São Paulo, 1968. |
Para a realização do teste começa-se calculando o valor de x? na

tabela em questão, que nada mais é do que uma tabela de contingência
de 3 x 2*. Assim procedendo, obtém-se x? = 11,985. Suponha-se que
o nível de significância fosse igual a 5%. Nestas condições, o valor crí-
tico de xº seria obtido na tabela correspondente para (3-1) x (2-1) = 2
graus de liberdade e a = 0,05, isto é, 5,991. Desde que o valor
observado 11,985 é maior do que o valor crítico, rejeita-se a hipótese
H,, isto é, a prática do aborto está relacionada ao tipo de união. Obser-
ve-se que a partir da tabela 17.1 tem-se:
Tipo de união % com aborto provocado

civil e religiosa 10,6
só civil 16,3
só religiosa ou livre 18,3
isto é, a percentagem de mulheres que provocam aborto aumenta para

mulheres com união só civil e mais ainda quando se passa a considerar
aquelas com união livre ou só religiosa; porém, a diferença entre estas
duas categorias é bem menor. Pode ser, então, que os dois tipos de
união, só civil e só religiosa ou livre, não difiram entre si, e ambos
difiram do tipo civil e religioso, o que explicaria, em termos probabilis-
ticos, a significância encontrada para xº.
* Note-se que está satisfeita a condição proposta por Lewantin (ver capítulo 3)-
84
Em situações como esta, em que se pretende localizar a significân-
cia encontrada, procede-se de acordo com Cochran *. Em primeiro lugar,
extrai-se da tabela original os tipos de união que apresentam propor-
ões de aborto provocado mais próximas (só civil e só religiosa
ou
livre) e calcula-se, para a nova tabela, o valor de x, a fim de testar
as mesmas hipóteses anteriores. Tem-se assim a tabela 17.2. Calcu-
bela 17.2 Distribuição das mulheres com e sem
do de união marital, São Paulo, 1965. aborto provocado, segundo o
Aborto provocado
Só civil
Só religiosa ou livre
Total
Fonte: Milanesi, M. L., op. cit.
lando-se o valor de x? para esta tabela, obtém-se x? = 0,179. Com-

parando-se ao valor crítico, para « = 0,05 e (2-1) x (2-1) = 1 grau
de liberdade, 3,841, aceita-se a hipótese Ho de independência entre a
prática do aborto e o tipo de união marital. Para finalizar a análise da
tabela 17.1, procede-se agora à comparação das mulheres tendo união
civil e religiosa com aquelas apresentando união só civil ou só religiosa
ou livre. Os dados correspondentes encontram-se na tabela 17.3
Tabela 17.3 Distribuição das mulheres com ou sem aborto provocado, segundo o
tipo de união marital, São Paulo, 1965.
Aborto provocado
Tipo de
união
Civil e religiosa
. civil ou
Teligiosa ou livre
1
Total
Fonte: Milanesi, M. L., op. cit.

>
For Strengthening the Common xº Test”. Bio-

* Ochran, . G., “Some Methods
metrics, 10 (4): 417-451, Dez. 1954.
285
aiii
Calculando-se o valor observado de x? em correspondência a esta
tabela, obtém-se 11,725; comparado a 3,841, leva à rejeição da hipótese
Hg de independência entre o tipo de união e a prática do aborto, isto
é, as mulheres com união civil e religiosa praticam aborto com menos
freqiiência do que aquelas com união só civil ou só religiosa ou livre,
Isto completa a análise e mostra que esta significância deve ser a res-
pansável por aquela inicialmente encontrada para a tabela 17.1, É
importante observar que os dois graus de liberdade relativos à tabela
17.1 foram decompostos em um grau referente à tabela 17.2 e outro
grau para a tabela 17.3. A partição de x? devida a Cochran deve ser
aditiva no que tange aos graus de liberdade, mas não é aditiva para
ox total.
17.2 Testes de duas proporções

17.2.1 As duas populações são independentes
Suponha-se duas populações P, e Ps», independentes, com relação
às quais se quer comparar as proporções com que uma certa caracterís-
tica ocorre. Designando-se por 7 e 7», respectivamente, a proporção
de vezes que esta característica ocorre nas populações P, e Ps, o que
se propõe é realizar o teste da hipótese de nulidade
H:m ==
contra a alternativa
H:m *m
Para tanto, uma amostra de tamanho n; deverá ser tomada de P;
e outra de tamanho n. deverá provir de Pa. Nestas condições, seja P:
a proporção de vezes que a característica em estudo está presente na
amostra de tamanho n, tomada da população P, ; p. será a proporção
correspondente à amostra de tamanho n. tomada de P..
De acordo cam o que foi visto no capítulo 11, a variável alea-
tória p; tem distribuição binomial com média m e desvio padrão
/ 1 -
pd el À - Analogamente, p, é binomial com média 7, e des-
a
vio padrão Mm (1 — m4)

B:
Portanto, a variável aleatória p; — po tem média (m — 7») &
desde que as populações são independentes, o desvio padrão é:
286
No caso particular de n; = n,,a distribuição amostral de (ps
será simétrica em torno de (7 — 7,). Sen; ;e n,, à simetria po
ser suposta se estiverem satisfeitas simultaneamente as condições:
nr >5 m(l-7)>5
n7 >s5, n(l
-—- 7) >5
onde 7 é O valor comum de 7, e 7», quando Hg for verdadeira.
Uma vez que 7 é desconhecido, um estimador proposto é dado por:

Mm Pi + Do po
m + mo
Voltando-se ao problema proposto de teste de Ho contra H,. su-

pondo-se a simetria da distribuição amostral de (p; — pe) e a veraci-
dade de Ho, pode-se dizer que (p; — p>) tem distribuição aproximada-
mente normal:
(Pp — po) — sf — 72); Mm tom)

Gm) + tra,
f 5]
Logo, a variável reduzida:
(Pi —po) — (m—72)
fm (1-—m) + no (1 — 75)
Ty Do
será aproximadamente normal com média zero e desvio padrão igual à

unidade.
Sob a veracidade de Ho, z torna-se:
Z= Pi — Pp:
a(1i —7n) a(1—7)

e qugo q E
n 1 No
Substituindo-se 7 pelo seu estimador p. tem-se:

Pi — Pa
z=
(pr + mapa) [m(l — py) + mall — po)]

no (n, + no)
Para um a pré-fixado, se o teste for bicaudal, rejeita-se H, se o

valor observado de z, que se representará por zo, for:
Z > Za,
ou
WS = Zaj,
onde z,, / é o valor crítico na distribuição normal em correspondência
aq/, '*
Para um teste monocaudal, do tipo
H:m =7
H:m>7» |
rejeita-se Ho se
% > 2a
No caso do teste monocaudal:
Ho :m=7ns
H:m <m
rejeita-se Ho se
Z <-— Za
Exemplo |
No capítulo 3 foi apresentado um exemplo (tabela 3.12) no qual

se relacionava o período da gestação no qual a gestante teve rubéola
com a condição do recém-nascido quanto a malformação congênita (do
ponto de vista médico, espera-se que o aparecimento precoce seja mais
prejudicial ao nascituro). Para tanto, duas amostras de gestantes foram
consideradas: aquelas que tiveram rubéola até o 3.º mês de gravidez €
aquelas para as quais a rubéola só apareceu depois do 3.º mês. Estas
gestantes foram observadas até o término da gravidez e cada recém-
288
nascido foi examinado
e classificado como normal
feito físico.
TA ou com algum d
Utilizando-se este exemplo
para ilustra: A r º proced e
de duas proporções ora apresentado, tem-se imento do teste
m= proporção de Tecém-nasc
lação (hipotética) idos com defeitos
de gestantes com rubéol físicos na popu-
de gravidez; a até o 3.º mês
n, = proporção de recém-nascidos com defeitos físicos na popu-

lação (hipotética) de gestantes co m rubéola depois do 3.0
mês de gravidez.
As hipóteses a serem testadas são:
Ho :m =7%
Ho:m > ma
Suponha-se a = 1%. Na tabela 3.12 tem-se: n, = 50 e no =

54,
bastante próximos, para se admitir simetria na distribuição amostral de
(pi — pz). Os valores observados de p, e p, são, respectivamente:
= 1414 = 0,28
"Es
3
PS =2 = 006
Nestas condições, tem-se, sob a veracidade de Ho:
(0,28
w=—————— — 0,06)A
= 3,03
Sta + 3) (36 + 51)
50 x 54 x 104
Comparando-se este valor com zy = 2,33, rejeita-se bagaço

de igualdade entre », e 7, isto é, a proporção de jtrrançii see
defeitos físicos é maior para as gestantes que tiveram ru
o"
Precocemente, ou seja, até o 3.º mês da gravidez.
Esta aproximação normal usada para a feitura do nã oa
ses pode ser melhorada pelo uso da chamada correção pa
rro decor-
dade, que nada mais é do que uma correção que a e eopiínia
Fente da substituição de uma distribuição discreta po
Designanto-se por X, a variável aleatória número de vezes que a
característica em estudo apareceu na amostra de tamanho n, tomada
a partir da população P,, e por Xy a variá el correspondente à popu-
lação P.. então as proporções p: € p: corrigidas serão dadas por:
um — 0,5
Pe a.
—-* + 0,5
= Fa
se p: > P-
Caso p; < ps, então
x + 0,5
Pe
x — 0,5
Pe =
O prosseguimento do teste de hipóteses se dá substituindo-se na
última expressão de z, p; e p: pelos seus respectivos valores corrigidos
e usando-se a distribuição normal N (0;1) para a realização do teste.
Tabela 17.4 Gestantes atacadas por rubéola, classificadas segundo o período de

estação por ocasião do ataque da doença e a condição do recém-nascido (dados
hipotéticos).
Condição do
pesido ec sã com Eacfeitca dem defeitos Total
da gestação
É 5 n=9
As prisma
ã 7 m=0
Depois do 3.º mês
6 12 18=n, + 8
ps
Suponha-se agora que, em lugar dos resultados apresentados, tives-
sem sido observados, para o mesmo tipo de estudo, os dados da tabela
17.4. Como se vê, agora as amostras são bem menores do que as an-
teriores e n; + n: = 18,0 que não permite mais usar a distribuição
normal para a feitura do teste de hipóteses que era a distribuição apro-
ximada de (p; — p=). Lança-se mão, por isso, do teste exato de Fisher
(já mencionado no capítulo 3). Este teste consiste em calcular a pro-
290
babilidade de se obter
uma tabela como a 17.4
ou outras disposições
ainda mais discrepantes (fixado
s os totais marginais) no sentido da
hipótese H, e compará-la com
O valor de a pré-fixado. Em outras
vras, calcula-se a probabilidad pala-
e de se obter
4 5/9 5 419 6 319

ou ou
2 7/09 1 89 o 9lso
6 12 18 6 12 18 6 12 | 18
Chamando-se de P;, P, e P, as probabilidades associadas às tabelas
acima pode-se demonstrar que:
91 9! 6! 12
Pa zs 7
91 9! 6 121
PM sas
Pp = 9191 61 12
181 61 31 01 9!
ou, genericamente,
fa! fa! fofo!

nt fun !fio! fo! fo!
para a disposição abaixo *:
Desde que P, = 0,244

P, = 0,061
Ps = 0,005
eras a i
* Ver capítulo 8, distribuição hipergeométrica.
29+
então a probabilidade procurada P, + P, + Ps; = 0,310 ou 31 0%,
comparada ao a (fixado, por exemplo, em 5%), levaria à aceitação
da lupótese He.
Para finalizar esta seção vale a pena observar que
(Pp — Pa)?
Mp + np) Im (1 —p) + mo (1 — po)]
m no (Mm + no)
stençnd ao x definido para o teste de associação em uma tabela

de 2
Ee z2, isto é, a expressão acima, na qual se substitui
P: por Pr € P: por Ps. corresponde ao X? (qui-quadrado corrigido).
17.22 As duas populações não são independentes
Com a finalidade de analisar uma situação deste tipo, considere-se

o exemplo discutido no capítulo 3, que se referia ao estudo da concor-
no mesmo indivíduo, entre dois métodos coprológicos (ver ta-
bela 3.1) e que foi retomado no início deste capítulo com o objetivo
de se testar a hipótese de independência contra a de associação entre
os dois métodos.
Outra pergunta feita muito comumente pelo investigador de pro-
blemas desta natureza, em que o mesmo indivíduo é usado como seu
próprio controle, é se os dois métodos são capazes de acusar a mesma
proporção de positividade para o parasita em questão, independente-
mente de concordância ou não dos resultados para um mesmo indivíduo.
Em outras palavras, com relação à tabela 3.1, esta preocupação
do investigador (no que se refere ao caso particular do parasita Giar-
dia lamblia) se traduz, em termos empíricos, na comparação de:
="
= = 41,0% cm g = = -—— = 41,5%
E É Es 200
Como se vê, estes valores são praticamente iguais entre si, O que
era de se esperar, uma vez que para a tabela acima o coeficiente de
associação de Yule foi igual a + 0,999, mostrando associação quase
perfeita positiva entre os dois métodos.
No entanto, a recíproca não é verdadeira, ou seja, pode-se ter
valores muito próximos, e até iguais, para estas proporções de positivos,
« haver independência entre os dois métodos.
292
O caso
' como o que
: se apresenta e: juematic; ,
divíduos, ilustra esta situação: e amente para doze in-
Resultado pelo
Indivíduo n.º
Cc
z
&
5mn
| +A+++
+rrLILILi+++
BESvodanawn
PEDIA
De fato, ele mostra que ambos os métodos apresentam exatamente

a mesma proporção de positividade igual a 50% e, no entanto, existe
: independência entre os resultados. Colocando-se estes dados em uma
tabela de 2 x 2, tem-se:
MIFC
E = Total
FAUST
E 3 3 6
> 3 3 6
Total 6 6 12
para a qual o coeficiente de associação de Yule vale: O = O. |

Ou seja, isto mostra que esta indagação colocada pelo investiga-
dor não fica automaticamente respondida quando do estudo da associa-
São. Por outro lado, este problema não pode ser tratado também dire-
tamente pela técnica apresentada na seção 17.2.1, que compara pro-
porções de sucesso de duas populações independentes. Realmente, à
questão proposta envolve a comparação de duas proporções popula-
cionais, onde as populações não são independentes pelo fato de se re-
erirem a exames feitos sobre os mesmos indivíduos. No nível das amos-
tras e voltando-se novamente à tabela 3.1, trata-se de duas ema
de tamanho n, cada uma, e as proporções amostrais & as tém o
comum f;; indivíduos que foram positivos por ambos os métodos, po!
293
a
to tu + to
n
ta tu tt,
Feitas estas considerações, sejam respectivamente 71€ y2 as verda-
deiras proporções de sucesso nas populações Pe Ps, não-independen-
dentes. Fixado um nível de significância de à, o teste de hipótese
de Ho: n = ys contra Hiiy =* y2
poderá ser feito através da estatística
(a — 2) — (un —y)
Vo +03 —2 po 0
onde q? e os? são as variâncias de g; e £>, respectivamente, e py é

a correlação entre g; e g>, todos desconhecidos.
McNemar * propôs para estimador de
Vo +o — 2Py nO
a expressão:
fu
& Bs Ea
n
e demonstrou que a estatístia ç
U = (g — go)? :
&+g = 22 —Mn
n
tem distribuição x? com 1 grau de liberdade. Logo, o teste de H
contra H; é realizado comparando-se o valor observado de U:, Uz, com
o valor crítico correspondente de yº para 1 grau de liberdade e um nível
de significânciaa. Se U; > Daio? rejeita-se Ho, aceita-se Ho, em caso
contrário.
a nica estes resultados ao exemplo proposto. tem-se, para
a= 5%:
é McNemar, Q.. “Note on the sampling error of the difference between correlated
proportions of percentages”. Psychometrika, 12: 153-157, 1947.
294
a pg (0,410 — 0,415)2 a
0,410 + 0,415 — 2x 040 — 020
200
valor que comparado ao x? = 3,841 para 1 grau de liberdade leva

à aceitação de Ho.
McNemar propôs ainda uma forma alternativa de testar H, contra
H, baseada na seguinte consideração: y1 € 72 seriam iguais, isto é,
A seria verdadeira se não existissem resultados discordantes do tipo
+-—) e (— +). Logo, nada mais natural do que substituir
Ho e H,
pelas hipóteses:
Ho: dd = 5
HP :ô * d
onde ô; e 8, representam respectivamente as proporções de resultados

discordantes do tipo (+ —) e do tipo (— +).
Sob Hy', o valor esperado para ô, = ô, será
fi + fo
e, portanto, o teste de Ho" contra H;' será feito através de V2:
fio + fo)? fe + faP

; fr — E fy — “2,
= +
fo + fo fiz + fa
2 2
=
fo — tu?
fu
ty)? , que tem distribuição xº com 1 grau de
fio o fo:
liberdade.
Pode-se demonstrar que esta expressão é igual àquela dada por U..
V2, com a correção de continuidade de Yates, torna-se:
W = (If — fal — 1)?

: fio + fr
295
fu + f
Quandoa freqliência esperada ———
2 2 for menor do que 5, a
aproximação pelo x), mesmo com =" será precária; portanto, o
teste exato através da distribuição binomial é o mais aconselhável,
Exemplo
Rocha e Silva et al.,* para testar as hipóteses, ao nível de 5%
de significância,
H, : preferência alimentar do T. sordida por sangue de ave =
preferência alimentar por sangue di
H: preterição alimentar por sangue de ave '> preferência por

sangue humano,
encontraram o resultado da tabela 17.5, para 116 insetos correspon-
dentes uo estrato “região São José do Rio Preto — captura na cama”,
devendo-se esclarecer que cada triatomíneo era examinado para sangue
de ave e humano simultaneamente, caracterizando-se o teste de diferen-
ça de proporção para populações não-independentes.
Tabela 17.5 Número de T. sordida segundo positividade para sangue humano e

de ave. São José do Rio Preto, 1975/1976*.
Sangue
Sangue de humano + - Total
ave
+ 12 23 35 (30,17%)
— 20 61 81
32 84 116
Total (27,59%)
* Capturados na cama.
Fonte: Rocha e Silva, Eduardo Olavo, er al., op. cit.
* Rocha e Silva, Eduardo Olavo da: Souza, José Maria Pacheco de; Andrade,
José Carlos Rehder; Mello, Cássio José de; Ferreira, Octávio Alves. rt
Alimertar (Entre Sangue Humano e ave) dos Triatoma sordida Encontrados Em
Casas Habitadas da Região Norte do Estado de São Paulo, Brasile, Ros Saúde
Públ.. 11: 258-69; 1977.
296
Chamando-se y, à proporção de triatomíneos que têm preferência
O e poolem n eo têm preferência por sangue humano,

H :y = 72
H:y > y2
e testadas pela estatística U2:
(0,3017 — 0,2759)2 — 0,0000666

Ui = = 0,21
0,3017 + 0,2759 — 2Er 0,003196
116
indicando aceitação de Ho.
Alternativamente pode-se usar as hipóteses
Ho :ô = 69,
Hy : ô > ô , que levam ao resultado
= D-D 23 — z
9 gy9
23+ 20 43
Capítulo 18
Teste de um coeficiente de correlação e
de um coeficiente de regressão
18.1 Teste de correlação
No capítulo 4 foi introduzido o coeficiente de correlação amostral

r, como medida da correlação entre duas variáveis quantitativas X e Y.
No exemplo lá apresentado, X era o peso e Y a estatura, em
do sexo feminino com 7 anos de idade.
Suponha-se, agora, que estas crianças tivessem sido estudadas com
o objetivo de testar uma hipótese de correlação nula contra uma hipó-
tese de correlação positiva entre X e Y — isto é, denotando-se por p
o verdadeiro coeficiente de correlação entre X e Y, testar a um nível
de significância de a:
H:P=0
contra
H:P *<0
| A fim de resolver este problema, necessário se torna conhecer a

distribuição amostral do coeficiente de correlação r em amostras de ta-
manho n tomadas de uma população com p = O.
Demonstra-se que, nestas condições, a estatística
rvn-—2
t=
1-—r
tem distribuição t de “Student” com (n — 2) graus de liberdade.
Suponha-se « = 5%. No capítulo 4, o valor de r observado na
amostra de n = 20 meninas de 7 anos de idade foi: 1 = + 0,87.
Portanto, substituindo-se estes valores na expressão acima, tem-se:
t 0= DDDWwWwWw>w>|>—;—
9:87 V 20 -2 = 7,49
V1 — 0,569
Indo a tabela de teom n — 2 = 18 graus de liberdade e a = 0,05,
encontram-se os valores enticos de t: — 2,101 e 2,101. O valor obser.
vado de t for 7,49, que é maior do que 2.101, ou seja, 7,49 caiu na
região de rejeição de Ho: rejeita-se a hipótese Ho. isto é, rejeita-se,
20 mre! de ST, a hipotese de que não existe correlação entre o peso (X)
e estatura (Y), em meninas escolares de 7 anos de idade.
É importante insistir em que a estatística t aqui definida só terá
distnbuição + com (mn — 2) graus de liberdade se H; : p = 0. No
caso de H, especificar para p um valor não-nulo, o teste de H, contra
H. sera feito através de outra estatística e este caso não será conside-
rado neste livro.
18.2 Teste
de regressão
Ainda no capítulo 4 foi tratado o problema de se ajustar aos dados

uma reta de minimos quadrados 9, = a + bx; quando se pretendia
estimar Y para um dado valor de X e se supunha que entre X e Y
havia uma relação de tipo linear, isto é, y7 = a + Bx, + us,
Como se recorda, a e b eram dados, respectivamente, por:
a=y-—bz
Da-Dy-DA
il
Da - nt
is
e esta di ão depende lusi da p posição da liga-

ção de tipo linear entre X e Y.
No caso de se querer testar hipóteses a respeito de a e b, várias
pressuposições. entretanto, precisam estar satisfeitas.
Em primeiro lugar, X não é variável aleatória, ou seja, os valores
de X são fixos. não sujeitos a erros de medida. Somente Y é variável
aleatória. Para cada valor x, de X, supõe-se ainda:
1) o erro de medida na variável aleatória Y não é sistemático,
ou seja. a média dos erros de medida na variável Y é nula;
2) ia variância dos erros de medida na variável aleatória Y é
igual a O*. isto é. é a mesma para qualquer valor fixado para X;
» o erro de medida de uma observação sobre Y é independente
do erro de medida em outra observação;
4) o erro de medida na variável aleatória Y tem distribuição
normal.
300
Em decorrência » a de 1,2 e 3 4 pode .
medida na variável aleatória Y tem distribua enunciada: o erro de
E
zero e desvio padrão o. ção normal com média
Isto posto, pode-se demonstrar que as estatísticas
b-sB a-a
SE: e
Sb Sa
têm aproximadamente distribuiçõ -

onde: ções t com (n — 2) graus de liberdade,
por: s, é um estimador do desvio padrão

ã da variável
iá óri b, dado
aleatória
n n
SGD? — 43 Gu-m2]/(n-2)
is is
n
x Gu—R)?
FI
es. a é é ê : .
um estimador do desvio padrão da variável aleatória a, dado por:
io
1 zº É o E .
“= o +=== ==— 20 -=9)2 — >, (3)?
z G— 3? il Fl
1 n=2
Nestas condições, o teste da hipótese: Ho : b = 0, que se traduz

e dizer que a reta de regressão de Y em X é pa ralela ao eixo dos
e
» Contra a hipótese H; : b > 0, a um nível de significância à,

serárá feifeito através do cômputo do valor da estatística
: e seu
na curva
— ta, n-2 € ta/2, n-2, obtidos
prai com valores críticos O teste é bicaudal.
liberdade, uma vez que
Para (n — 2) graus de
301
iii ati
- <-ta/gn-
b-3
ou o > ta/a, n-2, rejeita-se Ho.
Caso contrário, aceita-se H,

O procedimento é análogo para o teste das hipóteses
H, :a=0
H:ax0
a hipótese Hg significando que a reta y, = à + bx corta o eixo das

ordenadas no ponto zero quando x = zero.
Exemplo
Para o exemplo já apresentado no capítulo 4, sobre regressão,

suponha-se que se quisesse testar, a um nível de significância de 1%,
a hipótese de que a inclinação f da reta de regressão de Y em X fosse
nula, isto é, que as alterações sofridas pela quantidade de glucose re-
tida (em gramas por quilo de peso por hora) não dependessem linear-
mente da quantidade de glucose injetada. Aqui H, :B> 0.
Neste caso, recorde-se que:
b = 0,8041
Calculando-se agora sp, tem-se:
= / 8IT6T6AE— 0,6466 x 126481818 sd

16 x 126,48184g
Portanto, o valor observado para a estatística bob » quando

a: Sy
H, for verdadeira, torna-se:
b- 0,8041
b=b = = 14,7813
Sp 0,0544
Indo-se à tabela da curva t para 16 graus de liberdade e um nível

de significância de 1%, obtém-se o valor crítico de 2,583. Uma vez
que o valor observado 14,7831 é maior do que o valor crítico; rejei-
ta-se a hipótese Ho, isto é, B > O.
302
Para testara, tem-se:
; a = 0,0462
= / | 1, J0s6t | [4875978 — ,6466x 7026767] | o6ss
S 18 * 7,026767 16 o
. a-a
A expressão toma o valor
a-a 00462
Sa 0,0658 = 0,7021, levando à decisão estatística de
que o coeficiente linear a é igual a zero.
303
Capítulo 19
Estimação de parâmetros populacionais —
Por ponto e por intervalos de confiança
Do capítulo 11 ao 18 o interesse residiu em testar- hipóteses a res-

peito de parâmetros populacionais. Ao se realizar um teste de signifi-
cância a respeito de um parâmetro, há o problema de que o próprio
parâmetro em discussão e/ou outros sejam desconhecidos, surgindo a
necessidade de usar os dados amostrais 'para obter um valor (ou valo-
res) que substitua tal parâmetro.
xistem outras situações em que o interesse não é testar hipóteses,
mas justamente ficar conhecendo o valor de determinado parâmetro
populacional (a média, o desvio padrão). Em geral, o procedimento
para esta determinação não é feito pela observação de todos os indiví-
duos da população, o que forneceria o verdadeiro valor do parâmetro.
O que se faz é, a partir de uma amostra, obter um valor que se acredite
seja o mesmo ou o mais próximo possível do valor verdadeiro.
Ao procedimento de obtenção de um valor amostral para substi-
tuir o respectivo parâmetro denomina-se estimação, à característica que
substitui o parâmetro chama-se estimador, e o valor numérico do esti-
mador é uma estimativa.
19.1 Estimação por ponto; estimador não-viciado
Quando se propõe um único valor para substituir o parâmetro, aes

timação se diz por ponto. Assim, o estimador por ponto da média aritmé-
: - = Ex a
tica populacional m é a média amostral x =. O estimador por ponto
a , EK?
da variância populacional o? é a variância amostral sº =
= 2a
—)2 % 4
. Para indicar que se está diante
:
de um esti-.
ous? n-1 o
mador, usa-se
o símbolo A . Tem-se: m = XxX
õ=s
d=r.
305
E desejável que o estimador de um parâmetro tenha certas proprie-
dades que permitam avaliar se o estimador é um bom substituto do
parâmetro que se pretende estimar. Estas propriedades estão ligadas ao
fato de" os estimadores serem variáveis aleatórias. Em geral, deve-se
preferir estimadores não-viciados. consistentes, de melhor eficiência e
suficientes.
A discussão dos conceitos referentes às três últimas propriedades
está além do escopo deste livro. Será apresentado apenas o conceito de
estimador não-viciado.
Considere-se o fato de estimar a média populacional m, de uma
população P, através do seu estimador à = X, calculado em uma
amostra de tamanho n, originando a estimativa X. A partir da popu-
lação P. todavia. é possível obter um conjunto de amostras, cada qual
originando determinado X; na prática, somente uma amostra é tomada
e somente um X é usado em lugar de m, não sendo possível afirmar
que X seja igual a m. A teoria estatística permite, porém, afirmar que.
se fosse calculada a média aritmética de todos os possíveis X obtidos
de todas as possíveis amostras de tamanho n daquela população P. o
valor obtido seria justamente m. Ou seja, a média aritmética dos x é m,
o que caracteriza O estimador X como não-viciado, o conceito de vício
já tendo sido exposto no capítulo 6, Amostragem.
Genericamente, diz-se que um estimador Y é não-viciado quando
a média aritmética de todos os possíveis valores numéricos v, estimados
nas amostras de tamanho n, teoricamente obteníveis da população P,
é igual ao parâmetro V. Já se viu que a média aritmética amostral X
: a EG -— 3
tem esta propriedade. O estimador 6º = njE S e=
lg -—s
não-vici
éÉ não-viciado. enquanto dºs =s2,, = 7 é viciado. De fato,
pode-se demonstrar que a média de todos os valores 6º no primeiro caso
é o* e no segundo
caso é
19.2 Estimação por intervalo de confiança
A discussão anterior foi conduzida a partir da substituição do pa-

râmetro atraves de um único valor. o estimador por ponto. A questão
que sera agora abordada é estimar o parâmetro populacional por um
conpunto de valores. um intervalo no qual se possa depositar certo
306
grau de confiança de que contenha o verdadeiro parâmetro
desconhe-
cido. A tal intervalo denomina-se intervalo de confiança.
O grau de confiança 100 (1 — a)% que se quer depositar na
mativa feita através de um intervalo vai depender de
esti-
cada caso parti-
cular e pode ser 80%, 90%, 95%, 99%, etc. Se o grau
de confiança,
também chamado coeficiente de confiança, for de, por exemplo, 95%,
O intervalo diz-se de confiança de 95%. Os intervalos de confiança
“podem ser bicaudais ou monocaudais.
19.2.1 Intervalo de confiança para a média populacional
Seja estabelecer um intervalo de confiança bicaudal de 95% para

a média populacional m. Já se viu que, se uma população tiver distri-
buição normal com média m e desvio padrão o, então a distribuição de
x em amostras de tamanho n será normal com média m e desvio pa-
drão a Portanto, para a distribuição de x, podem-se estabelecer os

vn
valores z; e zo da distribuição normal reduzida, tais que a probabilidade
de se ter
nm-n= <i<n+ta-&
“Va vn
seja 95%, isto é, tal que
is o
jus et<m e +27 —) o = 95%
(D) P(m am “ms)
Indo à tabela da distribuição normal encontra-se que 7, = Ze =

1,96; logo, a (1) torna-se
= Eo =
<z<m+ 1,96 A ) =ta 95%,
(2) P(m 1,96 Ta Va
que também pode ser escrita como segue:
(3) P(xz — 1,96 —€

Ta z
m<XI+ )
1.965) = 95%,
que diz que a probabilidade de o intervalo bicaudal
. o,| o
(4) X-— 196 +x 1,96 ——
conter
m é de 95%.
Entretanto, quando tomada uma amostra de tamanho n é calcu-
lado o valor de X = % e substituído na (4), deixa de ter sentido
falar em probabilidade de o intervalo resultante conter m, porque o
intervalo
á %
x —-196-LH>
1% + 1,96
6) b 6 ? va
deixou de ser agora uma variável aleatória. De fato, X%, ce Vn são
múmeros conhecidos e o intervalo por eles determinado ou contém
ou não contém o parâmetro m. Diz-se, então, que a confiança que se
deposita nesse intervalo é de 95%, porque antes da tomada da amostra
de tamanho n a ele estava associada uma probabilidade de 95% de
que contivesse m. Por esta razão, a (5) chama-se intervalo de confiança
de 95% para a média populacional.
o o
(Go — 1,96—-—
vã? e
é ão + 1,96
va
—=)
são, respectivamente, o limite inferior e o limite superior do intervalo

de confiança de 95% para m, também chamados limites de confiança.
Analogamente, o intervalo de confiança de 99% para m é dado
por
, o
z 2,58) — + 258
va! e E
Genericamente, o intervalo de confiança de (1a) para m será
dado por: :
—
o o |
9)x- ww
ay, «.— | [R + za,
va
+ onde Zg, é o valor na distribuição normal reduzida que tem à sua
direita ada área total.
age <£ for desconhecido, usa-se o estimador por ponto s e o inter-

valo torna-se:
E 8 e
M x -— tafo,ni va > E + ta/an-l , a
onde toy, » n-1 é o valor na distribuição t
para n-l graus de liberdade
que tem à sua direita 5 da área total.
Note-se que, para um mesmo % e um mesmo o (ou s se for o caso),

a amplitude do intervalo de confiança depende do grau de confiança e
de n. Se n também for fixado, quanto maior o grau de confiança, maior
a amplitude do intervalo.
A amplitude do intervalo, que será denotada por A, vale:
Ae E Blog a
ea
Tirando-se o valor de n, tem-se:
n = 4x2, q xo?
o que mostra que, conhecido o, se se fixar o grau de confiança e a

amplitude do intervalo, pode-se calcular o tamanho da amostra à base
da qual se fará a estimativa de m por intervalo, satisfazendo àquelas
condições prévias.
Exemplo
Com sua amostra de recém-nascidos de peso maior do que 2.500 g,

Yunes * pôde estabelecer um intervalo de 0,90 de confiança para a
verdadeira média de estatura da população hipotética de recém-nasci-
dos no Hospital das Clínicas da USP naquela categoria de peso. o
autor encontrou a média amostral X) = 48,55 cm e o desvio padrão
s = 2,13 cm; apesar de o desvio padrão populacional não ser conhe-
t de
cido, pode-se usar a distribuição normal ao invés da distribuição
“Student”, pois o número de graus de liberdade, 219, é suficientemente
a F
0,05, pois
grande. Assim, tomando z = 1,65, que corresponde a õ =
o intervalo é bicaudal, o intervalo ficou assim determinado, para 0,90

de confiança:
* Yunes, João, op. cit.

“ss — 1,68 x 2,13 48,55 + 1,65 x 2,13
v 220 220
48ss — 024 L— 4855 + 0,24
48,31 em E 48,79 cm
19.2.2 Intervalo de confiança para uma proporção

Um raciocínio totalmente análogo àquele usado para estabelecer
o intervalo de confiança para a média m de uma população normal leva
a um intervalo de confiança para estimar a verdadeira proporção p de
sucessos numa distribuição binomial com parâmetros n e p, com p
desconhecido. A solução exata deste problema é feita através da dis-
tribuição binomial e apresenta dificuldades cuja análise está fora dos
limites deste livro.
Só será considerada aqui a solução aproximada obtida pelo em-
prego da distribuição normal. A sua aplicabilidade fica, obviamente,
na dependência das mesmas restrições já apresentadas anteriormente.
Nestas condições, o intervalo de confiança de 100 (1 — a)% para
p será dado por:
” Zay, Hp + op,
onde p', é a proporção observada de sucessos numa amostra de tama-
nho n e Za), é o valor na distribuição normal que tem à sua direita 5

da área total.
Exemplo
Em dissertação de mestrado, Amador * estimou por intervalo com
95% de confiança, em mulheres que fregientam ambulatório
de gine-
cologia e de clínica médica de dois hospitais de São Paulo,
qual a ver-
dadeira proporção que tem informação sobre a técnica de
auto-exame
* Amador, Maria Virtuosa Pereira, Contribui

ao Estudo do Aui to-exame da
Mama como Método de Detecção Precoce do ção Câncer
'e do Câncer, dissertas trado,
sertação d de mestrado,
310
da mama. Da amostra de tamanho n = 893 mulheres entrevistadas,
221 (x) responderam afirmativamente, o que resulta em p', = 24,75%
(0,2475) de mulheres informadas. O intervalo de confiança
é cons-
truído a seguir:
0,2475 — 1,96 0,2475 x 0,7525 | |

893
0,2475 + 1,96 / 0,2475-x 0,7525

893
0,2475 — 0,0283 | | 0,2475 + 0,0283
0,2192 | | 0,2758
21,92% | | 27,58 %
Intervalos com 95% e 99% de confiança podem ser obtidos

gra-
ficamente utilizando-se as figuras 19.1 e 19.2, respectivamente.
Para
o exemplo dado, no eixo inferior das abscissas (E) toma-se o valor
0,25 = 0,2475 e a partir daí levanta-se uma perpendicular até cruzar

as duas curvas referentes a n = 1.000, quantidade próxima a 893.
Dos pontos de encontro, traçam-se paralelas ao eixo das abscissas até
encontrar, à esquerda, o eixo das ordenadas (p). Os valores são os
limites aproximados inferior e superiór do intervalo de confiança dese-
jado: 22,0% e 27,5%, valores bem próximos aos encontrados ante-
riormente.
xo. , ;
Com valores de maiores do que 0,5, usa-se a abscissa superior
e as paralelas devem cruzar o eixo das ordenadas à direita.
19.2.3 Intervalo de confiança para a diferença de duas médias de

Populações não-correlatas
Quando as duas populações P, e P>, não-correlatas, tiverem des-

vios padrão conhecidos, o intervalo que contém a verdadeira diferença
m; — mp, é obtido sob a forma
3H
2 2
o st = A
(Ro —Ro2) Zap Eh + I2
a [a À
,
(X%o — Xo2) + Zafa ma
onde Xo; € Xos São as médias correspondentes às amostras de tamanho

nm; € no das populações P, e Ps, respectivamente, com os outros símbo-
los já definidos anteriormente.
No caso de desvios padrão desconhecidos existem as duas situa-
ções já vistas para teste de hipóteses, ou seja, variabilidade igual ou
desigual. Para ida, porém sup a mes-
ma nas duas populações P, e P., o intervalo de confiança é construído |
usando-se a distribuição t de “Student” com n, + n; — 2 graus de |
liberdade. Pode-se dizer, então, que o seguinte intervalo: |
e (m— Ds + ( P/1,a
(Ko —%oz) — taya, mtm-2 m Tens mm + nz r )
(m—)s2+ (ne-1)s2
Pe E
(1 a
(Roo) +t Gn +n9-2 m+tn-—2 non
contém, com (1 — a) de confiança, a verdadeira diferença (m, — mo).
Para desvios padrão desconhecidos e supostamente diferentes, tem-
se o intervalo:
s;2 =
Go—Roa)—tap1E f—=. + ar +
(Ro — Ros) +tay, '8

st, st
n n$
o valor de ta/., g correspondendo à distribuição 1 com
| EPn no
Dr DT — 2 graus de liberdade
( sf sy?
ma o
+
m+1 nm+il
312 j
Exemplo
É possível estabelecer intervalo com 90% de confiança para a

verdadeira diferença entre as médias de dosagem de lipídios no tecido
placentário no 21.º e 20. dia de prenhez em ratas, utilizando dados de
Andrade.* O autor encontrou os seguintes valores em suas duas amos-
tras de 10 ratas cada:
21.º dia de prenhez
Km = 751,32 mg% e st = O22(mg%):

20.º dia de prenhez
Xe = 722,60 mg% e su? = 42,2723(mg%)?
Admitindo-se que s;? e s;º são valores amostrais obtidos de um

valor comum o?, tem-se o intervalo
csta2- 72260) 1734 /º x 1102211 + 9 x 42,2723 (+55)

10 + 10 -2 10 10
E
as132-12260) + 1.738 É 9 aiç 2 o9 23/10 1
Ea 1 +5)
10 +10-2 to 10
28722 —- 67 [—— 2872 + 6,77

21,95 mg % | 35,49 mg%
19.2.4 Intervalo de confiança para a diferença de duas médias de

Populações correlatas
Mais uma vez pode-se fazer a analogia com o respectivo teste de

hipóteses. definindo-se uma nova variável D, que é a diferença para
cada um dos n pares de valores das duas populações P, e Py. A média
* Andrade Antônio Suzart, Relação Entre a Atividade Lisossómica e o Teor de

Lipidios na Placenta Fetal da Rata Durante o Período Funcional, tese de doutora-
mento, Escola Paulista de Medicina, 1975
TO BIBLIOTECA | 313
FACULDADE DE MEDICINA DE
aritmética Do dos D é a estimativa por ponto da diferença das médias
m, ce ms € O respectivo intervalo de confiança fica construído da se-
guinte forma:
Sp
Do - taí, nm va IDo + tap nd VE.
Exemplo
Ribeiro et al.,* em estudo comparativo de efeitos broncoespasmo-
lítico e colaterais entre dois medicamentos (HD e teofilina), mediram
a Capacidade Vital Forçada (C. V. F.) em ml, no primeiro dia de tra-
tamento. antes e duas horas após a administração da droga a ser testa-
dada a 15 pacientes distribuídos aleatoriamente. Foram obtidos os se-
guintes resultados:
Número do paciente Antes Depois Diferença
1 1.020 1.650 — 630

vá 2.860 3.030 — 170
3 3.580 4.080 — 500
4 2.760 2.460 300
5 3.500 3.550 — 5
6 1.930 2.120 — 190
7 2.600 2.900 — 300
8 2.500 2.500 —
9 2.320 2.700 — 380
10 3.000 — 3
u 1.860 — 360
2 000 — 80
13 4080 5? 180
14 1.900 « — 940
15 3.050 - — 50
Média Do = Xuntes — Rrcpois = — 231.33 ml no

Desvio padrão s = 314.03 ml
Para estabelecer um intervalo com 0,99 de confiança para a ver-

dadeira diferença entre as médias de antes e depois da administração
da droga, usa-se o valor de t com 14 graus de liberdade igual a 2,977
e tem-se:
* Ribeiro. Herval Pina: Nogueira. Diogo Pupo: Haebisch, Horst; Koga, Rosa
Kiyoka: Souza. José Maria Pacheco de. “Estudo Comparativo dos Efeitos Bron-
coespasmolíico e Colaterais entre 0 7 — 3 — [2 — (3,5 — Dihidroxifenil)
— 2 — Hidrox-Etil-amino Propilj) — Teofilina. D — 1959 e a Teofilina Com-
primidos” - trabalho não publicado, 1976
314
314,03 314,03
— 231,33 — 2977. VT | [-— | |— - 231,33 + 2,977. 21405
— 231,33 — 241,38 || = 231,33 4 241,38
— 42741 ml || 10,05 ml
19.2.5 Intervalo de confiança para a variância populacional
Para se propor um intervalo em que se deposite 100 (1 — a)% de

confiança de que contenha a verdadeira variância populacional e, por
conseguinte, o respectivo desvio padrão, lança-se mão da distribuição
x, .a fim de se ter
(n — 1) 82 (n — 1)82
P ———
x >6'> ——>——
x, l-=a-
(1-0),
onde Kat o valor de x? na distribuição com (n—1) graus de liberdade
que deixa 5 de área à sua direita e Xj & deixa (1 =) de

área à sua direita.
Exemplo
Utilizando ainda os dados de Andrade *, é possível estabelecer um

intervalo de 90% de confiança para a verdadeira variância o? de lipf-
dios no tecido placentário de ratas prenhes de 21 dias.
Tem-se:
9 x 110,2211 9 x 110,2211
16,919 ! 3,325
58,6317 (mgh)? |—— 298,3428 ((mg% )?,
possam conter o verda-

podendo-se também estabelecer os limites que
é,
deiro desvio padrão, bastando extrair a raiz quadrada, isto
7,66 mg% | | 17,27 mg%
* Andrade, Antônio Suzart, op. cit.
315
19.26 Intervalo de confiança para o coeficiente de correlação
A fim de se estabelecer o intervalo de confiança para um coefi-

ciente verdadeiro p de correlação, há a necessidade de se trabalhar com
uma variável introduzida por Fisher,
p=12
1l+r
» que tem distribuição normal, com média
1 = f
my = a
1+P
=P e desvio padrão oy= RE
1
» para n grande.
Os limites para um intervalo de (1a) de confiança são:

-—2z
2 204 4
p= lDt o Va
1l+r
p= DL 1+r
ass
2
Pag -— 22
% '
(+ Ter 4
Av = ia LDt
1+r
VIRA -
onde ln, e, 294 er já foram definidos.
É possível também obter os valores-limites para um intervalo que

contenha o verdadeiro valor de p utilizando-se gráficos, que são apre-
sentados nas figuras 19.3 e 19.4, que se referem, respectivamente, a
coeficientes de confiança de 95% e 99%. A utilização desses gráficos
é feita da seguinte maneira: para 100 ( 1 — a)% fixado, toma-se o valor
observado de r=r, na amostra de tamanho n em estudo e localiza-se este
valor no eixo das abscissas; a partir dele levanta-se uma paralela ao
eixo das ordenadas até encontrar as duas curvas referentes ao n em ques-
tão. De cada um dos pontos de encontro traça-se uma paralela ao
eixo das abscissas até encontrar o eixo dos valores de p, obtendo-se
assim os limites inferior e superior do intervalo de confiança para p.
Exemplo
Retomando o exemplo dado no capítulo 4, isto é, a correlação

entre estatura e peso de meninas escolares de 7 anos de idade, será
calculado o intervalo de confiança de 0,95 para p.
Para tanto,
n=20
r = 0,87
316
po Iltçvln=3
logo: [+
2x 1,96
1- 087 VID=3
=1-0>>Se VW 3 2, 01799 = 0,820]:
T+ 0,87
2 Za,
L=>r e
1+ —— JAF = 1 + 0,179= 1,1799
V20-3
L+r
Nestas condições, o limite inferior do intervalo de confiança será

dado por:
Quanto ao limite superior, tem-se:

=2 Za, =2x 1,96
1-r vVn-3 1 — 0,87 v20-3 +
La" [+ 0,87
=: 1 ama
=| — 0,0269 = 09731
" - 2
º az
pa LDLn-3 =| + 00269 = 1,0269
| rt
Portanto.
= 2 Za,
| - 1l-— vyn-3
Lastá 0973 09476

2 a, 1,0269
1—r yn-—3
L+ e
1+r
317
Então, o intervalo no qual se deposita 0,95 de confiança de que
contenha o verdadeiro valor de p é dado por:
a” | 1 0,95
Finalizando, pode-se ver que, pela figura 19.3, o intervalo de 0,95
de confiança para p está muito próximo do obtido diretamente. -
19.27 Intervalo de confiança para o coeficiente de regressão
De acordo com o que se viu no capítulo anterior, satisfeitas as

suposições sobre o erro de medida na variável aleatória dependente y,
b-—-ôB
Soy
tem distribuição t com (n — 2) graus de liberdade.
Portanto, o intervalo de (1a) de confiança de que contenha o

verdadeiro valor de b será dado por:
b-—st s |———| b+t s
amoo | | huma
Exemplo
Retomando o exemplo estudado nos capítulos 4 e 18, suponha-se

estimar o coeficiente de regressão B da reta que expressa Y (quanti-
dade de glucose retida por quilo de peso por hora) em função de X
(quantidade de glucose injetada) através de um intervalo de confiança
de 99%.
Tem-se:
n 18
b 0,8041
pa
Sp 0,0544
t = 2,921;
% 82
logo, o intervalo no qual se deposita 99% de confiança de que conte-

nha o verdadeiro valor do coeficiente angular da reta de regressão de
y x é dado por:
0,6452 |-— | 0,9630

318
Coeficiente de confiança de 95% is EA
a 4) 8 7 2
as 21858833 85653853224343428243385
T
qFERE! a g qq 8
8sesss8senrce o Ss
on8
o o
SSsocoGscSsoS
— o tamanho da amostra n
Os números que aparecem sobre as curves indicam
ajx
na distribuição binomial, dada uma pro-

Figura 19.1 Limites s antas para p
porção observada di 1, E. S. Pearson e H. O.
Extraia o da Bioneirita EA for Statisticians, vol.
artley,p.
319
8s esz2eg
0,46
0,50
SBssscsssssIsAgAgaEaS
048
0,44
042
indicam o tamanho di stra n

Figura 19.2 Limites de
ae cêntiitaa para p na distribuição binomial, dada uma pro-
porção observada de
Extraído da Bíometrika a for Statisticians, vol. 1, E. S. Pearson e H. O.
Hartley, p. 205.
320
Valores de p
:TTTTIRTIS3
Seaqonauaqmnançoagaszgnaagass 5SEFIFSTSS
335
Valores de r
Os números que aparecem sobre as curvas indicam o tamanho
da amostra n
Figura 19.3 Limites de confiança para o coeficiente de correlação populacional,

ps dado o coeficiente de correlação amostral, r.
Extraído da Biometrika Tables for Statisticians, vol. 1, E. S. Pearson e H. O
Y, p. 140.
Oueticiente
de contiança de 99
Valores de 1º
eE el2ts = 2 4ss masso = um

ssa o5 8on 0 a6 6ag
- 149 S +++ ++s
* Valores de
Os números que aparecem sobre as curvas indicam o tamanho da amostra n
Figura 194 Limites de confiança parei e-Soeticiente de correlação populacional,

p: dado o coeficiente de correlação am:
Extraído da Biometrika Tables for Sratisticians, vol. I, E. S. Pearson e H. O.
Hartley, p.
322
Capítulo 20
Análise segiiencial
Nos anos que precederam a criação da análise

seqiiencial, a teoria
estatística estava baseada no postulado de que uma investigação consis-
te, necessariamente, de duas fases perfeitamente distintas: na primeira
procede-se à coleta de todas as observações, cujo número, n, foi fixado
com antecedência; somente depois de terminada esta primeira fase é
que se procede à análise dos dados colhidos para o estabelecime
nto
das conclusões. Conquanto na prática, na maioria das vezes, o valor de
n seja determinado apenas vagamente antes do início da pesquisa, sen-
do posteriormente fixado no curso da mesma, principalmente em fun-
ção de considerações relativas à duração e ao custo do trabalho, a
teoria não-segiiencial encara n como constante, fixado previamente,
contanto que sua escolha não seja influenciada pelos resultados das
próprias observações.
Em problemas práticos, fregiientemente acontece que, mesmo quan-

do não são exigidos valores muito reduzidos para a e , n é relativa-
mente grande, e pode ser que o teste implique a observação de algu-
mas centenas de pacientes, consumindo grande quantidade de trabalho,
de tempo e de numerário. Por exemplo, pode acontecer que, com o
intuito de mostrar, com certo grau de confiança, que um tratamento é
inócuo, seja necessário aplicá-lo a um número muito grande de pa-
cientes; ou ainda, coligir evidências, através de um período longo de
anos, antes que se possa estar razoavelmente seguro de que um trata-
mento é eficiente e deve ser recomendado.
Em experimentos assim longos, fregiientemente o pesquisador não

pode deixar de conjecturar em que direção se dará a decisão final e,
no seu desejo de pôr fim à experiência, poderá, ocasionalmente, fazer
alguns testes de significância. Bastaria que um destes testes resultasse
significante para que ele fosse tentado a concluir que poderia interrom-
o a pesquisa declarando significante o resultado, ao nível de signifi-
Cância a.
Se o pesquisador adotar tal procedimento, não estará usando ne-

Nhum dos testes clássicos descritos anteriormente. O número de obser-
323
vações sobre o qual estará baseando sua decisão já não poderá mais
ser encarado como um valor fixado previamente. Pelo contrário, quan-
do decidir coletar observações adicionais, fa-lo-á na dependência dos
resultados daquelas até então coligidas, porém não de forma sistemá-
tica. mas sim, algumas vezes, em função de meras impressões, e outras,
em termos de testes de significância
Demonstra-se (Armitage *, 1954) que, assim procedendo, a pro-
babilidade de rejeitar erroneamente a hipótese de nulidade é maior do
quea. De fato, o exemplo que se segue ilustra bem esta afirmativa.
Suponha-se que um investigador, com o fito de pôr em prova a hipó-
tese H, de que a proporção de curas p, atingida por certo método
terapêutico, seja igual a um valor dado p; = 50%, contra a alterna-
tiva H,: p = po a um nível de significância a = 10%, tomasse 10
pacientes e. após havê-los submetido ao mencionado tratamento e ob-
servado o número x de curas, adotasse a seguinte regra de compor-
tamento:
1º — sex < 20ux > 8, ele rejeitaria H, (onde os valores 2 e 8
são determinados por « = 10% numa binomial para N, = 10
e po = 50%, pois numa tal binomial a probabilidade de se
obter 2 ou menos 8 ou mais sucessos é igual a
2x 0,0546875 = 0,1093750);
2º — sex = 5, ele aceitaria Ho;
3º — sex = 30u40ou 6 ou 7, ele tomaria nova amostra de mais
N. = 10 pacientes e os submeteria ao mesmo tratamento.
Agora, baseado no número de curas dentre os 20 pacientes, ele
rejeitaria H, se este número fosse menor do que ou igual a 6 ou
maior do que ou igual a 14 (onde 6 e 14 são determinados a
partir de uma binomial com N = N, + No = 20e p, = 50%,
tal que a probabilidade de se obter 6 ou menos ou 14 ou mais
sucessos é aproximadamente igual a 10%)
Nestas condições, pode-se mostrar que o pesquisador não estará
trabalhando a um nível a = 10%, e sim maior. De fato, segundo o
critério adotado, ele rejeitaria H,:
a) se na primeira amostra obtivesse x < 20ux > 8;
b) se na primeira amostra obtivesse x = 3 ou 4 ou 6 ou 7e
na totalidade dos 20 pacientes obtivesse x < 6 oux > 14.
Armitage, “Sequential Tests a: o ap látic and Therapeutic Trials”, Quant.

4 Med. Fe series), 23: 255-274;
324
A probabilidade correspondente a a) foi fixada
em 0,1093750.
Aquela correspondente a b) é dada por 0,063114.
Portanto, o nível de
significância no qual o pesquisador estaria na realidade
trabalhando
seria igual a
o = 0,1093750 + 0,063114 = 0,1724899 = 17,2489% *
Desde que a decisão de parar ou prosseguir seja condicionada
aos
resultados das observações já coligidas, tem-se o que se
denomina
um proced: quencial. Ent , atitude Th à do exem-
plo apresentado é. algumas vezes, adotada sem que o pesquisador
for-
mule explicitamente as suas regras de parada ou prosseguimento; não
é possível, então, o cômputo do verdadeiro valor de « e, o que
é mais
grave, o pesquisador pode, erroneamente, acreditar que ele seja aquele
inicialmente fixado.
20.1 O método segiiencial de testar uma hipótese
Em geral, fala-se de um teste segiiencial, para contrastar com os

testes correntes. baseados em amostras de tamanho constante, sempre
que as observações são coletadas em etapas, e segue-se alguma regra
definida que especifique qual das três ações se deva adotar:
1) rejeitar Ho;
2) aceitar Ho;
3) realizar uma etapa adicional.
À semelhança do que acontece nos testes para amostras de tama-

nho fixo, um teste sequencial será julgado pelas probabilidades de erro
a ele associadas. Porém, enquanto nos primeiros, «a = q, e B < Bos
se requer pelo menos No (&,, Bo) observações, no teste sequencial o nú-
mero de observações necessárias para uma decisão está sujeito a varia-
ções casuais, uma vez que é função das próprias observações. Se for
possível encontrar um teste segiencial com a, e Bor já anteriormente
definidos, para o qual o número médio de observações seja menor do
que N,, então tal teste seria, pelo menos do ponto de vista prá-
tico, preferível àqueles de tamanho fixo. O teste seqiiencial da razão
de probabilidades, devido a Wald **, prevê este teste para uma impor-
————
* B ó re álise Segiiencial para Testes de Hipóteses Relativas a
Proboisoii docas e probiemes de Medicina e de Saúde Pública, tese de
cátedra, Faculdade de Higiene e Saúde Pública, USP, 1959 .
** Wald, A., “Sequential Tests of Statistical Hypothesis”, 4nn. Math. Statist., 16:
117-186, 1945.
325
tante classe de problemas. Para vários destes problemas, Wald provou
tambem que o teste sequencial da razão de probabilidades conduz a
uma decisão com um número médio de observações menor do que qual-
quer outro teste sequencial. Este fato tem como pressuposição que o
processo sequencial terminará com probabilidade igual a 1, isto é, o
experimento terminará com a aceitação ou a rejeição de Ho.
Conquanto num teste segiiencial não seja possível predizer o nú-
mero necessário de observações a um experimento particular e, oca-
sionalmente. se possa deparar com uma sequência de observações ex-
cepcionalmente longa, o uso de rotina de processos sequenciais redu-
zirê. em média, o número de observações.
Naturalmente, nem todos os problemas são passíveis de tratamento
pelo metodo sequencial. Por exemplo, se for necessário um longo tempo
para obter resposta a um tratamento, pode ser mais expedito tratar
um número predeterminado de indivíduos ao mesmo tempo, em lugar
de esperar pela resposta de um antes de tratar do próximo paciente,
Mesmo quando a natureza do problema permita o uso da análise se-
quencial. em alguns casos, devido a considerações de ordem técnica,
poder-se-ia ser favorável a um processo de tamanho fixo. Assim, pode
ser que a economia possível no número de observações não seja sufi-
cientemente grande para impelir o pesquisador a abandonar métodos
com que esteja familiarizado, ou pode ainda acontecer que, do ponto
de vista administrativo, não seja possível ao experimentador continuar
nas observações até que uma decisão seja atingida. Este segundo incon-
veniente está presente, até certo ponto, em todo processo segiiencial,
e conduziu à consideração de uma forma modificada do referido pro-
cesso. o chamado processo segiiencial truncado.
Num plano segiiencial truncado, decide-se com antecedência qual
será o número máximo de observações, No, que se está disposto a fazer,
até que uma decisão final sobre H, seja atingida. Se o processo se-
quencial não conduzir a uma decisão final antes da ou na No-ésima
eiapa, propõe-se uma nova regra para aceitação ou rejeição de Ho.
O processo segiiencial truncado tem, em geral, probabilidade de erros
de primeira e segunda espécies diferentes do processo segiencial ori-
ginal, dependendo a mudança de quando o truncamento foi realizado
e da decisão tomada no momento do truncamento.
20.2 O teste segiencial da razão de probabilidades

Ao descrever O teste segiencial da razão de probabilidades para
pór em prova hipóteses referentes a proporções, será considerado o caso
mais simples, aquele em que a proporção estudada, isto é, a proporção
de curas alcançadas por certo método terapêutico no universo (imagi-
326
nário) de pacientes submetidos ao tratamento, pode assumir apenas
um de dois valores possíveis (p, e p,) e a hipótese nula estabelece que
p = Poe a alternativa que p = p,, Na maioria das aplicações, hipó-
teses assim tão simples não acontecem especificando valores
únicos de
p, mas conjuntos de possíveis valores, como, por exemplo,
H, : p < po
contra H, : p > Po- Todavia, como será visto mais tarde, as soluções
destes problemas mais complexos repousam na solução do problema
mais simples, ou seja, pôr em prova Hy : P = po contra a alternativa
H,:p =p
Num teste seqiiencial da razão de probabilidades, a escolha
entre
as três decisões possíveis, em cada etapa, é baseada na relação por
quociente de duas probabilidades: a probabilidade de que as
observa-
ções até então coletadas tivessem ocorrido se H, fosse verdadeira
e a
probabilidade de que as mesmas observações tivessem ocorrido se H;
fosse verdadeira. Seja, numa etapa qualquer, P, a probabilidade de
ue a amostra obtida tivesse ocorrido, se Ho fosse verdadeira, e P,
a probabilidade de que a mesma amostra tivesse ocorrido, se H, fosse
verdadeira. Se P; for menor do que P,, isto é, (P;/P5) < 1, a amos-
tra é mais provável sob a pressuposição da veracidade de Ho, isto é.
a verificação da desigualdade (P;/Po) < 1 deve ser encarada como
um indício para aceitar Ho. Naturalmente, a força deste indício cresce
à medida que P;/Pq decresce no intervalo 0—1. Pois bem, toda a
idéia de Wald reside em encontrar um subintervalo 0-B, onde a força
do indício seja tal, que a margem de erro resultante da aceitação de Ho,
quando H, é verdadeira, seja 8. Analogamente, a verificação de P, maior
do que Po, isto é, (P;/Po) > 1, é indício favorável à rejeição de Ho,
cuja força cresce à medida que P,/P, cresce no intervalo 1 — x, e a
idéia de Wald consiste em encontrar um subintervalo A — sc, onde a
força do indício seja tal que a margem de erro resultante da rejeição
de Ho, quando Hg é verdadeira, sejaa.
Resumindo, no teste segiencial da razão de probabilidades, dois
números Ae B(A > 1eB< 1) são escolhidos e, em cada etapa
do experimento, computa-se P,/Po:
se (P;/P)) > A, o experimento termina pela rejeição de Ho;
se(P;/P,) < B, o experimento termina pela aceitação de Ho;
se B< (P;/Po) < A, o experimento é continuado e colhe-se nova
observação.
Demonstra-se que, fazendo-se:
A=78
1-B Es
es B
327
obtém-se um teste sequencial cuja probabilidade de um erro de pri.
meira espécie é praticamente igual a a e a probabilidade de um erro
de segunda espécie é praticamente igual a p.
No presente exemplo, é fácil calcular Po e P, em cada etapa, uma
vez que a resposta de cada paciente ao tratamento é obtida indepen-
dentemente. Suponha-se que os primeiros m pacientes, depois de trata-
dos, apresentassem sm curas e (m — Sm) não-curas. Desde que, sob a
veracidade de Ho, a probabilidade de uma cura é po e a de uma não-
cura é (1 — po), tem-se, para a probabilidade da amostra observada,
quando H, é verdadeira:
m — Sm
DRp=p(-po)
Analogamente, desde que a probabilidade de uma cura, quando H, é
verdadeira, é p; e a de uma não-cura é (1 — p:), então a probabili-
dade da amostra observada vale:
Sm m — Sm
BD P =p (O —p)
Portanto, o teste sequencial da razão de probabilidades consiste em cal-

cular estas quantidades em cada etapa e parar, logo que uma das desi-
gualdades abaixo for satisfeita:
Sm m — Sm
Pp (1 —p) 1-sB
Q PP =—>—————— >
Sm m — Sm a
Po (1 — po)
Sm m —
Pp (1 —p) “a
9 Prp=————
> cb
Sm m — 1 -a
Po (1 — po) Sa
No primeiro caso, Ho será rejeitada e no segundo, aceita.

a" desigualdades citadas podem assumir, respectivamente, as for-
(5) Sm >2U +(m-s)V

(6) Sm <W+d(m-s)V
328
onde U, V e W são calculados a partir dea, B, po € P1, como segue:
(7) Ui = ass
(8) V = —dom
Pi
1 -a
Em termos das desigualdades (5) e (6), o teste pode, portanto,

ser realizado da seguinte maneira: na etapa m-ésima, compara-se sy,
comU + (m — sy) VeW + (m — sn) V; o experimento prosse-
gue enquanto sm estiver compreendido entre. estes dois valores e termina
em caso contrário. Se sy 2 U + (m-sn) V, rejeita-se Ho, e se
Sm <W+ (m-— sm) V. aceita-se Ho.
Graficamente, medindo-se (m — sm) ao longo do eixo das abs-
cissas e sy no das ordenadas, o teste pode ser conduzido por meio das
duas retas paralelas (figura 20.1)
(10) Rm =U+(m-s)V
AD An=W+(m-—s)V
Os pontos (m — sm; Sm) são projetados à medida que o experi-

mento vai sendo realizado. Se o ponto jaz no espaço compreendido
entre as duas retas, a experiência é continuada; quando ele se encon-
tra sobre a reta Rm (10) ou acima desta a experiência termina com a
rejeição de Ho; finalmente, quando o ponto se localiza sobre a reta Am
(11) ou abaixo dela, a experiência termina com a aceitação de H,,
329
Rm Am
Sm À Rejeição y
| Set // Continuação
| // da experiência
| / É
|
| /
| /
|
| x Aceitação de H,
|
A
v
m — sm
0
Figura 20.1 Regiões de decisão para o teste sequencial da razão de probabili-

:Ho:p=PpeH:p=p,
20.3 Teste de uma proporção
20.3.1 A hipótese alternativa é H, : p > P,
Este é o caso em que: Ho: p po
Para se descrever como o teste segiiencial da razão de probabili-
es pode ser conduzido neste caso, suponha-se que o investigador
não deseja afirmar erroneamente que o novo tratamento é eficiente, se
na realidade não o for, em mais do que a das vezes. Fixado o valor
de a, deve-se elaborar um teste para descobrir se p > pa. Isto será
tanto mais fáci] ou tanto mais difícil quanto maior ou menor, respec-
tivamente, for a diferença real entre p e Po. Se o resultado com o novo
tratamento é apenas um pouco melhor do que sem ele, isto é, se p é
pouco maior do que pu, será mais difícil descobrir que p > pa do que
seria se p fosse muito maior do que py. Por outro lado, existe a possi-
bilidade de crro decorrente de não se conseguir descobrir uma diferen-
ça realmente existente no sentido apontado. Naturalmente, a importân-
330
cia deste tipo de erro será tanto meno| r quanto menor for a magnitude
da diferença. Usualmente, é possível para o investigador formar tal
juízo a respeito de um limite e que, se a diferença
p — po for menor
do que e, ele possa Tesignar-se a deixar de
orque o benefício decorrente do novo descobrir que Pp >
tratamento é, neste caso, emos
siadamente pequeno para ter significação prática. Os valores compre-
endidos entre po e Po + E = p; constituem a chamada zona
de indi-
ferença.
Entretanto, se (p — po) > €, o pesquisador ra
jari
boas possibilidades de poder optar od HA = ea serem Ra
erro de segunda
erro já anteriormente apontado, o chamado
cuja probabilidade
um valor fixado, B. de ocorrência ele desejará que seja menor do que
Depois de considerar os vários aspectos do problema e
as conse-
qiiências de cada um dos possíveis erros, o pesquisador especifica as
três quantidades mencionadas, a saber:
1) um limite p; de tal magnitude que, se P > Po mas p < py,
ele não vê inconveniente na aceitação errônea de Ho;
2) a ináxima probabilidade permissível a de dizer que p > Po,
quando na realidade, p < po;
3) a máxima probabilidade permissível p de dizer que p < Po,
quando, na realidade, p > pi.
O processo segiiencial consiste em tomar observações, uma de cada

vez, e anotar se se trata de um sucesso ou um fracasso e, em cada
etapa, tomar uma das três decisões: rejeitar Ho, aceitar Ho ou conti-
nuar coletando observações. Suponha-se que se esteja na m-ésima ob-
servação e seja Sm O número de sucessos até esta etapa; então:
se Sw > U+(m- sn) V, rejeita-se Ho;
se sm <W+ (m- sy) V, aceita-se Ho;
seW+(m-—s)V<S<U+(m-— su) V, toma-se mais

uma observação e repete-se todo o processo acima, (U, Ve W já
definidos pelas expressões (7), (8) e (9), respectivamente). Isto pode
ser feito também graficamente, como anteriormente.
É possível mostrar que o número médio de observações necessá-
rias para atingir uma decisão é dado por
w-—-a(W-—U)
42) fo =
po (1— po) V
se Ho for verdadeira, e por:
U+B(W-—U)
19) | =—>———————
se H, for verdadeira.
Exemplo
Em conexão com a Campanha de Erradicação da Malária, os la-

boratórios das diversas zonas enviavam ao Laboratório Central, no fim
de cada mês, todas as lâminas positivas, e no mínimo 10% das nega-
tivas para serem submetidas a revisão, permitindo, assim, avaliar o grau
de fidedignidade atribuível aos resultados.
Tormava-se essencial, portanto, que os técnicos do Laboratório
Central fossem microscopistas de alto nível. O então Departamento de
Estatística Aplicada da Faculdade de Saúde Pública foi solicitado*
para desenvolver um método que permitisse testar se os referidos mi-
croscopistas poderiam ser considerados de um nível adotado pelo La-
boratório como padrão, não só quanto à habilidade em diagnosticar
corretamente, como também quanto ao julgamento da qualidade das pre-
parações.
Focalizando o primeiro aspecto, foi elaborado, separadamente, um
teste para a calibração dos ice no diagnóstico de espécie
de plasmódio, que é apresentado a seguii
Considerava o Laboratório Central que as conseqgiiências advindas
de uma falha no diagnóstico, quando se tratasse de uma lâmina sabida-
mente positiva, eram mais sérias do que quando a lâmina fosse negativa,
pois, na primeira eventualidade, um caso de malária seriá negligencia
do. Por esta razão, acreditava o referido órgão que não valeria a pena
todo o trabalho decorrente de testar seus técnicos para leitura de lâmi-
nas confirmadamente negativas. Decidiu-se, portanto, testá-los apenas
para a leitura de lâminas positivas. Evidentemente, os técnicos deveriam
ignorar tratar-se apenas de lâminas positivas, e para tanto foram mis-
turadas às positivas algumas negativas, cujos resultados não seriam le-
vados em conta.
A habilidade do técnico em diagnosticar corretamente uma lâmina
positiva é influenciada pela qualidade da lâmina, isto é, quanto me-
* Consulta feita pelo Dr. Victório Barbosa, assessor das Operações de Epldemio-
logia do Serviço de Profilaxia da Malária do Estado de ao Padio. 195
332
lhor a preparação da lâmina, mais fácil o diagnóstico. O Laboratóri
distinguia quatro categorias de lâminas, a saber: muito boas, boas, mé-
dias e ruins, €, conquanto esperasse manter baixa a proporção de ruins,
era difícil garantir que isto sempre acontecesse. Por esta razão, que-
riam estar seguros de que um técnico fosse capaz de conseguir pelo
menos 90% de diagnósticos corretos, mesmo quando 25% das lâminas
fossem de má categoria, sabendo também que havia 25% de cada uma
das demais categorias. Nestas condições, a proporção total de diagnós-
ticos corretos de lâminas positivas, p, torna-se uma média ponderada:
p= 0,25m + 0,257 + 0,257 + 0,25 74
onde 74, 72, 73 € 74 São, respectivamente, as próbabilidades que um

técnico tem de diagnosticar corretamente lâminas positivas muito boas,
boas, médias e ruins.
Para o Laboratório Central, um técnico era considerado “aceitá-
vel” se a proporção total de leituras corretas de lâminas positivas, p,
atingida por ele fosse maior do que 90%; na realidade, o que se al-
mejava é que essa proporção não fosse menor do que 95%. Por
outro lado, aqueles que não alcançavam uma proporção maior do que
90% eram considerados “inaceitáveis”. Portanto, o problema de cali-
brar um técnico para o Laboratório equivalia, em última análise, a
testar a hipótese de nulidade:
Ho :p p = 90%
Do ponto de vista prático, pareceu razoável ao Laboratório Central:
1) que a probabilidade de dizer que um microscopista é “acei-

tável”, quando na realidade ele não o é, fosse de 5%, isto é, a = 5%;
95%,
2) tendo em vista as considerações já feitas, escolher pr=
isto é, não ver inconveniente em que um microscopista, cujo nível
fosse superior a 90%, fosse considerado “inaceitável”, sempre que
ele não fosse superior a 957%;
3) que a probabilidade de dizer que um microscopista é “inacei-de

tável”, quando na realidade seu nível é superior a 95%, fosse
15%, isto é, B = 15%.
333
Uma vez especificadas as quantidades acima, estava-se em posição
de utilizar o metodo sequencial. De acordo com as fórmulas (7), (8)
e (9), foram calculadas as quantidades:
1- 0,15 0,95
J=1 = -— + To = 52,402
UV = ços E 090
1 — 0,90 0,95
V=lg >—>—— + lg —— = 12,820
E 7-095 E 0,90
0,15 0,95
W=lg ——— + 1 —=— =—34,139
E 1- 0,05 E 0,90
“e projetadas as retas:
Ro. = 52,402 + 12,820 (m — sm)
Am = —34,139 + 12,820 (m — sm)
usando-se as fórmulas (10) e (11). .

Calculou-se ainda, segundo as fórmulas (12) e (13), respectiva-
mente:
no = 78 e n= 128
Comparando-se estes resultados com o número de observações

necessárias, num teste clássico, para os mesmos valores de a, p e ps,
isto é, N = 207, pode-se ver que, em média, seria economizado um
número apreciável de leituras pelo emprego do método segiiencial.
O problema a seguir foi o de planejar o experimento de tal ma-
meira que cada diagnóstico pudesse ser considerado como feito inde-
pendentemente do anterior e com a mesma probabilidade, p, de estar
correto. Estes requisitos estariam satisfeitos se fosse imaginada uma
população de lâminas dividida em quatro estratos, cada um contendo
um número suficientemente grande de lâminas, e se, antes de cada lei-
tura, fosse sorteado o estrato a que pertenceria a lâmina a ser exami-
nada. Os resultados calculados, segundo as fórmulas (12) e (13), in-
dicam a ordem de grandeza do número “suficientemente grande” de
lâminas, acima referido, para que se tivesse boa garantia de estar pro-
tegido contra o risco de esgotamento do estoque de lâminas de um es-
trato, resultante dos azares do sorteio e de um prolongamento da expe-
riência além do número médio esperado.
Tendo-se em mente a pressuposição de homogeneidade para as
fâminas de um mesmo estrato, a sua preparação não constituía tarefa
334
das mais simples, indicando a conveniência de
um Planejamento que
permitisse uma redução do tamanho de cada estrato.
bela dos Números Casuais de Fisher.e Yates) e apresentadas, uma a

uma, ao microscopista para o diagnóstico.
É óbvio que este planejamento simplificado implicava a quebra
das condições impostas quanto à independência de cada diagnóstico em
relação ao anterior e à constância da probabilidade de correção de
cada um. Todavia, pode-se demonstrar que, para efeitos práticos, são
negligenciáveis as diferenças que ocorrem em relação a estas condições.
Depois de cada diagnóstico, um supervisor anotava se o resultado
estava certo ou errado e um ponto (m — sm; Sm) era projetado num
gráfico, onde m é o número total de leituras e sm é o número total de
leituras corretas. Se o ponto estivesse compreendido entre as duas linhas,
o técnico recebia a próxima lâmina. Se ficasse sobre ou acima da linha:
Rm = 52,402 + 12,820 (m — sm)
o experimento terminaria com a rejeição de Ho. Finalmente, se o ponto
estivesse sobre ou abaixo da linha:
Am = —34,139 + 12,820 (m — sm)

o experimento terminaria com a aceitação de Ho.
A trajetória descrita na figura 20.2 refere-se à classificação de um
microscopista, o qual, como se vê, foi considerado “aceitável” depois
de haver lido 52 lâminas.
203.2 A hipótese alternativa é H) : p < Po
Este é o caso em que Ho: P 2 Po

H,: p Ps
não se vê inconveniente em aceitar erroneamente Ho;
2) a probabilidade máxima permissível a de dizer que p < Po,
quando de fato p > Po;
335
=
S
3
o
&
901 Ê
Bo
E ul =
8 o
5”
e
$
o
o “mo
E 607 £
égs Ê
o
5ê 40
E
1
JF 30+
203-
10%
0 - r t r r
5 10 15 20 25 M-Sa
Figura 20.2 Regiões de decisão para o teste segiiencial da razão de probabilidade.
Ho : Pp < 90%
H, :p > 90%
3) a probabilidade máxima permissível 8 de dizer que p Z Po

quando na verdade p < p;, então:
sesm <U+(m-— sm) V, rejeita-se Ho;
sesm > W+ (m — sm) V, aceita-se Ho;
seU+(m-sm)V<sm<W+(m- sm) V, colhes
uma observação adicional e repete-se todo o processo
336
O número médio esperado de observações necessário para atingir
uma decisão é dado por:
wW —-a(W- U)
4
go — (1 — q) Vº
se Ho for verdadeira, e por:
-.V-BW-Uu)
nm =
= 0—q)v
se H; for verdadeira, onde U”, V” e Wº são obtidos a partir
de U, V e
W, respectivamente, substituindo-se nestas p por q = 1 — Pp.
sendo
q =1—-p, e gq =1— po
20.3.3 A hipótese alternativa é H, : p x Po
Este caso pode ser desdobrado em:

Ho :P= Po
H :p po
Para melhor se descrever como um teste sequencial pode ser con-

duzido neste caso, considera-se como exemplo o caso da escolha, na
vida da criança, do momento oportuno para a vacinação antidiftérica.
Sabe-se que certa p dos recé id ossui imunidad
passivamente recebida por via transplacentária; esta percentagem varia
segundo a região e, no mesmo lugar, conforme a época, principalmente
em função das condições epidemiológicas da infecção em causa; em
nosso meio, alcança níveis altos, de 80% ou mais. Na escolha do mo-
mento oportuno para a vacinação, entre outras considerações que po-
dem ser levadas em conta, acredita-se que influencie a que diz respeito
ao período de vida decorrido para que o percentual de imunes se re-
duza até um determinado nível, capaz de condicionar uma probabili-
dade elevada de que seja suscetível uma criança dessa idade.
Suponha-se então que um pesquisador está interessado
em conhe-
cer, para determinada população, se em certa idade o referido percen-
tual alcança um nível po considerado como indicador de conveniência
da vacinação, onde po = 50%. Para tanto, ele resolve estudar o per-
centual de imunes em uma amostra de crianças da referida idade, por
exemplo, três meses.
337
No caso de o pesquisador verificar que na idade de três meses
existem SOS de imunes, ele concluirá que esse é o momento oportuno
para proceder à vacinação. Entretanto, se esse percentual já for menor
do que SOS, O investigador sera levado a acreditar que o momento
oportuno esta situado em uma tase mais precoce da vida da criança:
maior do que 50%
se ele encontrar um percentual
ao contrino,
admira que ainda se pode deixar para uma fase mais tardia a realização
da pratica imunizante.
Seja p a proporção de imunes encontrada na amostra de crianças
consistirá em fixar
de três meses de idade. O procedimento sequencial
primeiramente as quantidades:
1) um limite p; de tal magnitude que. se p; < P < po, não haja

Hi;
inconveniente na aceitação de H, em lugar de
2) um limite p» de tal magnitude que, se po < p < Ps não haja
inconveniente na aceitação de Ho em lugar de Ho;
3) a máxima probabilidade permissível a; de dizer que p < Po,
quando, de fato, p = Po;
4) a máxima probabilidade permissível a» de dizer que p > Po,
quando na verdade, p = Po;
5) a máxima probabilidade permissível B; de dizer que p = po,
quando de fato, p < Pi;
6) a máxima probabilidade permissível B> de dizer que p = Po,
quando na realidade, p > po.
Depois de escolhidas estas seis quantidades, se elas satisfizerem as
log 1——
-— po lo A. Po
l-p é =P
Do > = O
P2
a log Pi
e Po
log LO Ps fog
de By
— 2
P2
dg log Pº
Pi
338
1 Pa 1 a
og — og ——
Bia, EI-A
——————————— > —— em
P:
log — log Pe
Po Ps:
então se estará em condições de elaborar um plano segiúencial que per

mita optar por H;, Ho ou H,.
Para tanto, calculam-se as quantidades:
1-— B
log
%
U,
1
log Pr
Po
1-—-
p
log g —=p+
Pa
log
Po
k
B1
o8 1l-—- q
log
log
log
log
m
I
'v19
log —
=Ba
Wim A
, tos DP
Po
em coletar observações, uma de
O processo seqiiencial consiste
bem como o de
cada vez, e, em etapas, contar o número de sucessos,
fracassos, até então verificados. Colhida justamente a m-ésima obser-
vação,
se sa Us+ (m — Sm) Va
rejeita-se Ho e aceita-se Ho;
SW + (m-— sm) Va
seW+(m-sm)Vi<Sm
aceita-se Ho; se nenhuma destas condições for satisfeita, toma-se uma

nova observação e repete-se todo o processo.
Índice de gráficos para consulta
Papel de curva normal ............iii ln 189-191

Curvas características operacionais (OC) para distribuição
normal .....lcci cn 228-229
Curvas características operacionais (OC) para distribuição t . 230-231
Limites de p para 95% de confiança ................. 319
Limites de p para 99% de confiança ................ 320
Limites de p para 95% de confiança ............... 321
Limites de p para 99% de confiança ................ 322
341
by: “NR?
LXXXVII
Índice de tabelas para consulta
1
Distribuição binomial para p = e diferentes valores de n ..
Distribuição binomial para n = 10 e diferentes valores de p .. 170

1
Distribuição hipergeométrica para p = — en = 10 17
2
Distribuição normal reduzida i92
Distribuição t de po 232
Distribuição X2 250
Valores críticos nível de 0,1% .. 260
Valores críticos de F ao nível de 0,5% 261
Valores críticos de F ao nível de 1% 262
Valores críticos de F ao nível de 2,5% ......ccciciticiio 263
Valores críticos de F ao nível de 5% .......c.ccccoccoo
eos 264
Valores críticos de F ao nível de 10% ..........cciccco. 265
Valores críticos para o Teste de Cochran ao nível de 5% .... 266
Valores críticos para o Teste de Cochran ao nível de 1% .... 267
343

Berquo - Bioestatistica 2ed

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Berquo - Bioestatistica 2ed

Enviado por

Direitos autorais:

Formatos disponíveis

Dados Internacionais de Catalogação na Publicação (CIP)

Câmara Brasileira do Livro, SP, Brasil)

erquó, Elza Salvatori.

l.Bioestatística 2. Estatística 1. Souza,

DEDALUS - Acervo - FMRP

Bacharel em Matemática pela Pontifícia Universidade Católica de Campinas;

JOSE MARIA PACHECO DE SOUZA

Cirurgião-dentista pela Faculdade de Farmácia e Odontologia da U.S.P.; pós.

SABINA LÉA DAVIDSON GOTLIEB

Cirurgiã-dentista pela Faculdade de Farmácia e Odontologia da U.S.P.; pós-gra-

1.1 O pensamento científico e a Estatística

2.1 Tipos de levantamento ...........cciicctico

3.1 Estudo da associação em tabelas de 2x2 ......... 47

Análise descritiva de variáveis quantitativas: medidas de po-

4.1 Medidas de posição ou de tendência central ou médias a

5. Noções elemenares sobre a teoria dos conjuntos ..

6: AMOSTADEM, us res darem qua pose pra E BEST MES É qm e

6.1 Etapas de um levantamento por amostragem ......

7. Delineamento de pesquisa ............clcccccceo

7.1 Considerações sobre a relação causa-efeito.........

8.1 A distribuição .......lc

9.1 A distribuição ecl

10.1 Considerações básicas

Teste de uma proporção populacional ...............

12. Teste de uma média populacional ..................

(3. Comparação entre as médias de duas populações ........

Teste de uma variância populacional ER Car a, sa

14.1 A distribuição a MET TO

Medium Mesa cados Da vusl

17. Testes de hipóteses em tabelas de 2 x Ze der xs ........ 281

18.1 Teste de correlação .........cccicicc 299

Estimação de parâmetros populacionais — Por ponto e por

19.1 Estimação por ponto; estimador não-viciado ...... 305

Análise segiencial ........l 323

Dedicamos este nosso trabalho a dois mestres que pela inestimável

Esta publicação pretende saldar uma dívida que fomos assumindo

1.1 O pensamento científico e a Estatística

O” pensamento científico se dá ao nível de uma linguagem teórica

Nestas condições, a proposição, isto é, a hipótese científica, pode ser

Em resumo, o processo Jógico da acumulação do conhecimento em

1.2 Evolução do papel da Estatística : E

* Nesman. 5. Indeterminism in Science

1.3 Os termos Estatística e Bioestatística

principalmente dis in E ees o mas

* Yule, G. U. e Kendall, M. G., op. cit. .

pie M. 5 locatário Brasileiro de Estatística, Universidade de so

** Greenwood, M., “Medical Statistics f », Biometrika, 31:

* Greenberg, B. G., “Basic Principles of Biostatistics”, in Preventive Medicine for

2.1 Tipos de levantamento

Levantamento de dados é a pperação de coleta do material básico

* Berquó, Elza S., “A Pesquisa Nacional Sobre Reprodução Humana”, Estudos de

Até agora, os exemplos citados diziam respeito a levantamentos de

2.2 Níveis de mensuração

Um problema básico que se coloca nos levantamentos é o nível

Nesta ordem de idéias, pode-se dizer que o nível mais elementar de

2.3 Apuração de dados

Executado o levantamento de dados, torna-se necessário passar à

Tabela 2.1 Número de óbitos, segundo o sexo, de residentes no município de São

Sexo Número de óbitos

Neste exemplo tem-se uma distribuição unidimensional, pois se

Uso de MAC Alguma vez Nunca Total

Total 2.162 76,2 676 238 2.838 100

Fonte: Berquó, E. et al., 4 Fecundidade em São Paulo — Características Demo-