Escolar Documentos
Profissional Documentos
Cultura Documentos
Desenvolvimento estatstico:
Manuel Ayres
Professor Emrito da Universidade Federal do Par
Manuel Ayres Jr. Ph.D.,
Universidade de Maryland
Desenvolvimento do software
Daniel Lima Ayres
Engenheiro de Computao
Universidade de Illinois
Alex de Assis Santos dos Santos
Prefcio da 5a Edio
O universo encontra-se em constante evoluo. A idia de que o mundo seria
imutvel, com toda a sua monotonia, foi alterada por outra, de uma dinmica
incessante. Da mesma maneira, a famlia Ayres e seu fiel companheiro Alex Santos
dos Santos tambm no param. Estamos agora diante da quinta verso de um manual
que j provou sua imensa utilidade junto comunidade cientfica brasileira. Tendo
como origem texto publicado h 20 anos atrs, as diferentes verses do BioEstat esto
sempre procurando manter-se alertas s necessidades desta comunidade, em uma rea
que tradicionalmente considerada difcil por alunos e profissionais da biologia e
biomedicina.
Esta natural (ser mesmo natural?) averso de bilogos e biomdicos
matemtica e estatstica est sendo vencida, e boa parte do progresso alcanado
vincula-se revoluo causada pela eletrnica. Com a internet houve uma
considervel democratizao do saber. Informaes que antes levavam meses para
transitar entre o Primeiro e o Terceiro Mundos atualmente podem ser obtidas de
maneira quase instantnea. Da mesma forma, os pacotes estatsticos tornaram
imensamente mais fcil a tarefa dos nefitos, como pode ser perfeitamente
testemunhado por todos os usurios das verses anteriores do BioEstat.
O que pode ser encontrado nas mesmas, bem como na verso atual? Bem, ali
(e aqui) esto matrias presentes tambm em qualquer tratado de bioestatstica, como
probabilidades; amostragem; construo de grficos e tabelas; frmulas mais
empregadas; estimao de parmetros clssicos; correlao e regresso; e anlise de
varincia. Mas tambm h tpicos mais especializados e de grande valor, como
anlise de sobrevivncia; bootstrap; ou meta-anlises diversas.
O que h de novo? O teste de Mantel; acrscimo aos testes de risco relativo;
ndices de diversidade; e diversos outros aplicativos que complementam de maneira
importante aspectos de processos considerados anteriormente.
Qual seria a mensagem final desta breve introduo? A de que devemos
agradecer que crebros como os dos autores deste livro estejam se dedicando difcil
tarefa de colocar disposio de seus colegas ou de qualquer outro interessado as
ferramentas bsicas necessrias utilizao de conceitos e interpretao de processos
cientficos. Em uma poca em que lado a lado com os fantsticos progressos da
cincia pululam por todo o mundo movimentos anticincia salutar encontrar obras
como esta: uma aragem revigorante que parte do ambiente quase sempre escaldante
da nossa Amaznia!
Francisco M. Salzano
Professor Emrito
Universidade Federal do Rio Grande do Sul
Prefcio da 1a e 2a Edies
O alvio da pobreza na Amaznia s pode ser feito se
diminuirmos a migrao da zona rural para as grandes
cidades. Para mantermos a populao humana na zona
rural, alm de darmos infra-estrutura escolar, sanitria
e mdica, precisamos manejar os recursos naturais de
forma sustentvel com base cientfica slida e assim
manter a estrutura dos ecossistemas atravs da
conservao dos processos ecolgicos e evolutivos.
Jos Mrcio Ayres
APRESENTAO
Prefcio da 3a Edio
A conservao da biodiversidade componente essencial para qualquer poltica de
desenvolvimento sustentvel. A falta de uma poltica consistente para este fim poder levar a
contnua eliminao de diferentes formas de vida, perda de recursos genticos e a modificao
de processos ecolgicos e evolutivos que so essenciais para a prpria sobrevivncia da nossa
prpria espcie. Como demonstrado por inmeros estudos, a perda da diversidade biolgica
ter custos enormes para toda a humanidade, tanto se utilizarmos os indicadores econmicos
tradicionais, como se considerarmos tambm os valores sociais, estticos e espirituais que
fazem parte da nossa cultura.
A Conservation International acredita que conservao da biodiversidade deve ser baseada em
cincia de boa qualidade. Por isso, estamos estabelecendo, atravs dos nossos Centros de
Conservao da Biodiversidade, parcerias diversas para o desenvolvimento de pesquisas e
capacitao em todas as reas do conhecimento relevantes para a ao de conservao.
Independente da rea, o conhecimento da estatstica fundamental.
Uma necessidade comum no Brasil, tanto para os cientistas mais novos como para os que j
possuem anos de experincia, a existncia de programas de computador que sejam efetivos
para as anlises estatsticas. nesse contexto, que temos a honra de apoiar a publicao da
terceira edio do livro BIOESTAT, escrito com toda a competncia por Manuel Ayres,
Manuel Ayres Jnior, Daniel Lima Ayres e Alex Santos dos Santos. H poucos cientistas no
Brasil que no conhecem as verses anteriores e certamente so milhares os estudantes de
graduao e ps-graduao no pas que iniciaram ou aprofundaram seus estudos de estatstica
utilizando este livro. O sucesso das duas verses anteriores foi to grande, que os autores
tiveram que trabalhar bastante para atender a uma demanda enorme para a atualizao e
publicao peridica de um livro to importante para todos.
Em nome de todos os que se dedicam ao estudo e a conservao da biodiversidade brasileira e
mundial, desejamos agradecer o extraordinrio esforo dos autores para produzir uma obra to
importante para todos, assim como reconhecer a importncia do trabalho realizado por nosso
grande amigo Jos Mrcio Ayres, cujo trabalho fenomenal para demonstrar de forma
inequvoca a indissociabilidade entre cincia e conservao.
Russel A. Mittermeier
Presidente
Conservation International
Gustavo A. B. da Fonseca
Vice-Presidente Executivo
Conservation International
Prefcio da 4a Edio
A Estatstica tem tido grande importncia ao longo de sua histria, que comea Antes
de Cristo, com os registros egpcios de presos de guerra, a partir da organizao de bancos
de dados que possibilitaram o estabelecimento de uma relao-verdade entre o passado, o
presente e o futuro.
O BioEstat trilha a gide que fortalece o conhecimento da Estatstica como cincia,
desvendando modelos matemticos e procedimentos de anlises e, assim, possibilitando maior
facilidade na interpretao dos fenmenos que se manifestam espontaneamente ou so
induzidos natureza dos seres vivos, sobretudo pelo prprio Homem.
A evoluo deste trabalho didtico deve-se, entre outros fatores, s fases evolutivas
dos conhecimentos estatsticos. A princpio houve a preocupao de introduzir aqueles
aplicativos de uso mais geral, e assim o BioEstat 1.0 se apresentou como ferramenta destinada
a oferecer aspectos voltados sobretudo para estudantes de graduao e ps-graduao das
reas mdicas e biolgicas. Na segunda etapa, o BioEstat 2.0 no perde seu foco inicial, mas
evolui com a incluso de novos modelos de anlises e ultrapassa as fronteiras brasileiras e
alcana o pblico tcnico-cientfico da lngua espanhola.
Na fase seguinte, com a adio de novos aplicativos, a sugesto da escolha dos testes
estatsticos e o clculo do tamanho das amostras, o BioEstat 3.0 solidifica-se como ferramenta
didtica quase obrigatria devida, sobretudo, facilidade de sua aplicao e interpretao dos
fenmenos biolgicos, sejam de ordem observacional, quer de natureza experimental. Tem
assim incio, e de forma definitiva, a empatia entre usurios e autores, cada um interpretando
as necessidades de desenvolvimento do outro.
Por fim, ocorre a interdependncia de diversas reas do conhecimento das cincias
biomdicas com a Biometria o BioEstat 4.0 chega com nova roupagem, com mais 15
aplicativos, sem se despir de sua trajetria histrica, mas atendendo as exigncias dos
usurios, vidos por ampliar seus conhecimentos e se coloca, com seus 184 testes, como
alternativa didtica para outras reas das cincias, com sugestes dos prprios usurios.
Esta edio do BioEstat 4.0 consolida a relao de dependncia com o seu pblico
fiel, onde as trocas se igualam vontade de evoluir, com ganhos de conhecimentos e
confiabilidade, diante da necessidade de aprender a ensinar ensinando. Desperta interesse
maior e permite a sua insero, como instrumento de consultas, por estudiosos de outras reas
de conhecimento tcnico-cientfico, que se auxiliam do BioEstat nas avaliaes de seus
estudos experimentais e observacionais.
Do mesmo modo como a Estatstica surgiu e ganhou reconhecimento, o projeto
BioEstat vem evoluindo a cada lanamento. Esta evoluo s se tornou possvel pelo forte
empenho e competncia de seus autores, os quais tem se dedicado ao longo de 20 anos no
aperfeioamento e na produo desta obra.
Ana Rita Pereira Alves
Diretora
AGRADECIMENTOS
NOTA: Manuel Ayres, Manuel Ayres Jnior, Daniel Lima Ayres e Alex Assis
Santos dos Santos tm a satisfao em lanar a mais nova edio do BioEstat (5.0),
com 210 aplicativos voltados sobretudo para as reas de cincias biolgicas e
mdicas, resultantes do aperfeioamento das verses anteriores e de sugestes
recebidas dos Usurios deste software, esclarecendo, todavia, que possveis
incorrees no programa e no texto so de inteira responsabilidade dos seus
autores.
J. C. Voltolini
Jeffrey Shaw
Jos Mrcio Corra Ayres *
Jos Maria Cardoso da Silva
Jos Maria de Azevedo Barbosa *
Jos Maria de Sousa
Jos Slvio Govone
Jussara Moretto Martinelli
Lucimar Macedo Rodrigues
Lcio Flvio Pinto
Luiz Claudio Marigo
Marcos Porpino de Oliveira
Maria Aparecida Pion Abuabara
Miguel Petrere Jr.
Oswaldo Frota-Pessoa
Paulo A. Otto
Peter Toledo
Renata Gomes G. Oliveira
Roberto B. Cavalcanti
Russel A. Mittermeier
Srgio de Mello Alves
Sdia M. Callegari Jacques
Suely Fraiha
Victoria J. Isaac
William D. Hamilton *
SUMRIO
CAPTULO 1
Usando o BioEstat
1.7 Imprimindo, 6
CAPTULO 2
Amostragem
2.1 Introduo, 9
CAPTULO 3
Anlise Multivariada.
17
3.1 Introduo, 17
CAPTULO 4
Anlise de Sobrevivncia .
39
4.1 Introduo, 39
4.2 Atuarial, 40
4.8 Mantel-Haenszel, 52
- xi -
SUMRIO
CAPTULO 6
Anlise de Varincia
39
6.1 Introduo, 39
CAPTULO 7
55
7.1 Introduo, 55
CAPTULO 8
Correlao
8.1 Introduo, 65
65
Spearman: rs, 74
CAPTULO 9
Distribuio de Probabilidades
9.1 Introduo, 75
9.8
Curva ROC, 83
9.9
Regra de Bayes, 85
9.10 Sensibilidade/Especificidade, 85
9.11 Distribuio F, 86
9.14 Distribuio Z, 88
- viii -
75
SUMRIO
CAPTULO 10
10.1
10.2
10.3
10.4
10.5
89
10.6 Teste de Kolmogorov-Smirnov, 94
10.7 Teste de Lilliefors, 95
10.8 Teste do Qui-Quadrado, 96
10.9 Teste do Qui-Quadrado, 97
10.10 Teste de Poisson, 98
11.9
11.10
11.11
11.12
11.13
11.14
11.15
Introduo,117
Teste t de Student, 117
ANOVA, 119
Teste de McNemar, 120
CAPTULO 13
Introduo, 99
Teste t de Student, 100
Teste Z, 102
Teste Binomial, 104
Teste Exato de Fisher, 104
Teste G, 105
Teste de Kolmogorov-Smirnov, 106
Teste de Mann-Whitney, 107
CAPTULO 12
12.1
12.2
12.3
12.4
Introduo, 89
Teste t de Student, 89
Teste Z, 91
Teste Binomial, 92
Teste G, 93
CAPTULO 11
11.1
11.2
11.3
11.4
11.5
11.6
11.7
11.8
Uma Amostra
Estatstica Descritiva
99
Teste da Mediana, 108
Teste do Qui-Quadrado, 109
Odds Ratio (OR), 110
Risco Relativo (RR), 112
Taxa de Incidncia, 113
Coeficiente de Variao, 114
Teste de Poisson, 115
117
125
CAPTULO 14
14.1
14.2
14.3
14.4
Estimao de Parmetros
Introduo, 129
Estimao da Mdia, 129
Estimao da Proporo, 130
Estimao da Diferena entre Duas
Mdias, 131
129
- ix -
SUMRIO
14.5 Estimao da Diferena entre Duas
Propores, 133
14.6 Densidade e Tamanho da
Populao, 134
14.7 Fentipos e Gentipos, 135
CAPTULO 15
Meta-Anlise
15.1
15.2
15.3
15.4
15.5
15.6
Introduo, 143
Teste de DerSimonian-Laird, 144
Dados Contnuos, 146
Teste de Mantel-Haenszel, 148
p-valor (pw combinado), 149
Qui-Quadrado, aderncia
para k amostras, 150
15.7 Qui-Quadrado independncia
para k tabelas 2 x 2, 151
CAPTULO 16
Regresso
165
16.5 Teste de Lilliefors, 167
16.6 Teste de Shapiro-Wilk, 168
18.1
18.2
18.3
18.4
15.8
15.9
143
Normalidade
CAPTULO 18
Introduo, 177
Regresso Linear Simples, 177
Regresso Linear Mltipla, 179
Ajustamento de Curvas, 180
177
18.5
18.6
18.7
18.8
-x-
SUMRIO
CAPTULO 19
19.1
19.2
19.3
19.4
19.5
Introduo, 191
Anlise de Varincia, 192
Correlao Linear, 192
Teste de McNemar, 193
Proporo: uma amostra, 194
CAPTULO 20
Transformao
191
19.6
19.7
19.8
19.9
19.10
201
CAPTULO 21
21.1
21.2
21.3
21.4
21.5
21.6
21.7
Frmulas Estatsticas
CAPTULO 23
23.1
23.2
23.3
23.4
205
Introduo, 205
Grfico de rea, 206
Box-Plot (Mediana e quartis), 207
Box-Plot (Mdia e desvios), 208
Caule e Folha (Stem and Leaf), 209
Grfico de Colunas, 211
Diagrama de Disperso, 213
CAPTULO 22
22.2
22.3
22.4
22.5
22.6
22.7
22.8
22.9
Grficos e Tabela
21.8
21.9
21.10
21.11
21.12
21.13
21.14
Histograma, 214
Grfico de Linha (Curva), 217
Grfico de Mximo e Mnimo, 218
Grfico Polar, 219
Grfico de Setor, 220
Manipulao de Grficos, 221
Tabelas de Freqncia, 223
227
22.10
22.11
22.12
22.13
22.14
22.15
22.16
22.17
Introduo, 265
Nmero de Amostras, 266
Uma Amostra: uma varivel, 266
Uma Amostra: duas variveis, 267
265
- xi -
SUMRIO
23.5 Uma Amostra: k variveis, 267
23.6 Duas Amostras Independentes: uma
varivel (Dados Categricos), 268
23.7 Duas Amostras Independentes: uma
varivel (Dados Ordenativos), 268
23.8 Duas Amostras Independentes,
k variveis (dados numricos), 269
CAPTULO 24
k variveis, 270
23.12 k Amostras Relacionadas, 271
23.13 Distribuio de Probabilidades, 271
23.14 Estimao de Parmetros, 272
24.2
24.3
24.4
24.5
24.6
24.7
24.8
273
Glossrio
303
Referncias Bibliogrficas
313
ndice
319
- xii -
CAPTULO 1
USANDO O BIOESTAT
VALOR DESEJADO
GRAFIA
INCORRETA
Um e meio.
1.5
1,5
2.75
2,75
5000.01
5000,01
-1-
CAPTULO 1 - INTRODUO
Podero ser observadas pequenas divergncias de resultados quando comparados a
outros pacotes desse gnero. Essas diferenas, porventura detectadas, podem estar
relacionadas ao emprego de distintos algoritmos.
Sugestes para melhoria do pacote e possveis erros encontrados durante o seu uso
sero bem recebidos pelos autores. Essas modificaes tambm podero ser inseridas
em futuras verses.
J. Mrcio C. Ayres
MPEG/CNPq
Wildlife Conservation Society NY
Belm, Par, Maio de 1998.
-2-
CAPTULO 1 INTRODUO
1.2 REQUERIMENTOS DE SISTEMA
O BioEstat requer o sistema operacional Microsoft Windows 95 ou posterior e um PC
486 ou superior com no mnimo 8 MB de RAM.
1.3 INSTALANDO O BIOESTAT
a) Coloque o CD-ROM do BioEstat no drive apropriado;
b) O programa de instalao deve inicializar aps alguns instantes. Caso isso no
ocorra, clique no boto Iniciar, em seguida escolha Executar e digite:
D:\SETUP.EXE, onde D a letra do drive apropriado;
c) Aps o programa de instalao inicializar, siga as instrues contidas na tela;
d) Quando a instalao estiver terminada, voc pode rodar o BioEstat clicando em
Iniciar, Programas, BioEstat 4.0 e, por fim, ao lado, em BioEstat 4.0.
1.4 EXPRESSO DE CASAS DECIMAIS
No BioEstat, para que seja mantida a compatibilidade com outros softwares e
acompanhando a norma aceita internacionalmente nas calculadoras eletrnicas, todos
os valores que possuam casas decimais devem ser grafados usando o ponto decimal.
A vrgula, portanto, no usada no BioEstat como indicador da separao entre a
parte inteira e a decimal, conforme os exemplos abaixo:
GRAFIA
CORRETA
VALOR DESEJADO
GRAFIA
INCORRETA
Um e meio.
1.5
1,5
2.75
2,75
5000.01
5000,01
Captulo 5 - Anlise de Sobrevivncia: foram introduzidos os testes de CoxMantel, Gehan (Wilcoxon generalizado) e Mantel-Haenszel;
-3-
CAPTULO 1 - INTRODUO
f)
j)
-4-
CAPTULO 1 INTRODUO
1.6 BIOESTAT VERSO 3.0: BELM, PAR, MAIO DE 2003
A verso 3.0 do BioEstat mantm e aprimora os recursos da verso anterior. Foram
acrescentados novos testes e alterados alguns captulos como sero vistos a seguir:
a)
f)
j)
-5-
CAPTULO 1 - INTRODUO
m) Captulo 18 - Regresso. O teste de Homogeneidade agora faz parte integrante
do captulo Meta-Anlise, com a denominao de Regresso (Bw) para k
amostras. Foi incorporada a sada grfica para Anlise de Resduos e Ajustamento
de Curvas;
n) Captulo 19 - Tamanho das Amostras. O teste do Qui-Quadrado agora estima o
tamanho das amostras, tanto para testes de aderncia quanto para os de
independncia;
o) Captulo 21 - Grficos e Tabela. Foi introduzido o grfico Polar. A Tabela de
Freqncia e o Histograma foram aprimorados para permitir maior flexibilidade
na configurao das classes e respectivos limites.
O total de aplicativos no BioEstat 3.0 atinge, agora, 169 programas.
1.7 BIOESTAT VERSO 4.0: BELM, PAR, DEZEMBRO DE 2005
A verso 4.0 do BioEstat caracteriza-se pela incluso do Captulo 24 o qual contm
16 novos aplicativos, acrescidos de outros distribudos em diferentes Captulos,
totalizando cerca de 189 mtodos computacionais aplicados s cincias biomdicas,
como so exemplos: Anlise de Conglomerados, Anlise Discriminante, Correlao
Cannica, Cox (Risco Proporcional), Ponto de Corte, Reamostragem (bootstrap),
Aumento do Tamanho da Amostra, Testes de Hiptese para Resumos Amostrais,
Correlao Intraclasse e Diagramas IC (95% e 99%), Pontual e Pirmide
Populacional.
-6-
CAPTULO 2
USANDO O BIOESTAT
2.1 INTRODUO
Para usar o BioEstat preciso entender alguns termos bsicos do programa e do
padro Microsoft Windows 98/2000/NT/XP:
Menu superior
Figura 2.1
Janela do
BioEstat.
Barra de
ferramentas
Grid geral
de entrada
de dados
Tela de
resultados
Barra de
status
Figura 2.2
Barra de ferramentas
Abrir
Novo grid
Imprimir
Copiar
Recortar
Salvar
Aumentar
largura da
coluna
Diminuir
Colar casas
decimais
Aumentar
casas
decimais
Localizar
Diminuir
largura da
coluna
-7-
Ajuda
Limpar tudo
Lista dos
testes
estatsticos
mais
comuns
-8-
-9-
Figura 2.4
Salvando os
dados de um
grid especfico.
Na parte superior do grid consta o seguinte: Novo, Deletar, Salvar e Imprimir, que podem
ser utilizados pelo usurio, conforme o caso.
2.4 ABRINDO ARQUIVOS
Quando for necessrio abrir um arquivo, siga as seguintes instrues:
a) Clique na opo Abrir (tecla Ctrl + A) no menu Arquivo ou pressione o boto
Abrir na barra de ferramentas;
b) Selecione o arquivo desejado e pressione o boto Abrir.
Para abrir um arquivo que foi recentemente utilizado, clique no menu Arquivo e
selecione aquele desejado na parte inferior do menu.
O BioEstat contm os dados dos vrios exemplos encontrados neste manual; para
acess-los, siga os seguintes passos:
a) Clique na opo Abrir (tecla Ctrl + A) no menu Arquivo ou pressione o boto
Abrir na barra de ferramentas;
b) D um duplo clique na pasta Exemplos, que se encontra na lista de arquivos;
c) Selecione um dos vrios exemplos disponveis e pressione o boto Abrir.
O programa tambm permite importar dados do formato CSV (delimitado por vrgula)
e, para isso, siga as seguintes condutas:
a) Clique na opo Importar do menu Arquivo;
b) Selecione o arquivo desejado e pressione o boto Abrir.
- 10 -
- 11 -
- 12 -
CAPTULO 2
AMOSTRAGEM
2.1 INTRODUO
Amostragens ou sondagens so procedimentos de seleo de subconjuntos de
populaes as amostras , destinados ao conhecimento de uma ou vrias
caractersticas dos universos investigados. Quando se estuda uma populao por
sondagens, necessrio selecionar suas amostras representativas, a fim de que os
resultados obtidos possam ser inferidos para o conjunto objeto da investigao.
As amostragens dividem-se em dois grupos:
a) Amostragens probabilsticas:
i amostras aleatrias simples;
ii amostras sistemticas;
iii amostras estratificadas;
iv amostras por conglomerados;
v amostras aleatrias: dados do grid;
vi aumento do tamanho da amostra;
vii reamostragem Bootstrap.
b) Amostras no-probabilsticas:
i intencional;
ii por convenincia;
iii por cotas.
No BioEstat sero abordadas as amostragens probabilsticas, nas quais cada indivduo
tem uma chance conhecida, diferente de zero, de ser includo na amostra e o mtodo de
seleo deve ser compatvel com a probabilidade de cada unidade.
Algumas etapas devem ser observadas na seleo amostral:
a) Definio da populao-alvo;
b) Alistamento de todos os indivduos desse universo: 1, 2, 3, , n;
c) Determinao do tamanho da amostra;
d) Escolha do modelo de amostragem;
e) Seleo das unidades da populao.
2.1.1 INSTRUES
a) Dirigir o mouse para o menu superior e clicar em Estatstica;
b) Apontar o mouse em Amostragem, quando surgir a figura abaixo, comum para
todos os modelos de seleo amostral do BioEstat:
Figura 2.1
Menu de
Amostragem.
-9-
CAPTULO 3 AMOSTRAGEM
3.2 AMOSTRAS ALEATRIAS SIMPLES
So aquelas cujos indivduos foram obtidos ao acaso da populao, tendo cada
amostra a mesma chance de ser escolhida dentre todas aquelas possveis do mesmo
tamanho. Os termos aleatrio, randmico, casual e ao acaso so sinnimos. As
amostras aleatrias simples podem ser obtidas por sorteio, em tabelas de nmeros
aleatrios e por computao.
3.2.1 EXEMPLO
Para determinar a estatura mdia de uma populao de 400 alunos da segunda srie do
primeiro grau, tomou-se amostra aleatria de 50 estudantes, precedida da listagem
numrica de todos os discentes desse universo.
3.2.2 INSTRUES
a) Apontar o mouse em Aleatria, para escolha de um dos modelos: Com ou Sem
reposio.
b) Clicar o mouse em Sem reposio, modelo escolhido neste exemplo; preencher as
caixas de texto com os tamanhos da populao e da respectiva amostra,
pressionando, a seguir, o boto Executar.
Figura 3.2
Amostragem
Aleatria
(sem
reposio).
- 14 -
CAPTULO 3 AMOSTRAGEM
Figura 3.3
Amostragem
sistemtica.
- 15 -
CAPTULO 3 AMOSTRAGEM
Figura 3.4
Amostragem
Estratificada.
3.5.1 EXEMPLO
Calcular o peso mdio de estudantes da quinta srie do ensino fundamental das
escolas pblicas de um municpio. O total de estabelecimentos de ensino de 50
escolas (conglomerados do 1o estgio), cada uma com 10 turmas da quinta srie
(conglomerados do 2o estgio), e cada turma apresentando 40 alunos matriculados
(unidades simples, 3o estgio). Foram selecionadas 5, 4 e 8 unidades dos estgios 1o,
2o e 3o, respectivamente, constituindo, ao final, amostra de 160 discentes (5 x 4 x 8).
3.5.2 INSTRUES
a) Clicar o mouse em Conglomerados;
b) Preencher a caixa de texto com o nmero de estgios e o grid especfico com a
denominao de cada um, o nmero de unidades contidas nos respectivos clusters
e, por fim, a quantidade de unidades determinadas para sorteio em cada
conglomerado. Pressionar, em seguida, o boto Executar.
Figura 3.5
Amostragem
por Conglomerados.
(parte dos resultados)
- 16 -
CAPTULO 3 AMOSTRAGEM
3.6 AMOSTRA ALEATRIA DOS ESCORES DO GRID
Pode-se retirar amostras aleatrias de escores inseridos no grid geral do BioEstat.
3.6.1 EXEMPLO
Esto inseridos no grid 140 escores (Figura 3.6), referentes estatura de estudantes do
sexo masculino de idades compreendidas entre 16 e 18 anos, de uma escola de ensino
fundamental. Tendo em vista que os dados compreendem todos os alunos
matriculados nessa instituio, com as caractersticas referidas, esses escores
constituem, portanto, uma populao, com estatura mdia igual a 169.45 cm. Retirouse amostra aleatria desse conjunto para calcular a mdia amostral da varivel peso
no sentido de verificar se ela representativa do universo em questo.
Figura 3.6
Dados
parciais do
Exemplo
3.6.1.
3.6.2 INSTRUES
a) Introduzir os dados no grid padro do BioEstat, conforme a Figura 3.6;
b) Pressionar o mouse em Aleatria dos escores do grid;
c) Selecionar a coluna respectiva, a qual, neste exemplo, a de nmero 1;
d) Pressionar em Executar;
e) Informar na caixa de texto o tamanho da amostra desejada e que, no caso, foi
igual a 10, conforme demonstra a Figura 3.7;
Figura 3.7
Tamanho da
Amostra
- 17 -
CAPTULO 3 AMOSTRAGEM
f)
Pressionar em OK, para resultados (Figura 3.8). Aparece, ainda, uma tela
indicando a coluna do grid onde ser inserida a amostra obtida.
Figura 3.8
A Coluna
Amostra
indica os
escores
selecionados
de maneira
aleatria
- 18 -
CAPTULO 3
ANLISE MULTIVARIADA
3.1 INTRODUO
A maioria dos testes estatsticos concernente ao exame de uma nica varivel, a qual
considerada importante na descrio ou no estudo analtico dos dados amostrais. Em
algumas situaes, porm, torna-se importante considerar a anlise de diversas
variveis aleatrias de modo simultneo, para atingir outros aspectos no abrangidos
por um exame mais simplificado. Embora se deva a Francis Galton (1886) as
primeiras anlises multivariadas, somente com o desenvolvimento dos computadores
foi possvel construir pacotes estatsticos com diferentes modelos de anlises
multivariadas, possibilitando seu uso em escala muito mais ampla. Do ponto de vista
matemtico, alm dos conhecimentos bsicos de lgebra, h necessidade de alguma
noo sobre matrizes algbricas, para a efetivao da anlise multivariada.
A atual verso do BioEstat (5.0) dispe dos seguintes testes:
a) Anlise de Conglomerados;
b) Anlise Discriminante;
c) Componentes Principais;
d) Correlao Cannica;
e) Distncia Multivariada (Euclidiana);
f) Distncia Multivariada (Penrose e Mahalanobis);
g) Teste de Bartlett (duas amostras);
h) Teste de Hotelling (uma amostra);
i) Teste de Mantel.
3.1.1 INSTRUES
a) Introduzir os dados no grid padro ou especfico, conforme o teste;
b) Dirigir o mouse para o menu superior e clicar em Estatstica;
c) Apontar o mouse em Anlise Multivariada, conforme demonstra a Figura 3.1:
Figura 3.1
Menu de
anlise
multivariada.
- 17 -
4.2.2 INSTRUES
a) Pressionar o mouse em Componente Principal;
b) Selecionar as colunas referentes s variveis do grid geral;
c) Clicar em Executar o Teste, para obter os resultados (ver Figura 4.3).
Figura 4.3
Resultados do
Exemplo 4.2.1
Os resultados
demonstram
que os ndices 1 e 2
representam
83% da
variao total
(73% + 10%)
dos indivduos
testados,
constituindo
os Componentes Principais nesse
Exemplo.
- 20 -
- 21 -
- 22 -
4.4.2 INSTRUES
a) Pressionar o mouse em Distncia Multivariada (Penrose/Mahalanobis);
b) Selecionar as colunas referentes s variveis do grid geral;
c) Clicar em Executar o Teste, informando, a seguir, o nmero de amostras
introduzidas:
d) Clicar em OK, para os resultados:
Figura 4.9
Nmero de
amostras
(Exemplo
4.4.1).
- 23 -
Figura 4.10
Resultado do
Exemplo 4.4.1.
Observa-se,
apesar das
diferenas dos
valores em cada
um dos testes,
que houve
concordncia
nos resultados:
a maior distncia foi observada entre as
amostras A e E,
e a menor,
entre as
amostras A e B.
- 24 -
4.5.2 INSTRUES
a) Pressionar o mouse em Teste de Hotelling;
b) Selecionar as colunas referentes s variveis do grid geral;
c) Clicar em Executar o Teste, para resultados:
Figura 4.13
Resultados
do Exemplo
4.5.1.
No h
diferena
estatisticamente significante entre
as duas
amostras,
p = 0.5210.
- 25 -
Figura 4.14
Nmero de
amostras
(Exemplo
4.6.1).
- 26 -
CAPTULO 4
ANLISE DE SOBREVIVNCIA
4.1 INTRODUO
A anlise de sobrevivncia vem sendo enfatizada nos estudos biomtricos e destina-se
a calcular a probabilidade de ocorrncia de eventos ao longo de certo perodo, o qual
dividido em vrios intervalos de tempo. Os eventos podem ser de diversas naturezas,
tais como: perodos de remisso de uma doena, tempo de sobrevivncia de indivduos
acometidos por neoplasia, estudos epidemiolgicos, durao de matrimnios, efeitos de
drogas e outros.
Um fato a destacar nas anlises de sobrevivncia o de que nem todos os elementos
selecionados para o estudo atendem ao seguimento ao longo do perodo previamente
estabelecido, podendo, a qualquer momento, abandon-lo por motivos diversos. Esses
indivduos recebem a designao geral de censurados, os quais, de acordo com o teste
escolhido, devem ou no ser registrados em cada tempo t no qual o perodo total foi
dividido.
O BioEstat oferece os seguintes modelos de Anlise de Sobrevivncia:
a) Atuarial;
b) Cox-Mantel;
c) Cox: Modelo de Risco Proporcional;
d) Kaplan-Meier;
e) Log-Rank Test;
f) Gehan (Wilcoxon generalizado);
g) Mantel-Haenszel;
h) Pirmide Populacional.
4.1.1 INSTRUES
a) Introduzir os dados no grid padro do BioEstat;
b) Dirigir o mouse para o menu superior e clicar em Estatstica;
c) Apontar o mouse em Anlise de Sobrevivncia, conforme demonstra a Figura 4.1
Figura 4.1
Menu
Anlise de
Sobrevivncia.
- 39 -
5.2.2 INSTRUES
a) Pressionar o mouse em Atuarial;
b) Selecionar as colunas referentes s variveis do grid geral;
c) Clicar em Executar o Teste, informando caixa de texto ao lado da Fig. 5.2 a
unidade de tempo representada pelos nmeros 1 a 5 (ano, neste exemplo);
d) Pressionar OK, para resultados.
Figura 5.3
Resultados
do Exemplo
521
- 28 -
Figura 5.4
Grfico do
Exemplo
5.2.1.
5.3 KAPLAN-MEIER
Este procedimento semelhante ao atuarial, porm o tempo aprazado menor, de dias
ou meses, e os intervalos no so, de modo obrigatrio, igualmente espaados,
obtendo-se, ainda, em cada tempo t, o intervalo de confiana (IC 95%) respectivo.
5.3.1 EXEMPLO
180 indivduos com patologia de alto risco de mortalidade foram submetidos a
tratamento com a droga A em altas doses. O perodo de observao foi de 6 meses,
com intervalos mensais de registro das observaes. Os dados foram introduzidos no
grid geral: as colunas 1 e 3 correspondem ao tempo t, aos indivduos vivos e aos
bitos, respectivamente, observando-se que os intervalos mensais no so constantes
como ocorre na anlise Atuarial (ver Figura 5.5).
Figura 5.5
Dados do
Exemplo
5.3.1.
- 29 -
- 30 -
H0: o tempo de recidiva ao alcoolismo o mesmo nos dois grupos de pessoas: p1 = p2;
H1: o tempo de recidiva ao alcoolismo dependente do grupo etrio dos indivduos:
p1 p2;
Nvel de deciso: alfa = 0.05.
5.4.2 EXEMPLO 2 (sem censurados, mtodo 2)
Dados hipotticos foram coletados relativos aos tratamentos A e B. No grupo A foram
acompanhados 14 indivduos enquanto no grupo B, 33. Os dados esto dispostos na
Figura 5.9.
Figura 5.9
Viso parcial
dos dados
do Exemplo
5.4.2
- 31 -
5.4.4 INSTRUES
a) Pressionar o mouse em Log-Rank test, e escolha uma das duas opes: Sem
Censurados (Figuras 5.8 e 5.9) ou Com Censurados (Figura 5.10);
b) Selecionar, no grid geral, as colunas referentes s variveis conforme o caso;
c) Clicar em Executar o Teste, para obter os resultados.
Figura 5.11
Resultados
do Exemplo
5.4.1.
- 32 -
Figura 5.13
Resultados
do Exemplo
5.4.3.
- 33 -
- 34 -
- 35 -
- 36 -
152
120
HPV -
108
110
143
111
HPV -
45
76
- 37 -
- 38 -
CAPTULO 5
ANLISE DE VARINCIA
5.1 INTRODUO
A Anlise de Varincia, introduzida por R. A. Fisher, compara a magnitude das
variaes de mais de duas amostras, decompondo a varincia total em duas partes:
a) entre as amostras, constituindo o chamado quadrado mdio dos tratamentos;
b) dentre cada tratamento, compondo o denominado quadrado mdio do erro
experimental.
c) O teste da anlise da varincia a razo entre esses quadrados mdios. Esta
anlise compreende dois grupos:
a) Testes paramtricos:
i ANOVA: um critrio;
ii ANOVA: dois critrios;
iii ANOVA: Fatorial (a x b) com replicao;
iv ANOVA: Fatorial (a x b x c) sem replicao.
b) Testes no-paramtricos:
i Teste de Friedman;
ii Teste de Kruskal-Wallis;
iii Teste Q de Cochran.
5.1.1 INSTRUES
a) Introduzir os dados no grid geral do BioEstat;
b) Dirigir o mouse para o menu superior e clicar em Estatstica;
c) Apontar o mouse em Anlise de Varincia, conforme demonstra a Figura 5.1:
Figura 5.1
Menu de
Anlise de
Varincia.
- 59 -
H0: o fumo no influencia a funo pulmonar medida pelo fluxo mdio expiratrio:
1 = 2 = 3;
H1: o fumo influencia a funo pulmonar medida pelo fluxo mdio expiratrio,
havendo diferena, pelo menos, entre duas mdias: 1 2 etc.;
Nvel de deciso: alfa = 0.01.
- 40 -
Figura 6.3
Dados do
Exemplo
6.2.2
6.2.3 INSTRUES
a) Pressionar o mouse em ANOVA: um critrio;
b) Selecionar as colunas referentes aos tratamentos do grid geral;
c) Clicar em Executar o Teste, surgindo a Figura 6.4 naqueles casos em que h
diferena estatisticamente significativa do F calculado (ver valor de p),
selecionando-se um dos testes sugeridos para a comparao das mdias
amostrais, os quais foram o de Tukey e o de Dunnett. Exemplos 6.2.1 e 6.2.2,
respectivamente.
Figura 6.4
Tela de
seleo do
teste para
ANOVA: um
critrio,
Exemplo
6.2.1
- 41 -
Figura 6.7
Resultados
do Exemplo
6.2.2
(Dunnett).
- 42 -
Figura 6.8
Grfico do
Exemplo
6.2.1.
- 43 -
- 44 -
Figura 6.12
Resultados
do Exemplo
6.3.1.
- 45 -
Figura 6.14
Resultados
do Exemplo
6.4.1.
O F-teste dos tratamentos foi elevado, com valor de p < 0.0001, indicando que o
efeito das drogas sobre o peso muito significativo, rejeitando-se sob esse aspecto a
hiptese de nulidade e aceitando-se a hiptese alternativa. No que diz respeito
varivel sexo e interao entre drogas e sexo conclui-se, pelos resultados dos
respectivos valores de F, que as diferenas no so estatisticamente significativas,
aceitando-se, assim, a hiptese de nulidade (ver Figura 6.14).
- 46 -
- 47 -
Observa-se pelos resultados contidos na Figura 6.16 que a interao dos Fatores a e
b, variedades vs. temperaturas, respectivamente, significativa, com p-valor da
ordem de 0.0146.
6.6 TESTE DE FRIEDMAN
A Anlise de Varincia de Friedman um teste no-paramtrico para dados
mensurados a nvel ordinal, abrangendo trs ou mais amostras e equivalendo
ANOVA com dois critrios. Este procedimento recebe, tambm, a designao de
Dupla Anlise de Varincia por Postos. Os dados devem ter dupla disposio: as
linhas representam os indivduos e as colunas, as condies experimentais ou
tratamentos. As amostras (tratamentos) devem ter o mesmo tamanho, a fim de
permitir a comparao entre todos os indivduos submetidos ao teste.
6.6.1 EXEMPLO
Em um experimento, cinco coelhos foram submetidos a quatro estmulos de
intensidade crescente: A < B < C < D. As respostas de cada animal variaram em uma
escala ordinal de 0 a 100 e os escores foram introduzidos no grid geral do programa.
Figura 6.17
Dados do
Exemplo
6.6.1.
- 48 -
- 49 -
6.7.2 INSTRUES
a) Pressionar o mouse em Kruskal-Wallis;
b) Selecionar as colunas referentes aos tratamentos do grid geral;
c) Clicar em Executar o Teste, para resultados:
- 50 -
Figura 6.21
Resultados
do Exemplo
6.7.1.
- 51 -
- 52 -
Figura 6.24
Resultados
do Exemplo
6.8.1.
- 53 -
- 54 -
CAPTULO 6
BOOTSTRAP
6.1 INTRODUO
A tcnica empregada para este procedimento consiste em retirar de uma pequena
amostra numerosas outras com reposio, por exemplo 500, 1000, 10000 ou mais.
Cada uma delas tem a probabilidade de 1/n de ser obtida. Chama-se, tambm, de
tcnica de simulao ou de reamostragem, cuja denominao na lngua inglesa
bootstrap, e a traduo tem sido Tira de Bota. Esta designao foi atribuda a Bradle
Efron, como tambm a afirmao de que a distribuio relativa de repetidas amostras
estatsticas uma estimao da distribuio de amostragem, conforme publicao de
seu artigo no The Annals of Statistics, em 1979.
Para alguns autores, requerido, para este procedimento, que as reamostragens nunca
sejam inferiores a 500, constituindo o bootstrap um mtodo computacional intensivo,
de anlise estatstica por simulao para estimativas de intervalos de confiana, erro
padro e testes de significncia, aplicveis a modelos paramtricos e no
paramtricos.
Os aplicativos tipo Bootstrap Tira de Bota - apresentados no BioEstat so:
a) Dados Qualitativos: Dicotmicos;
b) Dados Quantitativos: Contnuos;
c) Intervalo de Confiana da Correlao Linear;
d) Intervalo de Confiana da Mdia;
e) Intervalo de Confiana da Proporo;
f) Teste de hiptese: Teste t Duas Amostras Independentes;
g) Teste de hiptese: ANOVA (um critrio);
h) Teste de hiptese: Correlao Linear.
6.1.1 INSTRUES
a) Dirigir o mouse para o menu superior e clicar em Estatstica;
b) Apontar o mouse em Bootstrap, quando surgir a figura abaixo:
Figura 6.1
Menu de
Bootstrap.
- 75 -
CAPTULO 7 BOOTSTRAP
qualquer um dos valores, 5 por exemplo, que corresponder a SIM e os demais (1, 2,
3, 4 e 6), a NO.
7.2.1 EXEMPLO
O lanamento de moeda 11 vezes resultou em 6 caras, representadas por 1, e 5
coroas, equivalentes a 0. Os dados esto contidos no grid geral (Figura 7.4).
Figura 7.2
Dados do
Exemplo
7.2.1.
7.2.2 INSTRUES
a) Pressionar o mouse em Dados Dicotmicos;
b) Selecionar a coluna Moeda, do Exemplo 7.2.1;
c) Clicar em Executar o Teste, preencha as caixas de texto, com os seguintes dados:
i tamanho da amostra inicial;
ii tamanho de cada reamostra;
iii valor do evento de interesse, 0 (coroa) no presente caso;
iv nmero de simulaes, 10000 no presente exemplo;
d) Pressionar o mouse em Executar, para resultados.
Figura 7.3
Resultados
do Exemplo
7.2.1.
- 56 -
CAPTULO 7 BOOTSTRAP
Figura 7.4
Dados
parciais do
Exemplo
7.3.1.
7.3.2 INSTRUES
a) Pressionar o mouse em Intervalo de Confiana da Correlao Linear;
b) Selecionar as colunas Peso (Y) e Comprimento (X);
c) Clicar em Executar o Teste. Sero exibidas caixas de texto, as quais devem ser
preenchidas com o nmero de simulaes - 1000, no caso - e o Intervalo de
Confiana desejado (95%, neste exemplo). Pressione, a seguir, em Executar, para
resultados.
Figura 7.5
Resultados
do Exemplo
7.3.1
O IC (95%), aps 1000 simulaes, est compreendido entre 0.14 a 0.72, tambm
mostrado graficamente na figura inferior em linha de cor cinza, assinalando-se, ainda,
o trao vertical escuro correspondente ao valor de r da simulao, igual a 0.58,
includo, como seria de esperar, no respectivo intervalo, prximo do valor de r da
amostra inicialmente coletada (0.45).
7.4 INTERVALO DE CONFIANA DA MDIA
De dados amostrais randmicos podem-se obter a mdia das reamostragens e seu
respectivo intervalo de confiana baseado em percentis.
- 57 -
CAPTULO 7 BOOTSTRAP
7.4.1 EXEMPLO
De amostra formada por 10 insetos, mediu-se o peso de cada indivduo em gramas.
Os resultados foram estes:
Figura 7.6
Dados do
Exemplo
7.4.1
7.4.2 INSTRUES
a) Pressionar o mouse em Intervalo de Confiana da Mdia;
b) Selecionar a coluna do grid geral (Exemplo 7.4.1) correspondente aos valores
amostrais e clicar em Executar o Teste;
c) Preencher as caixas de texto com as informaes sobre o nmero de simulaes e
o Intervalo de Confiana desejados;
d) Pressionar em Executar, para resultados.
Figura 7.7
Resultados
do Exemplo
7.4.1.
Foram efetuadas 10000 simulaes, ou seja, a retirada de dez mil amostras da amostra
inicial, com reposio, obtendo-se a Mdia e o Intervalo de Confiana de 95%
seguintes:
Mdia = 3.050:
IC (95%): 2.640 a 3.407 (em termos de percentis)
Para efeito de comparao, quando se efetua a estimao de parmetros somente com
base na mdia e no desvio padro da amostra original, obtm-se:
Mdia = 3.05
IC (95%): 2.622 a 3.478 (em termos de desvio padro)
- 58 -
CAPTULO 7 BOOTSTRAP
Obs.: pode-se repetir n vezes o mesmo procedimento, com ou sem alteraes do
nmero de Simulaes e do Intervalo de Confiana, clicando-se em Executar, para
resultados.
7.5 INTERVALO DE CONFIANA DA PROPORO
O procedimento semelhante ao utilizado para mdia, como ser visto em seguida,
cujos Intervalos de Confiana esto baseados nos percentis.
7.5.1 EXEMPLO
Em sondagem eleitoral, efetuada com dois meses de antecedncia do pleito, obteve-se
amostra de tamanho 200 e a seguinte proporo para o candidato AZ: 0.36 (36%),
correspondendo a 72 eventos favorveis em 200 eleitores. Efetuar 15000 simulaes,
para calcular a proporo com o respectivo Intervalo de Confiana de 99%.
7.5.2 INSTRUES
a) Pressionar o mouse em Intervalo de Confiana da Proporo;
b) Preencher as caixas de texto com as informaes sobre o nmero de simulaes,
o Intervalo de Confiana desejado e os valores originais do tamanho da amostra e
da respectiva proporo;
c) Pressionar em Executar, para resultados.
Figura 7.8
Resultados
do Exemplo
7.5.1.
Foram efetuadas 15000 simulaes, ou seja, a retirada de quinze mil amostras com
reposio da amostra original, obtendo-se os seguintes valores:
Proporo = 0.363
IC (99%): 0.275 a 0.445 (em termos de percentis)
- 59 -
CAPTULO 7 BOOTSTRAP
Para efeito de comparao, quando se efetua a estimao de parmetros somente com
base na amostra inicial e no nmero de eventos favorveis, obtm-se:
Proporo amostral = 0.36
IC (99%): 0.272 a 0.448 (em termos de desvio padro)
Obs.: pode-se repetir n vezes o mesmo procedimento, com ou sem alteraes do Nmero
de Simulaes e do Intervalo de Confiana, clicando-se em Executar, para resultados.
7.6 TESTE DE HIPTESE: Teste t Duas Amostras Independentes
Realiza-se a reamostragem de duas amostras independentes teste t , as quais podem
ser do mesmo tamanho ou desiguais.
7.6.1 EXEMPLO
Um investigador admite que a estatura dos homens de duas populaes de pases da
Europa ocidental so diferentes. Foram mensurados 36 indivduos do pas A e 33 do B.
Os dados esto inseridos no grid geral (Figura 7.9).
Figura 7.9
Dados
parciais do
Exemplo
7.6.1
- 60 -
CAPTULO 7 BOOTSTRAP
Figura 7.10
Resultado
do Exemplo
7.6.1
A Mdia geral prior e o Desvio prior so estatsticas obtidas das amostras, sem
simulao. O p-valor da simulao mostrou resultado altamente significativo
(0.0030), rejeitando-se, portanto, a hiptese de nulidade, podendo-se admitir que a
estatura mdia dos homens desses pases diferente.
7.7 TESTE DE HIPTESE: ANOVA (um critrio)
Para obter a reamostragem de dados para fins de anlise de varincia, realiza-se o
seguinte procedimento: retirar trs ou mais amostras, dos mesmos tamanhos ou
desiguais, cujos critrios de comparao so os tratamentos. Procede-se, ento, a
simulao conforme indicado a seguir.
7.7.1 EXEMPLO
Foram coletadas sementes das espcies A, B, C e D, cujo peso em gramas de cada
unidade e respectivas espcies so mostrados na tabela seguinte.
Figura 7.11
Dados do
Exemplo
7.7.1.
- 61 -
CAPTULO 7 BOOTSTRAP
H0: os pesos das sementes obtidas das espcies em questo no apresentam diferenas
significativas: 1 = 2 = 3 = 4;
H1: pelo menos, os pesos das sementes de duas das espcies obtidas apresentam
diferenas significativas: i j;
Nvel de deciso: alfa = 0.01.
7.7.2 INSTRUES
a) Pressionar o mouse em Teste de hiptese: ANOVA (um critrio);
b) Selecionar as colunas referentes aos tratamentos (Espcies A, B, C e D) do
Exemplo 7.7.1;
c) Clicar em Executar o Teste e informar o Nmero de Tratamentos includos no
teste (4 tratamentos). Preencha, em seguida, o Nmero de Simulaes desejadas,
10000 neste exemplo, e pressione em Executar, para resultados.
Figura 7.12
Resultados
do Exemplo
7.7.1.
O p-valor da simulao mostrou resultado altamente significativo (0.0001), rejeitandose, portanto, a hiptese de nulidade, podendo-se admitir que, pelo menos, o peso
mdio das sementes de duas espcies das amostras coletadas so diferentes.
- 62 -
CAPTULO 7 BOOTSTRAP
Figura 7.13
Dados do
Exemplo
7.8.1.
7.8.2 INSTRUES
a) Pressionar o mouse em Teste de hiptese: Correlao Linear;
b) Selecionar as colunas do grid geral correspondentes aos valores amostrais X e Y
(Exemplo 7.8.1) e clicar em Executar o Teste;
c) Preencher as caixas de texto com o nmero de simulaes desejado, 1000 no
presente exemplo;
d) Clicar em Executar, para resultados.
Figura 7.14
Resultados
do Exemplo
7.8.1.
- 63 -
CAPTULO 7 BOOTSTRAP
- 64 -
CAPTULO 7
CORRELAO
7.1 INTRODUO
A Anlise de Correlao proporciona um meio de se verificar o grau de associao
entre duas ou mais variveis. Os testes mais utilizados para essa anlise so:
a) Testes paramtricos:
i Correlao linear de Pearson;
ii Matriz de Correlao;
iii Correlao parcial;
iv Correlao linear quando o parmetro diferente de zero (r < 0 ou r > 0);
b) Testes no-paramtricos:
i Contingncia C;
ii Concordncia de Kendall;
iii Correlao de Kendall;
iv Coeficiente Phi;
v Correlao de Spearman.
7.1.1 INSTRUES
a) Introduzir os dados no grid geral do BioEstat;
b) Dirigir o mouse para o menu superior e clicar em Estatstica;
c) Apontar o mouse em Correlao, conforme demonstra a Figura 7.1:
Figura 7.1
Menu de
Correlao.
- 85 -
CAPTULO 8 CORRELAO
H0: no h associao entre peso e estatura de adolescentes: r = 0;
H1: h correlao entre as duas variveis: r 0;
Nvel de deciso: alfa = 0.05.
Figura 8.2
Dados do
Exemplo
8.2.1.
8.2.2 INSTRUES
a) Pressionar o mouse em Coef. de Correlao de Pearson;
b) Selecionar as colunas referentes s variveis do grid geral;
c) Clicar em Executar o Teste para obter resultados.
Figura 8.3
Resultados
do Exemplo
8.2.1.
- 66 -
CAPTULO 8 CORRELAO
c) Clicar em Executar o Teste para obter resultados
Figura 8.4
Dados do
Exemplo
8.3.1
Figura 8.5
Resultados
do Exemplo
8.3.1.
Na parte
inferior est
representada a
matriz de
correlao.
- 67 -
CAPTULO 8 CORRELAO
8.4 CORRELAO PARCIAL
No estudo da correlao linear possvel estender o conceito medindo-se a associao
entre duas variveis e, ao mesmo tempo, controlando o efeito de uma terceira, a
varivel Z. Neste caso, chama-se o procedimento de Correlao Parcial.
8.4.1 EXEMPLO
O exemplo que vai ser mostrado o da influncia da renda familiar varivel Z na
correlao entre tempo de estudo dos pais varivel X e tempo de estudo dos filhos
varivel Y. O programa permite que se escolha a varivel Z, a qual pode ser
qualquer uma das trs colunas preenchidas com os escores. No exemplo, a varivel a
ser fixada est na coluna 3 do grid. Alm disso, os resultados da Correlao Linear de
Pearson das variveis X e Y so apresentados a ttulo comparativo.
H0: a renda familiar (varivel Z) no influencia a correlao tempo de estudo dos pais
(varivel X) e o tempo de escolaridade dos filhos (varivel Y);
H1: a renda familiar (varivel Z) influencia a correlao tempo de estudo dos pais
(varivel X) e o tempo de escolaridade dos filhos (varivel Y);
Nvel de deciso: alfa = 0.05.
Figura 8.7
Dados do
Exemplo
8.4.1.
8.4.2 INSTRUES
a) Pressionar o mouse em Coef. de Correlao Parcial;
b) Selecionar as colunas referentes s variveis do grid geral;
c) Clicar em Executar o Teste, surgindo uma tela para a escolha da varivel Z;
d) Pressionar Executar, para resultados.
Figura 8.8
Resultados
do Exemplo
8.4.1.
- 68 -
CAPTULO 8 CORRELAO
H uma associao entre a escolaridade dos pais e dos filhos (r XY= 0.8295, p =
0.021), a qual deixa de ser significativa ao se introduzir a varivel Z (r XY.Z =
0.2719, p = 0.6022)
8.5 CORRELAO LINEAR: < 0 ou > 0
Algumas vezes h interesse do pesquisador no estudo da associao entre duas
variveis, mas o parmetro de comparao passa a ser diferente de zero, como se
exemplifica a seguir.
8.5.1 EXEMPLO
Em estudo gentico (hipottico) verificou-se que o parmetro (
) de associao entre
as variveis X e Y igual a 0.50. Tomou-se amostra aleatria de 6 indivduos, cujas
variveis em questo foram mensuradas, a fim de verificar se estariam de acordo com
a distribuio terica formulada.
H0: = 0.50;
H1: 0.50;
Nvel de deciso: alfa = 0.05.
Figura 8.9
Dados do
Exemplo
8.5.1.
8.5.2 INSTRUES
a) Pressionar o mouse em Coef. de Correlao: < 0 ou > 0;
b) Selecionar as colunas referentes s variveis do grid geral;
c) Clicar em Executar o Teste, surgindo a Figura 8.10, a qual deve ser preenchida
com o valor de assumido da populao, 0.5 no caso;
Figura 8.10
Coef. de
correlao da
populao (
).
(Exemplo
8.5.1)
- 69 -
CAPTULO 8 CORRELAO
Figura 8.11
Resultados
do Exemplo
8.5.1.
a)
- 70 -
CAPTULO 8 CORRELAO
Figura 8.13
Resultados
do Exemplo
8.6.1.
- 71 -
CAPTULO 8 CORRELAO
Os resultados no mostram diferena estatisticamente significativa entre o
desempenho dos mdicos residentes e as respectivas avaliaes dos trs supervisores
(W = 0.7778 e p = 0.097), tendo havido, portanto, concordncia entre os avaliadores.
Aceita-se, portanto, a hiptese de nulidade.
8.8 COEFICIENTE DE CORRELAO DE KENDALL:
Mede a associao entre duas variveis mensuradas a nvel ordinal, ou seja, por
postos.
8.8.1 EXEMPLO
Dois mdicos neonatalogistas efetuaram a avaliao de seis recm-nascidos pelos
escores de Apgar. Os valores foram inseridos no grid geral.
H0: no h concordncia entre a avaliao dos neonatalogistas em relao aos escores
de Apgar dos recm-nascidos: Coef. de Correlao de Kendall = 0;
H1: h concordncia entre a avaliao dos neonatalogistas em relao aos escores
de Apgar dos recm-nascidos: Coef. de Correlao de Kendall 0;
Nvel de deciso: alfa = 0.05.
Figura 8.16
Dados do
Exemplo
8.8.1.
8.8.2 INSTRUES
a) Pressionar o mouse em Coef. de Correlao de Kendall;
b) Selecionar as colunas referentes s variveis do grid geral;
c) Clicar em Executar o Teste, para resultados.
Figura 8.17
Resultados do
Exemplo
8.8.1.
- 72 -
CAPTULO 8 CORRELAO
Os resultados revelam um Coeficiente de Correlao de Kendall (0.7877)
significativo (p = 0.0132), tendo havido concordncia dos mdicos especialistas em
relao aos escores de Apgar dos recm-nascidos. Rejeita-se a hiptese de nulidade,
aceitando-se a alternativa.
8.9 COEFICIENTE PHI: r
Este teste aplicado para verificar a associao de variveis mensuradas a nvel
nominal e que se apresentam de modo dicotmico em tabela de contingncia 2 x 2.
8.9.1 EXEMPLO
Foi efetuado levantamento em uma universidade para verificar se h associao entre
os sexos dos estudantes e os cursos de medicina e biologia. Nesse exemplo ambas as
variveis apresentam-se dicotmicas e so mensuradas a nvel nominal: sexo
masculino e feminino de um lado e, de outro, os cursos de medicina e biologia, com
os seguintes escores:
a) estudantes do sexo masculino cursando biologia: 40;
b) estudantes do sexo masculino cursando medicina: 48;
c) estudantes do sexo feminino cursando biologia: 55;
d) estudantes do sexo feminino cursando medicina: 47;
H0: no existe associao entre os sexos dos estudantes e os cursos de medicina e de
biologia: r = 0;
H1: existe associao entre os sexos dos estudantes e os cursos de medicina e de
biologia: r 0;
Nvel de deciso: alfa = 0.05.
8.9.2 INSTRUES
a) Pressionar o mouse em Coef. Phi;
b) Preencher o grid especfico da seguinte maneira;
Entrada de Dados do Coef. Phi.
Figura 8.18
Coeficiente
Phi.
(Exemplo
8.9.1)
c)
- 73 -
CAPTULO 8 CORRELAO
Pelos resultados verifica-se que no h diferena estatisticamente significativa entre
sexos e escolha dos cursos em questo (p = 0.3085). Aceita-se, portanto, a hiptese de
nulidade (Figura 8.20).
8.10 COEFICIENTE DE CORRELAO DE SPEARMAN: rs
uma prova no-paramtrica com a finalidade de determinar o grau de associao
entre duas variveis mensuradas, pelo menos, a nvel ordinal e dispostas em postos
ordenados em duas sries: X e Y.
8.10.1 EXEMPLO
Os mesmos dados relativos Correlao de Kendall sobre os escores de Apgar (ver
Figura 8.18).
H0: no h correlao entre a avaliao dos neonatalogistas em relao aos escores de
Apgar dos recm-nascidos: rs = 0;
H1: h correlao entre a avaliao dos neonatalogistas em relao aos escores de
Apgar dos recm-nascidos: rs 0;
Nvel de deciso: alfa = 0.05.
8.10.2 INSTRUES
a) Pressionar o mouse em Coef. de Correlao de Spearman;
b) Selecionar as colunas referentes s variveis do grid geral;
c) Clicar em Executar o Teste, para resultados.
Figura 8.19
Resultados do
Exemplo
8.10.1.
- 74 -
CAPTULO 8
DISTRIBUIO DE PROBABILIDADES
8.1 INTRODUO
Quando o procedimento para a coleta de dados, conseqentemente das variveis
investigadas, randmico, assumindo cada varivel um certo valor e uma
determinada probabilidade, diz-se, ento, que so variveis aleatrias. O programa
apresenta as seguintes distribuies:
a)
Distribuies discretas:
i Binomial;
ii Hipergeomtrica;
iii Poisson.
b) Distribuies contnuas:
i Exponencial;
ii Normal.
c) Probabilidade condicional:
i Crivo (screening test);
ii Curva ROC;
iii Ponto de Corte;
iv Regra de Bayes;
v Sensibilidade/Especificidade.
d) Outras distribuies:
i Distribuio F;
ii Distribuio do Qui-quadrado;
iii Distribuio t de Student;
iv Distribuio Z.
8.1.1 INSTRUES
a) Dirigir o mouse para o menu superior e clicar em Estatstica;
b) Apontar o mouse em Distribuio de Probabilidades.
Figura 8.1
Menu de
Distribuio
de Probabilidades.
- 95 -
Figura 9.2
Distribuio
Binomial.
(Exemplo
9.2.1)
- 76 -
A probabilidade de se encontrar na
amostra 2 vidros com subdosagem de
vitamina B1 0.2198, a de 2 vidros ou
menos 0.9780 e a de mais de dois
vidros 0.0220. A soma dessas
probabilidades igual unidade:
0.9780 + 0.0220 = 1 (o valor 0.2198
est includo em 0.9780).
- 77 -
- 78 -
Figura 9.5
Distribuio
Exponencial.
(Exemplo
9.5.1)
- 79 -
- 80 -
Figura 9.7
Distribuio
Normal.
(Exemplo
9.6.1 - b)
- 81 -
Definies
- 82 -
- 83 -
Figura 9.13
Resultados
do Exemplo
9.8.1.
Figura 9.14
A linha
diagonal
representa a
metade da
rea. Quanto
mais
prximas
estiverem as
curvas dessa
linha, menor o
desempenho
do teste.
- 84 -
9.10 SENSIBILIDADE/ESPECIFICIDADE
A probabilidade posterior pode ser calculada conhecendo-se a probabilidade prior e
os novos valores da sensibilidade e da especificidade.
9.10.1 EXEMPLO
Um determinado evento tem uma probabilidade prior 0.45, calculada com
informaes sobre a sensibilidade e a especificidade de 0.55 e 0.45, respectivamente,
obtidas em um screening test. Com o aperfeioamento dos exames de laboratrio, os
novos valores da sensibilidade e da especificidade foram, respectivamente, iguais a
0.85 e 0.78. Calcular a probabilidade posterior com essas novas informaes.
- 85 -
- 86 -
- 87 -
Figura 9.20
Distribuio
t de
Student,
o p-valor
unilateral
obtido
igual a
0.005.
O resultado unilateral,
como era esperado,
igual a 0.005.
Se fosse desejado o valor
bilateral, bastaria
pressionar o boto
Bilateral, o qual, com
esses dados, o p-valor
corresponderia a 0.005 de
cada lado da curva,
totalizando 0.01,
(0.005 + 0.005).
9.14 DISTRIBUIO Z
A distribuio Z, como se sabe, corresponde distribuio normal com parmetros
N(0,1). A curva e o p-valor so mostrados conforme se verifica na Figura 9.17.
9.14.1 EXEMPLO
Considerando o valor obtido de Z = 1.96, calcular o p-valor bilateral.
9.14.2 INSTRUES
a) Apontar o mouse em Outras distribuies;
b) Clicar o mouse em Distribuio Z;
c) Preencher a caixa de texto com o valor de Z e clicar em Bilateral.
Figura 9.21
p-valor
bilateral
obtido
igual a
0.025 de
cada lado
da curva,
totalizando
0.05.
- 88 -
CAPTULO 9
UMA AMOSTRA
9.1 INTRODUO
Os testes de inferncia estatstica para uma s amostra envolvem os dados amostrais e
os parmetros da populao investigada. Algumas vezes a comparao dos valores
numricos da amostra efetuada com distribuies tericas esperadas, recebendo a
denominao, nesses casos, de testes de aderncia.
Estes testes classificam-se em:
a) Testes paramtricos:
i Teste t: dados amostrais;
ii Teste t: resumo amostral;
iii Teste Z: dados amostrais;
iv Teste Z: resumo amostral.
b) Testes no-paramtricos:
i Teste Binomial;
ii Teste de Iteraes (Runs test);
iii Teste G;
iv Teste de Kolmogorov-Smirnov;
v Teste de Lilliefors;
vi Teste do Qui-Quadrado: propores esperadas iguais;
vii Teste do Qui-Quadrado: propores esperadas desiguais;
viii Teste de Poisson.
9.1.1 INSTRUES
a) Introduzir os dados no grid geral do BioEstat;
b) Dirigir o mouse para o menu superior e clicar em Estatstica;
c) Apontar o mouse em Uma Amostra, conforme demonstra a Figura 9.1:
Figura 9.1
Menu dos
aplicativos
para uma
amostra.
- 111 -
10.2.2 INSTRUES
a) Pressionar o mouse em Teste t;
b) Selecionar a coluna referente amostra do grid geral;
c) Clicar em Executar o Teste surgindo a Figura 10.3 e preencher ento a caixa
de texto com a mdia da populao.
Figura 10.3
Mdia da
populao.
- 90 -
Figura 10.4
Resultados
do Exemplo
10.2.1.
10.3 TESTE Z
Prova paramtrica semelhante anterior, devendo o procedimento ser escolhido
quando a mdia e a varincia da populao so conhecidas.
10.3.1 EXEMPLO
Em um lago criatrio foram pesados 50 peixes de determinada espcie, cujos escores
esto inseridos no grid geral. Em estudos efetuados no habitat natural, o peso mdio
dos animais dessa espcie de 21600 g e o desvio padro igual a 7338 g.
Figura 10.5
Viso parcial
dos dados
do Exemplo
10.3.1.
- 91 -
Figura 10.6
Mdia e
desvio padro
da populao.
- 92 -
10.4.2 INSTRUES
a) Pressionar o mouse em Teste binomial;
b) Preencher as caixas de textos com o tamanho da amostra, o nmero de sucessos e
a proporo do evento na populao (em decimais).
c) Clicar em Executar, para resultados.
Figura 10.8
Teste
Binomial
(Exemplo
10.4.1).
- 93 -
Os dados obtidos em todas as reas vincolas da regio indicam que o grau mdio
alcolico dos vinhos produzidos igual a 9, com desvio padro igual a 2.
H0: as freqncias acumuladas observadas no diferem da distribuio esperada, com
base nos dados da populao: F0(X) = Sn(X);
H1: as freqncias acumuladas observadas diferem da distribuio esperada, com base
nos dados da populao: F0(X) Sn(X);
Nvel de deciso: alfa = 0.05.
- 94 -
- 95 -
10.8.2 INSTRUES
a) Apontar o mouse em Qui-Quadrado, para Propores esperadas iguais,
conforme o Exemplos 10.7.1;
b) Selecionar a coluna do grid geral e clicar em Executar o Teste, para resultados.
Figura 10.15
Resultados
do Exemplo
10.8.1.
- 96 -
- 97 -
- 98 -
CAPTULO 10
DUAS AMOSTRAS INDEPENDENTES
10.1 INTRODUO
Um dos testes mais freqentes em bioestatstica consiste na avaliao da diferena
entre duas amostras independentes, que devem representar as respectivas populaes,
em que os dados de uma no esto relacionados com os escores da outra.
a) Testes paramtricos:
i Teste t: dados amostrais;
ii Teste t: resumo amostral;
iii Teste Z: dados amostrais;
iv Teste Z: resumo amostral.
b) Testes no-paramtricos:
i Binomial para Duas Propores;
ii Exato de Fisher;
iii Teste G;
iv Kolmogorov-Smirnov;
v Mann-Whitney;
vi Mediana;
vii Qui-Quadrado;
vii Odds Ratio;
viii Risco Relativo;
ix Taxa de Incidncia.
x Coeficiente de Variao;
xii Poisson;
10.1.1 INSTRUES
a) Introduzir os dados no grid geral do BioEstat ou preencher caixas de texto;
b) Dirigir o mouse para o menu superior e clicar em Estatstica;
c) Apontar o mouse em Duas Amostras Independentes.
Figura 10.1
Menu de
Duas
Amostras
Independentes.
- 125 -
- 100 -
- 101 -
11.3 TESTE Z
Apresenta caractersticas semelhantes ao Teste t, mas indicado para duas amostras
independentes quando as varincias paramtricas so conhecidas e as variveis nas
populaes apresentam distribuies normais. Esta ltima pressuposio pode no ser
conhecida, mas o tamanho de cada amostra, nesse caso, deve ser superior a 30
unidades.
- 102 -
11.3.2 INSTRUES
a) Pressionar o mouse em Teste Z;
b) Selecionar as colunas referentes s amostras do grid geral e clicar em Executar o
Teste;
c) Preencher as caixas de texto (Figura 11.6), com as informaes sobre as varincias
paramtricas e pressionar em Continue, para obter resultados (Figura 11.7).
Figura 11.8
Como
informar as
varincias
paramtricas.
Figura 11.9
Resultados
obtidos.
- 103 -
11.4.2 INSTRUES
a) Pressionar o mouse em Teste Binomial: duas propores;
b) Preencher as caixas de texto com os dados;
c) Clicar em Executar, para resultados.
Figura 11.10
Teste
Binomial
(Exemplo
11.4.1).
- 104 -
a)
primeiro grupo:
i aderncia presente: 9 animais;
ii aderncia ausente: 1 animal.
b) segundo grupo:
i aderncia presente: 2 animais;
ii aderncia ausente: 8 animais.
H0: a presena de aderncia do epploo no coto duodenal independe do nmero de
planos de sutura: p1 = p2;
H1: a presena de aderncia do epploo no coto duodenal depende do nmero de
planos de sutura: p1 p2;
Nvel de deciso: alfa bilateral = 0.01.
11.5.2 INSTRUES
a) Pressionar o mouse em Teste Exato de Fisher;
b) Preencher as caixas de texto com os dados;
c) Clicar em Executar, para resultados.
Figura 11.11
Resultados
do Teste
Exato de
Fisher
(Exemplo
11.5.1).
- 105 -
- 106 -
O teste revela que a diferena entre as duas amostras muito significativa, rejeitandose a hiptese de nulidade e aceitando-se a alternativa. mais fcil a adaptabilidade
das crianas ao Jardim I que ao Maternal, indicando que a idade influencia o
comportamento desses escolares.
11.8 TESTE DE MANN-WHITNEY
O teste de Mann-Whitney, conhecido tambm como Teste U, uma prova noparamtrica destinada a comparar duas amostras independentes do mesmo tamanho
ou desiguais, cujos escores tenham sido mensurados pelo menos a nvel ordinal.
11.8.1 EXEMPLO
Nveis de fosfatase sangnea em 12 pacientes acometidos de malria por P. vivax e
em 10 parasitados pelo P. falciparum.
- 107 -
11.8.2 INSTRUES
a) Pressionar o mouse em Mann-Whitney;
b) Selecionar as colunas referentes s amostras do grid geral;
c) Clicar em Executar o Teste, para resultados.
Figura 11.17
Resultados
do Exemplo
11.8.1.
- 108 -
11.9.2 INSTRUES
a) Pressionar o mouse em Mediana;
b) Selecionar as colunas referentes s amostras do grid geral;
c) Clicar em Executar o Teste, para resultados.
Figura 11.19
Resultados
do Exemplo
11.9.1.
- 109 -
H0: a proporo dos animais vivos e mortos independe dos cuidados veterinrios
recebidos;
H1: a proporo dos animais vivos e mortos depende dos cuidados veterinrios
recebidos;
Nvel de deciso: alfa = 0.05.
11.10.2 INSTRUES
a) Pressionar o mouse em Qui-Quadrado;
b) Selecionar as colunas referentes s amostras do grid geral;
c) Clicar em Executar o Teste, para resultados;
Figura 11.21
Resultados
do Exemplo
11.10.1.
- 110 -
Tendo em vista que se trata de um estudo de casos cujos controles foram definidos
pelo investigador, pode-se calcular o OR.
11.11.2 INSTRUES
a) Clicar o mouse em Odds Ratio;
b) Preencher as caixas de texto com os dados;
c) Clicar em Executar, para obter os resultados.
Figura 11.22
Teste de
Odds Ratio
(Exemplo
11.11.1).
- 111 -
Figura 11.23
Teste de
Odds Ratio
(Exemplo
11.11.1 com
posio
invertida das
amostras).
- 112 -
O Risco Relativo de uma pessoa com teste PPD positivo contrair a tuberculose 30
vezes maior do que se o teste for negativo. O resultado muito significativo (p <
0.0001), devendo o parmetro ser um valor dentro do espao compreendido entre 5.04
a 178.56 (IC 95%).
11.13 TAXA DE INCIDNCIA
Este teste destina-se a verificar se as taxas de incidncia (TI) de dois grupos
expostos e no expostos a determinado evento diferem ou no de modo
significativo.
11.13.1 EXEMPLO
Um levantamento foi efetuado em uma coorte de indivduos expostos e no expostos
a tuberculose no ambiente familiar. Ao final de um ano, obtiveram-se os seguintes
dados:
Expostos
No Expostos
Nmero
de casos
40
30
Nmero de pessoas
no perodo
2137
3485
- 113 -
Figura 11.25
Resultados
do Exemplo
11.13.1.
- 114 -
Figura 11.27
Coeficientes
de Variao:
Resultados
do Exemplo
11.14.1.
H0: 1 = 2
H1: 1 2
Nvel de deciso: alfa bilateral = 0.05.
11.15.2 INSTRUES
a) Clicar o mouse em Teste de Poisson;
b) Preencher as caixas de texto com os valores da primeira e da segunda amostra;
c) Clicar em Executar para resultados.
Figura 11.28
Teste de
Poisson
(Exemplo
11.15.1).
- 115 -
- 116 -
CAPTULO 11
DUAS AMOSTRAS RELACIONADAS
11.1 INTRODUO
um procedimento onde dois conjuntos so investigados, o segundo constitudo dos
mesmos elementos do primeiro, formando-se pares de unidades onde cada indivduo
contribui com dois escores, ou seja, funciona como seu prprio controle. So, pois,
amostras relacionadas, pareadas ou dependentes, tomadas para testar-se a mdia das
diferenas antes e depois da condio objeto da pesquisa.
Os testes estatsticos para duas amostras relacionadas classificam-se em:
a) Testes paramtricos:
i Teste t de Student: dados amostrais;
ii Teste t de Student: resumo amostral;
iii ANOVA.
b) Testes no-paramtricos:
i Correlao Intraclasse;
ii Kappa;
iii McNemar;
iv Sinais;
v Wilcoxon (Signed-Rank Test).
11.1.1 INSTRUES
a) Preencher duas colunas do grid geral com os dados: antes e depois, com exceo
do Teste de McNemar;
b) Dirigir o mouse para o menu superior e clicar em Estatstica;
c) Apontar o mouse em Duas Amostras Relacionadas, para a escolha do teste:
Figura 11.1
Menu dos
aplicativos
para duas
amostras
relacionadas.
- 147 -
Figura 12.2
Dados do
Exemplo
11.2.1.
- 118 -
12.3.2 INSTRUES
a) Pressionar o mouse em ANOVA;
b) Selecionar as colunas referentes s amostras do grid geral;
c) Clicar em Executar o Teste, para resultados.
Figura 12.5
Resultados do
Exemplo
12.3.1.
- 119 -
B (+ )
D (
)
B (+ +)
D (
+)
Os pares discordantes podem, assim, estar inseridos nas caselas B e C ou nas caselas
A e D, e o programa calcula a probabilidade desses pares em ambas as situaes,
- 120 -
- 121 -
12.5.2 INSTRUES
a) Pressionar o mouse em Sinais;
b) Selecionar as colunas do grid geral;
c) Clicar em Executar o Teste, para resultados:
Figura 12.9
Resultados
do Exemplo
12.5.1.
- 122 -
12.6.2 INSTRUES
a) Pressionar o mouse em Kappa;
b) Preencher as caixas de texto com os escores;
- 123 -
- 124 -
CAPTULO 13
ESTATSTICA DESCRITIVA
13.1 INTRODUO
A funo descritiva da estatstica consiste em sumarizar os dados coletados da
amostra ou da populao , ordenando-os e classificando-os, para torn-los de fcil
entendimento. O programa calcula o seguinte:
a)
Informaes gerais:
i Nmero de escores (N);
ii Valor mnimo;
iii Valor mximo;
iv Amplitude total (At).
b) Medidas de tendncia central:
i Mediana (Md);
ii Mdia aritmtica ( ou X ).
c) Medidas de disperso:
i Primeiro e Terceiro Quartis;
ii Desvio Interquartlico
iii Varincia (2 ou s2);
iv Desvio padro ( ou s);
v Erro padro ( x ou s x );
vi Coeficiente de variao (CV).
d) Medidas de forma:
i Coeficiente de assimetria (g1);
ii Coeficiente de curtose (g2).
Os valores de g1 e g2 so iguais a zero (0) nas curvas simtricas e mesocrticas,
respectivamente.
Dependendo do tipo de dados, como, por exemplo, os referentes a crescimento
bacteriano, diluies sorolgicas e outros, o programa permite determinar a mdia, a
varincia e o desvio padro geomtricos.
13.1.1 EXEMPLO 1
Um pesquisador coletou 3 amostras, cuja varivel investigada era a presso arterial
sistlica:
a) Amostra A: 12 estudantes do sexo feminino;
b) Amostra B: 9 alunos do sexo masculino;
c) Amostra C: 10 docentes.
- 125 -
13.1.2 EXEMPLO 2
Em uma cultura de bactrias, o nmero aumentou de 1431, no final do 1o dia, para
3250, 9610, 26800 e 63300 ao trmino do 2o, 3o, 4o e 5o dias, respectivamente.
Descrever a amostra calculando a mdia geomtrica.
Figura 13.2
Dados do
Exemplo
13.1.2.
13.1.3 INSTRUES
a) Introduzir os dados no grid geral do BioEstat;
b) Dirigir o mouse para o menu superior e clicar em Estatstica;
c) Clicar o mouse em Estatstica Descritiva;
d) Selecionar as colunas do grid (1, 2, 3, , n);
e) Clicar em Executar o Teste, informando se a mdia geomtrica deve ser ou no
calculada.
- 126 -
Figura 13.3
Resultados do
Exemplo
13.1.1.
A mdia geomtrica a medida de tendncia central que mais se ajusta aos dados
amostrais, sendo duas vezes menor que a aritmtica e estando mais prxima da
mediana.
- 127 -
- 128 -
CAPTULO 14
ESTIMAO DE PARMETROS
14.1 INTRODUO
A estimao de parmetros parte da inferncia estatstica atravs da qual, a partir
dos dados amostrais, se inferem os valores numricos da populao investigada. O
BioEstat apresenta os seguintes programas de estimao paramtrica:
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
Da Mdia;
Da Proporo;
Da Diferena entre Duas Mdias;
Da Diferena entre Duas Propores;
Da Densidade e Tamanho da Populao;
Fentipos e Gentipos;
Fourier (densidade);
Equilbrio de Hardy-Weinberg;
Tamanho da Populao (amostragem simples, mtodo direto);
Tamanho da Populao (amostragem simples, mtodo inverso);
Tamanho da Populao (amostragem mltipla, populao fechada);
Tamanho da Populao (amostragem mltipla, populao aberta).
14.1.1 INSTRUES
a) Dirigir o mouse para o menu superior e clicar em Estatstica;
b) Apontar o mouse em Estimao de Parmetros, como demonstra a Fig. 14.1:
Figura 14.1
Menu de
Estimao de
Parmetros.
- 129 -
- 130 -
- 131 -
- 132 -
- 133 -
- 134 -
- 135 -
14.8.2 INSTRUES
a) Pressionar o mouse em Fourier;
b) Preencher as caixas de texto e o grid especfico;
c) Clicar em Executar, para resultados.
Figura 14.10
Resultados
do Exemplo
14.8.1.
- 136 -
- 137 -
14.10.2 INSTRUES
a) Pressionar o mouse em Tamanho da populao (amostragem simples, mtodo
direto);
b) Preencher as caixas de texto;
c) Clicar em Executar, para resultados.
- 138 -
- 139 -
14.12.2 INSTRUES
a) Cada linha deve ter a seguinte disposio:
Na linha 1: ni ,nmero de animais capturados em cada amostra (marcados e
no marcados);
Na linha 2: mi, nmero de animais que j estavam marcados entre os
capturados na amostra;
Todos os animais capturados em cada amostra (ni ) so marcados, exceto os
que j apresentavam a marca, portanto, quantificados na linha (mi );
b) Introduzir os dados no grid como mostra a Figura 14.15;
c) Pressionar o mouse em Tamanho da populao (amostragem mltipla, mtodo de
Schumaker e Eschmeyer);
d) Selecionar as colunas do grid a partir da coluna 2, sendo neste exemplo de 2 a 7,
totalizando as 6 amostras e clicar em Executar, para resultados.
Figura 14.16
Resultados
do Exemplo
14.12.1.
Para obter o grfico desse Exemplo pressionar o mouse em Grfico da barra superior
da Figura 14.16.
- 140 -
Figura 14.17
Grfico
do Exemplo
14.12.1.
- 141 -
Figura 14.19
Resultados
do
Exemplo
14.13.1.
- 142 -
CAPTULO 15
META-ANLISE
15.1 INTRODUO
Define-se Meta-Anlise como um procedimento destinado a examinar, de modo
simultneo, vrias investigaes, diversas pesquisas sobre um mesmo tpico. Esse
tipo de estudo vem sendo largamente utilizado na esfera mdica, para, atravs de
numerosos dados de vrios trabalhos sobre determinado assunto, aumentar o nvel de
confiana nas inferncias estatsticas, com objetivos teraputicos e outros. Alguns
estudos, como se sabe, sobre determinada matria, so concordantes, mas podem
tambm ser contraditrios, o que aumenta a necessidade de anlises conjuntas para
que se possa concluir com maior segurana.
Embora o conceito de Meta-Anlise seja oriundo de uma escola de metodologia
desenvolvida por Glass em 1976, estudos genticos sobre gentipos e fentipos j
abrangiam esse conceito, conforme descrito por Sokal e Rohlf (Biometry, 1969), sob
o ttulo "Replicated tests of goodness of fit" (pgina 575), ou seja, a combinao de
vrias amostras com informaes sobre o mesmo assunto, para obter estimativas mais
precisas das propores paramtricas.
importante distinguir os efeitos observados entre os diversos estudos examinados
em conjunto:
1 - quando diferem somente em decorrncia do erro amostral, ou seja, o
verdadeiro efeito o mesmo em cada um dos estudos, na mesma direo e no devido
a diferenas sistemticas em cada trabalho, diz-se que as amostras so homogneas e
as diferenas so consideradas efeitos randmicos ou aleatrios;
2 - outras vezes os efeitos observados ultrapassam o esperado pelo erro amostral,
existindo diferenas reais entre os estudos examinados. Quando isso ocorre,
denominando-se o efeito, neste caso, de efeito fixo, o qual pode acontecer na mesma
direo dos tratamentos efetuados - favorvel ou no - ou em diferentes direes benfico e adverso, sendo as amostras consideradas heterogneas..
Alguns autores aplicam em tabelas 22 o teste do Qui-Quadrado de heterogeneidade.
Quando o teste significativo, escolhem testes de efeitos aleatrios, como o de
DerSimonian-Laird; caso contrrio, os de efeitos fixos, sendo o mais conhecido o de
Mantel-Haenszel.
Existem vrias discusses, contudo, sobre a escolha do teste, mas preciso lembrar
ser fundamental preencher, pelo menos, estas recomendaes:
a) as amostras devem ser aleatrias, representativas da populao em estudo;
b) os experimentos devem ser controlados, escolhendo-se os indivduos de modo
randmico para cada grupo. Estes procedimentos so designados na literatura
inglesa como RCT (Randomized Controlled Trials);
- 143 -
CAPTULO 15 META-ANLISE
c) os critrios de tratamento devem ser semelhantes entre os estudos submetidos
meta-anlise;
d) rigorosa escolha dos trabalhos publicados, podendo-se incluir pesquisas ainda no
editadas, desde que atendam os requisitos antes referidos.
O BioEstat apresenta os seguintes aplicativos para Meta-Anlise:
a) Efeito Aleatrio: DerSimonian-Laird: para k tabelas 2 x 2;
b) Efeito Fixo: Dados Contnuos
c) Efeito Fixo: Mantel-Haenszel e Odds Ratio: para k tabelas 2 x 2;
d) p-valor (pw, combinado);
e) Qui-Quadrado (aderncia): para k amostras;
f) Qui-Quadrado (independncia): para k tabelas 2 x 2;
g) Regresso (w): para n amostras;
h) Risco relativo (w), para k tabelas 2 x 2;
i) Teste G (aderncia): para k amostras;
j) Vrias Correlaes (rw combinado);
k) Vrias Propores (pw combinado).
15.1.1 INSTRUES
a) Dirigir o mouse para o menu superior e clicar em Estatstica;
b) Apontar o mouse em Meta-Anlise, conforme mostra a Figura 15.1;
c) Introduzir os dados no grid geral ou nas caixas de texto, conforme o teste.
Figura 15.1
Menu de
Meta-Anlise
- 144 -
CAPTULO 15 META-ANLISE
Grupo A
Tabelas (Estudos)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Sucessos (a)
181
214
118
100
1
217
163
109
906
345
212
33
24
30
100
250
180
307
100
1113
190
92
132
4270
369
123
293
1840
2000
6540
Insucessos (b)
29
69
36
3
31
60
40
21
110
80
30
17
16
1
1
173
29
41
6
37
40
16
10
268
48
1
18
67
43
33
Grupo B
Sucessos (c) Insucessos (d)
157
108
78
40
32
192
151
107
901
113
201
38
28
47
29
244
165
318
97
1080
200
50
130
4267
355
97
300
1830
1990
1661
52
37
39
4
4
81
53
25
112
26
50
12
20
10
3
177
32
47
7
48
27
2
14
247
61
2
11
72
42
3
Total
413
428
271
147
68
550
407
262
2029
564
493
100
88
88
133
844
406
713
210
2234
457
160
286
9052
833
223
622
3809
4075
8237
- 145 -
CAPTULO 15 META-ANLISE
Figura 15.2
Resultados
do Exemplo
15.2.1.
- 146 -
CAPTULO 15 META-ANLISE
a)
b)
c)
d)
e)
f)
Figura 15.3
Dados
do Exemplo
15.3.1.
- 147 -
CAPTULO 15 META-ANLISE
15.4 EFEITO FIXO: TESTE DE MANTEL-HAENSZEL
Este teste tambm utilizado em anlise de sobrevivncia, mas indicado para
avaliao dos chamados efeitos fixos, utilizando-se k tabelas 2 x 2. Calcula-se,
simultaneamente, o valor do Odds Ratio e o respectivo intervalo de confiana.
15.4.1 EXEMPLO
Estudos realizados (dados hipotticos) em diferentes centros populacionais, sobre a
ocorrncia de cncer pulmonar em fumantes e no fumantes, revelaram o seguinte:
BELFAST
Fumantes
No Fumantes
Com cncer
12
2
Sem cncer
598
613
LISBOA
Fumantes
No Fumantes
Com cncer
14
3
Sem cncer
734
758
LONDRES
Fumantes
No Fumantes
Com cncer
14
5
Sem cncer
709
742
MADRID
Fumantes
No Fumantes
Com cncer
17
4
Sem cncer
684
650
BERLIM
Fumantes
No Fumantes
Com cncer
22
3
Sem cncer
918
832
- 148 -
CAPTULO 15 META-ANLISE
Figura 15.5
Resultados
do Exemplo
15.3.4.
- 149 -
CAPTULO 15 META-ANLISE
H1: as probabilidades dos testes submetidos meta-anlise apresentam p-valor
combinado (w) significativo;
Nvel de deciso: alfa = 0.01.
Figura 15.6
Dados
parciais
do Exemplo
15.5.1.
15.5.2 INSTRUES
a) Inserir os dados no grid geral conforme mostra a Figura 15.6
b) Apontar e pressionar o mouse em p-valor;
c) Selecionar a coluna 2 e clicar em Executar, para resultados.
Figura 15.7
Resultados
do Exemplo
15.5.1.
O Qui-quadrado com 30 graus de liberdade foi igual a 86.6554, cujo p-valor (w)
altamente significativo (p < 0.0001).
15.6 QUI-QUADRADO (aderncia): PARA k AMOSTRAS
Indicado para comparar vrias amostras em testes de aderncia..
15.6.1 EXEMPLO
Coletaram-se 4 amostras sobre sazonalidade de nascimentos de crianas cujos pais
residiam em localidades rurais ou urbanas do Mdio Solimes:
Categoria A
Nascimentos de maio a
outubro (tempo menos
chuvoso e de vazante do rio)
Categoria B
Nascimentos de novembro
a abril (perodo chuvoso e
de enchente do rio)
H0: O desvio entre Observado e o Esperado nas categorias de cada amostra ocorrem
na mesma direo, sendo as mesmas homogneas;
H1: O desvio entre Observado e o Esperado nas categorias de cada amostra ocorrem
em diversas direes, sendo as mesmas heterogneas;
Nvel de deciso: alfa = 0.05.
- 150 -
CAPTULO 15 META-ANLISE
15.6.2 INSTRUES
a) Apontar o mouse em Qui-quadrado Aderncia: Homogeneidade;
b) Preencher as caixas de texto com o nmero de amostras e de categorias, em
seguida preencher o grid especfico com os dados;
c) Clicar em Executar, para obter os resultados.
Figura 15.8
Dados do
Exemplo
15.6.1.
Municpio A
Municpio B
Municpio C
Municpio D
POSITIVO NEGATIVO
POSITIVO NEGATIVO
POSITIVO NEGATIVO
POSITIVO NEGATIVO
35
70
50
55
48
74
56
60
- 151 -
17
29
18
20
30
73
52
39
CAPTULO 15 META-ANLISE
ZONA
Municpio E
POSITIVO NEGATIVO
URBANA
RURAL
33
75
52
50
Municpio F
Municpio G
POSITIVO NEGATIVO
POSITIVO NEGATIVO
43
78
66
47
31
78
55
40
Municpio H
POSITIVO NEGATIVO
31
74
59
38
- 152 -
CAPTULO 15 META-ANLISE
15.8 REGRESSO LINEAR (w): PARA k AMOSTRAS
Trata-se de verificar se vrias amostras, no que diz respeito aos coeficientes de
regresso e aos interceptos, provieram do mesmo universo. Trata-se de uma
combinao das anlises de varincia e de regresso, conhecida como Anlise de
Covarincia ou ANCOVA. O programa determina, ainda, o coeficiente de regresso
(b) e o intercepto (a) de cada amostra, bem como o coeficiente de regresso conjunto,
tambm denominado pooled regression, simbolizado por Bw. A homogeneidade dos
coeficientes de regresso e dos interceptos determinada pela anlise de varincia,
constatando-se ou no se eles so oriundos da mesma populao, ou seja, se so
homogneos ou heterogneos. As amostras podem ser de diferentes tamanhos.
15.8.1 EXEMPLO
Registrou-se a presso arterial diastlica (P.A.D.) de pessoas do sexo feminino, cujas
idades variavam de 39 a 73 anos, selecionando-se, ao acaso, trs amostras obtidas em
diferentes cidades, cada uma constituda de 8 indivduos. O objetivo do estudo
verificar se a relao entre a idade e a P.A.D. homognea, para as trs amostras
levantadas. As hipteses formuladas foram as seguintes:
H0: Os coeficientes de regresso so iguais, pois as amostras foram retiradas da
mesma populao: b1 = b2 = b3;
H1: Os coeficientes de regresso so desiguais, pois as amostras foram retiradas de
populaes diferentes: pelo menos um bi bj ;
H0: Os interceptos so iguais, pois as amostras foram retiradas da mesma populao:
a1 = a2 = a3;
H1: Os interceptos so desiguais, pois as amostras foram retiradas de populaes
diferentes: pelo menos um ai aj ;
Nvel de deciso: alfa = 0.05.
Figura 15.11
Dados do
Exemplo
15.8.1.
15.8.2 INSTRUES
a) Preencher o grid geral com os escores amostrais, introduzindo na primeira coluna
os valores da varivel idade (X1) e na seguinte, os valores da varivel P.A.D.
(Y1) e, de modo sucessivo, para as demais amostras;
b) Clicar em Homogeneidade e selecionar as colunas do grid geral;
c) Clicar em Executar, para obter os resultados.
- 153 -
CAPTULO 15 META-ANLISE
Figura 15.12
Resultados
do Exemplo
15.8.1.
- 154 -
CAPTULO 15 META-ANLISE
15.9.2 INSTRUES
a) Apontar e pressionar o mouse em Risco Relativo;
b) Preencher as caixas de texto com os dados da primeira tabela 2 x 2;
c) Clicar em Nova Tabela e introduzir os dados da segunda tabela e assim,
sucessivamente, de acordo com o nmero de tabelas;
d) Aps introduzir a ltima tabela, clicar em Executar, para resultados.
Figura 15.13
Resultados
do Exemplo
15.9.1.
- 155 -
CAPTULO 15 META-ANLISE
H0: os desvios entre os valores observados e os esperados em cada categoria ocorrem
na mesma direo: as amostras so homogneas;
H1: os desvios entre os valores observados e os esperados em cada categoria ocorrem
em diversas direes: as amostras so heterogneas;
Nvel de deciso: alfa = 0.05.
15.10.2 INSTRUES
a) Apontar o mouse em Teste G aderncia: Homogeneidade, surgindo a Figura
15.14.
b) Preencher as caixas de texto com o nmero de amostras e o de categorias, 4 e 2,
respectivamente, no presente caso;
c) Clique em Executar;
Figura 15.14
Quantidade
de amostras
e de
categorias.
Figura 15.16
Resultados
do exemplo
15.7.1.
- 156 -
CAPTULO 15 META-ANLISE
15.11 VRIAS CORRELAES (rw combinado)
Destinado a testar vrios coeficientes de correlao linear (r), no sentido de verificar
se foram retirados da mesma populao, ou seja, se as amostras de onde provieram
apresentam homogeneidade.
15.11.1 EXEMPLO
Pesquisa realizada sobre a associao linear entre peso e estatura de recm-nascidos
foi efetuada em 3 maternidades, com a finalidade de verificar se as amostras eram
homogneas. Cada amostra, independentemente do tamanho, tem um valor de r
correspondente ao grau de associao entre as duas variveis analisadas.
H0: r1 = r2 = r3;
H1: pelo menos ri rk;
Nvel de deciso: alfa = 0.05.
15.11.2 INSTRUES
a) Pressionar o mouse em Vrias correlaes: homogeneidade;
b) Preencher a tela seguinte (15.17) com o nmero de amostras a testar, sendo 3
neste exemplo, pressionando-se, ento, em Montar Grid;
Figura 15. 17
Nmero de
amostras.
(Exemplo
15.11.1)
Figura 15.18
Dados do
Exemplo
15.11.1.
c)
Figura 15.19
Resultados
do Exemplo
15.11.1
O p-valor (0.0040) do teste com todas as amostras muito significativo, embora elas
no sejam oriundas da mesma populao, ou seja, elas so heterogneas. Quando os
valores de r so comparados entre si, constata-se que h diferena significativa entre
os coeficientes das amostras 2 e 3 e muito significativa entre aqueles representados
pelas amostras 1 e 3. Observa-se, ainda, que no h diferena significativa entre os
coeficientes das amostras 1 e 2.
- 157 -
CAPTULO 15 META-ANLISE
15.12 VRIAS PROPORES (pw combinado)
Em determinados estudos h interesse em comparar vrias propores no sentido de
determinar se elas provieram ou no do mesmo universo, podendo ser efetuada a
pesquisa por este modelo de procedimento.
15.12.1 EXEMPLO
Procurou-se avaliar se os resultados da contagem de linfcitos na frmula leucocitria
do sangue perifrico eram influenciados pelos tipos de aparelhos eletrnicos
atualmente utilizados pelos laboratrios clnicos. Retirou-se amostra sangnea de um
indivduo considerado clinicamente normal e efetuou-se o procedimento laboratorial
em 4 aparelhos de marcas diferentes: A, B, C e D. Os resultados foram estes:
Figura 15.20
Dados do
Exemplo
15.12.1
H1: H diferena nas propores de linfcitos obtidas nos aparelhos testados: pelo
menos duas propores so desiguais; pi pj;
- 158 -
CAPTULO 15 META-ANLISE
15.13 GRFICOS FOREST PLOT E ANLISE DOS DADOS
Pode-se obter Grficos de alguns exemplos dos testes de Meta-Anlise, sob a forma
de Forest Plot. Alguns so exibidos em escala logartmica, utilizada nos testes que
envolvem Odds Ratio e Risco Relativo, enquanto que a escala decimal usada em
testes de Dados Contnuos. A barra horizontal representa o intervalo de confiana de
cada estudo. O ponto central um retngulo - o odds ou a mdia das diferenas,
cujo tamanho proporcional ao inverso da varincia, designado peso, como se
observa na Anlise dos Dados.
.
15.13.1 EXEMPLO 15.2.1 DerSimonnian-Laird
a) Pressionar o mouse em Grfico na barra da Figura 15.2, para resultado.
Figura 15.22
Grfico do
Exemplo
15.2.1
O Odds Ratio (w) combinado est representado na parte inferior do grfico, sob a
forma de um pequeno losango, cujo limite inferior maior que a unidade (1.015).
Se se desejar os dados de cada amostra (Odds Ratio) e respectivos Intervalos de
Confiana (95%), pressionar com o mouse em Anlise na barra da Figura 15.2.
Figura 15.23
Viso parcial
da Anlise e a
Meta-Anlise
do Exemplo
15.2.1
- 159 -
CAPTULO 15 META-ANLISE
15.13.2 EXEMPLO 15.3.1 DADOS CONTNUOS
a) Pressionar o mouse em Grfico na barra da Figura 15.4, para resultado.
Figura 15.24
Grfico do
Exemplo
15.3.1
- 160 -
CAPTULO 15 META-ANLISE
15.13.3 EXEMPLO 15.4.1 TESTE DE MANTEL-HAENSZEL
Pressionar o mouse em Grfico na barra da Figura 15.5, para obter o resultado.
Figura 15.26
.
Grfico do
Exemplo
15.4.1
- 161 -
CAPTULO 15 META-ANLISE
- 162 -
CAPTULO 15 META-ANLISE
15.14 OUTROS GRFICOS
Alm do Florest Plot, outros grficos podem ser obtidos nos testes de meta-anlise.
Foi escolhido um grfico de barra para representar as vrias propores.
15.14.1 EXEMPLO 15.4.1 VRIAS PROPORES (pw)
Pressionar o mouse em Grfico na barra da Figura 15.20
Figura 15.30
Grfico do
Exemplo
15.4.1
- 163 -
CAPTULO 15 META-ANLISE
- 164 -
CAPTULO 16
NORMALIDADE
16.1 INTRODUO
Uma das pressuposies dos testes estatsticos paramtricos diz respeito distribuio
normal das variveis nas populaes. Quando se retira, portanto, uma amostra para
esses modelos de testes, deve-se supor que as unidades do universo em questo
apresentem distribuio normal.
Vrios testes tm sido descritos para a identificao da normalidade das variveis. O
BioEstat apresenta os seguintes:
a) Teste DAgostino, para n 10 e k amostras;
b) Teste DAgostino-Pearson, para n 20 e k amostras;
c) Teste de Kolmogorov-Smirnov, para uma amostra;
d) Teste de Lilliefors, para k amostras;
e) Teste de Shapiro-Wilk, para n >2 e < 51 e k amostras;
f) Teste para Valores Extremos (Outliers).
16.1.1 INSTRUES
a) Introduzir os dados no grid padro do BioEstat;
b) Dirigir o mouse para o menu superior e clicar em Estatstica;
c) Apontar o mouse em Normalidade, conforme mostra a Figura 14.1
Figura 16.1
Menu
Normalidade.
- 165 -
CAPTULO 16 NORMALIDADE
Figura 16.2
Dados do
Exemplo
16.2.1.
16.2.2 INSTRUES
a) Pressionar o mouse em DAgostino;
b) Selecionar a coluna correspondente amostra do grid geral;
c) Clicar em Executar, para resultados.
Figura 16.3
Resultados
do teste
DAgostino.
O D obtido igual a 0.28118, o qual est contido nos limites dos valores crticos
tabelados ao nvel alfa de 5%, traduzindo um p-valor > 0.05. Aceita-se, portanto, a
hiptese de nulidade.
16.3 TESTE DAGOSTINO-PEARSON
Este teste baseia-se nas medidas de simetria (g1) e curtose (g2) e o p-valor calculado
pelo Qui-Quadrado com 2 graus de liberdade. Este teste deve ser utilizado para
amostras iguais ou maiores que 20 unidades, com uma ou k amostras.
16.3.1 EXEMPLO
O peso (g) de sementes de uma espcie de leguminosa foi calculado de amostra
aleatria de 30 unidades, cujos valores esto inseridos no grid geral.
H0: a varivel peso das sementes da leguminosa normalmente distribuda;
H1: a varivel peso das sementes da leguminosa no normalmente distribuda;
Nvel de deciso: alfa = 0.05.
16.3.2 INSTRUES
a) Pressionar o mouse em DAgostino-Pearson;
b) Selecionar a coluna do grid geral correspondente amostra;
a) Clicar em Executar, para resultados.
- 166 -
CAPTULO 16 NORMALIDADE
Figura 16.4
Dados do
Exemplo
16.3.1
e resultados
do teste
- 167 -
CAPTULO 16 NORMALIDADE
Figura 16.5
Dados das
amostras do
Exemplo
16.5.1.
Figura 16.6
Resultados
das
Amostras
do Exemplo
16.5.1.
- 168 -
CAPTULO 16 NORMALIDADE
16.6.2 INSTRUES
a) Pressionar o mouse em Shapiro-Wilk;
b) Selecionar a coluna correspondente amostra do grid geral;
c) Clicar em Executar, para resultados.
Figura 16.8
Resultados
do Teste de
ShapiroWilk.
- 169 -
CAPTULO 16 NORMALIDADE
16.7.2 INSTRUES
a) Preencher o grid geral com os dados amostrais;
b) Pressionar o mouse em Valores Extremos (base nos desvios);
c) Selecionar a coluna correspondente aos dados;
d) Clicar em Executar;
Figura 16.10
Resultados
do Teste de
Valores
Extremos
(Outliers).
O valor 65 kg considerado um valor extremo com p < 0.05. Se esse escore no for
excludo da amostra, o peso mdio dos peixes ser de 19.418 kg e, com sua excluso,
passa a ser igual a 18.4878 kg. H, portanto, diferena de 0.93 kg entre esses valores
mdios. Deve-se, assim, verificar a origem do valor extremo referido. Como neste
exemplo, n = 50, logo n/10 igual a 5, ento o programa admitiu a possibilidade de
existirem at 5 outliers, como demonstrado na Figura 16.10.
Valor
Extremo = 65
- 170 -
CAPTULO 16 NORMALIDADE
16.8 TESTE DE VALORES EXTREMOS, modelo com base nos quartis (OUTLIERS)
A determinao dos valores extremos pode ser calculada com base nos quartis, onde
os outliers sero:
a) Os escores menores que o limite inferior, com base no primeiro quartil ajustado;
b) Os escores maiores que o limite superior, baseado no terceiro quartil ajustado.
- 171 -
CAPTULO 16 NORMALIDADE
- 172 -
CAPTULO 17
QUI-QUADRADO
17.1 INTRODUO
O teste do Qui-Quadrado um dos mais empregados em pesquisas biomdicas, sendo
aplicado para dados mensurados em escala nominal ou ordinal.
Os testes de aderncia e de independncia do Qui-Quadrado e o teste G j foram
exibidos nos captulos relativos a uma e duas amostras independentes. Por sua vez, os
testes envolvendo vrias amostras sobre o mesmo assunto, tanto de aderncia como o
de n tabelas de contingncia, esto dispostos agora no Captulo 15 sobre MetaAnlise.
Este Captulo, embora abrange os testes de Aderncia e de Independncia, inclui
exemplos apenas dos aplicativos de Partio e de Tendncia:
a)
b)
c)
d)
17.1.1 INSTRUES
a) Dirigir o mouse para o menu superior e clicar em Estatstica;
b) Apontar o mouse em Qui-Quadrado, quando surgir a figura abaixo:
Figura 17.1
Menu do QuiQuadrado.
17.2 PARTIO
O teste de independncia do Qui-Quadrado destinado para vrias amostras dispostas
em tabelas de contingncia l x c: 2 x 3, 3 x 3, 3 x 4 etc. Nessas tabelas, quando o
resultado significativo (p-valor 0.05), no se pode saber com preciso em qual dos
conjuntos testados ocorreu a associao estatstica. A partio dessas tabelas de
contingncia em outras de tamanho 2 x 2, cada uma com um grau de liberdade,
permite esclarecer o problema. Inicia-se a partilha pelo canto superior esquerdo da
tabela geral, combinando-se linhas e colunas at abranger o todo.
17.2.1 EXEMPLO
Efetuou-se levantamento de 250 granjas de trigo, com a finalidade de determinar a
influncia da lagarta sobre a produo do cereal. As granjas foram classificadas em 4
- 173 -
- 174 -
54 59
120
784
IDADE EM ANOS
60 64
65 69
135
162
800
950
70 74
190
950
c)
Figura 17.5
Resultados
do Exemplo
17.3.1.
- 175 -
- 176 -
CAPTULO 18
REGRESSO
18.1 INTRODUO
No estudo de correlao procura-se verificar a magnitude e o sentido da associao
que possa existir entre duas variveis, sem haver qualquer grau de dependncia de
uma em relao outra. No teste de regresso, ao contrrio, a finalidade determinar
a dependncia de uma varivel em relao chamada varivel independente ou
preditora.
O BioEstat contm os seguintes programas de regresso:
a) Anlise de Resduos;
b) Ajustamento de curvas;
c) Regresso linear simples;
d) Regresso linear mltipla;
e) Regresso logstica simples;
f) Regresso logstica mltipla;
g) Polinomial.
18.1.1 INSTRUES
a) Dirigir o mouse para o menu superior e clicar em Estatstica;
b) Apontar o mouse em Regresso, quando surgir a figura abaixo:
Figura 18.1
Menu dos
Aplicativos de
Regresso
.
- 177 -
CAPTULO 18 REGRESSO
18.2.2 INSTRUES
a) Preencher o grid geral com os escores amostrais, representando a primeira coluna
os valores da varivel Y (dependente) e a segunda os escores da varivel X
(independente);
b) Clicar em Linear Simples e selecionar as colunas do grid geral;
c) Clicar em Executar o Teste, para obter os resultados.
Figura 18.2
Dados do
Exemplo
18.2.1
(viso
parcial).
Figura 18.3
Resultados
do Exemplo
18.2.1.
- 178 -
CAPTULO 18 REGRESSO
18.3 REGRESSO LINEAR MLTIPLA
A regresso mltipla linear semelhante regresso linear simples, mas a quantidade
de variveis independentes ou preditoras de duas ou mais.
18.3.1 EXEMPLO
Foi efetuada pesquisa em 12 indivduos do sexo masculino, com idades variando de
30 a 55 anos, determinando-se: Y : creatininemia em mg/dl ; X1: idade em anos; X2:
peso em kg; X3: estatura em cm.
Figura 18.4
Viso parcial
dos dados
do Exemplo
18.3.1.
- 179 -
CAPTULO 18 REGRESSO
O valor de F (regresso) significativo (p = 0.0399), rejeitando-se a hiptese de
nulidade e aceitando-se a alternativa: pelo menos uma das variveis independentes
X1, X2 ou X3 influencia o nvel srico de creatinina. Entre os coeficientes parciais de
regresso somente o b1 estatisticamente significativo (t = 2.3102, p = 0.0496),
sendo, portanto, X1 a varivel que mais explica a variao de Y. O nvel srico de
creatinina (Y) deve aumentar 0.0223 mg/dl para cada acrscimo de uma unidade de X1
(cada ano de idade, a partir de 39 e at 55).
Dados sobre os coeficientes de determinao (R2) e de correlao mltiplos (Ryy) esto
contidos nos resultados, assinalando-se, ainda, a comparao entre os coeficientes
parciais de regresso.
Assinale-se, por fim, que o modelo linear para predio de Y, baseado nas variveis
= 1.9457 + 0.0223X1 + 0.0222X2
X1, X2 e X3, representado pela seguinte equao: Y
+ ( 0.0164X3).
18.4 AJUSTAMENTO DE CURVAS
Em algumas pesquisas, nas quais se procura analisar a relao de dependncia entre
duas variveis, o modelo de distribuio pode no ser linear, eis que os dados podem
se ajustar a uma distribuio exponencial, logartmica ou geomtrica. Torna-se mais
fcil efetuar a regresso das variveis em questo de maneira simultnea, verificandose, pelo coeficiente de determinao, qual a curva que mais se ajusta aos escores
coletados.
18.4.1 EXEMPLO
Supondo-se que, em determinado experimento, os escores amostrais foram
submetidos ao teste de regresso. Os dados sobre as variveis X e Y, independente e
dependente, respectivamente, esto inseridos no grid geral. Efetuar o ajustamento.
Figura 18.6
Dados do
Exemplo
18.4.1.
18.4.2 INSTRUES
a) Preencher o grid geral com os escores amostrais, representando a primeira coluna
os valores da varivel X (independente) e a segunda, os escores da varivel Y
(dependente);
b) Clicar em Ajustamento de Curvas e selecionar as colunas do grid geral;
c) Clicar em Executar o Teste, para obter os resultados.
- 180 -
CAPTULO 18 REGRESSO
Figura 18.7
Resultados
do Exemplo
18.4.1.
- 181 -
CAPTULO 18 REGRESSO
O grfico confirma que o melhor ajuste representado por uma curva logartmica,
conforme indicado pelo coeficiente de determinao (r2) de 98%.
18.5 ANLISE DE RESDUOS
Na anlise de regresso a predio da varivel dependente Y efetuada diretamente
atravs do escore da varivel independente X e dos coeficientes respectivos, pela
equao: Y = a + bX . No entanto, de modo indireto, pode-se examinar a varivel
dependente pela avaliao dos resduos, ou seja, dos escores ei, os quais so obtidos
pela conhecida diferena: ei = ( y i y i ) , que estimam os valores paramtricos i. A
mdia dos resduos sempre igual a zero, obtendo-se a varincia pela equao da
soma dos quadrados e respectivo quadrado mdio.
Essa anlise pode ser til para verificar os seguintes pressupostos:
a) homogeneidade das varincias dos valores de Y;
b) linearidade dos valores observados;
c) normalidade dos escores de Y;
d) presena de valores extremos (outliers).
O exame dos resduos efetuado, em geral, com diagramas de disperso. Desse
modo, aps a anlise residual, conveniente efetuar com os valores obtidos os
referidos grficos.
18.5.1 EXEMPLO 1 (hipottico)
Suponha-se que foi determinada a presso arterial sistlica (P.A.S.) de 12 crianas de
ambos os sexos consideradas normais, cujas idades estavam compreendidas entre 1 e
6 anos (incluindo meses de vida). Os escores esto inseridos no grid geral.
Figura 18.9
Dados do
Exemplo
18.5.1.
- 182 -
CAPTULO 18 REGRESSO
18.5.2 INSTRUES
a) Preencher o grid geral com os escores amostrais, introduzindo na primeira coluna
os valores da varivel X (independente) e na seguinte os valores da varivel Y
(dependente);
b) Orientar o mouse para Regresso e clicar em Anlise de Resduos;
c) Selecionar as colunas correspondentes s variveis X e Y e clicar em Executar,
para resultados.
Figura 18.10
Resultados
do Exemplo
18.5.1.
1Figura 18.11
Grfico de
disperso do
Exemplo
18.5.1.
- 183 -
CAPTULO 18 REGRESSO
A linha contnua horizontal representa a mdia dos resduos valores de Y , a qual
igual zero (0). As linhas tracejadas correspondem a 1 em torno da mdia residual.
Nota-se que h muita diferena entre o valor observado Y11= 172.0000 e o esperado
Y 11= 130.8949, cujo resduo igual a 41.1051, o qual est inserido na Figura 18.10
(ver seta indicativa). Testando-se o conjunto dos resduos, no sentido de verificar se
esse escore pode ser considerado um valor extremo, obtm-se:
Figura 18.12
Valores
extremos.
Constata-se, pelos dados da Figura 18.12, que o resduo 41.1051 foi considerado um
valor extremo (p < 0.05). Esse resduo corresponde P.A.S. igual a 172 mmHg, de
uma criana de 5 anos de idade. Considerando-se essa faixa etria, deve-se rever essa
medio, uma vez que pode ter ocorrido erro do observador, equvoco no registro,
problemas com a aferio do aparelho medidor ou, ainda, hipertenso arterial
verdadeira.
18.5.3 EXEMPLO 2
Pode-se, tambm, testar os valores dos resduos para verificar a normalidade desses
escores. Para isso, escolheu-se o teste de Shapiro-Wilk com os resduos j calculados,
contidos na Figura 18.11 e reproduzidos, de modo isolado, na Figura 18.14:
Figura 18.13
Dados do
Exemplo
18.5.3.
- 184 -
CAPTULO 18 REGRESSO
b) Clicar em Normalidade e pressionar em Shapiro-Wilk;
c) Selecionar a coluna do grid correspondente aos valores dos resduos;
d) Pressionar em Executar, para resultados.
Figura 18.14
Resultados
do Exemplo
18.5.3.
H0: = 0;
H1: 0;
Nvel de deciso: alfa = 0.05.
- 185 -
CAPTULO 18 REGRESSO
18.6.2 INSTRUES
a) Clicar o mouse em Regresso Logstica Simples;
b) Selecionar as colunas do grid geral, comeando pela coluna 1, a qual ser
considerada como a varivel dependente (Y);
c) Clicar em Executar o Teste.
Figura 18.16
Resultados
do Exemplo
18.6.1.
- 186 -
CAPTULO 18 REGRESSO
Os valores estimados de Y so os mesmos anteriores: 78% e 18%, para X1 = 1 e X1 = 0,
respectivamente.
18.7 REGRESSO LOGSTICA MLTIPLA
A regresso logstica mltipla testa uma varivel dependente Y e duas ou mais
variveis independentes, sendo a varivel Y binria, ou seja, assume valores 1
(sucessos) e valores 0 (insucessos). As variveis independentes so geralmente
binrias, mas uma delas pode ser contnua.
18.7.1 EXEMPLO (hipottico)
Uma investigao foi efetuada no sentido de verificar a incidncia de cncer pulmonar
(Y) em relao ao fumo (X1) e ao sexo dos indivduos (X2). O nmero total de
indivduos investigados foi igual a 20, sendo os 6 primeiros contidos na Fig. 18.18.
Figura 18.18
Dados
parciais do
Exemplo
18.7.1
DEFINIES:
Y: Cncer presente = 1; Ausente = 0;
X1: Sexos: Masculino = 1; Feminino =0;
X2: Fumante = 1; No Fumante = 0
H0: 1 = 0; 2 = 0;
H1: 1 0; 2 0;
Nvel de deciso: alfa 0.05.
18.7.2 INSTRUES
a) Clicar o mouse em Regresso Logstica Mltipla;
b) Selecionar as colunas do grid geral, comeando com a coluna 1, a qual ser
considerada a varivel dependente (Y);
c) Clicar em Executar o Teste.
Figura 18.19
Resultados
do Exemplo
18.7.1
- 187 -
CAPTULO 18 REGRESSO
A chance (odds ratio) de neoplasia pulmonar cerca de 9 vezes maior em fumantes e
de 23 vezes se o indivduo fumante e do sexo masculino. Os valores probabilsticos
exatos so estimados (Pi) pela equao:
Logit Pi = -2.9892 + 2.1813 X1 + 3.1450 X2
Com base na equao acima referida, as probabilidades seriam assim calculadas:
a) Para X1 = 0 (no-fumante) e X2 = 0 (sexo feminino):
Logit P1 = -2.9892 + 2.1813 0 + 3.1450 0 = -2.9892
P1 = 1/(1+ EXP(-2.9892)) = 0.0479 = 4.79%;
b) Para X1 = 1 (fumante) e X2 = 0 (sexo feminino):
Logit P1 = -2.9892 + 2.1813 1 + 3.1450 0 = 0.8079
P1 = 1/(1+ EXP(0.8079)) = 0.31 = 31%;
c) Para X1 = 0 (no-fumante) e X2 = 1 (sexo masculino):
Logit P1 = -2.9892 + 2.1813 0 + 3.1450 1 = 0.1558
P1 = 1/(1+ EXP(0.1558)) = 0.54 = 54%;
d) Para X1 = 1 (fumante) e X2 = 1 (sexo masculino):
Logit P1 = -2.9892 + 2.1813 1 + 3.1450 1 = 2.3371
P1 = 1/(1+ EXP(2.3371)) = 0.91 = 91%.
Pode-se obter essas probabilidades diretamente do BioEstat, pressionando-se o boto
Exibir, assinalado pela seta (Figura 18.19), preenchendo-se as caixas de texto da
Figura 18.17 com X1= 1 (fumante) ou 0 (no-fumante.) e X2= 1(sexo masculino) ou
0 (sexo feminino). Pressione Estimar Y, para resultados.
Figura 18.20
Resultados
do Exemplo
18.7.1.
- 188 -
CAPTULO 18 REGRESSO
18.8.1 EXEMPLO (Regresso quadrtica)
Em um experimento de emprego de fosfato (X) e produo de milho (Y), os
resultados obtidos esto inseridos no grid geral (Figura 18.21). Efetuar a regresso
quadrtica para esses dados:
H0: 1 = 0; 2 =0;
H1: 1 0; 2 0.
Nvel alfa = 0.05
18.8.2 - INSTRUES
a) Pressionar o mouse em Polinomial;
b) Escolher uma das regresses polinomiais, que neste exemplo foi a Quadrtica;
c) Selecionar as colunas do grid, comeando com a que representa a varivel Y;
d) Clicar em Executar o Teste, para resultados.
Figura 18.21
Dados do
Exemplo
18.8.1
Figura 18.22
Resultados
do Exemplo
18.8.1
- 189 -
CAPTULO 18 REGRESSO
18.8.3 GRFICO DO EXEMPLO 18.8.1
Pode-se obter um grfico em curva dos dados do Exemplo 18.8.1 executando as
instrues abaixo:
a) Abrir o Exemplo 18.8.1;
b) Clicar Grficos e, a seguir, em Diagrama de Disperso;
c) Selecionar as colunas 2 (X) e 1 (Y), nessa ordem;
d) Pressionar em Executar, para visualizar o grfico;
e) Selecionar o menu Configuraes;
f) Clicar em Fontes e Cores e, a seguir, na opo Elementos do Grfico;
g) Pressionar o mouse no quadrado representando a cor preta (na grade de cores);
h) Selecionar a janela Linhas Auxiliares e, a seguir, em Curva Ajustada, aparecendo
em primeiro plano a palavra Polinomial;
i) Clicar em Polinomial;
j) Clicar em Habilitar para obter a Figura 18.23;
k) Fechar a janela de Configuraes.
Figura 18.23
Grfico de
linha do
Exemplo
18.8.1
Obs. O BioEstat 4.0 dispe tambm de exemplos para as regresses Cbica (Ex
18.08.2) e Qurtica (Ex 18.08.3), com os respectivos grficos.
- 190 -
CAPTULO 19
TAMANHO DAS AMOSTRAS
19.1 INTRODUO
O tamanho amostral est relacionado com o grau de variao dos dados, a magnitude
dos efeitos a serem detectados e o poder do teste desejado. Cumpre salientar que:
a) quanto maior a varincia, maior dever ser o tamanho da amostra, e vice-versa;
b) quanto menor o nvel alfa, maior dever ser o tamanho da amostra;
c) quanto maior o poder do teste, maior dever ser o tamanho da amostra;
d) quanto maior a diferena entre as mdias a serem comparadas, menor poder ser
o tamanho da amostra.
importante obter informaes de outros trabalhos sobre o assunto objeto da
investigao, pois possvel coletar informaes sobre parmetros e/ou estatsticas
da mdia e da varincia, a fim de permitir, com mais preciso, determinar o tamanho
amostral. Pode-se, ainda, efetuar um teste-piloto, cujo tamanho da amostra ficar a
critrio do pesquisador, obtendo-se estatsticas com definies prvias do nvel alfa e
do poder do teste que iro proporcionar os dados necessrios para o clculo do
tamanho amostral.
O BioEstat calcula o tamanho da amostra para os seguintes testes:
i Anlise da varincia;
ii Correlao linear;
iii Teste de McNemar;
iv Proporo: uma amostra;
v Proporo: duas amostras;
vi Qui-Quadrado: 2 x 2;
vii Teste t: uma amostra;
viii Teste t: duas amostras independentes;
ix Teste t: duas amostras pareadas.
19.1.1 INSTRUES
a) Dirigir o mouse para o menu superior e clicar em Estatstica;
b) Apontar o mouse em Tamanho das Amostras, quando surgir a figura abaixo:
Figura 19.1
Menu de
Tamanho
das
Amostras.
- 191 -
- 192 -
- 193 -
- 194 -
Figura 19.5
Tamanho
da amostra:
Uma
Proporo.
- 195 -
- 196 -
BNSE
ENSE
Mdia de peso
2950g
3240g
- 197 -
Desvio padro
468g
470g
- 198 -
- 199 -
- 200 -
CAPTULO 20
TRANSFORMAO DE DADOS
20.1 INTRODUO
As transformaes so procedimentos estatsticos de mudanas de escalas, com a
finalidade de obter a normalidade da distribuio dos escores e a estabilizao da
varincia.
Na distribuio normal os escores amostrais so transformados de modo linear em zescores, cuja mdia igual a zero (0) e o desvio padro igual a um (1). Outras
transformaes no-lineares podem ser efetuadas para atender ao modelo de
distribuio normal, sobretudo quando os escores brutos apresentam acentuada
assimetria ou quando mdias muito grandes so acompanhadas por varincias
tambm muito elevadas, com perda da normalidade, da homogeneidade e da
homocedasticidade.
O BioEstat apresenta os seguintes programas de transformaes:
a) Box e Cox;
b) Exponencial;
c) Logaritmo natural (neperiano);
d) Logaritmo decimal;
e) Percentual;
f) Quadrado;
g) Raiz quadrada;
h) Ordinal (rank);
i) Recproca.
Algumas indicaes so oferecidas nos textos de Estatstica sobre a escolha do
modelo de transformao dos escores brutos coletados.
A transformao logartmica, por exemplo, indicada quando os valores numa
distribuio linear so multiplicativos, como crescimento bacteriano, ou quando a
distribuio muito assimtrica, sendo indicada tambm em dados de pH. Esta
transformao no admite, obviamente, valores negativos ou nulos. Quando o escore
for zero, o programa adiciona 1 a todos os valores.
A transformao em raiz quadrada sugerida em variveis referentes a medidas de
superfcie ou em variveis discretas nmero de leuccitos por mm3, nmero de
filhos por casal etc. Emprega-se, tambm, quando o modelo de distribuio dos
escores brutos o de Poisson, no qual a mdia e a varincia tm o mesmo valor (np).
Com essa transformao a varincia e a mdia tornam-se independentes.
Quando o valor da varivel for zero, o programa acrescenta 0.5 a todos os valores.
A transformao ordinal (rank) designada para distribuies muito assimtricas,
sendo largamente usada nos testes no-paramtricos correlao de Spearman,
anlise de varincia de Kruskal-Wallis etc.
- 201 -
CAPTULO 20 TRANSFORMAO
Pode-se efetuar a transformao ordinal (rank) pela ordem numrica ou alfabtica, de
modo crescente ou decrescente. Algumas vezes h necessidade de ordenar um
conjunto de colunas, sendo a primeira aquela que conduzir os respectivos valores das
demais.
A transformao recproca empregada em pesquisas cujos escores envolvem
diluies, como ocorre em titulaes sorolgicas. Quando houver zeros entre os
dados, no dever ser usada essa transformao.
Box e Cox desenvolveram um procedimento a fim de estimar a melhor transformao
para obter a normalidade de um conjunto de escores. Trata-se de um modelo de
funo de mxima-verossimilhana, podendo o usurio, por esse mtodo, verificar
qual a transformao sugerida para seus dados.
Recomenda-se, todavia, ponderar as vantagens e as desvantagens da transformao de
dados. Quando ocorrer dvida, prefervel manter os escores originais e utilizar testes
no-paramtricos.
Figura 20.1
Menu de
transformao.
20.1.1 EXEMPLO 1
Determinaram-se as estatsticas dos dados inseridos no grid, verificando-se que a
varincia cerca de 25 vezes maior que a mdia, sendo a curva assimtrica positiva.
A transformao dos escores foi efetuada escolhendo-se, a ttulo ilustrativo, a
logartmica (natural), a raiz quadrada e a recproca, cujos valores esto contidos na
Figura 20.2. Os dados originais, contidos na coluna 1 do grid geral, foram ainda
submetidos ao procedimento de Box e Cox, cujo resultado est contido na Figura 20.3.
Figura 20.2
Dados do
Exemplo
20.1.1.
- 202 -
CAPTULO 20 TRANSFORMAO
20.1.2 INSTRUES
a) Preencher o grid geral com os escores amostrais;
b) Dirigir o mouse para o menu superior e clicar em Estatstica;
c) Apontar o mouse em Transformaes;
d) Clicar em Ln, selecionar a coluna correspondente aos valores originais;
e) Informar, ento, a coluna a ser preenchida com os valores transformados;
f) Repetir os passos d e e, para as demais transformaes.
g) Para o procedimento Box e Cox, efetuar a, b e c, pressionando a seguir nessa
opo.
Figura 20.3
Box e Cox
Figura 20.4
Estatstica
descritiva dos
dados
originais e
dos transformados.
- 203 -
CAPTULO 20 TRANSFORMAO
20.1.3 EXEMPLO 2 (hipottico)
Foram inseridos no grid geral os dados referentes a diversos municpios de um estado
brasileiro e respectivos valores da populao e da rea municipal em quilmetros
quadrados.
Figura 20.5
Dados do
Exemplo
20.1.3.
20.1.4 INSTRUES
a) Preencher o grid geral com os municpios selecionados e respectivos valores das
populaes e reas;
b) Dirigir o mouse para o menu superior e clicar em Estatstica;
c) Apontar o mouse em Transformaes e clicar em ordinal, pressionando em
ordem alfabtica ou numrica, a qual, neste exemplo, alfabtica;
d) Selecionar as colunas do grid de interesse, comeando com a coluna que ir
comandar as demais;
e) Escolher entre ordem crescente ou decrescente, e que, neste caso, foi crescente.
Figura 20.6
Rank
Alfabtico.
- 204 -
CAPTULO 21
GRFICOS E TABELA
21.1 INTRODUO
Os grficos constituem importantes instrumentos de comunicao rpida, clara e
efetiva, poupando, sobretudo, tempo e esforo na visualizao de dados resumidos,
permitindo fixar uma imagem duradoura, da o largo uso dessas representaes em
trabalhos estatsticos. As tabelas de freqncia permitem, tambm, condensar os
escores de modo a torn-los de fcil compreenso.
O BioEstat apresenta os seguintes grficos e tabelas de freqncia:
a) rea;
b) Box Plot: mediana e quartis;
c) Box Plot: mdia e desvios;
d) Caule e Folha (Stem and Leaf);
e) Colunas;
f) Diagrama de Disperso;
g) Diagramas IC e Pontual, Captulo 24;
h) Histograma;
i) Linha (Curva);
j) Mnimo e Mximo;
k) Pirmide Populacional, Captulo 24;
l) Polar;
m) Setor;
n) Tabelas de Freqncia.
21.1.1 INSTRUES
Dirigir o mouse para menu e clicar em Grficos, quando surgir a figura abaixo;
Figura 21.1
Menu
Grficos.
- 205 -
21.2.2 INSTRUES
a) Clicar em rea;
b) Selecionar as colunas do grid e pressionar em Executar.
Figura 21.3
Grfico de
rea do
Exemplo
21.2.1
- 206 -
21.3.2 INSTRUES
a) Clicar em Box Plot: mediana e quartis;
b) Selecionar as colunas do grid e pressionar em Executar, para resultados.
Figura 21.5
Colunas
selecionadas
para Box-Plot
O grfico compara valores das presses arteriais sistlicas nos perodos de viglia e de
repouso noturno (sono), o mesmo ocorrendo com as diastlicas. As posies e as
- 207 -
- 208 -
Figura 21.9
Grfico BoxPlot do
Exemplo
21.4.1
Outliers
Caule
52
46
115
5
Folha
3
7
8
2
- 209 -
Preciso da Folha
Unidade
Centsimo
Dcimo
Dezena
= 87
= 119
= 119.8
= 0.29
= 0.05
21.5.2 INSTRUES
a) Clicar em Caule e Folha (Stem and Leaf);
b) Selecionar a coluna do grid e pressionar o mouse em Executar;
c) O formulrio, mostrado na Figura 21.11 (lado direito), indica o maior e o menor
escore e a amplitude dos dados; deve-se, com um clique do mouse, indicar o nvel
de preciso da folha, que neste caso foi a unidade, e o nmero de linhas por
classe, o qual, neste exemplo, foram 2;
d) Pressionar em Exibir Diagrama, para resultados (Figura 21.11).
A figura abaixo ilustra a configurao
que precede a exibio do diagrama
de Caule e Folha.
Note a importncia da escolha
adequada do item Nvel de Preciso
da Folha.
Figura 21.11
Grfico de
Caule e Folha
do Exemplo
21.5.1
- 210 -
21.6.2 INSTRUES
a) Clicar o mouse em Colunas e pressionar em Simples;
b) Selecionar as duas colunas do grid e pressionar o mouse em Executar.
Para visualizar as Barras
de Erro, selecione na janela de Configuraes a
opo Outras e escolha
o tipo de Barra de Erro
conforme disponvel na
parte inferior da janela.
Figura 21.13
Grfico de
Colunas
do Exemplo
21.6.1
- 211 -
21.6.4 INSTRUES
a) Clicar o mouse em Colunas e pressionar em Justapostas;
b) Selecionar as trs colunas do grid e pressionar em Executar.
Figura 21.15
Grfico de
Colunas
justapostas
do Exemplo
21.6.3
- 212 -
- 213 -
A figura abaixo
ilustra o resultado
do teste de
Correlao Linear
do Exemplo 21.7.1.
- 214 -
Figura 21.20
Viso parcial
dos dados
do Exemplo
21.8.1
= 45
= 63
= 93
= 77,067
= 8,0068
= 76
21.8.2 INSTRUES
a) Pressionar o mouse em Histograma;
b) Selecionar a coluna do grid geral e clicar em Executar;
c) Preencher o formulrio Especificao das Classes (Fig.21.21):
i Tipo de Limites de Classes: inferior fechado e superior aberto ( | );
ii Mantenha o contedo da caixa de texto Nmero de Classe (6);
iii Ajuste os Limites Superior e Inferior, 96 e 60, respectivamente;
iv - O Limite Inferior no poder ser maior que o Limite Inferior da Amostra,
o qual corresponde ao menor valor amostral, 63 neste caso;
v O Limite Superior no poder ser menor que o Limite Superior da
Amostra, correspondente ao maior valor amostral, 93 neste exemplo;
d) Pressionar o boto Confirmar para obter o Histograma.
Figura 21.21
Histograma
do Exemplo
21.8.1
- 215 -
A figura abaixo
ilustra a configurao
para exibio
do polgono de
freqncia.
- 216 -
21.9.2 INSTRUES
a) Clicar em Linha (Curva);
b) Selecionar as colunas do grid e pressionar em Executar.
Figura 21.25
Grfico de
linha do
Exemplo
21.9.1
- 217 -
Legenda:
1: PMS-F presso mxima sistlica,
sexo feminino;
2: PMS-M presso mxima sistlica,
sexo masculino;
3: PMD-F presso mxima diastlica,
sexo feminino;
4: PMD-M presso mxima diastlica,
sexo masculino.
21.10.2 INSTRUES
a) Clicar em Mximo e Mnimo;
b) Selecionar as colunas do grid e pressionar em Executar.
Figura 21.27
Grfico de
Mximo e
Mnimo do
Exemplo
21.10.1
- 218 -
21.11.2 INSTRUES
a) Introduzir os dados no grid geral do BioEstat;
b) Apontar o mouse em Grficos;
c) Clicar em Polar;
d) Selecionar as colunas do grid e pressionar o mouse em Executar.
Figura 21.29
Resultados
do Exemplo
21.11.1
- 219 -
21.12.2 INSTRUES
a) Clicar em Setor;
b) Na janela do grfico selecione Configuraes;
c) Na aba Outras, selecione entre Absolutos ou Percentuais;
e) Selecionar as colunas do grid e pressionar o mouse em Executar.
Para destacar uma ou mais
fatias do grfico de setor,
pressione o menu
Configuraes, selecione
a janela Fontes e Cores,
clique no boto Elementos
do grfico, selecione o
nmero do(s) elemento(s)
desejado(s) e marque a
caixa Destacar.
Figura 21.31
Grfico de
setor do
Exemplo
21.12.1
- 220 -
- 221 -
Figura 21.35
Tamanho dos
caracteres.
3.
4.
5.
- 222 -
- 223 -
21.14.2 INSTRUES
a) Pressionar o mouse em Tabelas de Freqncia;
b) Selecionar a coluna do grid geral e clicar em Executar;
c) Preencher o formulrio Especificao das Classes (Fig.21.39):
i Tipo de Limites de Classes: inferior fechado e superior fechado ( || );
ii Aumente o contedo da caixa de texto Nmero de Classes para 7;
iii Ajuste os Limites Superior e Inferior, 73 e 32, respectivamente;
iv - O Limite Inferior no poder ser maior que o Limite Inferior da Amostra,
o qual corresponde ao menor valor amostral, 33 neste caso;
v O Limite Superior no poder ser menor que o Limite Superior da
Amostra, correspondente ao maior valor amostral, 70 neste exemplo;
d) Pressionar o boto Confirmar para obter Tabela de Freqncia.
Figura 21.39
Formulrio
Especificao
das Classes
- 224 -
Figura 21.40
Tabela de
Freqncia
do Exemplo
21.14.1
- 225 -
- 226 -
CAPTULO 22
FRMULAS ESTATSTICAS
22.1 INTRODUO
Neste captulo esto dispostas as frmulas dos testes estatsticos contidos no BioEstat.
22.2 ANLISE MULTIVARIADA
22.2.1 COMPONENTE PRINCIPAL
a) Matriz de covarincia:
c11 c12
c
21 c 22
C=
c p1 c p 2
c1 p
c 2 p
;
c pp
b) Autovalores:
1 + 2 + 3 + + p = c11 + c 22 + c33 + + c pp ;
c)
1 2 3 p 0 ;
d) Autovetores:
a i1 , a i 2 , , a ip ;
e)
f)
var (Z i ) = i .
dij = xik x jk 2 .
k =1
k =1
( ki kj )2 .
pVk
- 227 -
) (
Dij2 = ri rj v rs si sj
r =1 s =1
).
C=
{(n1 1) C1 + (n2 1) C2 } ;
n1 + n2 2
b) Teste de Hotelling:
T2 =
n1n2 ( x1 x2 )' C 1 ( x1 x2 )
;
n1 + n2
= n 1 ( p m ) ln[T / W ].
2
S (t ) S (t + t )
.
h(t ) =
S (t )
t
22.3.2 KAPLAN-MEIER
k nj d j
S (t ) =
nj
j =1
- 228 -
var ln S (t ) = var ln p j .
j =1
O = ai ;
i =1
k
+ bi )(ai + ci )
;
Ni
i =1
k (a + b )(c + d )(a + c )(b + d )
i ;
V = i i i 2i i i i
i =1
N i ( N i 1)
E=
2
X LR
(ai
( O E 0.5)2 .
V
r
1
i =1
i
Ai ) ; Z = U I .
n1+ n2
Var (W ) =
n1n 2
i =1
U i2
(n1 + n2 )(n1 + n2 1)
- 229 -
Z = W Var (W ) .
SQblo cos =
X .j
t
X ..2
; SQerro = SQtotal SQtratamentos SQblocos;
rt
- 230 -
.
Q=
N
N
2
k Li Li
i =1
i =1
22.5 CORRELAO
22.5.1 CONTINGNCIA C
r
2 =
(Oij Eij )2 ;
Eij
i =1 j =1
C=
2
N + 2
Rj
R j
N
kW 1
; r
;
W=
S av =
k 1
1 2 3
k N N
12
k = nmero de conjuntos de postos;
N = nmero de indivduos.
=
z=
S
1
N ( N 1)
2
2(2 N + 5) ;
9 N ( N 1)
- 231 -
rxy. z =
1 rxz2
2
r yz
gl = N 3.
XY ( X )( Y ) / n
r=
X ( X ) / n Y ( Y ) / n
n = nmero de pares (X, Y);
gl = n 2;
r n2 .
t=
1 r 2
2
phi = r =
ad bc
rs = 1
t = rs
6 Di2
N ( N 2 1)
N 2 .
1 rs 2
- 232 -
P( x ) =
xe ;
x!
( N k )!
k!
x ! (k x ) ! (n x ) ! (( N k ) (n x )) ! .
P( x ) =
N!
n !(N n )!
E(x) = = n
- 233 -
P( x 0) = e x
P( x 0) = e x , sendo > 0.
22.6.5 DISTRIBUIO NORMAL
=
2
X = mdia;
N
2
2
X ( X ) / N = varincia;
=
N
= 2 = desvio padro;
Y=
e(x )
2 / 2 2
= equao da curva normal;
Y = freqncia;
X = escore bruto;
e = 2.71828 (constante matemtica, base dos logaritmos neperianos);
= 3.1416 (constante matemtica);
X
= escores padronizados.
z=
c
d
Total
a+c
b+d
Total
a+b
c+d
a+b+c+d
a
d
100 = sensibilidade;
100 = especificidade;
a+c
b+d
a
100 = valor preditivo do teste positivo;
a+b
d
100 = valor preditivo do teste negativo;
c+d
a+c
= prevalncia.
a+b+c+d
- 234 -
NA = Nmero de pacientes
NN = Nmero de sadios
Ponto de Corte = 1 especificidade, sensibilidade
rea =
i =1
)
)(
Q3 = rea (1 rea ) ; Q4 = (NA 1) (Q1 - rea )
Q5 = (NN 1) (Q2 - rea ) ;
Q1 = rea/(2 rea);
Q2 = 2 rea 2 / 1 + rea
Erro padro =
d = (1 Sensibilidade )2 + (1 Especificidade )2
Eixo das ordenadas (Y) = Sensibilidade
Eixo das abscissas (X) = 1 Especificidade (Falso-positivos)
Pr( Bi A) =
Pr( A Bi ) Pr( Bi )
k
Pr( A B j ) Pr( B j )
j =1
1.36
, para = 0.05;
1.63
, para = 0.01.
2 =
(O E )2 ;
E
- 235 -
(Yates ) =
( O E 0.5)2 ;
E
gl = k 1.
22.7.3 TESTE G (aderncia)
N = tamanho da amostra;
Quando p < p0 : p(valor ) = 2 ( p p 0 )
Quando p p 0 :
( p0 q 0 ) / N ];
p(valor ) = 2{1 [( p p 0 ) ( p 0 q 0 ) / N ] }.
Xi
; sx = s / n ;
n
X
; gl = n 1.
t=
sx
X=
22.7.6 TESTE Z
= mdia da populao;
n = tamanho da amostra;
X
i
; x = / n ;
X=
n
Z=
0
p = 2 1
k
!
k =0
x e 0 0k
p = 2
k = 0 k !
quando x < 0
quando x 0.
- 236 -
p=
NB = tamanho da 2a amostra;
NA NB
NA + NB
; D 1.36
, para = 0.05;
NA + NB
NA NB
NA + NB
, para = 0.01.
D 1.63
NA NB
2 = 4D 2
n1 (n1 + 1)
n (n + 1)
R1 , ou U = n1n2 + 2 2
R2 ;
2
2
nn
(n1 )(n2 )(n1 + n2 + 1) = desvio padro;
U = 1 2 = mdia; U =
2
12
U U
; p(valor) = 2 [1 ( z )] .
z=
U = n1n2 +
- 237 -
N AD BC
2
;
X2 =
( A + B )(C + D )( A + C )(B + D )
gl = 1.
22.8.5 TAXA DE INCIDNCIA
E1 =
V1 =
(a1 + a 2 )t1
t1 + t 2
(a1 + a2 )t1t 2
(t1 + t 2 ) 2
a1 E1 + 0.5
V1
Total
n1
n2
N
p1 = a/n1; q1 = 1 p1;
p2 = c/n2; q1 = 1 p2;
( O E .5) ;
ad p1q 2 ; 2
X =
OR =
=
E
bc p 2 q1
2
C1 = ln(OR) 1.96 1 + 1 + 1 + 1 ;
a b c d
C2 = ln(OR) + 1.96 1 + 1 + 1 + 1 ;
a b c d
IC(95%): 2.71828C1 OR 2.71828C2;
IC vlido somente quando:
n1p1q1 5 e n2p2q2 5.
- 238 -
(Oij Eij )2 ;
i =1 j =1
r k
Yates
E ij
( Oij Eij
0.5
)2 ;
Eij
i =1 j =1
gl = (r 1)(k 1);
Correo de Yates: somente quando gl = 1.
22.8.8 RISCO RELATIVO
Tabela de contingncia 2 x 2:
Sucesso
Insucesso
Amostra 1
a
b
Amostra 2
c
d
Total
na
nb
Total
n1
n2
N
p1 = a/n1; q1 = 1 p1;
p2 = c/n2; q1 = 1 p2;
ad p1q 2
;
RR =
=
bc p 2 q1
X2 =
( O E .5)2 ;
E
C1 = ln(RR) 1.96
b
d ;
+
an1 cn2
C2 = ln(RR) + 1.96
b
d ;
+
an1 cn2
C2
RR 2.71828 ;
IC(95%): 2.71828C1
IC vlido somente quando:
n1 pq 5 e n 2 pq 5 .
p =
Z=
n1 p1 + n2 p 2
, q = 1 p ;
n1 + n2
p 1 p 2
p q (1 / n1 + 1 / n 2 )
- 239 -
p(valor) = 2[1 (Z )] , se Z 0;
p(valor) =
2 (Z ) , se Z < 0.
X 1 = X 1 / n1 ;
X 2 = X 2 / n2 ;
(n 1)s12 + (n 2 1)s 22
s dif = 1
n1 + n 2 2
1
1 ;
+
n
n
2
1
t = X 1 X 2 / s dif ;
gl = n1 + n2 2.
22.8.11 TESTE Z
n1 = tamanho da amostra 1;
X 1 = X 1 / n1 ;
Z=
X2
n2 = tamanho da amostra 2;
= X 2 / n2 ;
X1 X 2
;
x x
1
;
CV1 CV2
Z=
V2
V p2
p
2
n 1 + n 1 0.5 + V p
1
2
p-valor = 2 (1 - (z)).
Vp =
- 240 -
K=
po pe
;
1 pe
N (1 pe )2
i =1
1
se(K ) =
Z=
K ;
se( K )
p (valor ) = 1 (Z ) .
22.9.2 TESTE DE McNemar
NA = total de pares discordantes tipo A;
ND = total de pares discordantes;
Para ND 20:
2
1
ND ;
X = N A D
2
2
4
p (valor ) = Pr 12 X 2 ;
2
ND
ND 1
quando NA < ND/2;
p = 2
k =0 k 2
ND
ND
N D 1 quando N N /2.
p = 2
A
D
k=NA k 2
ND
1
;
2
Z=
2x 1 n
k =0
T =
N ( N + 1)
;
4
- 241 -
T =
sD =
sD =
t=
(D D ) ;
N 1
sD
2
D ; gl = N 1.
sD
j =1
i =1 j =1
- 242 -
X =
Xi
i =1
22.10.3 MEDIANA
a) quando o nmero de observaes for mpar:
Md = valor da posio n + 1 ;
2
b) quando o nmero de observaes for par:
n
n
Md = mdia dos valores das posies e + 1 .
2 2
22.10.4 VARINCIA
Xi X
s =
n 1
2
)2
2
X i ( X i ) / n .
ou s =
n 1
2
22.10.5 DESVIO-PADRO
s = s2 .
22.10.6 ERRO-PADRO
sx =
s .
n
CV =
s
100 .
X
(
= (X
= (X
);
X) ;
X) .
m2 = X i X
m3
m4
- 243 -
g1 =
n m3
(n 1) (n 2) 3
g1 = 0: curva simtrica;
g1 > 0: curva assimtrica positiva;
g1 < 0: curva assimtrica negativa.
22.10.10 COEFICIENTE DE CURTOSE
g2 = [n (n + 1) m4 3 m2 m2 (n 1)] ;
(n 1) (n 2) (n 3) 4
g2 = 0: curva normocrtica;
g2 > 0: curva leptocrtica;
g2 < 0: curva platicrtica.
GM =
X i , ou ln(G) =
i =1
ln( X i )
n
GM = antiln(G).
ln( X i )
ln( X 1 ) V1 ;
V1 =
; V2 =
n 1
n
antiln(V2 )
Vargeomtrica =
.
ln(10)
D1 = V2 ; Desvio-padrogeomtrico = antiln(D1).
- 244 -
Xi ;
n
X =
b) De intervalos:
s ;
n
sx =
IC(95%):
IC(99%):
p=k ;
n
b) De intervalos:
p (1 p )
;
n
p =
IC(95%):
p 1.96 p ;
IC(99%):
p 2.58 p .
22.11.3 ESTIMAO DA DIFERENA ENTRE DUAS MDIAS
a)
De ponto
E= X
Xj
Xi ;
;
XB =
nB
nA
A
XB ;
b) De intervalos:
- 245 -
12
( x1 x2 ) =
n1
s12 s22
22 ou s
+
( x1 x2 ) =
n1
n2
IC(95%):
X A X B 1.96 ( x1 x2 ) ou
n2
(X A X B ) t.05(gl ) s( x x )
1
IC(99%):
X A X B 2.58 ( x1 x2 ) ou X A X B t.01(gl ) s( x1 x2 )
( p 1
p2
) =
p1q1
+
n1
IC(95%): ( p1 p2 ) 1.96 ( p1 p2 ) ;
IC(99%): ( p1 p2 ) 2.58 ( p1 p 2 ) .
22.11.5 DENSIDADE E TAMANHO DA POPULAO
A = nmero total de quadros da rea investigada;
n = nmero de quadros selecionados de modo randmico;
a = tamanho de cada quadro;
m=
mi
= mdia de indivduos por quadro;
n
m
a
= estimador da densidade;
;
V =
an
M = A = populao estimada ;
IC(95%): M 1.96 V M ;
()
IC(99%): M 2.58
( )
V (M ) .
- 246 -
q(q+2r)
2pq
(B)
(AB)
-----------------------------------------------------------------------Funo logartmica de mxima verossimilhana:
L = (O) 2 ln r + (A){ln p + ln (p + 2 r)}+ (B){ln q + ln (q + 2r)}+ (AB)(ln p + ln q).
Substituindo:
x = p/r; y = q/r;
1 + x + y = 1/r;
Assim,
L = -2N ln(1 + x + y) + {(A) + (AB)}ln x + {(B) + (AB)}ln y + (A) ln (2 + x)+ (B)ln (2
+ y).
Estimao inicial:
B
AB
BB+BO
AB
[O ] ;
p ' = 1 [B ] + [O ] ;
q ' = 1 [ A] + [O ]
;
Total = 2 [ A] + [O ] [B ] + [O ] + [O ] ;
D 1 r p q = [ A] + [O ] + [B ] + [O ] [O ] 1.
r' =
2=
) (
)(
q' 2 q'
q ' + D q ' + D + 2r '
+
q
q + 2r
);
sendo:
r = (r+ D) (1 + D);
p = p(1 + D);
q = q(1 + D);
--------------------------------------------Total = (1 + D) (r+ p+ q+ D)
Sistema MN:
(m) = 2 (MM) + (MN);
(n) = (MN) + 2(NN);
- 247 -
(mn ) / 2G .
S k = Z k ; Ak = [2 ( N W )] S k ;
k =1
M +1
U = Ak ; H = (1/W) + U + A1;
k =2
D = N H (2 L ) = densidade ;
V = [1 ( N 1)] (1 W ) A2 + (2 W ) A 2 ;
1
) (
DA = ( N H ) (2 L ) ; DB = N N 2 + V H 2 ;
DD =
DA 2 DB : desvio padro;
p =
s
= proporo de animais marcados na 2a captura;
n
- 248 -
nt
t 2n (n s ) ;
= populao estimada; p =
N =
s
s3
IC (95%): N 1.96 p ;
IC (99%): N 2.58 p .
p =
s
= proporo de animais marcados (2a captura);
n
nt
t 2n (n s ) ;
N = = populao estimada; p =
s
s 2 (s + 1)
IC (95%): N 1.96 p ;
IC (99%): N 2.58 p .
22.11.10 TAMANHO DE POPULAO FECHADA (amostragem mltipla)
Mtodo de Schumacher e Eschmeyer
s
2
ni M i
N = i = 2
s
mi M i
i =2
s
mi M i
2
s m
(s 2) ~ 2 = i i =s2
n
2
i =2 i
ni M i
i =2
- 249 -
IC =
s
2
ni M i
i=2
1/ 2
s
~2 s
2
mi M i t s 2 ( / 2) ni M i
i =2
i=2
N o = M o / o
IC =
M o / ( o t n 2 ( / 2) o )
22.12 META-ANLISE
22.12.1 DerSimonnian-Laird
k
w = w1 k ;
s w2 =
i =i
1 k 2
wi kw 2
k 1 i =1
s2
U = (k 1) w i ; 2 = 0 if Q k 1
kw
= (Q (k 1)) / U if Q > k 1
k
k
1
wi* =
;
T.RND = wi*Ti / wi*
2
i =1
i =1
(1 / wi ) +
T.RND z / 2 /
i =1
i =1
22.12.2 MANTEL-HAENSZEL
Tabelas de Contingncia 2 x 2:
Teste Exposto No-exposto
+
ai
bI
ci
dI
Total ai + ci
bi + dI
Total
ai + bi
ci + di
ni
- 250 -
E=
i =1
V=
(ai + bi )(ai + ci ) ;
(ai
ni
i =1
2
=
X MH
(OE
ni2
(n i
0. 5 )
1)
gl = 1.
2 log( p i ) ;
i =1
Exposto
No-exposto
Total
Doente
No-doente
Total
n11
n21
n1
n12
n22
n2
n1
n2
n
s i = 1 / n11 + 1 / n12 + 1 / n 21 + 1 / n 22 ;
2
X A2
k
k
n11 (i ) n1 (i )n1 (i ) / n (i )
i =1
i =1
;
=
k n (i )n (i )n (i )n (i )
2
1
2
1
2
i =1
n (i ) (n (i ) 1)
- 251 -
X H2 =
s i2
A2 ; glA = 1; glH = k 1.
xy
bw =
i =1
n
i =1
n
SS 2 = y 2
( xy )2 ,
i =1
i =1
bi + d i
ni
i =1
a i
=
;
k a +c
i
i
bi
ni
i =1
k
RR MH
n i = a i + bi + c i + d i
zi =
1
[ln (1 + ri ) ln (1 ri )] ;
2
- 252 -
SS 3 / gl 3
.
SS1 / gl1
X2
(ni 3)z i
k
i =1
; gl = k 1.
= (ni 3)z i2
k
i =1
(ni 3)
i =1
p =
xi
i =1
k
ni
i =1
2
ni p )
=
; gl = k 1 ;
i =1 n p
(
)
1
p
i
2
; q = 1 p ;
(xi
22.13 NORMALIDADE
22.13.1 DAGOSTINO
n
D=
(i n + 1 / 2) x(i)
i =1
(x
i =1
x)
;
2
22.13.2 DAGOSTINO-PEARSON
K2 = Z 2 + Z 2
g1
g2
gl = 2
22.13.3 KOLMOGOROV-SMIRNOV
k = nmero de postos;
N = tamanho da amostra;
= mdia da populao; = desvio padro paramtrico;
Fo(X) = distribuio terica acumulada sob H0;
- 253 -
22.13.4 LILLIEFORS
k = nmero de postos;
N = tamanho da amostra;
Mdia e desvio padro amostrais;
Fo(X) = distribuio terica acumulada sob H0;
Sn(X) = distribuio amostral acumulada;
D = mximo |Fo(X) Sn(X)| = desvio mximo;
D
0.886
, para = 0.05;
N
1.031
, para = 0.01.
D
N
22.13.5 SHAPIRO-WILK
V = cov (xi , xj);
m = (m1 + m2 , ..., mn)
1
m,V y
yi
y=
;
= , 1m ;
mV
n
R2 = m V 1 m; C 2 = m V 1 V 1 m;
n
S2 = ( y y )2 ; b = R 2 / C
1
W =
b2
C 2S 2
22.14 QUI-QUADRADO
22.14.1 AMOSTRAS INDEPENDENTES
r = nmero de linhas;
k = nmero de colunas;
2
(Oij Eij )2 ;
r k
i =1 j =1
r k
2Yates =
Eij
i =1 j =1
Eij
gl = (r 1)(k 1);
Correo de Yates: somente quando gl = 1.
- 254 -
22.14.2 PARTIO R x C
Parties:
R = linha; C = coluna;
Exemplo:
Tabela 3 x 4 = 3R x 4C
N11
N21
N31
n12
n22
n32
n13 n14
n23 n24
n33 n34
A
C
B
D
C = n21; D = n22.
B = n13 + n23;
D = n33.
- 255 -
p = x / n = proporo geral de
xi = sucessos no grupo i;
p i = xi/ni = proporo de sucessos no
grupo i;
n = nmero total de unidades;
q = 1 p = proporo geral de
sucessos;
Si = escore da varivel do grupo i;
insucessos;
k
k
k
2
;
A = xi S i x S B = pq ni S i ni S i n ;
i =1
i =1
i =1
= a + bX : Linear;
Y
Y
= a + b ln(X) : Logartmica;
b=
( XY ) ( X )( Y ) / n ;
2
2
X ( X ) / n
a = Y bX ;
a Y + b XY ( Y )2 / n ;
R2 =
2
2
Y ( Y ) / n
Variveis:
Linear:
Xi = Xi ; Yi = Yi ; a = a.
Exponencial:
Xi = Xi ; Yi = ln(Yi); a = ln(a).
- 256 -
Yi = Yi ; a = a.
Yi = ln(Yi); a = ln(a).
Mdias:
X = X/n; Y = Y/n;
Exponencial: X = X/n; Gm(Y) = antiln [ln(Y)/n];
Logartmica: Gm(X) = antiln [ln(X)/n]; Y = Y/n;
Linear:
X=
bY =
Xi
Yi
; Y=
;
n
n
XY ( X )( Y ) / n ;
2
2
X ( X ) / n
a = Y bY X ; Y = a + bYX ;
x2 = X2 (X)2/n; y2 = Y2 (Y)2/n;
xy = XY (X)(Y)/n;
2
2
xy
; r = (r) ;
r=
2
2
x y
t=
r n 2 ; gl = n 2.
1 r2
- 257 -
X=
1 X n1 X n 2 X nm
n
x1
x2
x
2
x1
x1 x 2
1
2
X X = x 2 x 2 x1
x2
x m x m x1 x m x 2
b0
Y1
b
Y
1 ;
2 ;
b =
Y =
n 1 p 1
Yn
b p 1
xm
x1 x m
x2 xm ;
x m
1
b = (X' X ) (X' Y ) ;
p 1
p p
p 1
a = Y b1 X 1 b2 X 2 b p 1 X p 1 ; y i = a + b j xij ;
j =1
Teste F:
H0: b1 = b2 = b3 = = bp-1 = 0;
H1: bi 0;
i =1
i =1
SQtotal = ( yi y )2 ; SQerro = ( yi y )2 ;
SQregresso
gl regresso
QM regresso
QM erro
; QM erro =
SQerro
;
gl erro
F(gl) = k, n k 1.
p=
1
;
x
1 1 + ... + k x k )
1+ e
logit (pA) = + 1x1 + ... + j-1 xj-1 + j(1) + j+1 xj+1 + ... + kxk
logit (pB) = + 1x1 + ... + j-1 xj-1 + j(0) + j+1 xj+1 + ... + kxk
- 258 -
j = ln
OR = e j ;
z=
j
SE ( j )
Anlise de varincia:
Modelos de Regresso
i) Linear:
Y = a + b1X;
Estatstica F =
R12
( 1 R ) / (N 2 )
2
1
GL regresso = 1
GL erro
=N-2
ii) Quadrtica:
Y = a + b1X + b2X2;
Estatstica F =
R22 / 2
(1 R )/(N 3) ;
2
2
GL regresso = 2
GL erro
=N3
iii) Cbica:
Y = a + b1X + b2X2 + b3X3;
R2 / 3
3
;
Estatstica F =
1 R 2 / ( N 4)
3
GL regresso = 3
GL erro
=N4
iv) Qurtica:
Y = a + b1X + b2X2 + b3X3 + b4X4;
- 259 -
GL regresso = 4
GL erro
= N-5
n=
2 (z1 + z1 )2
( 0 1 )
b) Teste bilateral:
n=
2 (z1 / 2 + z1 )2
( 0 1 )
n=
s d2 z1 + z1
(D)2
)2 ;
b) Teste bilateral:
n=
s d2 z1 / 2 + z1
(D)2
)2 .
n=
b) Teste bilateral:
n=
- 260 -
(z1 / 2 + 2 z1
n=
p Aq A
4( p A 0.5)2 p D
)2 = nmero de pares;
2n = nmero de indivduos;
pA = pares discordantes tipo A;
pD = total de todos os pares discordantes.
22.16.5 PROPORO BINOMIAL: UMA AMOSTRA
a) Teste unilateral:
2
p1q1
p o q o z1 + z1
p o q o
;
n=
( p1 po )2
b) Teste bilateral:
p1q1
po qo z1 / 2 + z1
po qo
n=
( p1 po )2
1
n1 = pq 1 + z1 +
k
p q
p1q1 + 2 2 z1
k
( p2 p1 )2 ;
b) Teste bilateral:
2
p q
1
n1 = pq 1 + z1 / 2 + p1q1 + 2 2 z1 ( p 2 p1 )2 .
k
k
n2 = n1k;
k = 0.5, 1, 2, etc. = vezes que a segunda amostra deve ser em relao primeira.
22.16.7 CORRELAO LINEAR
zr = 0.5 ln 1 + r ;
1 r
- 261 -
z1 / 2 + z1
n=
+ 4.
z
r
v
v
L = ln sT2 + ( 1) ln Y ;
2
n
v = graus de liberdade;
sT2 = varincia do valor de Y transformado;
n = tamanho da amostra.
S (t ) = e
h (t ) = ln S(t )
h(t )
(b1 X 1 + b2 X 2 + ...+ bk X k )
=e
h0 (t )
h(t )
ln
= (b1 X 1 + b2 X 2 + ... + bk X k )
h0 (t )
22.18.2 ANLISE DE CONGLOMERADOS
a) Distncias: ver 22.2.2, 22.2.3 e 22.2.4
- 262 -
b) Distncia Chebischev:
c) Ligao simples:
d ij = max X iv X jv ;
d) Mdia do Grupo:
d (UV )W = i k
)(
ESS = x j x ' x j x ;
j =1
f) Gower (Mediana):
S ij =
S ijv
v =1
p
Wijv
v =1
g) Centride:
d (i , j )k = min d ik ; jk .
1
' x = x1 x2 ' S pooled
A combinao linear (Fisher) y = a
x
maximizada pela equao: max =
n1
s 2y
(a' d )2
a' S pooled a
n2
2
2
y1 j y1 + y 2 j y 2 +
j =1
j =1
n1 + n2 2
y1 j = a' x1 j e y 2 j = a' x 2 j
U r = a r1 X 1 + a r 2 X 2 + ... + a rp X p
Vr = br1Y1 + br 2Y2 + ... + brpY p
Corr (U ,V ) =
a' 12 b
a' 11 a b' 22 b
r
- 263 -
, sendo
( p 1)(q 1)
X1 X2 ... Xp
X1
X2
.
.
.
Xp
Y1
Y2
.
.
.
Yp
p x p matriz
A
q x p matriz
C
Estimao de ponto:
- 264 -
Y1 Y2 ... Yp
p x q matriz
C
q x q matriz
B
CAPTULO 23
ESCOLHA DO TESTE ESTATSTICO SUGESTES
23.1 INTRODUO
A escolha do teste adequado aos dados obtidos em uma investigao um passo que
deve ser decidido no planejamento de uma pesquisa. A experincia acumulada em
trabalhos anteriores, a indicao do orientador, quando o caso, e o conhecimento
pleno da Estatstica propiciam elementos capazes de se efetuar a escolha do teste mais
ajustado ao estudo em questo.
As sugestes oferecidas pelo BioEstat no esgotam todas as possibilidades na escolha
de um teste estatstico, destinando-se, sobretudo, aos iniciantes em investigaes
cientficas, mas deve ser precedida do planejamento da pesquisa, com formulao da
hiptese a ser testada, da cuidadosa definio do universo de onde a(s) amostra(s)
ser(o) coletada(s), do estabelecimento do nvel de significncia do teste (erro ), do
levantamento ou do experimento a ser efetuado, ou seja, de todas as etapas que
possibilitem, ao final, comprovar ou refutar a hiptese formulada, prevendo-se, nessa
fase, o teste estatstico que atenda ao objetivo do trabalho proposto.
Os fluxogramas apresentados em seguimento so auto-explicativos, obedecendo os
seguintes passos:
a) Nmero de amostras:
Uma amostra;
Duas amostras independentes;
Duas amostras relacionadas;
k amostras independentes;
k amostras relacionadas.
b) Nmero de variveis:
Uma varivel;
Duas variveis;
k variveis.
c) Tipo de dados:
Dados categricos;
Dados ordenativos;
Dados numricos.
Os dados categricos e ordenativos so aqueles mensurados em escala nominal e
ordinal, respectivamente, e esto geralmente relacionados a testes de distribuio
livre, abrangendo os chamados testes no-paramtricos ou estatsticas firmes, de largo
emprego nas reas de biologia e de medicina. Os dados numricos, mensurados em
escala intervalar ou de razes, dizem respeito a modelos de distribuio bem definidos
e, na sua maioria, referentes distribuio normal.
- 265 -
- 266 -
- 267 -
- 268 -
- 269 -
- 270 -
- 271 -
- 272 -
CAPTULO 24
APLICATIVOS INTRODUZIDOS NO BIOESTAT 4.0
24.1 INTRODUO
Este captulo contm os novos testes que foram inseridos na verso 4.0 do BioEstat e
est dividido nas seguintes partes:
a) Anlise Multivariada
- Anlise de Conglomerados
- Anlise Discriminante
- Correlao Cannica
b) Anlise de Sobrevivncia
- Cox: Modelo de Risco Proporcional
c) Distribuio de Probabilidades
- Ponto de Corte
d) Reamostragem: Bootstrap
e) Testes de Hiptese
1) Uma Amostra
- Teste t, Resumo Amostral
- Teste z, Resumo Amostral
2) Duas Amostras Independentes
- Teste t, Resumo Amostral
- Teste z, Resumo Amostral
3) Duas Amostras Relacionadas
- Teste t, Resumo Amostral
- Correlao Intraclasse
f) Grficos
- Diagrama IC (95% e 99%)
- Diagrama Pontual (Dot plot)
- Pirmide Populacional
g) Aumento do Tamanho Amostral
24.2 ANLISE DE CONGLOMERADOS
O objetivo desta anlise agrupar os indivduos em conglomerados ou clusters. Os
conglomerados so identificados como grupos que compem a populao ou a
amostra que est sendo analisada. As unidades de um grupo apresentam muitas
semelhanas entre si e muitas diferenas em relao s unidades dos demais grupos.
, pois, uma verdadeira classificao ou taxonomia, muito usada por bilogos. Dessa
forma um mtodo exploratrio, no um teste estatstico, contendo uma srie de
algoritmos para classificao dos objetos segundo o grau de similaridade, na tentativa
de estabelecer uma estrutura, mesmo sendo inexistente. A anlise pode ser realizada
segundo alguns critrios de procedimentos, os quais so selecionados conforme es
caractersticas das variveis a serem analisadas, sendo apresentados a seguir:
- 273 -
- 274 -
Figura 24.1
Nmeros
escritos por
extenso.
Exemplo
24.2.1
Figura 24.2
Valores que
representam
as duas
primeiras
letras de
cada idioma.
Exemplo
24.2.1
d) Selecione as opes:
- Ligao Completa, como Mtodo de Agregao;
- Euclidiana, como Tipo de Distncia;
- Com Estandardizao das Variveis;
- 275 -
- 276 -
24.3.2 INSTRUES
a) Clicar no menu Anlise de Multivariada e selecionar em Anlise Discriminante;
b) Selecionar as colunas referentes s variveis do grid geral;
c) Clicar em Executar o Teste, para obter a Figura 24.6;
d) Pressionar em OK, nessa Figura, surgindo as funes discriminantes de Fisher
(Y1 e Y2), com os respectivos estimadores das variveis X1, X2, X3 e X4.
Figura 24.6
As funes
discriminantes
de Fisher.
Exemplo
24.3.1
e)
- 277 -
Figura 24.7
Diagrama
da funo
discriminante.
Exemplo
24.3.1
Para obter um novo diagrama, pressione o boto Grfico (Figura 24.8), sendo gerado
novo diagrama com destaque para a nova unidade (Figura 24.9).
- 278 -
Figura 24.9
A seta
aponta
o novo
indivduo.
Exemplo
24.3.1
Percebe-se que a nova unidade (Objeto Classificado) est localizada entre as unidades
do Grupo 3, ris sp.3.
Uma das pressuposies dos testes estatsticos paramtricos diz respeito distribuio
normal das variveis nas populaes. Quando se retira, portanto, uma amostra para
esses modelos de testes, deve-se supor que as unidades do universo em questo
apresentem distribuio normal.
24.4 CORRELAO CANNICA
Trata-se de um modelo de Anlise Multivariada, que permite investigar o
relacionamento entre duas sries de variveis: um grupo de variveis X e outro de
variveis Y, a associao entre os grupos de variveis tem como resultante a
correlao (Rc) denominada Cannica.
Assim, na rea mdica, um pesquisador poder relacionar um grupo de sintomas com
um conjunto de fatores de risco em relao a determinada doena.
OBJETIVOS
a) Determinar a magnitude da relao entre dois conjuntos de variveis;
b) Deduzir os pesos de cada grupo de variveis de forma que a correlao de cada
composio linear seja maximizada;
c) Avaliar a contribuio relativa de cada varivel na correlao cannica, no
sentido de explicar a natureza do relacionamento;
d) Para propsitos descritivos e inferenciais, devendo, neste caso, as variveis
apresentar distribuio normal.
- 279 -
- 280 -
A figura acima define que as variveis sero analisadas em dois grupos, onde o
primeiro grupo formado por trs colunas, o segundo grupo de variveis tambm
formado por trs colunas. Esta especificao obedece a ordem na qual as colunas
foram selecionadas na interface Seleo de Amostras para Correlao Cannica.
Figura 24.12
Resultados
da correlao
cannica.
Exemplo
24.4.1
Uma das pressuposies dos testes estatsticos paramtricos diz respeito distribuio
normal das variveis nas populaes. Quando se retira, portanto, uma amostra para
- 281 -
- 282 -
24.5.2 INSTRUES
a) No menu Estatsticas clique em Anlise de Sobrevivncia;
b) Selecione a opo Cox: Modelo de Risco Proporcional;
c) Na janela Seleo de Amostras, escolha inicialmente as variveis preditoras:
Droga, Idade, Sexo, Uria, Clcio srico, Hemoglobina, Protena de Bence-Jones.
d) Ainda na mesma janela selecione as colunas: Tempo e Remisso. Estas devem,
obrigatoriamente, ser as duas ltimas colunas selecionadas.
e) A janela Seleo de Amostras ser configurada conforme a visualizao abaixo.
- 283 -
f)
Figura 24.15
Parte
superior do
grid de
resultados
do Exemplo
24.5.1
- 284 -
Figura 24.16
Viso parcial
dos resultados
do Exemplo
24.5.1
Na parte superior da figura 24.15 est localizada a opo que permite visualizar a
Curva de Sobrevivncia.
Figura 24.17
Grfico
do Exemplo
24.5.1
- 285 -
Figura 24.18
Viso parcial
dos dados
do Exemplo
24.6.1
- 286 -
Figura 24.22
Resultados
do Exemplo
24.7.1
- 287 -
Figura 24.24
Resultados
do Exemplo
24.8.1
- 288 -
Figura 24.26
Resultados
do Exemplo
24.9.1
- 289 -
Figura 24.28
Resultados
do Exemplo
24.10.1
- 290 -
Figura 24.30
Resultados
do
Exemplo
24.11.1
O tempo decorrido entre a ingesto das drogas e o alvio do sintoma foi menor com o
emprego da droga A (p < 0.05).
- 291 -
24.12.2 INSTRUES
a) Selecionar no menu:
- Duas Amostras Relacionadas;
- Teste t;
- Resumo Amostral.
b) Introduzir os dados no formulrio (Figura 24.31);
c) Clicar em Executar, para obter os resultados (Figura 24.32).
Figura 24.32
Resultados
do Exemplo
24.12.1
- 292 -
24.13.2 INSTRUES
a) Introduzir os dados no grid do BioEstat (Figura 24.33);
b) Clicar em Duas Amostras Relacionadas e, a seguir, em Replicabilidade;
c) Pressionar o mouse em Correlao Intraclasse;
d) Clicar em Executar, para Resultados;
Figura 24.34
Dados do
Exemplo
24.13.1
- 293 -
24.14.2 INSTRUES
a) Introduzir os dados da seguinte forma:
Primeira coluna: Contm as categorias. Neste exemplo os valores so de 1 a 4,
correspondentes s dosagens de 15 e 20 mg/kg/dia, antes e aps os tratamentos.
- 294 -
Verifica-se que as mdias dos intervalos PR das amostras antes dos tratamentos foram
ligeiramente superiores mdia geral (150.0), ocorrendo o oposto aps a medicao.
Por sua vez, o IC (95%) da mdia geral foi o menor de todos os ICs, em decorrncia
do tamanho amostral (60), o qual reuniu todas as amostras.
24.14.3 EXEMPLO 2
Em indivduos infectados pelo H. pylori na mucosa gstrica, a avaliao das idades de
299 destes indivduos apresentou a seguinte distribuio: 103 assintomticos; 100
com gastrite; 65 com lcera gstrica ou duodenal e 31 com cncer do estmago.
Figura 24.37
Viso parcial
dos dados
do
Exemplo
24.14.3
- 295 -
- 296 -
24.15.2 INSTRUES
a) Clicar em Grficos e, a seguir, em Diagrama Pontual;
b) Pressionar em Executar para Resultados.
Figura 24.40
Diagrama
Pontual
do
Exemplo
24.15.1 .
- 297 -
24.16.2 INSTRUES
a) Inserir no grid as informaes obtidas do IBGE;
b) Pressionar em Grficos e, a seguir, em Pirmide Populacional;
c) Clicar em Executar para Resultados.
Figura 24.42
Pirmide
populacional
do
Exemplo
24.16.1
- 298 -
24.16.6 INSTRUES
a) Inserir no grid as informaes obtidas do IBGE;
b) Pressionar em Grficos e, a seguir, em Pirmide Populacional;
c) Clicar em Executar para Resultados.
Figura 24.44
Pirmide
populacional
do
Exemplo
24.16.3
Enquanto no ano 2000 a proporo de residentes na rea rural era de 33.45%, no ano
de 1970 a populao dessa mesma rea chegava a 52.56%.
- 299 -
24.16.4 INSTRUES
a) Inserir no grid as informaes obtidas do IBGE;
b) Pressionar em Grficos e, a seguir, em Pirmide Populacional;
c) Clicar em Executar para Resultados.
Figura 24.46
Pirmide
populacional
do
Exemplo
24.16.5
- 300 -
24.16.8 INSTRUES
a) Inserir no grid as informaes obtidas do IBGE;
b) Pressionar em Grficos e, a seguir, em Pirmide Populacional;
c) Clicar em Executar para Resultados.
Figura 24.48
Pirmide
populacional
do
Exemplo
24.16.7
Esta pirmide representa trs variveis: faixa etria, sexo, estado civil (solteiros e no
solteiros).
- 301 -
24.17.2 INSTRUES
a) Inserir no grid os dados obtidos;
b) Selecionar no menu Amostragem: Escores do Grid e Aumento da Amostra;
c) Na janela Seleo de Amostras, escolha apenas uma coluna de cada vez;
d) Clique em Executar Estatstica;
e) Informe o tamanho da amostra a ser gerada;
f) O BioEstat 4.0 informar em qual coluna ser inserida a reamostragem;
g) Repita o procedimento para a segunda amostra;
h) Execute o teste em questo com as novas amostras obtidas.
Figura 24.50
Dados do
Exemplo
24.17.1, viso
parcial da
reamostragem
gerada e o
resultado do
teste de MannWhitney
Neste exemplo, com amostras geradas de tamanho = 20, foi aplicado o teste de MannWhitney o qual mostrou diferenas significativas, apresentando p-valor = 0.0002. Este
procedimento poder ser aplicado para k amostras, como nas anlises de varincias.
- 302 -
GLOSSRIO
Amostra: parte da populao.
Amostra aleatria, casual, randmica: amostra escolhida sem a interferncia do
pesquisador, obtida por sorteio, pelos nmeros aleatrios ou por procedimento computadorizado
(pseudo-randmico), constituindo, do ponto de vista matemtico, amostra probabilstica.
Amostra estratificada: amostra retirada de camadas da populao denominadas estratos
no-superpostos, caracterizando-se, de um lado, pela maior homogeneidade da varivel investigada
dentre cada estrato e, de outro, pela maior heterogeneidade entre as camadas, como, por exemplo,
nvel socioeconmico de populao urbana: baixo, mdio e elevado. De cada camada retiram-se
amostras aleatrias de tamanho proporcional a cada estrato.
Amostra por conglomerados: amostra probabilstica cujas unidades simples so obtidas
de modo randmico de unidades coletivas, pressupondo-se que estas ltimas apresentem
homogeneidade entre si. Colmeias, cardumes, blocos residenciais, so exemplos de unidades
coletivas de onde so retiradas amostras randmicas.
Amostra sistemtica: amostra probabilstica cuja primeira unidade obtida ao acaso e as
demais, a partir da primeira, escolhidas a cada k intervalo sistemtico, definido pela razo entre o
tamanho da populao e o tamanho da amostra.
Amostras independentes: dois ou mais subconjuntos randmicos da populao retirados
de modo independente e de tamanhos iguais ou desiguais.
Amostras pareadas: subconjuntos randmicos da populao em que a varivel estudada
mensurada antes e depois de um certo procedimento. Exemplo: medio do pulso radial antes e aps
esforo fsico controlado. As amostras so necessariamente do mesmo tamanho.
Amostragem: procedimento de estudo de uma parte do universo. Sinnimo: Sondagem.
Anlise de sobrevivncia: anlise estatstica do tempo de ocorrncia de determinado
evento, o qual, na rea mdica, pode ser o bito, a recidiva de uma doena, a resposta teraputica a
uma droga etc. As instituies securitrias utilizam esse modelo de anlise. O BioEstat apresenta os
seguintes programas de anlise de sobrevivncia: Atuarial, Cox-Mantel, Gehan (Wilcoxon
generalizado), Kaplan-Meier e Log-Rank test.
Anlise multivariada: compreende testes estatsticos nos quais so consideradas de
maneira simultnea n variveis de k amostras, destacando-se nesta verso do BioEstat os programas:
Componente Principal, Distncia Multivariada (Euclidiana, Penrose e Mahalanobis), teste de
Hotelling, teste de Bartlett, Regresso Linear Mltipla e Regresso Logstica Mltipla.
ANOVA: teste estatstico cujo modelo de distribuio de probabilidades o da varincia
para k amostras ou tratamentos independentes. As amostras podem ser do mesmo tamanho ou
desiguais, no caso de k tratamentos (um critrio), e devem ser iguais quando for o caso de k
tratamentos e r blocos (dois critrios). Este teste tambm conhecido como teste F, em homenagem
a R. A. Fisher, e destina-se a comparar diferenas entre mdias atravs das varincias, cujos escores
amostrais devem ser mensurados a nvel intervalar ou de razes.
Bioestatstica ou Biometria: estatstica aplicada s cincias biolgicas e da sade.
Bonferroni: procedimento de comparao entre mdias de vrios tratamentos, no sentido
de verificar a significncia estatstica das diferenas entre essas medidas de tendncia central,
- 303 -
GLOSSRIO
- 304 -
GLOSSRIO
Correlao: teste de associao entre variveis, medindo-se a magnitude e o sentido ou
somente o grau dessa correlao, conforme o teste empregado. No h qualquer dependncia
funcional de uma varivel em relao outra.
Curva ROC (Receiver Operanting Characteristic Curve): um mtodo estatstico e
grfico para determinar o melhor ponto de corte (cutoff point) de um teste diagnstico.
Dados: escores obtidos de observaes ou de experimentos, podendo ser de fontes
primrias ou secundrias e de amostras ou de populaes.
DAgostino: teste empregado para testar a normalidade dos dados amostrais.
DAgostino-Pearson: teste destinado a verificar a normalidade dos dados amostrais.
Desvio padro: raiz quadrada da varincia.
Distribuio binomial: modelo de distribuio de probabilidades de variveis aleatrias
discretas, consistindo de n provas idnticas e independentes, cada uma apresentando apenas dois
resultados: sucesso (p) e insucesso (q = 1 - p).
Distribuio de Poisson: modelo de distribuio de probabilidades de variveis aleatrias
discretas, cujos eventos so raros e referentes ao tempo e ao espao. A mdia igual varincia.
Distribuio exponencial: modelo de distribuio de probabilidades de variveis aleatrias
contnuas, referente ao intervalo de tempo decorrido entre eventos raros e discretos.
Distribuio hipergeomtrica: modelo de distribuio de probabilidades de variveis
aleatrias discretas, com as mesmas caractersticas da distribuio binomial. O tamanho da amostra,
contudo, relativamente grande em relao ao tamanho da populao, alterando-se em grau
acentuado a probabilidade dos elementos do universo pela retirada de cada unidade sem reposio.
Distribuio normal: modelo de distribuio de probabilidades de variveis aleatrias
contnuas de largo emprego em estatstica, caracterizando-se por ser simtrica, em forma de sino,
assinttica, cuja rea sob a curva igual unidade.
Erro amostral: vis observado nas amostras aleatrias, decorrente da natural variabilidade
dos elementos constituintes das populaes, assinalando-se o fato de que nem todas as unidades do
universo participam da amostra. O erro amostral reduzido pelo aumento do tamanho amostral e
medido pelo erro padro.
Erro padro: o desvio padro de uma populao de mdias amostrais, o qual
corresponde ao quociente do desvio padro do universo de onde as amostras foram retiradas pela
raiz quadrada do tamanho amostral. Quando se desconhece o desvio padro paramtrico, utiliza-se
no clculo o desvio padro da amostra
Erro tipo I (alfa): rejeio da hiptese de nulidade quando ela verdadeira.
Erro tipo II (beta): aceitao da hiptese de nulidade quando ela falsa.
Escala de razes: caracteriza-se por apresentar unidade constante e comum de
mensurao, atribuindo-se um nmero real a cada escore, havendo uma razo conhecida entre dois
intervalos quaisquer, um quociente conhecido entre dois valores quaisquer e um verdadeiro ponto
zero como origem. Exemplo: peso em gramas.
Escala intervalar: semelhante escala de razes, havendo apenas uma razo conhecida
entre dois intervalos quaisquer, sendo a unidade de medio e o ponto zero arbitrrios. Exemplo:
temperatura em graus centgrados.
Escala nominal: escala na qual as diversas categorias ou modalidades de uma varivel so
contadas. a mais simples das escalas, havendo relao de equivalncia entre e dentre as categorias.
Exemplo: estado civil solteiro, casado, divorciado e vivo.
Escala ordinal ou por postos: escala na qual as modalidades de uma varivel so
ordenadas em graus ou magnitudes convencionadas, havendo uma relao matemtica maior do
- 305 -
GLOSSRIO
que ou menor do que dos elementos entre as diversas categorias e de equivalncia das unidades
dentre cada modalidade. Exemplo: conceitos escolares Excelente, Bom, Regular e Insuficiente.
Escores padronizados: transformao dos escores brutos em escores z, onde a mdia
igual a zero e o desvio padro igual unidade (1), simbolizados por N (0,1).
Especificidade: percentagem de indivduos sem o evento (sem a afeco investigada, por
exemplo), cujo teste tuberculnico, por exemplo negativo ().
Estatstica descritiva: parte da estatstica cujo objetivo a coleta, a organizao, a
classificao dos dados amostrais ou das populaes, as apresentaes tabular e grfica e o clculo
de determinadas medidas: mdia, mediana, varincia, desvio padro, coeficiente de variao, de
assimetria, de curtose e outras.
Estatsticas (no plural): valores numricos das amostras: mdia, mediana, varincia,
coeficiente de assimetria etc., constituindo nas amostras probabilsticas estimativas no enviesadas
dos parmetros, conforme demonstrado pelo Teorema do Limite Central.
Estimao de parmetros: parte da inferncia estatstica, cujo procedimento indutivo
consiste em generalizar os valores numricos amostrais para o universo investigado.
Estudo longitudinal: aquele no qual se coletam informaes sobre os indivduos
selecionados ao longo de um intervalo de tempo especificado.
Estudo prospectivo: estudo longitudinal no qual os indivduos so observados a partir de
um dado momento, prosseguindo-se ao longo do tempo previamente fixado.
Estudo retrospectivo: estudo longitudinal no qual as informaes de interesse esto
contidas em registros anteriores, em arquivos de dados como, por exemplo, em pronturios
hospitalares.
Estudo transversal: dados coletados de um grupo de indivduos em um momento definido,
avaliando-se sobretudo a prevalncia de uma determinada afeco.
Experimento: estudo analtico no qual h interveno do pesquisador nos indivduos
submetidos pesquisa, com controle efetivo dos fatores causais e dos respectivos efeitos.
Fentipo: caracterstica de um indivduo resultante do produto dos genes e expressada de
diversas maneiras. As pessoas do sistema sangneo ABO, por exemplo, so classificadas em
fentipos dos grupos A, B, AB ou O.
Gentipo: conjunto de todos os genes que determinado indivduo possui. No caso, por
exemplo, do sistema sangneo ABO, as pessoas do grupo A possuem o gentipo AA ou AO; do
grupo B, gentipo BB ou BO; do grupo AB, gentipo AB; e do grupo O, gentipo OO.
Goodness of fit: teste estatstico de modelo de distribuio de probabilidades, no qual as
propores observadas se ajustam s propores esperadas, deduzidas matematicamente ou
estabelecidas de acordo com alguma teoria. tambm denominado de teste de aderncia.
Graus de liberdade (gl): so parmetros indexadores estatsticos correspondentes ao
nmero de observaes independentes, como se observam nas distribuies t de Student, F da
ANOVA, Qui-Quadrado e r da correlao linear de Pearson.
Grid geral: uma espcie de planilha eletrnica do BioEstat onde os dados, da maior parte
dos testes estatsticos, devem ser introduzidos. Sinnimo Matriz de Dados.
Grid especfico: similar ao grid geral, utilizado apenas para determinados testes
estatsticos.
Hiptese de nulidade (H0): a hiptese que se testa considerando-se no haver diferenas
entre os grupos especficos objetos do estudo, representada, por exemplo: 1 = 2.
Hiptese alternativa (H1): a hiptese que contraria a de nulidade, no sentido de afirmar
que h diferena entre os grupos especficos objetos da pesquisa, representada, por exemplo: 1 2
- 306 -
GLOSSRIO
Heterogeneidade das amostras: um modelo probabilstico que indica se as amostras
investigadas no so oriundas da mesma populao, sendo utilizado nos testes G, do Qui-Quadrado,
da correlao linear e da regresso linear.
Heterocedasticidade: vide Heterogeneidade das varincias.
Heterogeneidade das varincias: um modelo probabilstico que revela se as varincias
dos subconjuntos testados so desiguais, no sendo oriundas da mesma populao, e empregado no
F teste da ANOVA, no t teste de Student para duas amostras independentes e na regresso linear.
Sinnimo: heterocedasticidade.
Homogeneidade das amostras: um modelo probabilstico que indica se as amostras
investigadas so oriundas da mesma populao, sendo utilizado nos testes G, do Qui-Quadrado, da
correlao linear e da regresso linear.
Homocedasticidade: vide Homogeneidade das varincias.
Homogeneidade das varincias: um modelo probabilstico que revela se as varincias
dos subconjuntos testados so iguais, oriundas, portanto, da mesma populao, sendo empregado no
F teste da ANOVA, no t teste de Student para duas amostras independentes e na regresso linear.
Sinnimo: homocedasticidade.
Incidncia: estudo epidemiolgico de ocorrncia de casos novos de determinada doena,
constatados ao longo de um perodo de tempo prefixado como, por exemplo, 6 meses, um ano, e
assim por diante. Os estudos relativos incidncia so denominados de longitudinais.
Inferncia estatstica: mtodo indutivo de generalizao dos valores numricos amostrais
para a populao de onde os dados foram retirados. As generalizaes estatsticas, diferentes das leis
universais, admitem excees, mas proporcionam conhecimentos de relevncia em termos
cientficos.
Intercepto: uma constante relativa ao valor de Y nas equaes de regresso quando o
escore de X igual a zero, sendo simbolizada pela letra a. Representa, portanto, o valor da varivel
dependente quando o valor da varivel preditiva igual a zero.
Intervalos de confiana: rea abrangida por n erros padres em torno da estimativa
pontual, para mais e/ou para menos, e definidos em termos probabilsticos pela Regra Emprica e
pelo Teorema do Limite Central. Os intervalos de confiana mais usados so de 95% e 99%,
correspondentes, no caso do modelo da distribuio normal, a X 1.96 x e X 2.58 x ,
respectivamente.
Kolmogorov-Smirnov: teste estatstico no-paramtrico, de aderncia ou de
independncia, para uma ou duas amostras, respectivamente. O teste de aderncia utilizado
tambm para testar a normalidade dos escores amostrais.
Levantamentos ou surveys: estudos caracterizados pela coleta de dados, descrevendo-se os
escores amostrais e calculando-se estatsticas que estimam os parmetros da populao investigada.
Nos levantamentos pode-se, ainda, estudar a relao de causa e efeito de variveis, mas sem o
controle efetivo dos elementos causais.
Lilliefors: teste de aderncia empregado para testar a normalidade amostral.
Matriz de Dados: uma espcie de planilha eletrnica do BioEstat onde os dados, da
maior parte dos testes estatsticos, devem ser introduzidos. Sinnimo Grid Geral.
Mdia aritmtica: medida de tendncia central de largo emprego em estatstica,
representada pela razo do somatrio dos valores pelo nmero de escores.
Mdia geomtrica: medida de tendncia central representada pela raiz n do produto dos
escores e indicada, sobretudo, quando os dados esto dispostos em progresso geomtrica.
- 307 -
GLOSSRIO
- 308 -
GLOSSRIO
Regra de Bayes: modelo de distribuio de probabilidade condicional onde se calcula a
probabilidade a posteriori do evento (A) dada a ocorrncia do (B) (AB) , em funo do
conhecimento a priori da probabilidade de ocorrncia do evento B, desde que o evento A tenha
ocorrido Pr (BA). Para dois eventos o BioEstat apresenta o chamado crivo ou screening test,
enquanto que para trs ou mais, o programa dispe do modelo da regra de Bayes.
Regresso linear simples: teste estatstico que determina o modelo estimador dos valores
de Y a partir dos escores de X.
Regresso linear mltipla: teste estatstico que determina o modelo estimador dos escores
da varivel Y a partir dos valores de duas ou mais variveis preditivas: X1, X2, , Xn.
Regresso logstica simples: teste estatstico de regresso no qual a varivel dependente
Y sempre binria, assumindo valores de 1 (sucessos) e 0 (insucessos). Por outro lado, a varivel
independente X , em geral, binria, mas pode assumir valores contnuos. Este teste tem larga
aplicao nas cincias mdicas.
Regresso logstica mltipla: semelhante regresso logstica simples, mas o nmero de
variveis independentes, em geral binrias, mltiplo - 2 ou mais. A varivel dependente sempre
binria.
Risco relativo: teste estatstico simbolizado por RR, representando a razo entre o
coeficiente de incidncia de determinado evento em pessoas expostas (a uma doena, por exemplo) e
o coeficiente de incidncia do mesmo evento em indivduos no expostos.
Sensibilidade de um teste: percentagem de indivduos com o evento (determinada afeco,
por exemplo) cujo teste tuberculnico, por exemplo positivo (+).
Srie categrica ou especificativa: uma srie estatstica na qual o elemento varivel o
fenmeno estudado, mantendo-se fixos o tempo e o local de observao.
Srie cronolgica, temporal, evolutiva ou histrica: uma srie estatstica na qual o
tempo varia, mantendo-se fixos o local e o fenmeno estudado.
Srie geogrfica: uma srie estatstica na qual o local (fator geogrfico) varivel,
mantendo-se fixos o tempo e o fenmeno observado.
Shapiro-Wilk: teste empregado para verificar a normalidade dos dados amostrais.
Sondagem: procedimento de estudo de uma parte da populao voltado, sobretudo, para
pesquisas de opinio e de mercado. Sinnimo: amostragem.
Tabelas de freqncia: so representaes tabulares nas quais os escores se apresentam
em correspondncia com suas repeties, com freqncias dispostas em valores absolutos e/ou em
percentuais, podendo haver agrupamento de dados em classes previamente definidas.
Tabelas de contingncia: tabelas nas quais se dispem as freqncias observadas de duas
ou mais amostras, cada uma com duas ou mais categorias, em tabelas de l linhas e c colunas (2 x 2, 3
x 2, 2 x 3, 3 x 3 etc.).
Teste de aderncia: aquele em que se observa o ajustamento ou concordncia dos
escores observados aos valores tericos esperados ou deduzidos do ponto de vista matemtico.
Chama-se na literatura inglesa de goodness of fit. Os testes G e do Qui-Quadrado, para uma amostra,
so exemplos de testes de aderncia.
Teste bilateral: teste estatstico no qual a hiptese alternativa no especifica a direo da
diferena a ser detectada, com esta representao: 1 0, podendo 1 ser maior ou menor que 0.
Teste binomial (duas propores): teste estatstico baseado na distribuio binomial ou na
aproximao curva normal, onde se comparam as propores de duas amostras.
Teste binomial (uma proporo): teste estatstico baseado na distribuio binomial ou na
aproximao curva normal, onde se compara a proporo de uma amostra com a do parmetro.
- 309 -
GLOSSRIO
- 310 -
GLOSSRIO
categorias so independentes ou esto associadas. Os graus de liberdade neste teste so calculados
como segue: (l 1) x (c 1).
Teste Kappa: teste estatstico no-paramtrico destinado a comparar as propores da
mesma varivel mensurada a nvel nominal em duas ocasies distintas. Testa-se a reprodutibilidade
dos resultados, no sentido da haver ou no concordncia nas propores observadas nos diferentes
perodos. Os dados so dispostos em tabela de contingncia 2 x 2.
Teste no-paramtrico: aquele em que no h pressuposto sobre modelo de distribuio
nem quanto aos parmetros, no se aplicando ao mesmo o Teorema do Limite Central.
Teste paramtrico: aquele com pressuposto de um modelo de distribuio normal,
binomial etc. , cujos parmetros assumem um desses modelos, aplicando-se-lhe o Teorema do
Limite Central.
Teste unilateral: teste estatstico no qual a hiptese alternativa especifica a direo da
diferena a ser detectada, assim representado: 1 < 0 ou 1 > 0.
Testes t (Student): testes paramtricos para uma amostra, duas amostras pareadas ou duas
amostras independentes, baseados no modelo de distribuio de Student e geralmente efetuados
quando se desconhece as varincias paramtricas. O modelo de Student constitui uma famlia de
distribuio e est relacionado com os graus de liberdade.
Testes Z: testes paramtricos para uma amostra ou duas amostras independentes, baseados
no modelo de distribuio normal e geralmente efetuados quando as varincias das populaes so
conhecidas. Nos estudos estatsticos a distribuio normal constitui, como sabemos, um dos modelos
mais importantes em termos probabilsticos.
Transformao de dados: mudana de escala dos dados de uma varivel, podendo ser
efetuada pelos logaritmos, pela raiz quadrada, pela ordenao dos escores (rank), pelo quadrado dos
valores etc.
Unidade: indivduo, elemento, item, membro ou unidade estatstica onde se estuda uma ou
mais variveis. A unidade estatstica pode ser simples: pessoa, objeto, animal, planta, protozorio,
etc., ou coletiva: cardume, blocos residenciais, turmas escolares, colmeias, colnias bacterianas e
outras.
Universo: o mesmo que populao.
Valor preditivo de um teste negativo: probabilidade de que um indivduo com teste
negativo () seja uma pessoa sem o evento objeto da investigao (determinada doena, por
exemplo).
Valor preditivo de um teste positivo: probabilidade de que um indivduo com teste
positivo (+) apresente o evento objeto da investigao (determinada doena, por exemplo).
Valor extremo: escore muito afastado da maioria dos valores amostrais, decorrente da
incluso no universo investigado de elemento estranho, de erro de observao, de falha instrumental,
de equvoco de registro ou de introduo do dado na planilha de clculos. Pode, entretanto, ser um
valor verdadeiro, devendo-se examin-lo cuidadosamente antes de sua excluso da anlise dos
dados. Na literatura inglesa denomina-se outlier .
Varincia: soma dos quadrados dos desvios em relao mdia, dividida pelo nmero de
observaes da amostra menos um (n 1).
Variveis independentes: so variveis consideradas preditivas de uma outra varivel
denominada dependente.
Varivel: determinada caracterstica dos indivduos ou elementos objetos da investigao,
como so exemplos o sexo dos animais, o estado civil, a etnia, o peso de recm-nascidos etc.
- 311 -
GLOSSRIO
- 312 -
REFERNCIAS BIBLIOGRFICAS
Abuabara, M. A. P. & Petrere Jr. M. (1997). Estimativas da Abundncia de Populaes Animais.
EDUEM Editora da Universidade Estadual de Maring, Paran.
Allen, R.G.D. (1979). Estatstica para Economistas. Zahar Editores, Rio de Janeiro.
Ayres, M. & Ayres Jr., M. (1987). Aplicaes Estatsticas em BASIC. McGraw-Hill do Brasil, So
Paulo.
Ayres, M., Ayres Jr., M., Ayres, D.L., Santos, A. S. (1998). BioEstat. Verso 1.0, Sociedade Civil
Mamirau, MCT CNPq, Belm, Par, Brasil.
Beiguelman, B. (1979). Gentica Mdica, vol. 3. Edart-So Paulo Livraria Editora, Ed. da Universidade
de So Paulo.
Beiguelman, B. (1994). Curso Prtico de Bioestatstica. 3. ed., Revista Brasileira de Gentica.
Beiguelman, B. (1994). Dinmica dos Genes nas Famlias e nas Populaes. Sociedade Brasileira de
Gentica, Ribeiro Preto, So Paulo.
Berkeley, E.C. (1965). Sorte ou Azar. Editora Universidade de Braslia, Braslia.
Berqu, E.S., Souza, J.M.P. & Gotlieb, S.L.D. (1980). Bioestatstica. Editora Pedaggica e
Universitria, So Paulo.
Blank, S., Seiter, C. & Bruce., P. (2001). Resampling Stats in Excel. Resampling Stats, Inc., Arlington,
Virginia.
Bradley, E. & Tibshirani, R. J. (1993). An Introduction to the Bootstrap. Chapman & Hall/CRC,
London.
Brown, F.L., Amos, J.R. & Mink, O.G. (1975). Statistical Concepts. 2rd. ed., Harper & Row,
Publishers, New York.
Burleson, D.R. (1980). Elementary Statistics. Winthrop Publishers, Inc., Cambridge, Massachusetts.
Bussad, W.O. (1988). Anlise de Varincia e Regresso. 2. ed., Editora Atual, So Paulo.
Butcher, H.J. (1966). Sampling in Educational Research. Manchester University Press, Manchester.
Caldeira, A.M.S. & Ferreira, M.L.B. (1974). Estatstica Instruo Programada, vols. 1 e 2.
Conquista, Rio de Janeiro.
Callegari-Jacques, S. (2003). Bioestatstica: princpios e aplicaes. Artmed Editora S.A., Porto
Alegre, Brasil.
Calot, G. (1979). Cours de Statistique Descriptive. Deuxime dition, Dunod, Paris.
Camel, F. (1991). Estadstica Mdica y Planificacin de la Salud, I y II. Consejo de Publicaciones de la
Universidad de Los Andes, Mrida, Venezuela.
Campbell, R.C. (1994). Statistics for Biologists. 3rd. ed., Cambridge University Press, Cambridge.
Canavos, G.C. (1988). Probabilidad y Estadstica. McGraww-Hill, Mxico.
Castle, W.M. (1977). Statistics in Small Doses. 2rd. ed., Churchill Livingstone, London.
Centeno, A.J. (1982). Curso de Estatstica Aplicada Biologia. Editora. da Universidade Federal de
Gois, Goinia.
Chacn, E. (1972). Curso de Estatstica. Livro Ibero-Americano, Rio de Janeiro.
Chatfield, C. & Collins, A.J. (1986). Introduction to Multivariate Analysis. Chapman and Hall, London.
- 313 -
REFERNCIAS BIBLIOGRFICAS
Chernick, M.R. & Friis, R.H. (2003). Introductory Biostatisitcs for the Health Science. Wiley
Intercience, New Jersey.
Cochran, W.G. (1977). Sampling Techniques. 3rd. ed.., John Wiley & Sons, Inc., New York.
Cohen, J. (1977). Statistical Power Analysis for the Behavioral Sciences. 2rd. ed., Lawrence Erlbaum
Associates, Publishers, New Jersey.
Collett, D (1996). Modelling Survival Data in Medical Research. Chapman & Hall, London.
Cooke, D., Craven, A.H. & Clarke, G.M. (1984). Basic Statistical Computing. Edward Arnold
(Publishers), London.
Costa, J.J.S. (1981). Elementos de Estatstica. Editora Campus, Rio de Janeiro.
Costa, S.F. (1988). Introduo Ilustrada Estatstica. Editora Harbra, So Paulo.
Cox, D.R. (1972). Regression Models and Life-Tabels. J. Roy. Statist. Soc. , 34: 187-220.
Crespo, A.A. (1997). Estatstica Fcil. 15. ed., Editora Saraiva, So Paulo.
Cunha, O.S. & Ramos, F.A.O. (1976). Iniciao Estatstica: Volumes I e II. Tipografia do
Carvalhido, P.
Cunha, S.E. (1978). Estatstica Descritiva na Psicologia e na Educao. Forense-Universitria, Rio de
Janeiro.
Daniel, W.W. (1999). Biostatistics: A Foundation for Analysis in the Health Sciences. 7th. ed., John
Wiley & Sons, New York.
Dawson-Saunders, B. & Trapp, R.G. (1994). Basic & Clinical Bioestatstics. 2rd. ed., Appleton &
Lange, Norwalk, Connecticut.
DeGroot, M.H. (1988). Probabilidad y Estadstica. 2. ed., Addison-Wesley Iberoamericana,
Wilmington, Delaware.
Di Dio, R.A.T. (1979). Estatstica, Instruo Programada. Editora Pedaggica e Universitria, So
Paulo.
Dress, F. (2004). Probabilits et Statistique de A Z. Dunod, Paris.
Edwards, A.L. (1984). An Introduction to Linear Regression and Correlation. 2nd. ed., W. H. Freeman
and Company, New York.
Elston, R.C. & Johnson, W.D. (1994). Essentials of Biostatistics. 2nd. ed., F. A. Davis Company,
Philadelphia.
Essex-Sorlie, D. (1995). Medical Bioestatstics & Epidemiology. Appleton & Lange, Norwalk,
Connecticut.
Fisher, L.D. & Van Belle, G. (1993). Biostatistics. John Wyley & Sons, Inc., New York.
Fisher R.A. (1946a). The fitting of gene frequencies to data on Rhesus reactions. Ann. Eug. 13:150-155.
Fisher R.A. (1946b). Note on the calculation of the frequencies of Rh allelomorphs. Ann. Eug. 13:223224.
Fisher, R.A. (1993). Statistical Methods Experimental Design and Scientific Inference. Oxford
University Press, Oxford.
Fisher, R.A. & Yates, F. (1954). Tablas Estadisticas. Aguilar Ediciones, Madrid.
Fogiel, M. (1996). The Statistics Problem Solver. Research and Education Asscociation, New Jersey.
Freund, R.J. & Wilson, W.J. (1997). Statistical Methods. Revised Edition, Academic Press, New York.
Galambos, J. (1984). Introductory Probability Theory. Marcel Dekker, Inc., New York.
Gatts, R.R. (1978). Elementos de Probabilidade e Inferncia. Editora Atlas, So Paulo.
Glantz, S.A. (1997). Primer of Biostatistics. 4th. ed., McGraw-Hill, NewYork.
Gnedenko, B.V. & Khintchine, A.I. (1974). Introduo Teoria das Probabilidades e Estatstica.
Editorial Estdios Cor, Lisboa.
- 314 -
REFERNCIAS BIBLIOGRFICAS
Gonick, L. & Smith, W. (1993). The Cartoon Guide To Statistics. HarperPerennial, HarperCollins
Publishers, New York.
Greenberg, R.S., Daniels, S.R., Flanders, W.D., Eley, J.W. & Boring, J.R. (1996). Medical
Epidemiology. 2nd. ed., Appleton & Lange, Norwalk, Connecticut.
Groeneveld, R.A. (1979). An Introduction to Probability and Statistics Using Basic. Marcel Dekker,
Inc., New York.
Groves, R.M. (1989). Survey Errors and Survey Costs. John Wiley & Sons, New York.
Guedes, M.L.S. & Guedes, J.S. (1988). Bioestatstica para Profissionais de Sade. Ao Livro Tcnico,
Rio de Janeiro.
Guimares, R.C. & Cabral, J. A.S. (1997). Estatstica. McGraw-Hill de Portugal, Porto,
Gullon, A. (1971). Introduccion a la Estadstica Aplicada. Editorial Alhambra, Madrid.
Hayslett Jr., H.T. (1968). Statistics Made Simple. Doubleday, New York.
Hedges, L. V. & Olkin, I. (1985). Statistical Methods for Meta-Analysis. Academic Press, New York.
Herzon, F.D. & Hooper, M. (1976). Introduction to Statistics for the Social Sciences. Thomas Y.
Crowell Company, New York.
Hine, J. & Wetherill, G.B. (1975). A Programmed Text in Statistics: Book One, Summarizing Data.
Chapman and Hall, London.
Hinkle, D.E., Wiersma, W. & Jurs, S.G. (1994). Applied Statistics for the Behavioral Sciences. 3rd. ed.,
Houghton Mifflin Company, Boston.
Hoel, P.G. (1979). Estatstica Elementar. Editora Atlas, So Paulo.
Hosmer, D.W. & Lemeshow, S. (1989). Applied Logistic Regression. John Wiley & Sons, New York.
Hosmer, D.W. & Lemeshow, S. (1998). Applied Survival Analysis, John Wiley & Sons, New York.
Howell, D.C. (1993). Fundamental Statistics for the Behavioral Sciences. 2nd. ed., PWS-KENT
Publishing Company, Boston.
Huck, S.W. & Sandler, H.M. (1984). Statistical Illusions: Solutions. Harper & Row, Publishers, New
York.
Huff, D. (1993). How to Lie with Statistics. W. W. Norton & Company, Inc., New Yourk.
Ingelfinger, J.A., Mosteller, F., Thibodeau, L.A. & Ware, J.H. (1994). Biostatistics in Clinical
Medicine. 3rd. ed., McGraw-Hill, New York.
Jabardo, W.R.S. (1985). Gentica. Editora McGraw-Hill do Brasil, So Paulo.
Johnson, D. E. (1998). Mtodos Multivariados Aplicados al Anlisis de Datos. International Thomson
Editores, Mxico.
Johnson, R.A. & Wichern, D.W. (1998). Applied Multivariate Statistical Analysis. 4th. ed., Prentice
Hall, Inc., New Jersey.
Kaar, A.F. (1986). Point Processes and Their Statistical Inference. Marcel Dekker, Inc., New York
Kachigan, S. K. (1991). Multivariate Statistical Analysis A Conceptual Introduction. 2nd Ed.. Radius
Press. New York.
Kalbfleisch, J.G. (1985). Probability and Statistical Inference, vols. 1, 2. 2rd. ed., Springer-Verlag,
New York.
Kaplan, D. T. (1999). Resampling Stats in MATLAB. Resamplibg Stats. Inc., Arlington, Virginia.
Katz, D. L. (2001). Epidemiologia, Bioestatstica e Medicina Preventiva. Livraria e Editora RevinteR
Ltda., Rio de Janeiro.
Kellner, S.R.O., Cavas, C.S.T. & Nick, E. (1979). Exerccios de Estatstica. Editora Renes, Rio de
Janeiro.
Kirkwood, B.R. (1995). Essencials of Medical Statistics. Blackwell Science, Oxford.
- 315 -
REFERNCIAS BIBLIOGRFICAS
Lang, T.A. & Secic M. (1997). How to Report Statistics in Medicine. American College of Physicians,
Philadelphia.
Lange, K. (1997). Mathematical and Statistical Methods for Genetic Analysis. Springer-Verlag, New
York.
Lapponi, J.C. (1997). Estatstica usando Excel 5 e 7. Lapponi Treinamento e Editora, So Paulo.
Laurenti, R., Mello Jorge, M.H.P., Lebro, M.L. & Gotlied S.L.D. (1987). Estatsticas de Sade. 2. ed.,
Editora Pedaggica e Universitria, So Paulo.
Lee, E.T. (1992). Statistical Methods for Survival Data Analysis. 2nd. ed., John Wiley & Sons, Inc.,
New York.
Levin, J. (1978). Estatstica Aplicada a Cincias Humanas. Editora Harper & Row do Brasil, So
Paulo.
Levy, P.S. & Lemeshow, S. (1991). Sampling of Populations. John Wiley & Sons, Inc., New York.
Lindley, D.V. & Scott, W.F. (1984). New Cambridge Elementary Statistical Tables. Cambridge
University Press, Cambridge.
Manly, B.F.J. (2000). Multivariate Statistical Methods- A Primer, Third Ed., Chapman and Hall,
London.
Martinelli, J.M. (2005). Estrutura Populacional dos Camares Penaeidae no Esturio do Rio Caet,
litoral Norte do Brasil, Tese de Doutorado, Belm, Par, Brasil.
Martins, G.A. & Donaire, D. (1979). Princpios de Estatstica. Editora Atlas, So Paulo.
Massad, E., Menezes, R.X., Silveira, P.S.P. & Ortega, N.R.S. (2004). Mtodos Quantitativos em
Medicina. Editora Manole, So Paulo, Brasil.
Mattar, F.N. (1994). Pesquisa de Marketing, 1 e 2. Editora Atlas, So Paulo.
Matthews, D.E. & Farewell, V.T. (1996). Using and Understanding Medical Statistics. 3rd. ed., Karger,
Basel.
Maxwell, A.E. (1977). Multivariate Analysis in Behavioural Research. Chapman and Hall, London.
McCuen, R.H. (1993). Microcomputer Applications in Statistical Hidrology. Prentice Hall, New Jersey.
Mendenhall, W. & Beaver, R.J. (1991). Introduction to Probability and Statistics. 8th. ed., PWS-KENT
Publishing Company, Boston.
Michelson, S. & Schofield, T. (1996). The Biostatistics Cookbook. Kluwer Academic Publishers,
Boston.
Miller, S. (1977). Planejamento Experimental e Estatstica. Zahar Editores, Rio de Janeiro.
Minium, E.W., King, B.M. & Bear, G. (1993). Statistical Reasoning in Psychology and Education.
Third ed., John Wiley & Sons, Inc., New York.
Morettin, P.A. & Bussab, W.O. (2004). Estatstica Bsica, 5a. Ed., Editora Saraiva, SoPaulo.
Mosteller, F. & Rourke, R.E.K. (1993). Estatsticas Firmes. Edies Salamandra, Lisboa.
Murteira, B.J.F. (1990). Probabilidades e Estatstica, vols. I e II. 2. ed., McGraw-Hill de Portugal,
Lisboa.
Neave, H.R. (1985). Elementary Statistics Tables. George Allen & Unwin, London.
Neter, J., Kutner, M.H., Nachtsheim, C.J. & Wasserman, W. (1996). Applied Linear Regression
Models. 3rd. ed., IRWIN, Chicago.
Neter, J., Kutner, M.H., Nachtsheim, C.J. & Wasserman, W. (1996). Applied Linear Statistical Models.
4th. ed., IRWIN, Chicago.
Nick, E. & Kellner, S.R.O. (1971). Fundamentos de Estatstica para as Cincias do Comportamento.
Editora Renes, Rio de Janeiro.
Oliveira, T.F.R. (1976). Estatstica na Escola. Ao Livro Tcnico, Rio de Janeiro.
- 316 -
REFERNCIAS BIBLIOGRFICAS
Ott, R.L. & Mendenhall, W. (1995). Understanding Statistics. 6th. ed., Duxbury Press, Belmont,
California.
Pagano, R.R. (1994). Understanding Statistics in the Behavioral Sciences. 4th. ed., West Publishing
Company, New York.
Peters, W.S. & Summers, G.W. (1978). Anlise Estatstica e Processo Decisrio. 2. ed., Editora da
Fundao Getlio Vargas, Rio de Janeiro.
Rameau, C. (1971). As Estatsticas: um Instrumento de Gesto, 10 e 20. Livraria Clssica Editora,
Lisboa.
Rees, D.G. (1990). Essential Statistics. 2rd. ed., Chapman and Hall, London.
Reichmann, W.J. (1975). Uso e Abuso das Estatsticas. Editora Artenova, Rio de Janeiro.
Reis, E. (1997). Estatstica Multivariada Aplicada. Edies Slabo, Lda., Lisboa.
Reis, M.D. (1978). Elementos Bsicos de Estatstica. 2. ed., Editora Estrutura, So Paulo.
Reszczynski, O. (1969). Sumatorias. Centro Interamericano de Enseanza de Estadstica, Santiago.
Rivera, D.P.S. (1989). Estadstica Modelos y Mtodos, 1. Fundamentos. Alianza Editorial, Madrid.
Rocha, M.V. (1975). Curso de Estatstica. 3. ed., Fundao Instituto Brasileiro de Geografia e
Estatstica (IBGE), Rio de Janeiro.
Rosner, B. (1995). Fundamentals of Biostatistics. 4th. ed., Duxbury Press, Boston.
Rothenberg, R.I. (1991). Probability and Statistics. Harcout Brace Jovanovich, Publishers, New York.
Rowntree, D. (1981). Statistics Without Tears - A Primer for Non-mathematicians. Penguin Books,
New York.
Sahai, H. & Martnez, W. (1996). Tablas y Frmulas Estadsticas para las Ciencias Biolgicas,
Sociales y Fsicas. Grupo Editorial Iberoamrica, de C.V., Mxico.
Salaru, N.N. (1989). Blood groups in large sample from city of So Paulo (Brazil): allele and haplotype
frequencies for MNSs, Kell-Cellano, Rh and ABO systems. Rev. Brasil. Genet. 12, 2, 625-643.
Shapiro, S.S. & Wilk, M.B. (1965). An Analysis of variance test for normality (complete samples).
Biometrika, 52: 591- 411.
Shapiro, S.S., Wilk, M.B. & Chen, H.J. (1968). A comparative study of various tests for normality.
J. Amer. Statist. Assoc. 63: 1343 1372.
Scheaffer, R.L., Mendenhall, W. & Ott, L. (1990). Elementary Survey Sampling. 4th. ed., PWS-KENT
Publishing Company, Boston.
Shiavi, R. (1991). Introduction to Applied Statistical Signal Analysis. Aksen Associates Incorporated
Publishers, Boston.
Shiffler, R. E. & Adams, A. J. (1999). Succeding Statistics. Duxbury Press, New York.
Siegel, S. & Castellan Jr., N.J. (1988). Nonparametric Statstics for the Behavioral Sciences. 2nd. ed.,
Mc Graw-Hill, Inc., New York.
Sincich, T. (1993). Statistics by Example. 5th. ed., Prentice Hall, New Jersey.
Snedecor, G.W. & Cochran, W.G. (1978). Statistical Methods. 6th. ed., The Iowa State University
Press, Ames, Iowa.
Soares, J.F. & Siqueira, A.L. (2002). Introduo Estatstica Mdica. Departamento de Estatstica
UFMG, Belo Horizonte, Brasil.
Sokal, R.R. & Rohlf, F.J. (1995). Biometry. 3rd. ed., W. H. Freeman and Company, New York.
Sounis, E. (1985). Bioestatstica. 3. ed., Livraia Atheneu, Rio de Janeiro.
Spiegel, M.R. (1984). Estatstica. 2. ed., McGraw-Hill do Brasil, So Paulo.
Stansfield, W.D. (1985). Gentica. 2. ed., McGraw-Hill do Brasil, So Paulo.
Steel, R.G.D., Torrie, J.H. & Dickey, D.A. (1997). Principles and Procedures of Statistics A
Biometrical Approach. 3rd. ed., McGraw-Hill, New York.
- 317 -
REFERNCIAS BIBLIOGRFICAS
Stevens, W.L. (1938). Estimation of blood-groups gene frequencies. Ann. Eug. 8:362-217.
Stevens, W.L. (1950). Statistical analysis of the A-B-O blood groups. Hum. Biol. 22:191-217.
Sutton, A. J., Abrams, K. R., Jones, D. R., Sheldin, T. A. & Song. F. (2000). Methods for MetaAnalysis in Medical Research. John Wiley & Sons, Ltd., New York.
Tanis, E.A. (1987). Statistics II Estimation and Tests of Hypotheses. Harcout Brace Jovanovich,
Publishers, New York.
Tippett, L.H.C. (1968). Estatstica. 2. ed., Coleo SABBER, Publicaes Europa-Amrica, Lisboa.
Toledo, G.L. & Ovalle, I.I. (1995). Estatstica Bsica. 2. ed., Editora Atlas, So Paulo.
Triola, M.F. (1999). Introduo Estatstica. 7. ed., LTC Livros Tcnicos e Cientficos Editora, Rio
de Janeiro.
Van Belle. G. (2002). Statistical Rules of Thumb. Wiley Interscience, New York.
Vicente, P., Reis, E. & Ferro, F. (1996). Sondagens. Edies Slabo, Lisboa.
Vieira, S. (1981). Introduo Bioestatstica. Editora Campus, Rio de Janeiro.
Weaver, J. H. (2001). Conquering Statistics Numbers Without The Crunch. Perseus Publishing,
Cambridge, Massachusetts.
Wetherill, G.B. (1967). Elementary Statistical Methods. Methuen & Co. Ltd., London.
White, J., Yeats, A. & Skipworth, G. (1979). Tables for Statisticians. 3rd. ed., Stanley Thornes
(Publishers) Ltd., Cheltenham.
Wonnacott, R.J. & Wonnacott, T.H. (1985). Introductory Statistics. 4th. ed., John Wiley & Sons, New
York.
Zar, J.H. (1999). Biostatistical Analysis. 4th. ed., Prentice Hall, New Jersey.
- 318 -
NDICE
fatorial a x b x c, 47
Friedman, 48
Kruskal-Wallis, 50
Q de Cochran, 52
um critrio, 39
rea, grfico de, 206
Abrindo arquivos, 10
Aderncia,
G, teste, 93, 155
Kolmogorov-Smirnov, 94
Lilliefors, 95
Qui-Quadrado, 96/97
Ajustamento de curvas, 180
Amostras, tamanho, 191
Amostragem, tipos de,13
Aleatrias do grid, 17
Aleatrias simples, 14
Estratificadas, 15
Por conglomerados, 15
Sistemticas, 14
Anlise multivariada, 19
Componente principal, 19
Conglomerados, 273
Correlao cannica, 279
Discriminante, 276
Distncia Euclidiana, 21
Distncia de Penrose e Mahalanobis, 22
Teste de Hotelling, 24
Teste de Bartlett, 25
Anlise de resduos, 182
Anlise de sobrevivncia, 27
atuarial, 27
Cox-Mantel, 35
Cox: Modelo de Risco Proporcional, 282
Gehan, 36
Kaplan-Meier, 29
Log-Rank test, 31
Mantel-Haenszel, 36
ANOVA, 39
dois critrios, 44
duas amostras pareadas, 109
fatorial a x b, 45
B
Bartlett, teste de, 25
Bayes, regra de, 85
Binomial, distribuio, 75
Binomial, teste, 92, 104
Bootstrap, 55, 287
Box-plot, 207, 208
C
Casas decimais, expresso de, 3
Caule e folha, diagrama, 209
Cochran, teste Q de, 52
Coeficientes de variao, teste de,114
Colunas, grfico de , 211
Configurando o BioEstat, 12
Componente principal, 19
Conglomerados, amostras por, 15
Conglomerados, anlise, 273
Correlao, 65
cannica, 279
concordncia de Kendall, 71
contingncia C, 70
de Kendall, 72
intraclasse, 193
linear de Pearson, 65
linear < 0 ou > 0, 69
matriz de, 66
parcial, 68
- 319 -
NDICE
teste do Qui-Quadrado, 109
teste t de Student, 100
teste Z, 102
Duas amostras relacionadas, 117
ANOVA, 119
teste de McNemar, 120
teste de Wilcoxon, 124
teste dos Sinais, 122
teste Kappa, 123
teste t de Student, 117
Phi, 73
Spearman, 74
Curva, grfico de, 217
Cox-Mantel , 35
Cox: Modelo de Risco Proporcional, 282
Crivo (screening test), 82
D
DAgostino, teste, 165
DAgostino-Pearson, teste, 166
Densidade e tamanho da populao, 134
Diagrama de disperso, grfico, 213
Diagrama IC, 294
Diagrama Pontual, 297
Discriminante, anlise, 276
Distncia multivariada, 21
Euclidiana, 21
Penrose e Mahalanobis, 22
Distribuio de probabilidades, 75
binomial, 75
crivo (Screening test), 82
curva ROC, 83
exponencial, 78
F, 86
hipergeomtrica, 76
normal, 79
Poisson, 77
Qui-Quadrado, 87
Regra de Bayes, 85
Sensibilidade/Especificidade, 85
t Student, 87
Z, 88
Duas amostras independentes, 99
coeficiente de variao, 114
Odds Ratio (OR), 110
Risco Relativo, (RR), 112
taxa de Incidncia, 113
teste binomial, 104
teste exato de Fisher, 100
teste G, 105
teste de Kolmogorov-Smirnov, 106
teste de Mann-Whitney, 107
teste da Mediana, 108
teste de Poisson, 115
E
Entrando com os dados, 8
Escolha do teste estatstico, sugestes, 265
Escolhendo o teste, 11
Estatstica descritiva, 125
Estimao de parmetros, 129
da diferena entre duas mdias, 131
da diferena entre duas propores, 133
da mdia,129
da proporo, 130
densidade e tamanho da populao, 134
fentipos e gentipos, 135
Fourier (densidade) , 136
Hardy-Weinberg, 137
tamanho da populao, 138, 139 ,139, 141
Estratificadas, amostras, 15
Euclidiana, distncia, 21
Executando o teste, 9
Exponencial, distribuio, 78
F
F, distribuio, 86
Fatorial, anova, 45, 47
Fentipos e gentipos, 135
Frmulas estatsticas,
anlise multivariada, 227
anlise de sobrevivncia, 228
anlise de varincia, 229
correlao, 231
distribuio de probabilidades, 233
duas amostras independentes, 237
duas amostras relacionadas, 240
- 320 -
NDICE
estatstica descritiva, 242
estimao de parmetros, 245
meta-anlise, 250
normalidade, 253
Qui-Quadrado, 254
regresso, 256
tamanho das amostras, 260
transformao de dados, 262
uma amostra, 235
Fisher, teste exato, 104
Fourier (densidade), 136
Freqncia, tabelas de, 223
Friedman, teste de, 48
I
Imprimindo, 11
Incidncia, taxa de, 113
Independncia,
duas amostras, 99
Qui-Quadrado, 151
ndice, 319
Instalando o BioEstat, 3
K
Kaplan-Meier, 29
Kappa, teste, 123
Kendall
coeficiente de concordncia, 71
coeficiente de correlao, 72
Kolmogorov-Smirnov, teste de
aderncia, 94, 167
independncia, 106
uma amostra, 94
Kruskal-Wallis, teste de, 50
G
G, teste , 93, 105, 155
Gehan, 36
Glossrio, 303
Grficos e tabela, 205
rea, 206
box-plot (mediana), 207
box-plot (media), 208
caule e folha, 209
coluna, 211
curva, 217
diagama IC, 294
diagrama pontual,, 297
disperso, 213
histograma, 214
manipulao, 221
mximo e mnimo, 218
pirmide populacional, 298
polar, 219
resultados, 225
setor, 220
tabelas de freqncia, 223
L
Lilliefors, teste de, 95, 167
Linear, correlao, 65, 69
Linear mltipla, regresso , 179
Linear simples, regresso, 177
Logstica mltipla, regresso, 187
Logstica simples, regresso , 185
Log-Rank test, 31
M
Mahalanobis, distncia de, 22
Manipulao, Grficos, 221
Mann-Whitney, teste de, 107
Mantel-Haenszel, 36, 148
Mximo e mnimo, grfico, 218
McNemar, teste de, 120
Mdia, estimao da, 129
Mediana, teste da, 108
Meta-Anlise, 143
DerSimonian-Laird, 144
H
Hipergeomtrica, distribuio, 76
Histograma, grfico, 214
Hotelling, teste de, 24
- 321 -
NDICE
Poisson, teste, 98, 115
Polgono de freqncia, 214
Polinomial, regresso, 188
Probabilidades, distribuio, 75
Proporo,
estimao da, 130
uma amostra, 92
duas amostras, 104
vrias propores, 158
Q
Q, de Cochran, 52
Qui-Quadrado,
amostras independentes, 109
distribuio do, 87
homogeneidade, aderncia, 150
homogeneidade, independncia, 151
Mantel-Haenszel, 148
partio, 173
tendncia, 174
uma amostra, 96/97
vrias propores, 158
N
Normal, distribuio, 79
Normalidade, 165
D'Agostino, teste de, 165
D'Agostino-Pearson, teste de, 166
Kolmogorov-Smirnov, teste de, 167
Lilliefors, teste de, 167
Shapiro-Wilk, teste de, 168
Valores extremos, 169, 170
Obtendo ajuda, 12
Odds-ratio, 110, 144, 148
P
Parcial, correlao, 68
Pearson, correlao de, 65, 69
Penrose, distncia de, 22
Pirmide Populacional, 298
Ponto de Corte, 285
Populao, tamanho,
amostragem simples direta, 138
amostragem simples inversa, 139
amostragem mltipla pop. aberta, 139
amostragem mltipla pop. fechada, 141
densidade e tamanho, 134
Poisson, distribuio de, 77
S
Salvando os dados, 9
Setor, grfico de, 220
- 322 -
NDICE
Teste de Mantel-Haenszel, 36, 148
Teste de Mann-Whitney, 107
Teste de McNemar, 120
Teste de Parker, 141
Teste de Poisson, 98, 115
Teste de Shapiro-Wilk, 136
Teste de Schumacher e Eschmeyer, 139
Teste de Wilcoxon, 124
Teste do Qui-Quadrado
amostras independentes, 109
homogeneidade, 150, 151
partio, 173
tendncia, 174
uma amostra, 96/97
vrias propores, 158
Teste dos sinais, 122
Teste exato de Fisher, 104
Teste G
amostras independentes, 105
uma amostra, 93
homogeneidade, 155
Teste Kappa, 123
Teste Q de Cochran, 52
Teste t
duas amostras independentes, 100, 288
duas amostras relacionadas, 117, 292
uma amostra, 89, 288
Teste Z
duas amostras independentes, 102, 291
uma amostra, 91, 289
Transformao de dados, 201
Sensibilidade/Especificidade, 85
Shapiro-Wilk, teste, 168
Sinais, teste dos, 122
Spearman, correlao de , 74
Sugestes, escolha do teste estatstico, 265
T
t de Student, distribuio, 87
Tabela de freqncia, 223
Tamanho da populao
amostragem simples direta, 138
amostragem simples inversa, 139
amostragem mltipla pop. aberta, 139
amostragem mltipla pop. fechada, 141
Tamanho das amostras, 191
anlise de varincia, 192
correlao linear, 192
McNemar, 193
proporo
duas amostras, 195
uma amostra, 194
Qui-Quadrado, 173
teste t
amostras pareadas, 117
duas amostras independentes, 100
uma amostra, 89
Taxa de incidncia, 113
Teste binomial
duas propores, 104
uma proporo, 92
Teste da Mediana, 108
Teste de Bartlett, 25
Teste de Cox-Mantel, 34
Teste DAgostino, 165
Teste DAgostino-Pearson, 1166
Teste de Gehan, 35
Teste de Friedman, 48
Teste de Hotelling, 24
Teste de Kappa, 123
Teste de Kaplan-Meier, 29
Teste de Kolmogorov-Smirnov
duas amostras independentes, 106
uma amostra, 84, 167
Teste de Kruskal-Wallis, 50
Teste de Lilliefors, 95, 167
U
Uma amostra, 89
binomial, teste, 92
teste G, 93
teste de Kolmogorov-Smirnov, 94
teste de Lilliefors, 95
teste do Qui-Quadrado, 96/97
teste de Poisson, 98
teste t de Student, 89
teste Z, 91
- 323 -
NDICE
V
Valores extremos, 169 e 171
Vrias propores, 158
Variao, coeficiente de, 114
Varincia, anlise de, 39
W
Wilcoxon, teste de, 124
Z
Z, distribuio, 88
Z, teste para duas amostras independentes, 102
Z, para uma amostra, 91
- 324 -