Você está na página 1de 139

ESTATSTICAEBIOESTATSTICA

NDICE GERAL

I - INTRODUO .............................................................................................................................................5
1. NOES GERAIS ..........................................................................................................................................6
2. POPULAO E AMOSTRA ............................................................................................................................9
3. MTODOS DE AMOSTRAGEM ....................................................................................................................11

3.1 AMOSTRAGENS PROBABILSTICAS E NO-PROBABILSTICAS .......................................................11


3.1.1 As Amostras Probabilsticas .................................................................................................................11
3.1.1.1 TIPOS DE AMOSTRAGENS PROBABILSTICAS ......................................................................................12
3.1.1.2 TIPOS DE AMOSTRAGENS NO PROBABILSTICAS:............................................................................14

3.2 DETERMINAO DO TAMANHO DA AMOSTRA..................................................................................16


3.2.1 Clculo do Tamanho da Amostra para Populaes Infinitas (>100.000 elementos)..............16
3.2.2 Clculo do Tamanho da Amostra para Populaes Finitas (<100.000 elementos) ................18
3.2.3 Determinao da Margem de Erro da Amostra................................................................................20
3.2.4 Determinao da Amostra sem conhecer os limites da populao.............................................20

3.3 INDIVDUO OU UNIDADE ESTATSTICA.............................................................................................21


3.4 VARIVEL ESTATSTICA....................................................................................................................22
3.5 ESTATSTICA DESCRITIVA E ESTATSTICA INDUTIVA....................................................................24
3.6 PARMETRO E DADO ESTATSTICO ...................................................................................................24
3.7 REPRESENTAO DE UMA VARIVEL ESTATSTICA ........................................................................25
3.8 REDUO DE UMA VARIVEL ESTATSTICA .....................................................................................29
3.8.1 Mdia...........................................................................................................................................................30
3.8.2 Mediana ......................................................................................................................................................33
3.8.3 Moda............................................................................................................................................................34
3.8.4 Quantis ........................................................................................................................................................38
3.8.5 Medidas de disperso .............................................................................................................................40
3.8.6 Coeficiente de disperso .......................................................................................................................49

3.9 AS CARACTERSTICAS DA DISTRIBUIO NORMAL...........................................................................51


3.9.1 A curva normal e os desvios-padro .................................................................................................53

4. ESTATSTICA PARAMTRICA E NO PARAMTRICA ..............................................................................59


5. TESTES NO PARAMTRICOS PASSO-A-PASSO .....................................................................................63

5.1 TESTE DO QUI-QUADRADO................................................................................................................63


5.2 PROCEDIMENTOS PARA ORDENAO DE RESULTADOS ....................................................................67
5.3 TESTES PARA DUAS AMOSTRAS INDEPENDENTES ...........................................................................69
5.4 TESTE U

DE

MANN-WHITNEY .........................................................................................................70

6. TESTES PARA DUAS AMOSTRAS RELACIONADAS ....................................................................................74

6.1 PROVA DE McNEMAR PARA A SIGNIFICNCIA DE MUDANAS .........................................................75


1
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6.2 CORRECO DE CONTINUIDADE ........................................................................................................78


6.3 TESTE DOS SINAIS DE WILCOXON .....................................................................................................79
7. TESTES PARA K AMOSTRAS INDEPENDENTES.........................................................................................82

7.1 TESTE DE KRUSKAL-WALLIS ...........................................................................................................82


8. TESTES PARA K AMOSTRAS RELACIONADAS ...........................................................................................87

8.1 PROVA DE COCHRAN ..........................................................................................................................88


8.2 TESTE DE FRIEDMAN .........................................................................................................................92
9. MEDIDAS DE CORRELAO E SUAS PROVAS DE SIGNIFICNCIA .............................................................97

9.1 COEFICIENTE DE CORRELAO RHO DE SPEARMAN-RANK .............................................................97


9.2 O

COEFICIENTE DE CONCORDNCIA DE

KENDALL...........................................................................99

10. TESTES PARAMTRICOS PASSO-A-PASSO .........................................................................................106

10.1 CORRELAO ..................................................................................................................................106


10.2 TESTE T DE STUDENT (NO RELACIONADO) ..............................................................................111
10.3 TESTE T DE STUDENT (RELACIONADO).......................................................................................115
10.4 ANLISE DE VARINCIA .......................................................................................................119
10.4.1 Anlise da Varincia com Igual Tamanho .....................................................................................119
10.4.1.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS ............................................................123
10.4.2 ANLISE DE VARINCIA COM DIFERENTES TAMANHOS ..................................................125
10.4.2.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS ............................................................127

ANEXOS ........................................................................................................................................................129

Anexo I ...................................................................................................................................................130
Anexo II ..................................................................................................................................................131
Anexo III.................................................................................................................................................132
Anexo IV ................................................................................................................................................133
Anexo V..................................................................................................................................................134
Anexo VI ................................................................................................................................................135
Anexo VII ...............................................................................................................................................136
Anexo VIII ..............................................................................................................................................137
Anexo IX ................................................................................................................................................138
Anexo X ..................................................................................................................................................139

2
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

NDICE DE ILUSTRAES

FIGURA 1: POPULAO E AMOSTRA......................................................................................................................................... 10


FIGURA 2: AMOSTRA ESTRATIFICADA ....................................................................................................................................... 13
FIGURA 3: CONVERSO DOS NIVEIS DE CONFIANA EM DESVIOS PADRO .................................................................................. 17
QUADRO 1: QUADRO GERAL DE SERIAO .............................................................................................................................. 25
QUADRO 2: QUADRO DE FREQUNCIAS .................................................................................................................................... 26
QUADRO 3: QUADRO DE FREQUNCIAS .................................................................................................................................... 27
QUADRO 4: QUADRO DE FREQUNCIAS .................................................................................................................................... 28
QUADRO 5: QUADRO DO CLCULO DA MDIA .......................................................................................................................... 30
QUADRO 6: QUADRO DO CLCULO DA MDIA .......................................................................................................................... 31
QUADRO 7: CLCULO DA MDIA PONDERADA .......................................................................................................................... 32
FIGURA 4: CURVA SIMTRICA .................................................................................................................................................. 35
FIGURA 5: CURVA ASSIMTRICA DIREITA .............................................................................................................................. 36
FIGURA 6: CURVA ASSIMTRICA ESQUERDA .......................................................................................................................... 36
FIGURA 7: CURVA ASSIMTRICA DIREITA .............................................................................................................................. 39
FIGURA 8: CURVA SIMTRICA ACHATADA (PLATOCURTICA) ..................................................................................................... 42
QUADRO 8: CLCULO DO DESVIO MDIO ................................................................................................................................ 44
QUADRO 9: CLCULO DO DESVIO MDIO PARA CLASSES ......................................................................................................... 45
QUADRO 10: CLCULO DA VARINCIA .................................................................................................................................... 45
QUADRO 11: CLCULO DA VARINCIA .................................................................................................................................... 46
FIGURA 9: DISTRIBUIO NORMAL .......................................................................................................................................... 51
FIGURA 10 - DISTRIBUIO LEPTOCRTICA E PLATICRTICA .................................................................................................... 51
FIGURA 11: % DE RESULTADOS 1 DP ACIMA E ABAIXO DA MDIA ............................................................................................. 54
FIGURA 12: POSIO DE UM RESULTADO .................................................................................................................................. 55
QUADRO 12: TABELA DE CONTINGNCIA (CROSSTAB)............................................................................................................. 65
QUADRO 13: ORDENAO DE UM GRUPO EM FUNO DO N. DE FACTORES DE RISCO ............................................................... 67
QUADRO 14: ORDENAO PARA AMOSTRAS RELACIONADAS OU EMPARELHADAS ................................................................... 69
QUADRO 15: RESULTADOS DO REGISTO DAS QUEIXAS .............................................................................................................. 71
QUADRO 16: TESTE MCNEMAR................................................................................................................................................ 75
QUADRO 17: TABELA DE QUATRO CASAS PARA A PROVA DE SIGNIFICNCIA DE MUDANAS ...................................................... 77
QUADRO 18: RESULTADOS DO TESTE DO VOCABULRIO ........................................................................................................... 79
QUADRO 19: NMERO DE IDEIAS RELEMBRADAS PARA TRS TIPOS DE TESTES .......................................................................... 83
QUADRO 20: Q DE COCHRAN .................................................................................................................................................. 89
QUADRO 21: Q DE COCHRAN .................................................................................................................................................. 90
QUADRO 22: AVALIAO DE TRS TIPOS DE ILUSTRAES ....................................................................................................... 93
QUADRO 23: COEFICIENTE DE CONTINGNCIA DE RHO DE SPEARMAN-RANK ......................................................................... 99
QUADRO 24: POSTOS ATRIBUDOS A 6 CANDIDATOS A EMPREGO POR 3 CHEFES DE PESSOAL.................................................... 100
FIGURA 13: DIAGRAMA DE DISPERSO DE PONTOS OU SCATTERPLOT OU SCATTERGRAM ......................................................... 107
QUADRO 25: CORRELAO DE PEARSON ............................................................................................................................... 110
QUADRO 26: TESTE T NO RELACIONADO .............................................................................................................................. 114
QUADRO 27: TESTE T RELACIONADO ..................................................................................................................................... 117
QUADRO 28: DADOS DE 4 AMOSTRAS E RESPECTIVAS MDIAS ................................................................................................ 118
3
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

QUADRO 29: NOTAO PARA ANLISE DA VARINCIA ........................................................................................................... 119


QUADRO 30: RECIDIVAS POR TRATAMENTO ............................................................................................................................ 121
QUADRO 31: ANOVA .......................................................................................................................................................... 123
QUADRO 32: POST-HOC DAS RECIDIVAS ................................................................................................................................. 124
QUADRO 33: MDIAS POR TRATAMENTO ................................................................................................................................ 125
QUADRO 34: ANOVA .......................................................................................................................................................... 127
QUADRO 35: POST-HOC ......................................................................................................................................................... 128

4
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

I - INTRODUO

Desde sculos o homem tem, muitas vezes, tomado notas de coisas e de pessoas, no com o
nico fim de acumular nmeros, mas com a esperana de utilizar os dados do passado para a
resoluodeproblemasdopresenteassimcomoparaaprevisodeacontecimentosfuturos.No
entanto,osucessoquantoaesteobjectivosfoipossvelemdatamuitorecente:snofinaldo
sculoXIXe,sobretudo,noprincpiodosculoXXque,comaaplicaodeprobabilidadesaos
problemassobreainterpretaodosdadosrecolhidos,foipossvelresolveralgunsdeles.
AEstatsticaconquistou,hoje,oseulugarentreascincias.Opoderdoseumtodo,sobretudo,
afirmado nas ltimas dcadas e aplicase, agora, nos domnios mais variados. At aqui, s um
pequenonmerodepessoassepreocupoucomestudosestatsticos,querpelanaturezadassuas
investigaes, quer por causa da sua utilidade para as diferentes profisses. O valor e a
importnciadomtodoestatsticoresidemnoesforoparamelhorcompreenderonossomundo,
tomaravilhosamentecomplexo,tantonopontodevistafsicocomosocial,levamnosasonhar
queelesetorneobjectodeumconhecimentocomoasoutrascincias.Avidacorrentelevanosa
decisesparapassardoconhecidoaodesconhecido,daexperinciapreviso.
Este curso tem por fim fornecer conhecimentos estatsticos (sem ter muitos conhecimentos
matemticos) e saber interpretar resultados que podem ser obtidos atravs de programas de
computador.

5
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

1. NOES GERAIS

Paraalgumaspessoas,aEstatsticanosenoumquadrodecolunasmaisoumenoslongasde
nmeros que dizem respeito populao, indstria ou ao comrcio, como se v
frequentementeemrevistas;paraoutras,eladgrficosmostrandoavariaonotempodeum
facto econmico ou social, a produo ou os nmeros relativos aos negcios de uma empresa,
assimcomoseencontranosescritriosdeempresasprivadas.
To diferenciados se apresentam os mtodos estatsticos que no possvel estabelecer uma
definio que os contenha a todos. Apesar disso, apresentamos a seguir uma definio que,
emboranecessariamenteincompletacomoqualqueroutra,temavantagemdeintroduziroaluno
namatria.
AEstatsticatemcomofinalidadeelaborardeumasntesenumricaqueevidencieoquedemais
generalizadoesignificativoexistanumconjuntonumerosodeobservaes.
O grande nmero de observaes de que se parte reflecte uma diversidade tal que se torna
ininteligvel a sua interpretao. Para que, a partir dessa diversidade se possa comear a
entender logo, tornase necessrio reduzir sucessivamente as observaes, ganhandose em
generalidadeoquesevaiperdendoemindividualidade.
A sntese implica, assim, que nos desprendamos do que particular e individual para nos
atermos ao que existe de mais geral no conjunto das observaes; medida que a sntese
progride,vaiseperdendoocontactocomasparticularidadesimediatas.
Destemodo,aEstatsticanoseocupadoqueexcepcional,masapenasdoquegeral:nose
interessa pelo indivduo, mas por grupos de indivduos; no se ocupa, em suma, de uma s
medio,masdeumconjuntodemedies.
Acrescentese,ainda,queasntesenumrica.Queristodizerqueseprescindeinteiramentedas
palavras e dos recursos literrios de mais ou menos efeito que elas possibilitam. Alcanase a
sntesepelorecursoexclusivodosnmeros.

6
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Da o af com que frequentemente se escolhem os nmeros de acordo com os argumentos. A


Estatstica intrinsecamente uma disciplina no literria, manipula exclusivamente nmeros e
alcanaasnteseordenandoosecooperandocomeles.
Estatstica, deriva de status que em latim significa Estado, e que s por si demonstra a
ligaoquesempreexistiuentreambos;
O primeiro levantamento estatstico remonta a 3050 a.C., no Egipto, tendo como objectivo
informaroestadosobrerecursoshumanoseeconmicos.
No sc. XVII d.C., a disciplina de Estatstica era j leccionada nas universidades alems,
continuandocomafinalidadededescreveraspopulaeseasriquezasdoEstado.
Aindanosc.XVII,dseaexpansodosseuscamposdeinvestigaoareascomo:
Sadepblica;
Indstria;
Comrcio;
EstudosDemogrficos.

Os mtodos de inferncia estatstica surgem com Jonh Graunt (16201674), um modesto


comerciante,quetiraconclusesvlidassobreumapopulaodesconhecidaporele.
Fermat (16011665) e Pascal (16231662) permitem que o estudo do acaso tome uma expresso
matemtica,introduzindooClculodasProbabilidades.
O Clculo das Probabilidades e o aparecimento do Mtodo dos mnimos quadrados, vm
credibilizaraEstatsticaconferindolheafundamentaomatemticaemqueelaassentahoje.
Nosc.XVIIILambertQuetelet(17961874)introduziuaEstatsticaemreascomo:
Meteorologia;
Antropometria;
CinciasSociais;
Economia;
Biologia.

7
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

FrancisGalton(18221911),apresentanoesderegressoecorrelao;
KarlPearson(18571936)apresentaamaisbelaeacabadateoriadeEstatstica,ficandotambm
conhecidopelosseuscoeficientes;
FishereosseustrabalhossobreinfernciaEstatsticaderamtambmumgrandecontributoao
desenvolvimentodaEstatstica.
Em 1943,dseumagrandereviravolta,umavezqueotratamentodedadosdeixadeserfeito
manualmenteepassaasercomputadorizado.
MtodoEstatstico:
Tcnicausadaparaobter,analisareapresentardadosnumricos;
Mtodocientficocujafinalidadeoestudodaspropriedadesnumricas
dosconjuntosdosfactos.

OMtodoEstatstico,segundoateoriadeCramer,pressupeasseguintesfases:
Recolhadedadosestatsticos:obtenodaamostraapartirdapopulao,
devendo depurar e rectificar os dados estatsticos, que no seu conjunto
sodenominadossrieestatstica.
Descrio:conjuntodeoperaes,numricasougrficas,efectuadassobre
os dados estatsticos determinando a sua distribuio; procedese sua
ordenao,codificaoerepresentaopormeiodequadrosetabelas.
Anlise: consiste em tirar concluses sobre a distribuio da populao,
determinaroseugraudeconfianaeaindaformularhipteses,tentando
verificlas,quantoaofenmenoemestudo.
Predio: uma previso do comportamento do fenmeno em estudo,
tendoemcontaadefiniodadistribuioestatstica.

8
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

2. POPULAO E AMOSTRA

Populao: somatrio dos indivduos ou elementos, com qualquer caracterstica comum e que
estosujeitosaumaanliseestatstica,portereminteresseparaoestudo.
Quantosuaorigempodeser:

Conjuntodepessoas;

Conjuntodeobjectos;

Conjuntodeacontecimentos.

Quantosuanaturezapodeser:

Existenteoureal;

Hipotticaounototalmenteexistente;

Conjuntofinito;

Conjuntoinfinito.

Podeaindaser:

Amostra:umsubconjuntoretiradodapopulao,quesesupeserrepresentativodetodasas
caractersticas da mesma, sobre o qual ser feito o estudo, com o objectivo de serem tiradas
conclusesvlidassobreapopulao.
Amostragem: o procedimento pelo qual um grupo de pessoas ou um subconjunto de uma
populao escolhido com vista a obter informaes relacionadas com um fenmeno, e de tal
formaqueapopulaointeiranosinteressaestejarepresentada
OPlanodeAmostragemserveparadescreveraestratgiaautilizarparaseleccionaraamostra.
Este plano fornece os detalhes sobre a forma de proceder relativamente utilizao de um
mtododeamostragemparadeterminadoestudo.

9
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Logo que o investigador delimite a populao potencial para o estudo, ele deve precisar os
critriosdeselecodosseuselementos.
Certoscritriosdizemrespeitoscaractersticasrequeridasparaqueumelementoousujeitofaa
partedaamostra:
Aamplitudedaidadedosparticipantes;
Condiesdesadeprecisas.

Igualmentecertoscritriosdefinemossujeitosquenofaropartedoestudo:

Populao

Populao-alvo
Amostra

Figura 1: Populao e Amostra

Um investigador interessado pela readaptao aps cirurgia de revascularizao, pode


concentrarsesomentenossujeitosquetiveramumanicaexperinciadestetipoeexcluremos
outros.
Umaamostraditarepresentativaseassuascaractersticasseassemelhamomaispossvelsda
populaoalvo.particularmenteimportantequeaamostrarepresentenosasvariveisem
estudo,mastambmoutrosfactoressusceptveisdeexerceralgumainflunciasobreasvariveis
estudadas,comoaidade,osexo,aescolaridade,orendimento,etc.
ARepresentatividadeavaliasecomparandoasmdiasdaamostracomasdapopulaoalvo.

10
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Comoseignorasetodasascaractersticasdapopulaoestopresentesnumaamostradadoque
estassomuitasvezesdesconhecidas,admitesequeexistesempreumgraudeerro.
ERRODEAMOSTRAGEM:adiferenaqueexisteentreosresultadosobtidosnumaamostrae
osqueteriamsidoobtidosnapopulaoalvo.

Duassoluesexistemparareduziraomnimooerroamostral:
1. Retirar de forma aleatria e um nmero suficiente de sujeitos que faro parte da
amostra.
2. Procurar reproduzir o mais fielmente possvel a populao pela tomada em conta das
caractersticasconhecidasdesta.

3. MTODOS DE AMOSTRAGEM
3.1 AMOSTRAGENS PROBABILSTICAS E NOPROBABILSTICAS
3.1.1 As Amostras Probabilsticas

Os mtodos de amostragem probabilstica servem para assegurar uma certa preciso na


estimaodosparmetrosdapopulao,reduzindooerroamostral.
Aprincipalcaractersticadosmtodosdeamostragemprobabilsticaresidenofactodequecada
elementodapopulaotemumaprobabilidadeconhecidaediferentedezero,deserescolhida,
aquandodatiragemaoacasoparafazerpartedaamostra.
Oobjectivodestaabordagemobteramelhorrepresentatividadepossvel.

11
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.1.1.1 TIPOS DE AMOSTRAGENS PROBABILSTICAS

TiposdeAmostragem:
a) AAmostragemAleatriaSimples;
b) AAmostragemAleatriaEstratificada;
c) AAmostragememCachos;
d) AAmostragemSistemtica.

AMOSTRAGEM ALEATRIA SIMPLES

AAmostragemaleatriasimplesumatcnicasegundoaqualcadaumdoselementos(sujeitos)
quecompeapopulaoalvotemigualprobabilidadedeserescolhidoparafazerpartedeuma
amostra.Aamostragemaleatriasimplesconsisteemelaborarumalistanumricadeelementos
deondesetira,comaajudadeumatabeladenmerosaleatrios,umasriedenmerospara
constituiraamostra.

AMOSTRAGEM ALEATRIA ESTRATIFICADA

AAmostragemaleatriaestratificadaumavariantedaamostraaleatriasimples.Estatcnica
consisteemdividirapopulaoalvoemsubgruposhomogneoschamadosestratoseaseguir
tirar de forma aleatria uma amostra de cada estrato. A Amostragem aleatria estratificada
utilizadaquandoapopulaointeirareconhecidaporcertascaractersticasprecisas,taiscomoa
idade, o sexo, a incidncia de uma condio de sade, tudo isto para assegurar a melhor
representatividadepossvel.

12
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA
P o p u la o - A lv o

2 0 0 0 e s tu d a n te s e m
S o c ia is

C i n c ia s

C la s s ific a o

E s tr a t ific a o P r o p o r c io n a l
E s tra to 1

E s tra to 2

E s tra to 3

D o u to ra m e n to

M e s tra d o

L ic e n c ia tu r a

400 = 20%

600 = 30%

1000 = 50%

E s c o lh a A le a t r ia

E s tr a t ific a o N o - P r o p o r c io n a l
A m o s tra = 2 0 0
E s c o lh a A le a t r ia d e 1 0 % e m

c a d a E s tra to

4 0 E s tu d a n te s

6 0 E s tu d a n te s

1 0 0 E s tu d a n te s

D o u to ra m e n to

M e s tra d o

L ic e n c ia t u r a

Figura 2: amostra estratificada

AMOSTRAGEM EM CACHOS

Consiste em retirar de forma aleatria os elementos por cachos em vez de unidades. til
quandooselementosdapopulaoestonaturalmenteporcachoseporissodevemsertratados
comogruposouquandonopossvelobterumalistagemdetodososelementosdapopulao
alvo.

AMOSTRAGEM SISTEMTICA

Consistequandoexisteumalistaordenadadeelementosdapopulao.EstatcnicaconsisteK
elementosdessalistasendooprimeiroelementodaamostraretiradoaoacaso.
Ointervaloentreoselementoscorresponderazoentreotamanhodapopulaoedaamostra.
Exemplo:Sepretenderumaamostrade100indivduoseapopulaoforde1000osistemaser
1000:100=10 (dez em dez o sistema), isto , ser includo um elemento da lista de 10 em 10
indivduosapartirdo1.n.sorteado.

13
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Importante
Se se utilizar uma amostragem por cachos ou outros tipos de agrupamentos, a amostra s
consideradaprobabilsticaseosgruposforamescolhidosaoacasoantesdarepartioaleatria
dossujeitosnosgrupos.

3.1.1.2 TIPOS DE AMOSTRAGENS NO PROBABILSTICAS:

umprocedimentodeselecosegundooqualcadaelementodapopulaonotemamesma
probabilidadedeserescolhidoparaformaraamostra.
Estetipodeamostragemtemoriscodesermenosrepresentativaqueaprobabilsticanoentanto
muitas vezes o nico meio de construir amostras em certas disciplinas profissionais
nomeadamentenareadasade.
TiposdeAmostragensNoProbabilsticas:
a)

AAmostragemAcidentaloudeConvenincia;

b)

AAmostragemporCotas;

c)

AAmostragemdeSelecoRacionalouTipicidade;

d)

AAmostragemporRedesouBoladeNeve.

AMOSTRAGEM ACIDENTAL OU DE CONVENINCIA

formada por sujeitos facilmente acessveis, que esto presentes num determinado local e
momentopreciso.
Exemplo: pessoas hospitalizadas. Um investigador pode ter acesso a uma unidade hospitalar
paraconstituirumaamostradepacienteshospitalizados.
Nestetipodeamostratemavantagemdesersimplesemorganizarepoucoonerosa,todaviaeste
tipodeamostraprovocaenviesamentos,poisnadaindicaqueasprimeiras30a40pessoassejam

14
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

representativas da populaoalvo. So utilizadas em estudos que no tm como finalidade a


generalizaodosresultados.

AMOSTRAGEM POR COTAS

Idnticaamostragemaleatriaestratificadadiferindodestaapenaspelofactodossujeitosno
seremescolhidosaleatoriamentenointeriordecadaestratooudecadagrupo.

AMOSTRAGEM POR SELECO RACIONAL OU POR TIPICIDADE

Temporbaseojulgamentodoinvestigadorparaconstituirumaamostradesujeitosemfuno
doseucarctertpico.
Por exemplo: o estudo de casos extremos ou desviantes como uma patologia rara ou uma
instituio.

AMOSTRAGEM POR REDES OU BOLA DE NEVE

Consisteemescolhersujeitosqueseriamdifceisdeencontrardeoutraforma.Tomaseporbase,
redessociaisamizadeseconhecimentos.
Porexemplo:ImigrantesdeLeste.
Quando o investigador encontra sujeitos que satisfazem os critrios escolhidos pedelhes que
indiquemoutraspessoasdecaractersticassimilares.

15
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.2 DETERMINAO DO TAMANHO DA AMOSTRA


Os tamanhos das amostras so relativos, isto , depende do tamanho da populao. Para
determinar as amostras existem vrias frmulas, consoante o parmetro em critrio. As mais
utilizadasnasadesoasquesebaseiamnapercentagemdofenmeno:

3.2.1 Clculo do Tamanho da Amostra para Populaes


Infinitas (>100.000 elementos)

Aamostradependeda:
1. Extensodouniverso;
2. DoNveldeConfiana;
3. DoErroMximopermitido;
4. Dapercentagemcomqueofenmenoseverifica.

F rm ula:

n= 2 . (p.q)
e2

n=Tamanhodaamostra
=Nveldeconfianaescolhidoexpressoemndesviospadro(s)
p=%comoqualofenmenoseverifica
q=%complementar(100p)
e=Erromximopermitido

16
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Sedesejarmosumnveldeconfianabastantealtosuperiora99%aplicaseafrmuladostrs
desvios.

Figura 3: converso dos niveis de confiana em desvios padro

Logo,odesvio(s)2seriaiguala32=9
Seoerromximoforde2%oe2seriguala22=4

Exemplo:Seforpossveladmitirqueonmerodecaptaesdeguaemprofundidadesesituam
porvoltados50%,noultrapassandoesta%,entop=50e,consequentemente,q=10050ouseja
50.Assim,temseaequao
n= 9 . (50.50) = 5625
4

Isto,paraatendersexignciasestabelecidas,on.decaptaesaanalisarseria5625.
Setodavia,foraceiteonveldeconfianade95%(2desvios)eumerromximode5%on.de
elementosserbemmenor.
osclculos.
n=2 . (p.q)
e2
n= 4 . (50.50) = 400
25

Convmlembrarquesemprequenosejapossvelestimarumapercentagemdofenmeno,deve
utilizarsesemprep=50

17
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.2.2 Clculo do Tamanho da Amostra para Populaes


Finitas (<100.000 elementos)

Aamostradependeda:
1. Extensodouniverso;
2. DoNveldeConfiana;
3. DoErroMximopermitido;
4. Dapercentagemcomqueofenmenoseverifica.

Frmula

Onde:
n=Tamanhodaamostra
=nveldeconfianaescolhido,expressoemnmerosdedesviospadro
p=percentagemdofenmeno
q=percentagemcomplementar
N=tamanhodapopulao
e2=erromximopermitido
Exemplo:Verificarquantosdos100empregadosdeumacantinacumpremcorrectamenteas
normasdehigieneeseguranadotrabalho.
Presumesequeessen.nosejasuperiora30%dototal;desejaseumnveldeconfianade95%
(2desvios)etoleraseumerroat3%.

Ento,n=90,4Logodeveroserpesquisados90empregados.
Confirmeaplicandoafrmula
Mas,seapopulaofossede10.000empregados,comosmesmoscritriosanteriormente
referidos,ento:

n= 4 . (30.70).10000 = 853
(9.9999)+4.(30.70)

18
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

DETERMINAO DO TAMANHO DA AMOSTRA

Otamanhoptimodeumaamostra,nodependetantodotamanhodapopulaomassimde
doisparmetrosestatsticos:amargemdeerroeonveldeconfiana
MargemdeerroUmaamostrarepresentaaproximadamente(enuncaexactamente)uma
populao.Amedidadesteaproximadamenteachamadamargemdeerro,elidoassim:
seumapesquisatemumamargemdeerrode2%eaDoenaCardacateve25%deprevalncia
naamostrarecolhida,podemosdizerque,naqueleinstante,napopulao,elateruma
prevalnciaentre23%e27%(25%menos2%e25%mais2%).
NveldeconfianaAspesquisassofeitascomumparmetrochamadonveldeconfiana,
geralmentede95%.Estes95%queremdizeroseguinte:serealizarmosumaoutrapesquisa,com
umaamostradomesmotamanho,nasmesmasdataselocaisecomomesmoinstrumentode
recolhadedados,humaprobabilidadede95%dequeosresultadossejamosmesmos(euma
probabilidadede5%,claro,dequetudodifira).
Quandojseefectivouumapesquisaesedesejaconheceramargemdeerroutilizadaaplicase:

p =

Frmula

(p.q)
n

Onde:
n=Tamanhodaamostra
p=Erropadrooudesviodapercentagemcomqueseverificadeterminadofenmeno
p=percentagemdofenmeno
q=percentagemcomplementar

19
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.2.3 Determinao da Margem de Erro da Amostra

Exemplo:Numapesquisaefectuadacom1000adultos,verificouseque30%bebemcafpelo
menosumavezpordia.Qualaprobabilidadedequetalresultadosejaverdadeiroparatodoo
universo.

p =

(30.70)
1000
p = 1,45

Comoovalorencontrado(margemdeerro)correspondeaumdesvio,entoparadoisdesvios
(95,5%),temos1,45*2=2,90.
Para3desviosotriplo(4,35).
Istosignificaque,porexemplo,paraumnveldeconfianade95%(2desvios)oresultadoda
pesquisaapresentarcomomargemdeerro2,90paramaisoumenos.
provvel,portanto,queon.deconsumidoresdecafestejaentre27,10%(30%2,90)e32,90%
(30%+2,90).

3.2.4 Determinao da Amostra sem conhecer os


limites da populao

Frmula

Z 2 ( /2 ) p (1 -p )
d2

Emque
p=fenmeno]
=erro
{SeIC(intervalodeconfiana)=95%,=5%(0,05)}Ento
/2=0,05/2=0,025
Z(/2)=Z(0,025)=1,96
d=nmerodedesvios

20
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Assimparaumfenmenoquetenhaumaprevalnciade25%,osresultadosseriam:

Emtermosestatsticosconsideramosqueumaamostra:Pequenasen<30

CUIDADOS

A TER NA ESCOLHA DA AMOSTRA:

1. Imparcialidade:todososelementosdevemteramesmaprobabilidadeeoportunidadede
seremescolhidos;
2. Representatividade: deve conter em proporo todas as caractersticas que a populao
possui,qualitativaequantitativamente,demodoaquenosetornetendenciosa;
3. Tamanho: suficientemente grande de modo a fornecer as principais caractersticas, por
outroladopequenaparaeconomizartempo,dinheiroepessoal.

3.3 INDIVDUO OU UNIDADE ESTATSTICA

OestudoEstatsticorecaisobreaamostra,noentantoestefeitodemodopormenorizadoacada
umdoselementosdaamostra,quesodesignadosporIndivduoouUnidadeEstatstica.
Unidade Estatstica: o factor elementar, o objecto de anlise, que independentemente da sua
naturezatemquepossuirumadefinioprecisa.
AsprincipaiscaractersticasdeumaboaunidadeEstatsticaso:
1. Propriedadeouadequaoaoobjectivodainvestigao;
2. Clareza;
3. Mensurabilidade;
4. Comparabilidade.

21
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

NoestudodecadaunidadeEstatstica,surgemresultadosindividuaiscomosquaissofeitasas
infernciassobreapopulao.EstesresultadostmonomedeDadoEstatstico.
DadoEstatstico:oresultadodoestudoefectuadoacadaunidadeEstatsticatendoemcontaa
suaindividualidade,sendoestedepoistratadodemodoapermitirinferirsobreacolectividade
queaintegra(populao).

3.4 VARIVEL ESTATSTICA

Ao ser efectuada uma anlise Estatstica a uma populao, os aspectos (caractersticas) que se
tmemconta,umouvrios,sodenominadosporVarivelEstatstica.
UmavarivelEstatsticapodeser:

1. Qualitativa:seasuanaturezaquevariadeelementoparaelemento.
Asvariveisqualitativasdividem:seem:
a. Variveisnominais:quandooseusignificadosseentendeemfunodonomee
o nmero ou cdigo que se lhe atribua no nos d nenhuma informao (sexo,
cordeolhos,graudeparentesco,tipodepatologia,presena/ausnciadefactores
derisco,etc.).
b. Variveis ordinais: quando existe uma ordenao possivel (gravidade de uma
leso,classesocial,graudeescolaridade,etc.).

22
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

2. Quantitativa: se a sua intensidade que varia de elemento para elemento, tornandoa


mensurveloureferencivel.
Asvariveisquantitativasdividemseem:
a. Variveisdiscretas:assumevaloresisolados,normalmenteinteiros(n.defilhos,
n.defactoresderisco,n.dedependentes,n.derespostas,etc)
b. Variveis contnuas: em que possvel qualquer operao aritmtica, podendo
assumirqualquervalorreal(altura,peso,IMC,distncia,etc).

Tendoemcontaonmerodeatributos(caractersticas)queestoaserestudadas,asvariveis
podemser:
1. Unidimensionais:seapenascorrespondeaumatributo
2. Bidimensionais:secorrespondeadoisatributos;
3. Pluridimensionais:secorrespondeavriosatributos.

Modalidade: toda a manifestao possvel de uma varivel, isto , as vrias hipteses de


resposta,podendoelasserduasoumais.
Asmodalidadestmobrigatoriamentequeser:
1.

Incompatveis:cadaunidadeEstatsticanopodepertencersimultaneamentea
duasoumaismodalidades;

2.

Exaustivas: todas as unidades Estatsticas tm que ser inseridas numa


modalidade.

Aescolhadasmodalidadesdeveserfeitadeacordocomasinformaespossudas.Noentanto,
surgemsituaesemquehnecessidadedeseaumentarumamodalidadesuplementar.

23
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.5 ESTATSTICA DESCRITIVA E ESTATSTICA INDUTIVA


AEstatsticaDescritivarecolhe,organizaeanalisaosdadosdeumaamostra,semtirarqualquer
conclusosobreumgrupomaior.
A Estatstica Indutiva recolhe, organiza, analisa e estabelece relaes entre os dados para fazer
infernciassobreapopulao.Combasenosresultadosobtidossobreaamostrapodemosinferir
concluses vlidas sobre a populao (este ramodaEstatsticajexigeautilizaoderecursos
matemticosespeciais,nomeadamenteaTeoriadasProbabilidades).
Assim,aEstatsticaIndutivapermitenosfazerinfernciassobreapopulaoechegaraleisea
teorias.

3.6 PARMETRO E DADO ESTATSTICO

Oparmetrotodaafunodefinidaapartirdosdadosnumricosdeumapopulao.

Exemplo:consideremosasseguintesnotasemEstatstica101110159
Mdia =xi/n = 55/5 = 11

Ovalor11oparmetro(resultadodamdiaaritmtica).

Odadoestatsticotodaafunodefinidaapartirdosdadosnumricosdeumaamostra.
Exemplo:consideremosaamostra:1010
Mdia =xi/n = 20/2 = 10

O valor 10 o dado estatstico

24
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.7 REPRESENTAO DE UMA VARIVEL ESTATSTICA

Depoisdetermosdefinidoalgumasnoesbsicasdeestatstica,tratarse,aseguir,dasegunda
fasedeumestudoestatstico.Comojreferimos,osdadosnumricosrecolhidosregistamseem
sriesestatsticase,paraseremanalisados,devemserordenadoserepresentadosemquadrose
emgrficos.
Quandotrabalhamoscomumavariveldiscretaoudescontnuafalamosemseriaoequando
trabalhamoscomumavarivelcontnuafalamosemclassificao.

SERIAO DE UMA AMOSTRA

Como j referimos anteriormente, uma seriao implica que a varivel seja discreta (exemplo:
nmerodefilhosdeumcasal,nmerodedivisesdeumacasa,etc.).
Oquadrogeraldeumaseriaoestexpressonoquadroquesesegue.
Quadro 1: Quadro Geral de Seriao

Varivel

Frequncias
absolutas

Frequncias
acumuladas

X1

n1

n1

X2

n2

n1+ n2

X3

n3

n1+ n2+ n3

Xi

ni

n1+ n2+ +ni

Xk

nk

n1+ n2+ +nk

Total
N
Legenda: Distribuio de frequncias de uma varivel discreta

Frequncias
relativas
n1
N
n2
N
n3
N

ni
N

nk
N
1

Frequncias
relativas
acumuladas
n1
N
n1+n2
N
n1+ n2+n3
N

n1+ n2++ ni
N

Na primeira coluna temos os valores que a nossa varivel X toma (x1, x2, ..., xk). Esta coluna
podesertambmdenominadaporxi.
Nasegundacolunaapresentamosasfrequnciasabsolutassimplesouefectivas,isto,onmero
devezesquecadavalorfoiobservadoouonmerodevezesquecadavalorsurgenaamostra.
25
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Estacolunapodetambmserdenominadaporni.Devemoslembraraquiqueonmerototalde
indivduos pertencentes populao/ou amostra chamase efectivo total e designase por n,
devendosempreverificarsequeni=n.
Naterceiracolunapodemosvisualizarasfrequnciasacumuladas,isto,asomadasfrequncias
absolutas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser
tambmdenominadaporN(xi).Assim,
N(xi) = ni
xi<x

Na quarta coluna apresentamos as frequncias relativas simples. Esta coluna pode ser tambm
denominadaporfi,emquefi=ni/ne,detalmodoque,fi=1;afrequnciarelativaexpressa,
emgeral,empercentagem.
Na quinta coluna temos as frequncias relativas acumuladas, isto , a soma das frequncias
relativas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser
tambm denominada por F(xi); a frequncia relativa acumulada expressa, em geral, em
percentagem.
Exemplo:ConstruaoquadrodefrequnciasparaavarivelXquetomaosseguintesvalores:
xi

14

14

13

12

11

12

10

Quadro 2: Quadro de Frequncias

xi

ni

fi=ni/n

N(xi)

F(xi)

10

1/9

1/9

11

1/9

2/9

12

3/9

5/9

13

2/9

7/9

14

2/9

9/9

ni = 9

fi = 1

em que n = 9

26
Margarida Pocinho e Joo Paulo de Figueiredo

13

12

ESTATSTICAEBIOESTATSTICA

CLASSIFICAO DE UMA AMOSTRA

Como j referimos anteriormente, uma classificao implica que a varivel seja contnua
(exemplo:atemperaturadeumcorpo,aalturadeumapessoa,aduraodecertofenmeno,etc.
variveisrelacionadascomoespao,otempoouamassa).
Quadro 3: Quadro de Frequncias

Frequncias
Marcas da

Frequncias

Frequncias

Frequncias

classe

absolutas

acumuladas

relativas

Classes

relativas
acumuladas

c0-c1

X1

c1-c2

n1

X2

c2-c3

n2

X3

n3

n1

n1

n2

n1+n2

n1
n1+ n2
N

n3

n1+ n2+n3

ni

n1+ n2++ ni

n1+ n2+ n3

ci-1-ci

Xi

ni

n1+ n2+ +ni

ci-1-ck

Xk

nk

n1+ n2+ +nk

nk
1
N
Total

Legenda: Distribuio de frequncias de uma varivel contnua

Naprimeiracolunatemosasclasses.Porconveno,asclassessoabertassuperiormente,com
excepodaltimaclasse,naturalmente.
Nasegundacolunatemosasmarcasdaclasse.Estacolunapodesertambmdesignadaporxi.A
marcadeumaclasseopontomdiodessaclasse,ouseja,opontoequidistantedosextremos
deumaclasse.

Exemplo:classec0c1 x1=(c0+c1)/2

Naterceiracolunaapresentamosasfrequnciasabsolutassimplesouefectivas,ouseja,onmero
devezesqueosvaloresdedeterminadaclasseforamobservados.Estacolunapodesertambm
denominada por ni. Mais uma vez, ni = n (nmero total de indivduos pertencentes
populao/ouamostra,aquesechamaefectivototal).
Na quarta coluna apresentamos as frequncias acumuladas, isto , a soma das frequncias
absolutas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser
tambmdenominadaporN(i).
27
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Na quinta coluna temos as frequncias relativas simples. Esta coluna pode ser tambm
denominadaporfi,emquefi=ni/ne,detalmodo,quefi=1.
Na sexta coluna apresentamos as frequncias relativas acumuladas, isto , a soma das
frequncias relativas correspondentes a valoresinferioresaumdeterminadovalor.Estacoluna
podesertambmdenominadaporF(i).

NumaclassificaohabitualrepresentarmosporKonmerodeclasses(emgeralKvariaentre
5e20,inclusive)eporAaamplitude(emqueA=xmximoxmnimo).

Ento,
- Se K dado = A/K
- Se dado K=A/ , sendo a amplitude do intervalo de
classe e A a amplitude do intervalo
da amostra

Exemplo:Construaoquadrodefrequnciascomosseguintesdados:
Classes [20-23[ [23-26[ [26-29[ [29-32[ [32-35[ [35-38]
ni
2
5
7
10
4
2
Quadro 4: Quadro de Frequncias

Classes

ni

ni

fi

N(i)

F(i)

x'i

[20-22]

2/30

2/30

21

[23-25]

5/30

7/30

24

[26-28]

7/30

14

14/30

27

[29-31]

10

10/30

24

24/30

30

[32-34]

4/30

28

28/30

33

[35-38]

2/30

30

30/30

36

= 30

fi

= 1em que n = 30 e = 3

28
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.8 REDUO DE UMA VARIVEL ESTATSTICA

CONCEITO DE REDUO E SUA CONVENINCIA

Anteriormente definimos o conceito de varivel estatstica e construramse quadros e grficos


estatsticos com vista a uma descrio numrica e grfica de uma varivel estatstica.
Naturalmente, os grficos permitem uma primeira sntese das informaes registadas nos
quadros.
Por outro lado, por simples aproximao das curvas de frequncias absolutas ou relativas de
duasoumaisvariveis,podemosfazerumaprimeiracomparaoentreelas.
H, porm, necessidade de sintetizarmos toda a informao respeitante a uma varivel
estatstica, resumindose os dados a um pequeno nmero de elementos que bastam para
caracterizla. Tal sntese consiste na reduo de dados e os elementos numricos obtidos
designamseporparmetrosdavarivelestatstica.
Feitaarepresentaodosdadosestatsticospormeiodequadrose/oudegrficos,importafazer
sobreosmesmosumestudonosentidodesepoderchegaraconcluses.
Paratal,impeseumtrabalhodesimplificaoqueconsisteemprocederasnteses,emreduzir
grandesquantidadesdedadosanmerossimplesquepermitamumaanliserpidaeumafcil
comparaocomoutrassriesdamesmanaturezaoudenaturezadiferente.
Tais nmeros so designados, habitualmente, por caractersticas, parmetros ou medidas e so
agrupadosemcategoriasconformeotipodeinformaoquefornecem.

29
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

MEDIDAS DE TENDNCIA CENTRAL OU DE POSIO

Sobestadesignaoagrupamseosparmetrosque,ounosindicamalgodeassocivelaoncleo
ou centro da distribuio, ou nos permitem compartimentla. Vamos considerar as seguintes
medidasdetendnciacentraloudeposio:mdia,mediana,modaequantis.

3.8.1 Mdia
MDIA ARITMTICA

Amdiaaritmticaopontodeequilbriodosdados,isto,tendoumconjuntodenvaloresx1,
x2,...,xndeumavarivelXoquocienteentreasomadessesvaloreseonmerodeles.
Amdiaaritmticapodeserrepresentadapelaseguintefrmulamatemtica:
x = xi / n

Numaamostraseriadaosvaloresx1,x2,...,xkocorremn1,n2,...,nkvezes,respectivamente,a
mdiaaritmticaser
x = nixi / n = fixi

Exemplo:Calculeamdiaaritmtica,sabendoque

xi
ni

4
2

6
4

7
5

8
3

Quadro 5: Quadro do clculo da mdia

xi

ni

nixi

24

35

24

10

20

=16

=111

Ento,
x = nixi / n = 111/16= 6,94
30
Margarida Pocinho e Joo Paulo de Figueiredo

10
2

ESTATSTICAEBIOESTATSTICA

Numa amostra classificada a frmula definidora da mdia no se pode aplicar directamente


porque no conhecemos os valores exactos da varivel estatstica, mas apenas o nmero de
observaesdentrodecadaclasse,isto,quandoosdadosestoagrupadosemclasses,parao
clculo da mdia simples, devemos considerar o ponto mdio de cada classe (marca) como
representativo de todos os valores nela includos, pelo que aquela pode ser representada pela
frmulamatemticaseguinte:
x = nix'i / n = fix'i

Exemplo:Calculeamdiaaritmtica,sabendoque
Classes
ni

[3-5[
2

[5-7[
4

[7-9[ [9-11[ [11-13]


5
3
2

Quadro 6: Quadro do clculo da mdia

Classes

ni

x'i

nix'i

[3-5[

3,5

[5-7[

5,5

22

[7-9[

7,5

37,5

[9-11[

9,5

28,5

[11-13]

12

24

=16

=119

Ento:
x = nix'i / n = 119/16 = 7,43

Temos de salientar que quando usamos a marca da classe estamos a colocar um certo erro de
agrupamento,peloquedevemosconsideraraCorrecodeSheppard,detalmodoque:

x semelhante a x

Relativamentespropriedadesdamdiaaritmticapodemosenunciarduas:

Somandoousubtraindoumaconstanteatodososvaloresobservados,amdiaresultante
ficaraumentadaoudiminuda,respectivamente,dessaconstante;

Multiplicandooudividindoosvaloresobservadosporumaconstantediferentedezero,a
mdiaresultanteficarmultiplicadaoudividida,respectivamente,poressaconstante.

31
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

MDIA ARITMTICA PESADA OU PONDERADA:

Porsuavezassociaseax1,x2,...,xkcertosfactoresdeponderaooupesosp1,p2,...,pkque
dependemdosignificadoouimportnciaatribudasobservaes.Assim,afrmulamatemtica
damdiaser:
x p = pixi / pi

Exemplo 9: Umprofessordematemticaquersaberamdiapoderadadassuasavaliaesnas
quatroturmasemquelecciona,sabendoqueotestetinhaumaponderaode30%eotrabalho
umaponderaode70%:
TurmaAMdiadanotadoteste=65%

Mdiadanotadotrabalho=78%

TurmaBMdiadanotadoteste=60%

Mdiadanotadotrabalho=70%

TurmaCMdiadanotadoteste=40%

Mdiadanotadotrabalho=28%

TurmaDMdiadanotadoteste=80%

Mdiadanotadotrabalho=75%

Determineamdiaponderadadasquatroturmasemconjunto.
xp=pixi/pi

[((65*30)/100)

((78*70)/100)

((60*30)/100)

((70*70)/100)

((40*30)/100) + ((28*70)/100) + ((80*30)/100) + ((75*70)/100)]/4 = 62,3

Sepreferirmosemquadroaresoluoser
Quadro 7: Clculo da mdia ponderada

xi

pi

pixi

65

30

1950

60

30

1800

40

30

1200

80

30

2400

78

70

5460

70

70

4900

28

70

1960

75

70

5250

400

24920

x p = pixi / pi=24920/400=62,3

32
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Para alm da mdia aritmtica e da mdia aritmtica ponderada, temos tambm a mdia
geomtrica, a mdia harmnica e a mdia quadrtrica (a estes trs tipos de mdias no iremos
fazerqualquerreferncia).

3.8.2 Mediana

Amedianadeumasriedenobservaesx1,x2,...,xndeumavarivelXovalorqueocupaa
posiocentralquandoasobservaesestoordenadasporordemcrescenteoudecrescente,isto
,amedianadeumavarivelestatsticaovalordessavariveltalqueafrequnciadosvalores
que lhe so inferiores a mesma que a frequncia dos valores que lhe so superiores.
Representase,habitualmente,porMd.
Amedianausadaquandonaamostrahvaloresexcntricosemrelaoaoutrosvalores.
Paraoclculodamediana,temosdeconsiderarduassituaes:ocasoemqueNmpareocaso
emqueNpar.
N

MPAR:

Amedianaumvalorobservado,detalmodoqueolugarqueocupadadopelafrmula
Md = (N +1) / 2

Exemplo:Determineamedianaparaaseguintesriededados:
5

Ordenandoporordemcrescente,vem56789

ComoNmpar,ento

Md=(N+1)/2=(5+1)/2=6/2=3

Seamedianaocupaaterceiraposioouterceirotermo,oseuvalor7

33
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

PAR:

Amediananocoincidecomnenhumvalorobservadoficandocompreendidaentredoisvalores
centrais classemediana;convencionousetomarparamedianaamdiadestesdoisvalores.A
posioqueamedianaocupadadapelafrmula
Md = mdia dos valores que se encontram na posio N / 2 e (N / 2) + 1

Exemplo:Determineamedianaparaaseguintesriededados
5

12

Ordenandoporordemcrescente,vem5678912
ComoNpar,ento N/2=6/2=3;(N/2+1)=3+1=4
Assim,aclassemedianaocupadapelasposies3e4,ouseja,pelosvalores7e8,peloquea
Md=(7+8)/2=15/2=7,5

3.8.3 Moda

A moda (ou valor modal) de uma srie de n valores x1, x2, ..., xn de uma varivel X o valor
ondeafrequnciaatingeomximo(relativo).Representase,habitualmente,porMo.

AMOSTRA SERIADA:

Amodaovalordavarivelcommaiorefectivo,isto,seumavariveldiscreta,a(s)moda(s)
(so)o(s)valor(es)davarivelestatsticaqueseobserva(m)commaiorfrequncia.
Exemplo:Determineamodaparaaseguintesriedevalores

xi

10

ni

Amoda8.

34
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

AMOSTRA CLASSIFICADA:

Nestecasofalamosemclassemodal,tomandoseparamodaamarcadaclasse.Assim,amoda
deumavarivelcontnuaXtodoovalordeXparaoqualafunodefrequncia(absolutaou
relativa)atingeummximolocal.
Exemplo:Determineamodaparaaseguintesriedevalores
classes [2-4[
ni

[4-6[

[6-8[

[8-10[

[10-12]
10

Aclassemodal[810[,peloqueamoda=(8+10)/2=18/2=9

RELAO EMPRICA ENTRE A MDIA, A MEDIANA E A MODA

Pearson chegou concluso de que para as distribuies unimodais e moderadamente


assimtricas,vigoraaseguinterelaoemprica:

MdiaModa=3(MdiaMediana)

Vejamos,agora,arelaoexistenteentreestastrsmedidasnocasodasfigurasqueseseguem

Figura 4: Curva simtrica

35
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Figura 5: Curva assimtrica direita

Mdia > Moda


Mdia > Mediana
Mediana > Moda

Figura 6: Curva assimtrica esquerda

Moda > Mediana


Moda > Mdia
Mediana > Mdia

A UTILIZAO DA MDIA ARITMTICA, DA MEDIANA E DA MODA


MDIA ARITMTICA:

A medida de tendncia central mais usada a mdia aritmtica, que apresenta em relao
medianaemodavantagensapreciveis,taiscomo:

facilmentecalculvel;

aquemelhorseprestaaulterioresanlisesestatsticas;

Dependedetodososvaloresdasrie;

umamedidadetendnciacentralparticularmenteestvel,variandoomenospossvel
deamostraparaamostraextradasdamesmapopulao;

Podesertratadaalgebricamente.

Existem,todavia,casosemqueainformaofornecidapelamedianaoupelamoda,pareceser
maiscompletadoqueafornecidapelamdiaaritmtica,comopassamosaindicar.

36
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

MEDIANA:

Estamedidadetendnciacentraldeverutilizarsequando:

Sedesejaconheceropontomdioexactodadistribuio;

Existemresultadosextremosqueafectariamgrandementeamdia.Importasalientarque
a mediana no influenciada pelos resultados extremos exemplo: na srie
10,13,15,16,18,19,21,tantoamdiacomoamedianaso16;sesubstituirmos21por50eos
restantesresultadospermaneceremosmesmos,amediana16eamdiaserde20,1;

A distribuio truncada, isto , incompleta nas extremidades exemplo: desejamos


medir os tempos de reaco em Psicologia e as vrias respostas ultrapassam as
capacidades de medida do aparelho; vemonos, assim, impossibilitados de calcular a
mdia,jquenodispomosdetodososvaloresdavarivel,sendo,noentanto,possvel
calcularovalordamediana,jqueconhecemosonmerodemedidasefectuadas.

MODA:

Estamedidadetendnciacentraldeverutilizarsequando:

Umamedidarpidaeaproximadadatendnciacentralforsuficiente;

Sedesejaconhecerovalormaistpicodeumadistribuioexemplos:descreveroestilo
devestidousadopelamulhermdia,salriopreponderanteemdeterminadaempresa.

desalientarque,apesardasvantagensapresentadasparaamoda,estatemadesvantagemde
serdedeterminaoimprecisa,nocasodasvariveiscontnuas.

37
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.8.4 Quantis

Chamasequantildeordempcom0p1erepresentase,habitualmente,porCpaovalordex
talqueF(x)=p.
Algunsquantistmdenominaesespeciais:

QUARTIS:

Osquartisdividemasrieordenadaem4partesiguais,contendocadaumadelas1/4ou25%das
observaes.
Q1=1quartil(correspondeaoquantildeordemp=1/4)
Q2=2quartil(correspondeaoquantildeordemp=1/2)
Q3=3quartil(correspondeaoquantildeordemp=3/4)

Assim, Q1 o valor da varivel estatstica que deixa atrs de si 25% das observaes; Q2 o
valordavarivelestatsticaquedeixaatrsdesi50%dasobservaeseQ3ovalordavarivel
estatsticaquedeixaatrsdesi75%dasobservaes.A(Q1Q3)chamaseintervalointerquartil
eointervaloaoqualpertencem50%dasobservaes,deixando25%paraadireitae25%paraa
esquerda.
de notar que dizer que os quartis dividem a srie em 4 partes iguais no significa que, por
exemplo, os intervalos (Q1, Q2) e (Q2, Q3) tm a mesma amplitude, mas sim que contm o
mesmonmerodeobservaes.

DECIS:

Os decis dividem a srie ordenada em 10 partes iguais, contendo cada uma delas 1/10 ou 10%
dasobservaes.
D1=1decil(correspondeaoquantildeordemp=1/10)
D2=2decil(correspondeaoquantildeordemp=2/10)
38
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

CENTIS:

Oscentisdividemasrieordenadaem100partesiguais,contendocadaumadelas1/100ou1%
dasobservaes.
C1=1centil(correspondeaoquantildeordemp=1/100)
C2=2centil(correspondeaoquantildeordemp=2/100)

RELAES ENTRE QUARTIS, DECIS, CENTIS E MEDIANA:

Comopodemosobservarnafigura18

Q1=C25
Q2=Md=D5=C50
Q3=C75
D1=C10
D2=C20

Figura 7: Curva assimtrica direita

39
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.8.5 Medidas de disperso

Uma medida de tendncia central no nos d, s por si, uma informao exaustiva da
distribuio considerada; pelo contrrio, a capacidade que se lhe atribui de representar os
elementos de uma distribuio depende do modo como estes se concentram ou dispersam em
torno dela. Assim, podemos dizer que os parmetros de tendncia central no so suficientes
para caracterizar uma srie estatstica, apesar de a mediana e os quantis darem j uma ideia
sumriadomodocomoestodistribudasasobservaes.
Consideremososeguinteexemplo:Doisgruposdealunoscomasseguintesclassificaes

A
B

2
8

3
9

10
10

16
11

19
12

A mdia e a mediana 10 e, contudo, estas distribuies so muito diferentes. Com efeito,


enquanto no grupo A as notas apresentam desvios muito grandes, na distribuio B todos os
valoresseaproximamde10.Adispersoouvariabilidadedaprimeirasriemaisacentuadado
quenasegunda.
Quer dizer: distribuies com a mesma tendncia central podem apresentar aspectos bastante
diferentesnoqueconcernedispersoouvariabilidade,emedidaqueestadispersoaumenta,
menossignificativasdadistribuiovosendoasmedidasdetendnciacentral.
Assim,paramelhorcaracterizarmosumadistribuio,temosdeconsiderar,almdasmedidasde
tendncia central, uma outra medida que exprima o grau de disperso ou variabilidade dos
dados.
Vamos considerar as seguintes medidas de disperso: amplitude total, amplitude interquartis,
desviomdio,varincia,desviopadroecoeficientededispersooudevariao.

AMPLITUDE TOTAL

Aamplitudetotaladiferenaentreomaiorvaloreomenorvalor,isto,aamplitudetotalde
uma varivel estatstica a diferena entre o valor mximo e o valor mnimo dos valores

40
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

observados.aformamaissimplesdeavaliaradispersodosdados,detalmodoquequanto
maiorforaamplitudetotalmaioradispersodosdados.
A amplitude total pode ser tambm denominada de intervalo total ou campo de variao;
representase,habitualmente,porAeapenasusavaloresextremos.
Numaamostraseriada:
A=xmximoxmnimo

Numaamostraclassificada:
A=extremosuperiordaltimaclasseextremoinferiordaprimeiraclasse
Se alguma destas classes for de amplitude indeterminada no possvel definir o intervalo de
variao.

Aamplitudetotalapresentaasseguintesdesvantagens:
Emborasejafcildecalcular,aamplitudetotaldependesomentedosvaloresextremos,queso,
geralmente,osmenosfrequenteseosmenossignificativosdeumadistribuio,desprezandose
os valores intermdios que so os mais frequentes. Alm disso, os valores extremos so
vulgarmenteanmalosemuitovariveis,consoanteaamostraqueseretiredeumapopulao,
detalmodoqueduasdistribuiespodemteramesmaamplitudetotal,masdispersesmuito
diferentes.
Outro inconveniente da amplitude total consequncia de no tomar em considerao as
frequnciasdasobservaes.
Exemplo:CalculeaamplitudetotaldogrupoG,sabendoque:
G=

10

16

19

A = xmximo - xmnimo = 19-2 = 17

41
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

AMPLITUDE INTERQUARTIS

Osquartisfornecemindicaoquantoformacomoasobservaessedistribuememtornoda
mediana.
Como o 1 e o 3 quartis representam valores abaixo dos quais esto, grosso modo,
respectivamente, 25% e 75% das observaes, entre eles existiro, assim, 50% das observaes
centrais. Consequentemente, quanto mais aproximados estiverem estes quartis, maior ser a
concentraodasobservaesemtornodamediana.
AamplitudeinterquartispodeserdefinidacomoadiferenaentreoQuartil3eoQuartil1.Esta
medida de disperso pode ser tambm denominada de intervalo interquartis ou intervalo
quartlico.
Como podemos observar na figura 8, quanto mais achatada a curva, maior a amplitude e
quantomaioraamplitudeinterquartlicamaisdispersaadistribuio.

Q1

Md

Q3

Figura 8: Curva simtrica achatada (platocurtica)

Exemplo:Calculeaamplitudeinterquartis,sabendoqueQ3=177,46eQ1=166,88.
Q=Q3Q1=177,46166,88=10,58

Podemostambmcalcularaamplitudesemiinterquatisouintervalointerquartlicoouintervalo
semiquartil ou desvio quartlico ou amplitude semiinterquartlico, que se representa,
habitualmente,porQepodeserdefinidadoseguintemodo:
Q = (Q3-Q1) / 2

Adistribuiotantomaisdispersaquantomaiorforaamplitudeinterquartis.
Podemos enumerar as vantagens e as desvantagens do uso da amplitude interquartis e da
amplitudesemiinterquartis:
42
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Estas medidas so mais completas do que a amplitude total, porque usam dois valores menos
extremos(Q1eQ3).Noentanto,tmaindaalimitaodenoentrarememlinhadecontacoma
disposio das frequncias nos intervalos definidos pelos valores separados exemplo: a
amplitudeinterquartisseramesma,queras50%dasobservaesseacumulemnumsponto,
querestejamuniformementedistribudasporesseintervalointerquartis.
As medidas de disperso que passaremos a descrever no tm esta limitao, porquanto o seu
clculodependedetodososvaloresdasrie.
DESVIO

Dadosnvaloresx1,x2,...,xndeumavarivelX,chamasedesviodecadavalorxiemrelao
constantec,adiferenadexiparac,isto,
xi - c

NotesequeosdesviosdavarivelXemrelaoac,isto,(x1c),(x2c),...,(xnc)constituemosn
valoresdavarivelXc.

DESVIO MDIO

Falamosemdesviomdioquandoconsideramososdesviosdecadavalorxiemrelaomdia
aritmtica,isto:
xi-x

O simples total destes desvios no pode ser utilizado como medida de disperso, por ser
identicamentenulo.Defacto,paranvaloressingulares,terse:
(xi-x)=0

Noentanto,oquocienteentreasomadosmdulosdestesdesvioseonmerodeles,jpodeser
consideradocomomedidadedisperso
D.M.= |xi-x | / n

43
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo20:CalculeodesviomdioparaA=453

Quadro 8: Clculo do Desvio Mdio

xi

xi-x

|xi-x |

4-4=0

5-4=1

3-4=-1

=12

3-4=-1

= 2

x = xi / n =12/3=4
D.M.= |xi-x| / n = 2/3=0,67

Observao:tambmseutilizaodesviomdioemrelaoaqualqueroutramedidadeposio
central.

Numaamostraseriadatemos:
D.M.= ni |xi-x| / n = fi |xi-x|

Se os valores da varivel estiverem tabelados de modo que cada valor xi corresponda a


frequnciaabsolutani,odesviomdioigualsomadosprodutosdasfrequnciaspelosvalores
absolutosdosrespectivosdesviosemrelaomdia,divididapeloefectivodadistribuio.

Numaamostraclassificada,osdesviosemrelaomdiaaritmticasocalculadosapartirdos
pontosmdiosdecadaclasse,ouseja:
D.M.= ni |x'i-x'| / n = fi |x'i-x'|

44
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo: Calcule o desvio mdio para

classes
ni

[4-6[
1

[6-8]
2

Quadro 9: Clculo do Desvio Mdio para classes

Classes

ni

xi

xi-x

|xi-x|

ni|xi-x|

[4-6[

4,5

4,5-6,2

1,7

1,7

[6-8]

7-6,2

0,8

1,6

=2,4
x' = nix'i / n = [(1x4,5) + (2x7)] / 3 = 6,2

=3,3

Ento,odesviomdio
D.M.= ni |x'i-x'| / n = 3,3 /3 = 1,1

Odesviomdioapresentaaseguintedesvantagem:
Embora dependa de todos os valores observados, o desvio mdio tem a desvantagem de
considerarosvaloresabsolutosdosdesvios,oqueimpedeoseutratamentoalgbrico.

VARINCIA

Outramaneiradeeliminarmosossinaisdosdesvios,consisteemelevlosaoquadrado.Porisso,
em vez da mdia dos valores absolutos dos desvios considerase a mdia dos quadrados dos
desvios.Obtmse,assim,umaoutramedidadedispersobastanteusadaavarincia.
Dados n valores x1, x2, ..., xn de uma varivel X, chamase varincia e representase,
habitualmente,pors2ous2xamdiaaritmticadosquadradosdosdesviosemrelaomdia
dessasvalores,isto:
S2 = (xi-x)2 / n
Exemplo 22: Calcule a varincia para X=17,18,19,20,21
Resoluo 22:
x = xi / n = (17+18+19+20+21) / 5 = 19

Ento,avarincia:
Quadro 10: Clculo da Varincia

xi
17
18
19
20
21
N=5

(xi-x)
17-19=-2
18-19=-1
19-19=0
20-19=1
21-19=2

(xi-x)2
4
1
0
1
4
=10

S2 = (xi-x)2/ n = 10/5 = 2
45
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Sex1,x2,...,xnocorremn1,n2,...,nkvezes,respectivamente,temos
Paraumaamostraseriada:
S2 = ni (xi-x)2 / n = fi (xi-x)2

Paraumaamostraclassificada:
S'2 = ni (x'i-x ')2 / n = fi (x'i-x ')2

Exemplo23:Calculeavarinciaparaadistribuiocujamdia103
Classes [85-90[ [90-95[ [95-100[ [100-105[ [105-110[ [110-115[ [115-120]
ni
12
25
38
85
93
16
9
Quadro 11: Clculo da Varincia

Classes

ni

xi

(nixi)

(xi-x)

(xi-x)2

ni(xi-x)2

85-90

12

87

1044

-15,5

240,25

2883

90-95

25

92

2300

-10,5

110,25

2756,25

95-100

38

97

3686

-5,5

30,25

1149,5

100-105

85

102

8670

-0,5

0,25

21,25

105-110

93

107

9951

4,5

20,25

1883,25

110-115

16

112

1792

9,5

90,25

1444

115-120

117,5

1057,5

15

225

2025

278

28500,5

12162,25

x = (nixi) / n
=28500,5/278
=102,5

Ento,avarincia
S'2 = ni (x'i-x)2/ n = 12162,25/ 278 = 43,7491

Podemos,agora,enumeraraspropriedadesdavarincia:

Somando ou subtraindo uma constante a todos os valores observados, a varincia


resultantepermanecerinalterada;

46
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Multiplicandooudividindotodososvaloresobservadosporumaconstantediferentede
zero, a varincia resultante vir multiplicada ou dividida, respectivamente, pelo
quadradodessaconstante.

CORRECODESHEPPARD:
Aocalcularseamdiaeavarinciadaamostraclassificadaatravsdadistribuioempricadas
marcas, cometese um certo erro (erro de agrupamento), pois supomos que as observaes
agrupadas em cada classe tm todas o valor da respectiva marca. Todavia, existem frmulas
correctivas devidas a Sheppard, isto ,na variancia, ao valor calculado deve subtrairse 1/12 ao
quadradodaamplitudedasclasses(a)
s2x = s2x' - a2/12 assim,nonossoexemploanterior,avarianciacorrigida

era
s2x =43,7491 - 52
12
s2x =41.666

DESVIOPADRO
O desvio padro pode ser definido como a raiz quadrada da varincia, representandose,
habitualmente,porsx,isto:
sx =

s 2x

Ainda que a varincia nos d uma boa informao sobre a distribuio ou variabilidade dos
valores observados em relao sua mdia, apresenta, no entanto, a desvantagem de no se
exprimirnamesmaunidadeaqueestoreferidososdadosiniciais.Contudo,estadesvantagem
poder ser eliminada se extrairmos a raiz quadrada da varincia. A nova medida chamase
desviopadrooudesvioquadrtico.

Numaamostraseriada,temos:

sx =

s 2x

47
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:Calculeodesviopadro,sabendoqueavarinciadeumaamostraseriada2.
sx =

s2x = 2 = 1,414

Numaamostraclassificada,temos:
sx =

s2x

Exemplo: Calcule o desvio padro, sabendo que a varincia corrigida de uma amostra
classificada4327,16.

sx =

s2x

=4327,16 = 65,78

AUTILIZAODASMEDIDASABSOLUTASDEDISPERSO
Amplitudetotal
Utilizasequando:

Osdadosforemmuitorarosoudemasiadodispersosparasejustificaroclculodeuma
medidamaisprecisadedisperso;

Forapenasnecessriooconhecimentodosresultadosextremos;

Desejamosumndicemuitorpidodedisperso.

Amplitudeinterquartlica
Utilizasequando:

Amedianaamedidadetendnciacentralusada;

Existirem resultados extremos que poderiam afectar o desvio padro de uma maneira
desproporcionada;

Adistribuiotruncada;

Adistribuioapresentaumaforteassimetria.
48
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Desviomdio
Utilizasequando:

Desejamosponderartodososdesviosemrelaomdiadeacordocomasuagrandeza;

Osdesviosextremosinfluenciaremindeterminadamenteodesviopadro.

DesviopadroeVarincia
Utilizamsequando:

Seprocuraumamedidadedispersoemrelaocomacurvanormal;

Tiveremdesercalculadosposteriormentecoeficientesdecorrelaoeoutrasestatsticas;

Sedesejarobterumamedidaqueserevistadeummximodeestabilidade;

Sesetratasomentededescreverumadistribuioprefereseodesviopadrovarincia.
Avarinciaintervmsobretudonaanliseestatstica.

3.8.6 Coeficiente de disperso

As medidas de disperso a que anteriormente nos referimos so medidas que se exprimem na


mesma unidade dos dados e, sendoassim,tornaseimpossvelcompararentresiasdisperses
deduasdistribuiescujosvaloresnoserefirammesmaunidade.
Exemplo:

DistribuioA:xA=30

sA=10

DistribuioB:xB=600

sB=20

49
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Qual a distribuio mais dispersa? Se compararmos os desvios padres a B, porque tem


maiordesviopadro.Masavariaode20para600muitomaiordoque10para30.Assim,em
vezdecompararmososdesviospadres,aplicamosoutramedidadedispersorelativaqueo
coeficientedevariaooudedisperso,quepodeserdefinidopelafrmula
V = sx /x

Exemplo26:Adistribuiodospesosedasalturasdeumgrupodeestudantesdedeterminada
Universidadeconduziuaosseguintesresultados:

X:Pesos

Mdia=57,5Kg

DesvioPadro=7,5Kg

Y:Alturas

Mdia=170cm

DesvioPadro=7,1cm

Determineocoeficientededispersoparacadaumadasdistribuiese,depois,indiqueemqual
delasadispersorelativamaior.
Vx=sx/x=7,5Kg/57,5Kg=0,130=13%
Vy=sy/Y=7,1cm/170cm=0,042=4,2%

Assim,podemosdizerqueadispersorelativamaisacentuadanadistribuiodospesos(X).
Adispersomaiornadistribuioquetivermaiorcoeficientededisperso.
Se pretendermos estabelecer comparaes entre disperses absolutas, devemos usar o desvio
padro,detalmodoquequantomaiorforodesviopadromaiorseradisperso.
Se pretendermos estabelecer comparaes entre disperses relativas, devemos usar um
coeficiente de disperso, de tal modo que quanto maior for o coeficiente de disperso V maior
seradisperso.

50
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.9 AS CARACTERSTICAS DA DISTRIBUIO NORMAL

A distribuio normal apresenta uma curva em forma de sino, como mostra a figura 9. A sua
principalcaractersticaadeastrsmedidasdetendnciacentralmdia,medianaemodaSe
encontrarem todas no mesmo ponto da curva, ou seja, todas terem o mesmo valor ou, pelo
menos,valoresmuitoprximos.SeOselementosqueconstituemumadistribuioestomuito
prximosoumuitodispersos,encontraremosformassemelhantesdafigura10.

Figura 9: Distribuio normal

Figura 10 - Distribuio leptocrtica e platicrtica

Estas no so distribuies normais, apesar de a mdia, a mediana e a moda se encontrarem


todas no mesmo ponto ( isto que confere simetria distribuio); a distribuio normal tem
sempre a forma de um sino. Como foi descoberta pelo matemtico Gauss, tambm lhe
chamamosdistribuiogaussiana.
Amaiorpartedosdadosrecolhidoscomorganismosvivostmestepadro.Podemosobservar
que, devido forma da curva, h poucos resultados muito baixos e poucos resultados muito
eleva. dos (a curva cai nos extremos esquerdo e direito, o que se deve s baixas frequncias
encontradas),enquantoamaioriadosresultadosseencontramjuntomdia.Vamosdebruar
51
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

nossobreopadroderesultadosmuitoembreve,masnestafasereferiremosoutracaracterstica
muito importante da distribuio normal. Tericamente, a curva nunca toca o eixo horizontal,
mas aproximase dele infinitamente. Esta uma propriedade matemtica da distri buio que
no se reflecte na recolha de dados real. No nos cruzamos com seres humanos com
dimensesgigantescasoumicroscspicas!
Entoaspropriedadesdadistribuionormalsoasseguintes:
1)simtrica;
2)Temformadesino;
3) A mdia, a mediana e a moda encontramse no mesmo
pontodacurva;
4)Temduaspontasquenuncatocamoeixohorizontal.

Podemos perguntarnos quo rgida a distribuio normal relativamente aos elementos. Por
outras palavras, quanto pode uma curva desviarse da forma de sino e continuar a ser
consideradanormal?Geralmente,usamosduasabordagensparatomarmosestetipodedeciso;
na verdade, este problema mais importante do que o leitor pode pensar, pois existem testes
estatsticos,descritosmaisfrente,quespodemrealizarseseoselementosforemnormalmente
distribudos. Uma das abordagens baseiase na observao dos dados por averiguao, para
lhe darmos um nome mais respeitvel. Se o conjunto de nmeros for extenso, tornarse mais
fcil desenhar uma distribuio de frequncias. A outra abordagem reside em seguir um dos
procedimentos matemticos para determinar se um conjunto de resultados normalmente
distribudo. A verso do teste do quiquadrado que inclumos neste manual um desses
procedimentos.Naverdade,improvvelquenestafasedasuacarreiraestatsticanecessitede
saber com grande preciso se uma distribuio considerada normal ou no, pelo que o teste
grficodevebastar.Noentanto,devesersensvelaoproblema.

52
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.9.1 A curva normal e os desvios-padro

Suponhamos que temos um conjunto de nmeros cuja mdia 50 e cujo desvio padro 5.
Chamamos a este valor (centmetros, segundos, pontos numa escala, ou outra coisa qualquer)
um desvio padro. Dez centmetros, segundos, etc., seriam dois desvios padro e quinze
centmetros,segundos,etc.,trsdesviospadro...semprecomrefernciaaoconjuntoatravsdo
qual obtivemos o valor 5. como se pudssemos tirar o desvio padro e transformlo numa
unidadedemedidadeumaescala;comosedissssemosqueumapolegadaso2,54cm.Nunca
misturaramos polegadas e centmetros nos mesmos clculos, mas poderamos converter uma
unidade na outra. Do mesmo modo, no misturamos resultados de desvios padro com
resultadosreais,masconvertemosumaescalanaoutra.
Voltemos s propores de nmeros em diferentes partes da distribuio. Se retirarmos uma
partedacurvaentreamdia,queestamarcadanoeixohorizontaldafiguraqueseseguecomo
50,eumdesviopadro,marcadonoeixohorizontalcomo55,sabemosquedevemostercercade
um tero de todos os resultados neste conjunto, porque o que acontece sempre com a
distribuio normal. De uma forma mais precisa, a proporo exacta do nmero total de
resultados que se encontram entre a mdia e um desviopadro acima da mdia(50e55neste
caso)34,13%.Comoadistribuionormalsimtrica,deveverificarseamesmacoisaabaixo
damdia,isto,devemosteroutros34,13%dosresultadosentreosvalores50e45sendo45o
valordamdiamenosumdesviopadrode5pontos.Observemosasduaspartesasombreado.
Aaritmticaelementardiznosque68,26%dototaldosresultadosseencontramentreosvalores
45e55,pertencendo31,74%aosvaloresextremosqueseencontramnosoutrosdoislados.Mais
umavez,asimetriadacurvasignificaque,paraestaproporo,metadede31,74%,ouseja,15,87
%,encontrasedecadaumdosladosdadistribuio.Poroutraspalavras,cercade16%detodos
osnmerosnesteconjuntoseromenoresdoque45,sendoamesmaquantidademaiordoque
55.

53
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Figura 11: % de resultados 1 dp acima e abaixo da mdia

Exemplo: Suponhamos que o professor obtm os resultados de um teste de leitura feito a 200
crianas.Osresultadossonormalmentedistribudoscomumamdiade60eumdesviopadro
de 8. A partir das propriedades da distribuio normal, sabemos que cerca de dois teros dos
resultados,isto,aquelesqueforamobtidoscomcercade136crianas,encontrarseoentreos
52eos68pontos.Cercade32crianas(16%)teroresultadosabaixode52ecercade32tero
resultadosacimade68.Josreferimostodos.Suponhamosentoqueospaisdeumacrianaque
obteve 68 gostariam de saber algo acerca do progresso do seu filho. Quando souberam que o
resultado da criana estava acima da mdia, ficaram contentes, mas gostariam de saber,
posteriormente,quoacimadamdiaseencontra,relativamenteaosoutros50%decrianasque
tambmobtiveramresultadosacimadamdia.Poroutraspalavras,ospaispretendemsaber
qualaposiorelativadodesempenhodofilho.Seosresultadosestivessemtodosmuitoperto
da mdia, sendo a nota mxima 68, os pais continuariam encantados. Ficariam, porm, menos
satisfeitos se soubessem que a nota mxima tinha sido 90, com um grande conjunto de notas
altas,acimade70.Noentanto,oprofessorsabequeodesviopadrodasnotasfoi8e,porisso,
umterodetodososresultadosestavaentre60e68.Sabendoque50%dosresultadosobtidos
estavamabaixodamdia,podemosperceberqueaposiodestacrianaestaonvelde84%
dosresultados,napartesuperiordetodososresultados.Afinal,ospaistmrazesparaestarem
contentes! Se a criana tivesse obtido 76, os pais teriam muito mais razes para estarem
orgulhosos, pois saberiam que o seu filho estava acima de 98 % das outras crianas (nota 76 e
dois desviospadro acima da mdia);umanota84colocariaomeninonaposioinvejvelde
estar acima de 99,87 % das outras crianas por outras palavras, num grupo de 200 crianas,
54
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

estaria, muito provavelmente, no topo. Os desviospadro cortam propores fixas da


distribuio normal, a partir da mdia e at ao infinito (pelo menos teoricamente), nas duas
direces.Devecertificarsedequepercebeucomoseobtmaposiorelativadanota76(isto,
50%+33%+15%)ecomosecalculaquenestegrupodecrianasexistemoutrasquatrocomnotas
acimade76.Vejaseconseguecalcularanotaquecolocariaacriananaposio,menosinvejvel,
deestarapenasaquatrolugaresdofim.
Aresposta44.Paraobtermosestanotanecessitamosdesaberquenotarepresentadoisdesvios
padro abaixo da mdia ou que nota corresponde a 2%. Partindo de 60, a mdia, se lhe
subtrairmos o valor de dois desviospadro 16, duas vezes o valor de 8, que um desvio
padroobteremos44.Devemostercuidadoenomisturarosvaloresdosdesviospadrocom
os resultados reais. Neste exemplo no subtramos o valor 2 da mdia de 60, apesar de
querermos oresultadoqueestavadoisdesviospadroabaixodele.Subtramos16pontos,pois
esteonmeroquecorrespondeadoisdesviospadroparaesteconjuntoderesultados.

Resultados z Nos exemplos considerados os resultados encontravamse sempre na mdia, ou


exactamenteum,doisoutrsdesviospadroacimaouabaixodela.Temos,porm,deexaminar
resultados que no sejam to facilmente convertveis para desviospadro. Suponhamos, por
exemplo,queumacrianacompaisansiososobteveumanota64numtestedeleitura.Aposio
dacriananacurvaseriaametadedadistncia,noeixohorizontal,entreoresultadodamdia
(60)eumdesviopadroacima(68).

Figura 12: posio de um resultado

55
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

A posio da criana exactamente a meio entre os pontos 60 e 68. Significar isto que a sua
posionogrupoopontocentralentreamdiade50%e84%danota68?Isto,encontrarse
acrianaacimade67%doscolegas?Olhemoscuidadosamenteparaasduasporesdacurva
que est dividida pela linha ao nvel da nota 64. Sero simtricas? No e aqui temos um
problemaquetornaoclculodeumaposiorelativamuitomaiscomplicadoecansativodoque
gostaramos. Quanto mais nos afastamos da mdia, menos resultados correspondem s
diferentes propores. Assim, se tivermos duas pores entre 60 e 64 e entre 64 e 68, haver
menos resultados neste ltimo intervalo. Haver ainda menos no intervalo sguinte, entre as
notas 68 e 72, e assim sucessivamente. Isto tambm verdadeiro para os resultados abaixo da
mdia,mas,nestecaso,soosresultadosmaiselevados,enoosmaisbaixos,queseencontram
maispertodamdia.Hmuitomenosresultadosentre44e48doqueentre48e52,apesarde,
em ambos os casos, a variao de notas ser de 4 pontos, ou seja, meio desviopadro. Quando
olhamosparaaformadeumadistribuionormal,otamanhodiferentedasproporesquecada
desviopadro compreende parece bvio. No entanto, o problema de decidir a posio relativa
de uma nota 64, quando comparada com os resultados, no desapareceu. Como podemos
determinla? A resposta dada atravs de resultados z. Os resultados z correspondem a
desviospadroe,naverdade,sovirtualmenteamesmacoisa,exceptonofactodeumresultado
zsereferirsempreposiodeumpontoemrelaoamdia.Istovaitornarseclaroembreve.
Paraj,pensemosqueumresultadozde1amesmacoisaqueumdesviopadrode1,queum
resultado z de 2 e um dp 2, e assim por diante. Como no h, virtualmente, nada numa
distribuionormaldepoisdoterceirodesviopadroouresultadozemqualquerdasdireces
,r,aroqueosdesviospadroouosresultadoszincluamovalor4.Ecomumreferirmonosaos
resultadoszcomomaisoumenos;aosdesviospadrodescrevemoloscomosituandoseacima
ouabaixodamdia,emvezdemaisoumenos.Umdesviopadrotemumvalordefinidono
varivel, enquanto um resultado z se refere a uma posio relativa na curva e referido em
funo da mdia. Como, at agora, um resultado z tem o mesmo significado que um desvio
padroacimadamdia,podemosconsiderarqueosresultadoszeosdesviospadrosoiguais.
No entanto, um desviopadro pode referirse a um conjunto de resultados que distem um
desviopadro de qualquer ponto da curva, enquanto os resultados z tm posies fixas. Um
resultado z de + 1 corresponde exactamente a um desviopadro acima da mdia, e no a
qualquer conjunto de resultados que constituam um desviopadro. Voltemos ao problema do
resultadode64esuaposiorelativa.Sabemosqueasuaposioexactamentemetadedeum
desviopadroacimadamdia,peloquelhedamosumresultadozde+0,5.

56
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

H tabelas que nos permitem ver muito facilmente onde os resultados z se situam na curva
normal(AnexoVIII).Vejamoscomoutilizlas.Utilizaremosonossoexemplode64,cujovalorz
+0,5.
Lemos o valor na primeira coluna da esquerda, encabeada por z, at chegarmos ao valor 0,5.
Olhamos para a coluna direita e vemos o nmero 19,15. Temos de somar 50%, de modo a
obtermos o valor 69,15. Sabemos ento que h 69,15% dos resultados abaixo de 64 e 30,85%
acima. Devemos arredondar os valores para 69% e 31%, respectivamente. Consideremos outro
exemplo,destavezcomovalor65.Estevalorest5pontosacimadamdiaeodesviopadro
paraoconjuntode8.Umresultadode5pontosacimadamdia5/8dedesviopadroacima
damdia.Sefizermosascontas,sabemosquez+0,63.Comoseencontraacimadamdia,oseu
valor positivo. Voltemos tabela 51. Como z tem, desta vez, duas casas decimais, os
procedimentos vo ser um pouco diferentes. O valor imediatamente direita (22,7) a
percentagemcorrectaparaumresultadozde0,6.Noentanto,onossoresultado0,63,peloque
temosdeandartrscolunasdatabelaataovalor0,03,notopo.Estevalor,somadoaovalor0,6,
dnos o z de 0,63 ou seja, 23,57. Como o nosso z positivo, devemos somarlhe 50% para
obtermos o valor final de 73,57. Assim, a nota 65 est frente de 74% da escala. Podemos ver
pelatabelaque49%detodasasnotasemcadaumdosladosdacurvaestoincludasnumzde
2,33ouumbocadinhomaisabaixo,parasermosmaisprecisos).Notemosque,matematicamente,
ascaudasdacurvanuncatocamoeixohorizontal,nemincluemtodososresultadospossveis.
Reparemosagoranaposiorelativadeumapessoaqueobtenhaumresultadoabaixodamdia,
digamosumanota41naamostraoriginal.Estanotaest19pontosabaixodamdia,apenasum
poucomenosdoquedoisdesviospadro.Parasermosprecisos,est19/8ou2,375abaixo.Oseu
zser2,375.NatabelaSIiemanexovemosqueumzde+2,3inclui48,93%dosresultados,mas
onossoresultadozovalorumpoucosuperiorde2,375.Anossatabelaspodeserusadacom
duascasasdecimais,peloquevamosarredondarestevalorpara2,38.Paramos,destavez,junto
dacolunade0,08eobtemosovalor49,13.Assim,umzde+2,38inclui50%+49,13%=99,13%de
todososresultados.Atagoratudobem,masoproblemaqueonossovaloreranegativo.Basta
virarmosanossacurvaaocontrrioetrabalharmoscomasuaimagemaoespelho.Assim,como
nosso valor 2,38 sabemos que 99,13% de todas as notas da distribuio esto acima dele e
apenas0,87%abaixo.Seconsiderarmosestapequenaproporode1%,devemosesperarque,na
nossaamostrade200indivduos,1%,ouseja,doisindivduostenhamnotasinferioresa41.No
57
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

outroextremodasnotas,devemosesperarqueapenasdoisalunostenhamnotasde19oumais
pontosacimadamdia,ouseja,notasqueexcedamos79%.
Omododeobterovalorzdadopelaexpressoformal
Z=

desvio da nota em relao mdia


desvio-padro

Seodesvioemrelaomdiativerumsinalpositivoounegativo,seestiveracimaouabaixoda
mdia,respectivamente,zficarcomosinalcorrecto.

Nota: : tenha cuidado quando trabalhar com z e dp, de modo a uslos sempre que os dados
atravs dos quais foram obtidos sigam uma distribuio normalOuaproximadamentenormal.
Deoutromodo,arranjarconfuses

58
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

4. ESTATSTICA PARAMTRICA E NO PARAMTRICA

Paramtricos:calculaasdiferenasnumricasexactasentreosresultados.
Noparamtricos:apenasconsideramsecertosresultadossosuperioresouinferioresaoutros
resultados.

REQUISITOSPARAUTILIZAODETESTESPARAMTRICOS
Quando se pretende empregar um teste t de Student ou uma anlise da varincia para fazer
comparaesentreamostras(testesparamtricos),existeumalistaderequisitosqueinclui,entre
outros:
1. queavariveltenhasidomensuradanumnvelmnimointervalar;
2. queadistribuiosejasimtricaemesocurtica;
3. queacaractersticaestudada(varivel)tenhadistribuionormalnumadadapopulao.

Semprequenosepode,honestamente,admitirasimetriaeanormalidadededistribuio,ou
osdadosforamrecolhidosnumnveldemensuraoinferioraointervalar,devemosrecorrera
testesquenoincluemanormalidadedadistribuioounvelintervalardemensurao.Esses
testeschamamsenoparamtricos

VANTAGENSDOSTESTESNOPARAMTRICOS
Podemserutilizados,mesmoquandoosseusdadosspodemsermedidosnumnvelordinal,
isto , quando for apenas possvel ordenlos por ordem de grandeza) podem ser utilizados
mesmoquandoosseusdadossoapenasnominais,isto,quandoossujeitospodemapenasser
classificadosemcategorias.

59
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

PODERDEUMTESTE
OpoderdeumtesteaprobabilidadederejeitarmosaH0quandoelarealmentenula
Os testes mais poderosos (os que tm maior probabilidade) de rejeio de H0, so testes que
possuemprrequisitosmaisdifceisdesatisfazer(testesparamtricoscomoteF).
As alternativas no paramtricas exigem muito menos prrequisitos mas produzem testes de
significnciacommenospoderqueoscorrespondentesparamtricos.

EMCONSEQUNCIA
Ao rejeitarse a H0 sem preencher as exigncias mnimas dos testes paramtricos, mais
provvelqueessarejeiosejafalsa(serejeitaraH0quandoelaverdadeiracometeumerrode
tipoI;seaceitaraH0quandoelafalsacometeumerrodetipoII).Quandoosrequisitosdeum
testeparamtricosoviolados,tornaseimpossvelconheceroseupodereasuadimenso()
obvioqueosinvestigadoresquerem,atodoocusto,rejeitaraH0quandoelamesmofalsa,
evitandoumerrodetipoI.
Otesteidealseriaaqueleque=0e=1,oqueimplicariaqueotesteconduziriasempredeciso
correcta,contudoestetesteidealraramenteexiste.
Aprobabilidadedoerrode1espciedeveserreduzida,fixandotericoem0,1;0,05ou0,01.o
valor fixado para depende da importncia que se d ao facto de rejeitar a H0 quando esta
verdadeira.
Umailustraodestepontodevistapodeserfeitacomoseguinteexemplo:
Umapessoainocenteatprovadocontrrio

H0:Apessoainocente

H1:Apessoaculpada

ErroI:Apessoacondenadamasestinocente
ErroII:Apessoaabsolvidamasculpada

60
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Naturalmente a justia procura reduzir a possibilidade de ocorrer o erro de 1 espcie, pois


entendesequemaisgravecondenarinocentesqueabsolvercriminosos.
Para certos sistemas judiciais um = 0,1 demasiado elevado, optando por =0,01; noutros
sistemasjudiciaispodeadmitirque=0,05umvalorrazovel.

ASSIM
Fixada a probabilidade do erro de tipo I (dimensodoteste),otestemaispotenteaqueleem
que a escolha da regio critica minimiza a probabilidade do erro de 2 espcie. Dizse tambm
queestaregiocriticaamaispotente.
Facilmenteseconcluiqueotestemaispotenteaqueleque,umavezfixadaaprobabilidadede
rejeitar a H0, quando ela verdadeira, maximiza a potncia ou a capacidade para rejeitar a
mesmahiptesequandoestafalsa.

PRESSUPOSTOS
Para saber se uma varivel simtrica dividimos o coeficiente assimetria (Skewness) pelo erro
padroeseoresultadoestiverentre2e2adistribuiosimtrica.
Parasaberseumavarivelmesocurticadividimosocoeficientedeachatamento(Kurtosis)pelo
erropadroeseoresultadoestiverentre2e2adistribuiomesocurtica.
Mas se os resultados de um teste paramtrico, no cumpriram com os requisitos (no mnimo
dados intervalares; distribuio simtrica, mesocurtica e normal), ento no tm interpretao
significativa.
Quando acontecem estes factos, a maioria dos investigadores opta por testes de significncia
noparamtricos.

61
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

PARAESCOLHERQUALQUERTIPODETESTEESTATSTICO
Distinguirseanossaamostraconstitudapelosmesmossujeitosemtodasassituaesouse
formadapordiferentessujeitosparacadasituao

INTERSUJEITOSOUDESIGNNORELACIONADO
estetipodedesignutilizadoquandoumindivduoouobjectoavaliadoapenasumavez.A
comparao efectuado entre os grupos de sujeitos/ objectos cujos resultados so no
relacionados.
Desvantagem: conjunto das diferenas individuais na forma como os sujeitos reagem ou
respondemtarefa.

INTRASUJEITOSOUDESIGNRELACIONADO
Acomparaofeitaentreosmesmossujeitos(sujeitosdomesmogrupo).
Aimportnciadestesdesignsaeliminaodequaisquerparticularidadesindividuais,umavez
queficamigualizadasemtodasassituaes.
Desvantagem:Efeitodememriaeaprendizagem.

AMOSTRASEMPARELHADAS
Igualizamsesujeitosdiferentesmasemparelhados,emtermosdeidade,sexo,profissoeoutras
caractersticasgeraisqueparecemimportantesparacadapesquisaemparticular.
estes tipos de designs podem ser considerados de designs relacionados, uma vez que
controladonassuascaractersticasrelevantes.
Desvantagem: Dificuldade em encontrar sujeitos que permitam o emparelhamento de todas as
caractersticasrelevantes.
Dificuldadesarranjargrandesamostras.

62
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

5. TESTES NO PARAMTRICOS PASSO-A-PASSO


5.1 TESTE DO QUI-QUADRADO

O QuiQuadrado (X2) de aderncia consiste em comparar os dados obtidos experimentalmente


comosdadosesperadosdeacordocomalei.Dascomparaessurgemdiferenasquepodemser
grandes ou pequenas: se forem grandes, a hiptese nula (H0) que pressupe um bom
ajustamento dever ser rejeitada em favor da hiptese alternativa (H1); se forem pequenas, a
hiptesenulanoserrejeitadaeasdiferenassoatribuveisaoacaso.
OX2deindependnciaserveparaajudaradecidirseasduasvariveisestoounoamarradas
umaoutraporumarelaodedependncia.

QUANDOUTILIZAR

Utilizasequandoosdadossonominais,peloqueemvezdesemediremresultadosdossujeitos
apenassepodemdistribuirossujeitosporumaoumaiscategorias.
OQuiQuadrado(X2)testaahipteseexperimentalqueprevquantossujeitosdecadagruposo
distribudosporumadeterminadacategoria.
OX2umtesteestatsticonoparamtrico,sendoumdosmaisutilizadosebastanteaplicadoem
diferentes planeamentos experimentais. O X2 muito usado mesmo ao nvel da estatstica
multivariada(nosentidodeobterograudeadernciaentreomodeloobtidoeoterico).

OBJECTIVO

Oobjectivocompararfrequnciasobservadascomfrequnciastericasouesperadas,ouseja,
verificaroseugraudeaproximao,quepodesergrande(=0)oupequeno(>0).
63
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Assim,oobjectivocompararasfrequnciasobservadasemcadaumadasclulasdeumatabela
de contingncia com as diferenas esperadas. O teste compara o nmero de sujeitos que se
distribuem por uma determinada categoria com o nmero de sujeitos que se esperaria se
distribussemporessamesmacategoria,casonoexistissemdiferenas.
OtestedoX2reflecteotamanhodasdiferenasentreasfrequnciasobservadaseesperadas.Para
sersignificativo,ovalordeX2deverserigualousuperioraosvalorescrticosdatabela(Anexo
I).

INSTRUESPASSOAPASSO
1. Calcular as frequncias esperadas (E) para cada clula, multiplicando os dois totais parciais
relevantesparacadaumaedividindopelonmerototaldesujeitos.
2.CalcularX2:

(O-E)2
X2

______________

emque:

O=frequnciasobservadasparacadaclula;

E=frequnciasesperadasparacadaclula.

3.Calcularosgrausdeliberdade:
g.l. = (r-1) (c-1)

emque

r=nmerodelinhasdatabeladecontingncia

c=nmerodecolunasdatabeladecontingncia

SeX2observado>X2crticorejeitaseH0

SeX2observado<X2crticonoserejeitaH0

Especificandoparaumatabeladeduplaentrada2X2:

g.l.=(nmerodecolunas1)(nmerodelinhas1)=1X1=1

64
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

A
C
A+C

B
D
B+D

A+B
C+D
N

N (AD - CB)2
X2 = _________________________________________
(A+C) (C+D) (A+C) (B+D)

Quandoumatabelatemmaisdeduasentradas:

g.l.=(nmerodecolunas1)(nmerodelinhas1)
X2 = (total de linha) (total de coluna)
(total geral)

Exemplo:Suponhaquequerestudarseosestudantesdecinciassociaisutilizamummtodode
estudo significativamente diferente daquele que utilizado pelos estudantes de tecnologia.
Escolheramsedoisgrupos,umcompostopor50estudantesdecinciassociaiseooutropor50
estudantes de tecnologia. Enviouse um questionrio aos 100 estudantes pedindolhes que
indicassememqualdasseguintescategoriasmelhorseenquadraoseumtododeestudo:estudo
dirioregular,estudoirregularemperodosconcentradosdetrabalhointensivoouumamistura
dosdois.Foramrecebidas44respostasdosestudantesdecinciassociaise42dosestudantesde
tecnologia.Colocouseahipoteseexperimental(H1)dequeotipodeestudodependiadocurso
frequentado
Os resultados so apresentados na forma de uma tabela 2X3, designada por tabela de
contingncia(crosstab).Asclulasquerepresentamcadaumadascategoriassonumeradasde
1a6.
Quadro 12: Tabela de Contingncia (Crosstab)

Tipo de estudo
Regular
Grupo 1
Estudantes de
Cincias
Sociais
Grupo 2
Estudantes de
Tecnologia
Totais dos
padres de
estudo

Irregular
2

6
5
10
16

23
E=24,05

44

24
E=22,95

42

6
8

E=7,81

Total parcial do
nmero
de
estudantes

3
15
E=11,77

E=8,19
4

Misto

E=11,23
23

47

65
Margarida Pocinho e Joo Paulo de Figueiredo

N=86

ESTATSTICAEBIOESTATSTICA

Resoluo49:

InstruesPassoaPasso:

1.calcularasfrequenciaesperadas(E)

Clula1:E=16X44/86=8,19

Clula2:E=23X44/86=11,77

Clula3:E=47X44/86=24,05

Clula4:E=16X42/86=7,81

Clula5:E=23X42/86=11,23

Clula6:E=47X42/86=22,95

2.Aplicarafrmula:

(O-E)2
X2

________________

E
X2 = (6-8,19)2 + (15-11,77)2 + (23-24,05)2 + (10-7,81)2 + (8-11,23)2 + (24-22,95)2
8,19
11,77
24,05
7,81
11,23
22,95
X2 = 0,59 + 0,89 + 0,05 + 0,61 + 0,93 + 0,05 = 3,12

3.Calcularosgrausdeliberdade(gl)
g.l. = (r - 1) (c - 1) = (2 -1) (3 - 1) = 2
4. Consultar a tabela (Anexo I)

Para
p=0,05 e gl=2
x2 critico=5,99

Concluses:DadoqueovalorobservadodeX2apenasde3,12,ouseja,inferioraovalorcrtico
de5,99parap<0,05,oresultadodaexperincianosignificativo.Aceitasehiptesenulade
que os padres de estudo dos estudantes de cincias sociais e de tecnologia no diferem,
rejeitandosedestaformaanossahipoteseexperimental(H1).

66
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

5.2 PROCEDIMENTOS PARA ORDENAO DE RESULTADOS

OstestesUdeMannWhitney;Wilcoxon;HdeKruskalWallis;rhodeSpearman;taudeKendall
e Friedman, exigem o recurso a ordenaes de resultados para efectuar os seus clculos. Neste
sentidocomearemosporexplicarosprocedimentosdeordenaoderesultados
Ordenamentoglobalderesultados(designsnorelacionadosparasujeitosdiferentes):
1.

Atribua a ordem mais baixa 1 ao resultado mais baixo, a ordem seguinte 2 ao


resultadoseguintemaisbaixo,eporafora.

2.

Osresultadosnulosde0socontadoscomooresultadomaisbaixopossvel,sendo
lheatribudaaordemmaisbaixa.

3.

Quando existem resultados idnticos solhe atribudas ordens mdias, calculadas


com base na globalidade das ordens que deviam ter sido atribudas a estes
resultados.

Exemplo:ordenarumgrupoemfunodon.defactoresderisco:

Quadro 13: Ordenao de um grupo em funo do n. de factores de Risco

N. de Factores
de risco
6

Ordem
4

12

Se existir um
zero este deve
ser considerado
o valor mais
baixo.

Noscasosemqueexistemresultadosiguaisutilizaseadoslugaresquedeviaocupar.

67
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:
N. de FR.

Ordem

6,5

6,5

AssimossujeitoscomumFactorderiscoso3(1+1+1)queocupariamo1.2.3.lugar
Ento3+2+1=6:(1+1+1)=2
Com4factoresderiscotemos2sujeitosqueocupariamo6.e7.lugar
Ento6+7=13:(1+1)=6,5

Ordenamento de diferenas entre resultados (designs relacionados para os mesmos sujeitos ou


emparelhados):
1.

Em geral, a atribuio de ordens s diferenas entre resultados efectuase tal como


fizemosparaosresultados,sendoatribudaaordemmaisbaixamenordiferenae
poraadiante;

2.

Diferenasidnticasentreresultadossoordenadasdamesmaformaqueresultados
idnticos,atribuindoseumaordemmdiaresultantedaglobalidadedeordensque
essasdiferenasdeveriamocupar;

3.

Resultadosnulosde0socontadoscomooresultadomaisbaixopossvelquandose
calculamdiferenasentreresultados;

4.

Contudo, quando existe igualdade entre resultados que originem uma diferena
nula entre as situaes experimentais, estes no so ordenados, sendo retirados da
anlise;

5.

Diferenaspositivasenegativassoordenadasemconjuntocomosesetratassede
umordenamentosimplesderesultados,ignorandoossinaispositivosenegativos.

68
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo: Suponha que quer ordenar as diferenas entre o nmero de frases correctas que
um grupo de crianas com suspeita de perda auditiva produziu antes da colocao de um
aparelhoauditivoeapsacolocaodaquele.

Quadro 14: Ordenao para Amostras Relacionadas ou Emparelhadas


Sujeitos

N de frases correctas
antes do aparelho
auditivo

N de frases correctas
depois do aparelho
auditivo

diferenas

ordem

6,5

6,5

10

Ao contrrio do que acontece nos casos das amostras relacionadas quando a diferena entre 2
situaes nula nas amostras relacionas a este tipo de resultado no atribuda nenhuma
ordem, sendo que o resultado nem sequer considerado na anlise. No ordenamento de
resultados negativos em amostras relacionadas ignoramse os sinais quando se ordenam os
resultados.

5.3 TESTES PARA DUAS AMOSTRAS INDEPENDENTES


Ao

estudarmos

as

diferenas

entre

dois

grupos

podemos

utilizar

grupos

relacionados/emparelhadosougruposindependentes.Nocasodeduasamostrasindependentes
determinamos se as diferenas nas amostras constituem uma evidncia convincente de uma
diferenanosprocessosdetratamentoaelasaplicados.
Conquanto o uso de duas amostras relacionadas em projectos de pesquisa tenha mritos
indiscutveis, a sua aplicao, em geral, no prtica. Frequentemente, a natureza da varivel
dependente impede a utilizao dos indivduos como seus prprios controlos, tal como ocorre
quandoavariveldependenteosuicidiotentado;umproblemaquepodeacontecerumanica
vez. Pode ser tambm impossvel delinear um projecto que utilize pares de dados, talvez por
69
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

desconhecimento,porpartedoinvestigador,devariveisteisquepossamformarpares,oupela
impossibilidade de obter mensuraes adequadas de alguma varivel de reconhecida
importnciaou,enfim,porquesimplesmentenosedispedeparesadequados.
Quandoautilizaodeduasamostrasrelacionadasnoprticaouadequada,podemosutilizar
duasamostrasindependentes.Emtaisprojectos,asduasamostraspodemserobtidasporumde
doismtodos:
a) Podemserextradasaleatoriamentededuaspopulaes;
b) Podemdecorrerdaatribuioaleatriadedoistratamentosaosmembrosde
umaamostradeorigemarbitrria.

Nota:Emnenhumdestescasosseexigequeasamostrastenhamomesmotamanho.

5.4 TESTE U DE MANN-WHITNEY

QuandoUtilizar:
Dadasduasamostras,detamanhosn1en2,possvel,medianteaprovaUdeMannWhitney,
saberseambasasamostraspodemserconsideradasprovenientesdamesmapopulao.
Como j se sabe, a estatstica paramtrica s pode ser usada desde que os dados tenham sido
mensurados, no mnimo, no nvel intervalar. Alm disso, as amostras devem ser aleatrias,
independenteseavarivelobservacionalprecisadeterdistribuionormalnapopulao.

O teste U de MannWhitney deve ser utilizado em designs com duas situaes, no


relacionados, quando so utilizados sujeitos diferentes em cada uma das situaes
experimentais.

70
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:Suponhaquequerinvestigaron.dequeixasdolorosasduranteumtratamentoa
ummesmoproblemateraputico(controladaagravidadeeaextensodaleso)emquese
utilizaram duas tcnicas diferentes. A hipotese experimental supe que durante a
utilizaodatcnicaBqueodoenteseapresentamaisqueixoso.
Quadro 15: Resultados do registo das queixas

Paciente

Ordem (1)

Ordem (2)

1
2
3
4
5
6
TOTAL
MDIA

3
4
2
6
2
5
22
3,67

3
4
1,5
7,5
1,5
5,5
T1=23

9
7
5
10
6
8
45
7,5

11
9
5,5
12
7,5
10
T2=55

RACIONAL
OracionalqueestportrsdotesteUdeMannWhitneybastantesemelhanteaodoteste
deWilcoxon.Adiferenafundamentalentreasduasresidenofactodosegundoseaplicara
designs relacionados e o U se aplicar a designs norelacionados, utilizando, portanto,
sujeitos diferentes. O teste de Wilcoxon analisa as diferenas entre a performance dos
mesmos sujeitos (ou pares de sujeitos emparelhados) submetidos a duas situaes
experimentais. Com um design norelacionado no temos uma base que nos permita
comparardiferenasentreparesderesultados.Assim,otesteUdeMannWhitneyordenaos
resultadosdetodosossujeitosemambasassituaescomosefossemapenasumconjunto
simplesderesultados.
Se as diferenas entre as situaes forem aleatrias, como postulado pela hiptese nula,
entoosresultadosdevemseraproximadamenteosmesmose,consequentemente,asordens
devem ser tambm aproximadamente as mesmas para as duas situaes. Se houver uma
preponderncia de ordens altas ou baixas numa situao ou na outra, ento porque a
diferenanototaldosresultadosordenadosparacadasituaodevidaaosefeitosprevistos
da varivel independente e no ao acaso. Se a soma total das ordens for muito baixa para
uma das situaes, ento ter de haver uma preponderncia de ordens elevadas na outra
situao. Quanto menor for U mais significativas sero as diferenas entre as ordens das duas
situaes.
71
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

INSTRUES PASSO-A-PASSO PARA CALCULAR W


Ordenetodososresultadosparaambososgruposcomosesetratassedeumconjuntonicode
resultados,atribuindoaordem1aoresultadoinferioreassimsucessivamente.
OordenamentoglobaldetodososresultadosapresentadoemOrdens(1)eOrdens(2).
Adicioneasordenstotaisparaogrupo1egrupo2emseparado.
T1=23 e T2=55

Seleccioneomaiortotaldasordens.
T2=55

CalculeovalordeUatravsdafrmula
Nx (nx + 1)
__________________

U = n1.n2 +

- Tx

emque:

n1=nmerodesujeitosnogrupo1

n1=6

n2=nmerodesujeitosnogrupo2

n1=6

Tx=maiortotaldeordens

Tx=T2=55

Nx=nmerodesujeitosdogrupocomomaiortotaldeordens

Nx=6

ClculodeU
6x7
U=6x6+

_______________

- 55 = 36+21-55=2

Quando existe o mesmo nmero de sujeitos em cada situao rapidamente se torna mais fcil
verificar qual o maior total de ordens. Normalmente, prefervel ter um nmero idntico de
sujeitosemcadagrupo;noentanto,setiverdeutilizarumnmerodesigualdesujeitosemcada
grupo,poderfazlo.Emcasodedvida,calculeUparaambasasordenstotais,seleccionando
onapropriadoacadacasoe,depois,considereoUmaispequeno.

72
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

CONSULTA DA SIGNIFICNCIA NA TABELA


As Tabelas (Anexo II) apresentamlhe os valores crticos de U nos diferentes nveis de
significnciadetestesunicaudaisebicaudais,paraasdiferentescombinaesden1en2dosdois
grupos.
O procedimento mais usual comear por verificar se o valor de U significativo ao nvel de
significnciadep<0,05paratestesunicaudais)ouparatestesbicaudais.Umavezqueprevimos
que a tcnica B produzia mais queixas, poderemos consultar a Tabela para testes unicaudais.
Localizando n1=6 na linha superior e n2=6 na coluna do lado esquerdo, encontraremos o valor
crticodeUnaintercepodosdois.
Concluso: Uma vez que se convencionou utilizar o nvel inferior de U, o nosso valor de U=2
deve ser igual ou inferior ao valor crtico 7, o que acontece, podemos, desta forma, rejeitar a
hiptesenulaeaceitarqueexistemdiferenassignificativasaonveldador(p<0,05).

73
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6. TESTES PARA DUAS AMOSTRAS RELACIONADAS

Empregamseasprovasestatsticasdeduasamostrasquandooinvestigadordesejadeterminar
sedoistratamentossodiferentesouseumtratamentomelhordoqueooutro.Emcadacaso,
comparase o grupo em que se aplicou o tratamento com outro que no sofreu nenhum
tratamentoouquesofreutratamentodiferente.
Em tais comparaes de dois grupos observamse, por vezes, diferenas significativas que no
soresultantesdotratamentoaplicado.
Umadasmaneirasdesuperaradificuldadedecorrentedaintroduodediferenasextrnsecas
entredoisgruposconsisteemutilizarnapesquisaduasamostrasrelacionadas,isto,relacionar
de alguma forma as duas amostras estudadas. Tal relacionamento pode ser conseguido
utilizandosecadaindivduocomoseuprpriocontroloouentoformandoparesdeindivduos
e, em seguida, associando os dois membros de cada par s duas condies. Quando um
indivduo serve como o seu prprio controlo, ele submetido a ambos os tratamentos em
ocasies diferentes. Quando se utiliza o mtodo do emparelhamento devem procurar
seleccionarse,paracadapar,indivduosquesejamtosemelhantesquantopossvelemrelaoa
quaisquervariveisextrnsecasquepossaminfluenciarosresultadosdapesquisa.
Sempre que possvel, o mtodo de utilizao do indivduo como o seu prprio controlo
(contrabalanando a ordem em que se aplicam os tratamentos ou mtodos) prefervel ao
mtododeemparelhamento.Earazodissoquelimitadaanossacapacidadeparaformaros
paresadequadamente,emconsequnciadonossodesconhecimentodasvariveisrelevantesque
determinam o comportamento. A validade por emparelhamento est na razo directa do
investigador para determinar como formar os pares, e essa capacidade quase sempre muito
limitada. Essa dificuldade contornada quando se utiliza cada indivduo como seu prprio
controlo;nosepodepretenderrelacionamentosmaisprecisosdoqueaprpriaidentidade.

74
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6.1 PROVA DE McNEMAR PARA A SIGNIFICNCIA DE


MUDANAS

Quandoutilizar:
A prova de McNemar para a significncia de mudanas particularmente aplicvel aos
planeamentosdotipoantesedepois,emquecadaindivduoutilizadocomooseuprprio
controlo e a mensurao se faz ao nvel de uma escala nominal ou ordinal. Pode, assim, ser
usada para testar a eficincia de determinada tcnica (reunies, folhetos, visita, etc.) sobre as
prefernciaseleitoraisarespeitodevrioscandidatos.
Nestescasos,cadapessoapodeservircomooseuprpriocontrolo,utilizandoseamensurao
emescalanominalparaavaliarasalteraesdasituaoapsemrelaosituaoantes.
Exemplo: Suponha que um profissional de sade est interessado em estudar os
comportamentos resultantes da iniciao de obesos prtica do exercicio fisico. Este
profissional observou ao longo dos anos que os obesos utilizam preferencialmente o
elevadorparasedirigiremsuaconsultacujoconsultrioerano1.andar.Colocaahipotese
de que os obesos que tiveram como terapeutica exerccio fsico comeariam a usar
preferencialmenteasescadas.Afimdetestarahipoteseotcnicoobserva25doentesemque
ministrou como exerccio fsico caminhar uma hora por dia cinco vezes por semana.
Decorrido um ms de exercicio ele observa os mesmos 25 doentes e faz a classificao
comportamentos.Osdadossoosseguintes:

Quadro 16: Teste Mcnemar

Preferencia aps 30 dias de exercicio

Preferncia antes da
teraputica

Escadas

Elevador

Elevador

(A)

14

Escadas

(C)

(B)
(D)

HIPTESE DE NULA:
H0: Para os obesos que modificaram a sua atitude, a probabilidade de mudar o percurso do
elevador para as escadas (PA) igual probabilidade de mudar de mudar das escadas para o
elevador(PD)eambassoiguaisa.Isto,

H0:PA=PD=1/2

H1:PA>PD

75
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

PROVA ESTATSTICA:
Utilizase a prova de McNemar para significncia de mudanas, porque o estudo utiliza duas
amostras relacionadas, do tipo antesedepois e utiliza a escala de medida nominal
(classificativa).

Nveldesignificncia:
p=0,05

N=25

Distribuioamostral:
AdistribuioQuiquadradocom1graudeliberdadedumaboaaproximaodadistribuio
amostraldeQuiquadrado,talcomocalculadapelafrmula.

RegiodeRejeio:
ComoH1especificaosentidodadiferenaprevista,aregioderejeiounilateral.Consistede
todos os valores de Quiquadrado que so to grandes que acusem uma probabilidade
unilateral,associadasuaocorrnciasobH0nosuperiora0,05.

Deciso:
Estamosinteressadosnosobesoscujocomportamentoacusaalterao:representadosnasclulas
AeD.
Paraosdados,temos:
(A-D - 1)2
X2 =

_________________________

A+D

(4-3 - 1)2
=

__________________

(1 - 1)2
=

4+3

___________________

0
=

__________

=0

Sendo0valorobservadodex2=0,devemosconsultaratabela(AnexoI)paraobterovalorcritico,
no esquecendo que temos uma amostra unicaudal a um nivel de 0,05. consultando a tabela
observamosumx2criticode5,41.

Racional
Paracompararasignificnciadequalquermudanaobservada,porestemtodo,constriseuma
tabela de frequncias de 4 casas para representar o 1 e o 2 conjunto de reaces dos mesmos

76
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

indivduos. As caractersticas gerais desta tabela so as que se apresentam a seguir, em que se


utilizamossinais+eparaindicardiferentesreaces.

Quadro 17: Tabela de quatro casas para a prova de significncia de mudanas

ANTES
DEPOIS

+
-

A
C

+
B
D

Notesequeoscasosqueacusammodificaesentrea1ea2reacoaparecemnasclulasAe
D.UmindivduolocalizadonaclulaAsepassoude+paraenaclulaDsepassoude
para+.Naausnciademodificao,oindivduoclassificadonaclulaB(reaco+antes
edepois)ounaclulaC(reacoantesedepois).
Como A e D representa o nmero total de indivduos que acusam modificao, a perspectiva,
sobahiptesedenulidade,seriaque(A+D)acusassemmodificaesnumsentidoe(A+D)
acusassemmodificaesnoutrosentido.Ouseja,(A+D)afrequnciaesperada,sobH0,tanto
naclulaAcomonaclulaD.
NaprovadeMcNemardesignificnciademudana,estamosinteressadosapenasnasclulasA
e D. Portanto, A=nmero de casos observados na clula A, D=nmero de casos observados na
clulaDe(A+D)=nmeroesperadodecasostantonasclulasAcomoD,ento

(A-D)2
X2

_____________

A+D

comgrausdeliberdade=1

77
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6.2 CORRECO DE CONTINUIDADE

Aaproximao,peladistribuiodoQuiquadrado,dadistribuioamostraldafrmulatornase
excelenteseseintroduzirumacorrecodecontinuidade.Talcorreconecessria,porquese
utilizou um distribuio contnua (Quiquadrado) para aproximar uma distribuio discreta.
Quando todas as frequncias esperadas so pequenas, tal aproximao pode ser fraca. A
correcodecontinuidade(Yates,1934)constituiumatentativaderemoodessafontedeerro.
Comacorrecodecontinuidade,temse:
(A-D - 1)2
X2 = ________________________________
A+D

com graus de liberdade=1

Estaexpressoindicaquesedevesubtrair1dovalorabsolutodadiferenaentreAeDantesde
elevaraoquadrado.OgraudesignificnciadequalquervalorobservadodeQuiquadrado,tal
comocalculadoatravsdafrmula,determinadomedianterefernciaaumaTabela(AnexoI).
SeovalorobservadodeQuiquadradoiguala,oumaiordoque,ovalorexibidonaTabelapara
determinadonveldesignificnciacomgl=1,aimplicaoqueexisteefeitosignificativonas
reacesantesedepois.

INSTRUES PASSO-A-PASSO PARA CALCULAR X2


Enquadrarasfrequnciasobservadasnumatabelade4casas.
DeterminarasfrequnciasesperadasnasclulasAeD

E=1/2 (A+D)
Se as frequncias esperadas so inferiores a 5, empregar a prova binomial em substituio
provadeMcNemar.
Seasfrequnciasesperadasnosoinferioresa5,calcularovalordeX2atravsdafrmula

(A-D - 1)2
X2 =

_______________________

A+D
Mediante referncia Tabela (Anexo I), determinar a probabilidade, sob H0, associado a um
valortograndequantoovalorobservadodeX2.Sesetratadeumaprovaunilateral,dividirpor

78
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

2 o valor da probabilidade exibido na Tabela. Se o valor de p, dado pela Tabela para o valor
observadodeX2comgl=1,nosuperap,rejeitaseH0emfavordeH1.

6.3 TESTE DOS SINAIS DE WILCOXON


Quandoutilizar
OtestedeWilcoxondeveserutilizadonumdesignexperimentalrelacionado,comduas
situaesexperimentaisquandosoutilizadososmesmossujeitosousujeitosemparelhadosem
ambasassituaes.
Exemplo: Suponha que quer investigar se existe alguma diferena na quantidade de
vocabulrioutilizadoporcrianasqueusamumaparelhoauditivoouporcrianasqueno
usam. Este um bom exemplo dum caso em que essencial a utilizao de sujeitos
emparelhados. Como bvio, no possvel utilizar os mesmos sujeitos, uma vez que
nenhuma criana que no precisa de usar aparelho auditivo usa um mesmo tempo. Por
outrolado,nopodemosescolheraleatoriamenteossujeitosparacadagrupo.Podedarseo
caso,porexemplo,deossujeitosqueusamaparelhoauditivoseremmaisvelhos.Qualquer
efeito encontrado neste grupo pode ficar a deverse unicamente a esta diferena. Os dois
grupos com aparelho e sem aparelho necessitam de ser emparelhados em termos de
idade, sexo, inteligncia e todas as outras variveis que achemos necessrio serem
controladas. Apresentamos depois s crianas um teste que mea o seu vocabulrio,
traduzindooemresultados,talcomomostradonatabelaseguinte.

Quadro 18: Resultados do teste do vocabulrio


Par de

Situao A

Situao B

sujeitos

(com aparelho)

(sem aparelho)

d (A-B)

1
2
3
4
5
6
7
8
9
10
TOTAL
MDIA

3
4
3
1
5
2
3
4
1
3
29
2,9

5
5
2
5
4
5
5
4
5
5
45
4,5

-2
-1
+1
-4
+1
-3
-2
0
-4
-2

Ordem de d

5(-)
2(-)
2(+)
8,5(-)
2(+)
7(-)
5(-)
8,5(-)
5(-)

79
Margarida Pocinho e Joo Paulo de Figueiredo

Ordem das

Ordem das

diferenas

diferenas

positivas

negativas

5
2
2
8,5
2
7
5

8,5
5
41

ESTATSTICAEBIOESTATSTICA

RACIONAL
OobjectivodotestedossinaisdeWilcoxoncompararasperformancesdecadasujeito(oupares
de sujeitos) no sentido de verificar se existem diferenas significativas entre os seus resultados
nasduassituaes.OsresultadosdaSituaoBsosubtradosdosdaSituaoAediferena
resultante (d) atribudo o sinal mais (+) ou, caso seja negativa, o sinal menos (). Estas
diferenassoordenadasemfunodasuagrandeza(independentementedosinalpositivoou
negativo).Oordenamentoassimobtidodepoisapresentadoseparadamenteparaosresultados
positivos e negativos. O menor dos valores deste segundo, dlhe o valor de uma estatstica
designadaporW,quepodeserconsultadanaTabeladesignificnciaapropriada.
Aideiaqueseexistiremapenasdiferenasaleatrias,talcomopostuladopelahiptesenula,
ento haver aproximadamente o mesmo nmero de ordens elevadas e de ordens inferiores
tantoparaasdiferenaspositivascomonegativas.Seseverificarumaprepondernciadebaixos
resultados para um dos lados, isso significa a existncia de muitos resultados elevados para o
outrolado,indicandoumadiferenaemfavordeumadassituaes,superiorquiloqueseriade
esperarseosresultadossedevessemaoacaso.DadoqueaestatsticaWreflecteomenortotalde
ordens, quanto menor for o W mais significativas sero as diferenas nas ordenaes entre as
duassituaes.

INSTRUES PASSO-A-PASSO PARA CALCULAR W


1.

Calculeadiferenadentrecadaparderesultados,atribuindoosinalmaisoumenos.
Vejaacolunad(AB)

2.

Ordene as diferenas por ordem de grandeza desde a ordem inferior at superior,


ignorandoossinaispositivosenegativos.
Vejaacolunaordenamentoded

3.

Emseparado,juntetambmaordenaocorrespondenteaossinaisdiferentes(+ou).
Vejaostotaisparaordenamentosdediferenaspositivasedediferenasnegativasnas
respectivascolunas

80
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

4.

ConsidereomenordostotaisdasordenscomoW.
ValorobservadodeW=4,umavezqueototaldasordensparaasdiferenaspositivas
omenor

5.

ConteonmerodeparesdesujeitosN(noconsidereasigualdades).
N=101=9

CONSULTA DA SIGNIFICNCIA NA TABELA


A tabela anexada (Anexo III) apresentalhe o nvel de significncia de w tanto para os testes
unicaudaiscomobicaudais.NacolunadaesquerdaencontraosvaloresdeN.Umavezqueno
efectumosumaprevisodadireco(comoporexemplo,queobteramosmelhoresresultados
no vocabulrio de criana em jardim de infncia) teremos de utilizar os nveis de significncia
paraumahiptesebicaudal.SeleccioneovaloradequadoN=9everifiqueaolongodessalinhase
o valor de W significativo. Uma vez que se convencionou utilizar o menor valor das ordens,
entoovalorobtidodeWterdeserigualouinferioraovalorcrticodaTabela.Comoovalor
obtidoW=4inferioraovalorcrticode6parap<0,05(bicaudal),poderejeitarahiptesenulae
concluir que existe uma diferena significativa entre os resultados no vocabulrio dos dois
gruposdesujeitosemparelhados.
Suponha que tinhaefectuadoumaprevisonumadadadireco,porexemplo,queascrianas
que usam aparelho auditivo (Situao B) obtm resultados mais elevados no teste de
vocabulrio. O valor obtido de W=4, inferior a 6, que o valor crtico de W para p<0,025
(hipteseunicaudal),umaprobabilidadeinferiore,consequentemente,maissignificativadoque
onveldesignificnciaparaumahiptesebicaudalp<0,05.

81
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

7. TESTES PARA K AMOSTRAS INDEPENDENTES

O investigador pode precisar de decidir se diversas variveis independentes devem ser


consideradas como procedentes da mesma populao. Os valores amostrais quase sempre so
um tanto diferentes e o problema determinar se as diferentes amostras observadas sugerem
realmente diferenas entre as populaes ou se so apenas variaes casuais que podem ser
esperadasentreamostrasaleatriasdamesmapopulao.
Apresentamostcnicasparacompararasignificnciadediferenasentretrsoumaisgrupos
deamostrasindependentes,ouseja,paracomprovarahiptesedenulidadedequeKamostras
independentestenhamsidoextradasdamesmapopulaooudepopulaesidnticas.
Asprovasnoparamtricastmavantagemdepermitirestudar,quantosignificncia,dados
que so inerentemente classificados (escala nominal) ou se apresentam em postos (escala
ordinal).

7.1 TESTE DE KRUSKAL-WALLIS


REQUISITOS PARA O USO DO TESTE DE KRUSKAL-WALLIS
OtestedeKruskalWallispressupeasseguintescondiesparaoseuadequadouso:
a) Comparaodetrsoumaisamostrasindependentes;
b) OtestedeKruskalWallisnopodeserusadoparatestardiferenasnumanicaamostra
derespondentesmensuradosmaisdeumavez;
c) Dadoscujonveldemensuraosejanomnimoordinal;
d) Esta prova exige dados que possam ser ordenados e aos quais, por isso mesmo, seja
possvelatribuirpostosouordens;
e) Otamanhomnimodecadaamostradeveserde6parasepoderrecorreraox2.
82
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Quando n > 5 por grupo de respondentes, a significncia de H pode ser determinada por
recorrncia Tabela do Quiquadrado (Anexo I). Para testar diferenas entre amostras de
tamanhoinferiora6,deverecorreratabelasespeciais(AnexoIV).

QUANDO UTILIZAR
EstetestepodeserconsideradoumaextensodotesteUdeMannWhitneyquandonecessitamos
de utilizar trs ou mais situaes. Deve ser utilizado em designs norelacionados quando
sujeitosdiferentessodistribudosportrsoumaissituaes.

Exemplo:Suponhaqueestamosinteressadosemdescobrirseexistemdiferenasnoacessoa
uma pgina da internet em funo da caracteristica: muito ilustrada, com algumas
ilustraes e, sem ilustraes. Alocmos trs pginas na internet com o mesmo assunto e
titulo durante 4 meses. A seguir verificmos o nmero de vezes que formam acedidas
durantequatrosbadosseguidos.Osresultadosforam.
Quadro 19: Nmero de ideias relembradas para trs tipos de testes
Sujeitos do
grupo 1
(pgina muito
ilustrada)

Sabado
Sabado
Sabado
Sabado
TOTAL
MDIA

1
2
3
4

Resul
19
21
17
16
73
18,25

Ordem
10
11
9
8
38

Sujeitos do
grupo 2
(pgina com
algumas
ilustraes)

Resul
14
15
9

Ordem
6
7
1

38
12,67

14

Sujeitos do
grupo 3
(Pgina sem
ilustraes)

Result.
12
12
13
10
47
11,75

Ordem
3,5
3,5
5
2
14

RACIONAL
Este teste pretende determinar se os resultados so significativamente diferentes para trs ou
mais grupos. Uma vez que todos os resultados foram, em principio, obtidos por sujeitos
diferentes a nica forma de verificarmos as diferenas entre as situaes ordenlas em
conjunto, como se se tratassem apenas de um conjunto de resultados, tal como havamos
efectuado no teste U de MannWhitney. Isto acontece porque, no temos uma base para
compararresultadosdosmesmossujeitosoudesujeitosemparelhadosemdiferentessituaes,
comocomotesteUdeMannWhitneyparadesignsrelacionados.
Este ordenamento global, quando posteriormente adicionamos as ordens de cada coluna em
separado,permitenosobterototaldasordensparacadasituao.Seexistiremapenasdiferenas
aleatriasentreassituaes,comopostuladonahiptesenula,deesperarqueordensaltase

83
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

baixassedistribuamdeformaaproximadamenteequivalentepelasdiferentessituaes.Mas,se
pelocontrrio,houverumaprepondernciadealtosoubaixosresultadosemqualquerumadas
situaes, provvel que tal facto reflicta diferenas significativas devidas varivel
independente.
OvalordasdiferenasentreostotaisdasordensdadopelaestatsticadesignadaporH.Desde
queahipteseexperimentalprevejaaexistnciadediferenassignificativasentreassituaes,o
valor que obtivermos de H dever ser igual ou superior ao valor crtico da Tabela, para que
possaserconsideradosignificativo.

INSTRUES PASSO-A-PASSO PARA CALCULAR H


Ordene todos os grupos do design como se se tratasse apenas de um conjunto de resultados,
atribuindoaOrdem1aomenorresultadoeassimsucessivamente.
Paraumordenamentoglobaldosresultados,vejaascolunasordemparaosgrupos1,2e3,em
quetodososresultadossoconsideradosemconjunto
Adicioneostotaisdasordensparacadasituao.
CalculeovalordeHapartirdafrmula

T 2
12
c
= ________________ __________ - 3 (N + 1)
N (N + 1)

n
c

em que:
N=nmerototaldesujeitos

N=11

nc=nmerodesujeitosemcadagrupo

n1=4;n2=3;n3=4

Tc=totaldeordensparacadasituao,ouseja,
ostotaisdasordensparacadacoluna

T1=38;T2=14;T3=14

Tc2=totaldasordensparacadasituao,cadaumelevadoaoquadrado

T12=382;T22=142;T32=142

84
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Tc2= somadosquadradosdostotaisdasordensparacadasituaodividido
n c

pelonmerodesujeitosdessasituao:

382/4 + 142/3 + 142/4


Clculo de H
H

12
T 2
c
= ____________ ______ - 3 (N + 1)
N (N + 1)

n
c

12

H = _____________________ (382/4 + 142/3 + 142/4 )

- 3 (11 + 1)

11 (11 + 1)
12

H = ___________________ (1444/4 + 196/3 + 196/4 )

- 3 x 12

132

H = 0,091 (361 + 65,33 + 49) 36


H = 43,255 36 = 7,26
Calculeosgrausdeliberdade,ouseja,onmerodesituaes(C)menosuma.
gl=C1=31=2

CONSULTA DA SIGNIFICNCIA NA TABELA


ATabela(AnexoIV)utilizaseemexperinciascomtrsgruposdesujeitos,ecomummximo
decincosujeitosemcadagrupo.Paraummaiornmerodesujeitos,deveserutilizadaaTabela
doQuiquadrado(AnexoI).Quandonosoutilizadosmaisdetrsgrupos,poderlocalizarna
colunadaesquerdadaTabelaonmerodesujeitosdecadagrupo.Localizeentoacombinao
queprocura(nonossocaso:4,4,3).Notequeaordemdonmerodesujeitosnoimportante,
masacombinaoapropriadanaTabela4,4e3.Paraessacombinaoencontrarosvalores
crticos de H para vrias probabilidades. Se o valor de H que obteve for igual ou superior ao
valor crtico de um determinado nvel de significncia pode rejeitar a hiptese nula. No nosso
exemplo, o valor obtido de H=7,26 superior ao valor crtico de 7,1439 para p<0,01, pelo que
podemosaceitarahipteseexperimentalaestenveldesignificncia.
Sepossuirmaisdetrssituaes,e/ousujeitosemcadasituao,deverprocurarovalorcrtico
na Tabela do Quiquadrado. Repare que para isso ter que calcular os graus de liberdade.
Localizeosvaloresdosgrausdeliberdade(nonossoexemplo,gl=2)aolongodacolunadolado
esquerdo e verifique ao longo da linha os valores crticos para as diferentes probabilidades. O
85
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

valorqueobtivemosH=7,26superioraovalorcrticode5,99parap<=0,05,peloquepodemos
aceitar que o resultado significativo a este nvel. Dar conta que esta probabilidade menos
significativa de que quando utilizamos a Tabela anterior. Isso acontece porque essa Tabela
especialmenteconcebidaparanosdarasprobabilidadescomumpequenonmerodesujeitose
desituaes.
Notar tambm que o teste de KruskalWallis apenas lhe pode dizer que existem diferenas
globais nos resultados entre as situaes experimentais. Na tabela apresentada parece existir
uma tendncia para consultar pginas com mais ilustraes do que sem ilustraes. Mas para
podertestarseessatendnciarealmenteexiste,terdeutilizarumtestedetendncia.

86
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

8. TESTES PARA K AMOSTRAS RELACIONADAS

Soestatsticasparacomprovarasignificnciadediferenasentretrsoumaisgrupos,ouseja,
paracompararahiptesedenulidadedequeK(3oumais)amostrastenhamsidoextradasda
mesmapopulaooudepopulaesidnticas.
As circunstncias exigem, por vezes, o recurso a um experimento que nos permita estudar
simultaneamente mais de duas amostras ou condies. Quando se trata de comparar trs ou
maisamostrasoucondiesdeumexperimento,necessrioaplicarumaprovaestatsticaque
indique se h alguma diferena global entre as K amostras ou condies, antes que possamos
cogitardecomprovarasignificnciadadiferenaentreduasamostrasquaisquer.
Squandoumaprovaglobal(provadeKamostras)nosautorizaarejeitarahiptesenulaque
podemosempregarumprocessoparadeterminardiferenassignificativasentreduasquaisquer
dasKamostras.
Estas provas noparamtricas tm a vantagem de permitir o estudo da significncia de dados
que,inerentemente,seapresentamapenassobaformaclassificativaouempostos.
HdoisplanosbsicosparacompararKgrupos:
1.

Noprimeirodeles,asKamostrasdeigualtamanhosopostasemcorrespondncia
de acordo com determinado(s) critrio(s) que podem afectar os valores das
observaes.Nalgunscasos,essacorrespondnciaobtmsecomparandoosmesmos
indivduosoucasossobtodasasKcondiesouentocadaumdosNgrupospode
ser mensurado sob todas as K condies. Em tais planos, devem usarse provas
estatsticasparaKamostrasrelacionadas;

2.

O segundo plano envolve K amostras aleatrias independentes (no


necessariamente do mesmo tamanho), uma de cada populao. Em tais casos,
devemosusarasprovasestatsticasparaKamostrasindependentes.

87
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

8.1 PROVA DE COCHRAN

Quandoutilizar:
A prova de McNemar para duas amostras pode ser estendida para aplicao a pesquisas que
envolvem mais de duas amostras. Essa extenso, que constitui a prova Q de Cochran para K
amostras relacionadas, proporciona um mtodo para comparar se trs ou mais conjuntos
correspondentes de frequncias ou propores diferem entre si significativamente. A
correspondncia pode basearse em caractersticas relevantes dos diferentes indivduos ou no
facto de os mesmos indivduos serem observados sob condies diferentes. A prova Q de
Cochranadaptaseespecialmenteaocasoemqueosdadosseapresentamnumaescalanominal
ousobaformadeinformaoordinaldicotomizada.
Exemplo: Suponha que estamos interessados em saber se a atitude de um entrevistador
influencia a aceitao de participao num estudo por inqurito. Poderemos treinar o
entrevistadorparaefectuarassuasentrevistasdetrsmaneirasdiferentes:
1.

Demonstrandointeresse,cordialidade,entusiasmo;

2.

Demonstrandoformalismo,reservaecortesia;

3.

Demonstrandomodoabrupto,formalismoeaspereza.

88
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo: O entrevistador visitaria3gruposde18casas,aplicandootipo1deentrevistaa


umgrupo,otipo2aoutrogrupoeo3aoterceirogrupo.Teramos,assim,18conjuntosde
potenciais inquiridos com trs deles correspondendo em cada conjunto. Em cada conjunto
atribuirseam aleatoriamente aos trs membros as trs condies (tipos de entrevista).
Teramos, ento, 3 amostras relacionadas (correspondentes) com 18 elementos cada uma
(N=18).Poderamos,pois,comprovarseasdiferenasfundamentaisnostiposdeentrevista
influenciariam o nmero de respostas afirmativas sim dadas para aceitao de
participaopelos3gruposdecorrespondentes.
Quadro 20: Q de Cochran

Conjunto
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

Resposta

Resposta

Resposta

entrevista 1

entrevista 2

entrevista 3

1
2
1
1
2
2
2
1
2
1
2
2
2
2
2
2
2
2

1
2
2
1
1
2
2
2
1
1
2
2
2
2
2
2
2
2

1
1
1
1
1
1
1
1
1
1
2
2
1
1
1
2
1
1

RespostasSim(1)eNo(2)dadaspordonasdecasaatrstiposdeentrevistas

HIPTESE NULA:
AprobabilidadedeumSimamesmaparaostrsgruposdeentrevistas.
H1:AsprobabilidadesdeumSimdiferemconformeotipodeentrevista.

PROVA ESTATSTICA:
Escolhese a prova Q de Cochran, porque os dados se referem a mais de dois grupos
relacionados(K=3)eapresentamsedicotomizadossobaformaSimeNo.

NVEL DE SIGNIFICNCIA:
p=0,01
N=18
89
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

DISTRIBUIO AMOSTRAL:
Sobahiptesedenulidade,QtemumadistribuioaproximadamenteQuiquadradocomgl=1.
Isto,aprobabilidadeassociadaocorrncia,sobHo,dequalquervalortograndequantoum
valorobservadodeQpodeserdeterminadamedianterefernciaTabela.

REGIO DE REJEIO:
Consiste em todos os valores de Q to grandes quanto a probabilidade associada sua
ocorrncia,sobHo,nosejasuperiorap=0,01.

DECISO:
RecodificmosSimpor1eNopor0.
Quadro 21: Q de Cochran

Conjunto

Resposta
entrevista
1

Resposta
entrevista
2

Resposta
entrevista
3

Li

Li2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

0
1
0
0
1
1
1
0
1
0
1
1
1
1
1
1
1
1

0
1
1
0
0
1
1
1
0
0
1
1
1
1
1
1
1
1

0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
1
0
0

0
2
1
0
1
2
2
1
1
0
3
3
2
2
2
3
2
2

0
4
1
0
1
4
4
1
1
0
9
9
4
4
4
9
4
4

G1=13

G2=13

G3=3

Total

Li=nmerototalderespostasSimparacadalinha
K=nmerodecolunas
N=nmerodelinhas

90
Margarida Pocinho e Joo Paulo de Figueiredo

Li=29 Li263

ESTATSTICAEBIOESTATSTICA

Substituindoestesvaloresnafrmula,vem:
(K-1)
Q=

[K Gj

( Gj)2

(3-1)

_____________________________________________

[ 3X (13

K Li - Li2

+ 132 + 32) 292

]
= 16,7

3X29 - 63

Emque

K=n.degrupos

Gj=n.totaldesucessos

______________________________________________________

ATabela(AnexoI)indicaqueQ16,7temumaprobabilidadedeocorrncia,sobHo,p<0,001,
quandogl=K1=31=2.Essaprobabilidadeinferioraonveldesignificnciadep=0,01.Ovalor
deQestnaregioderejeioe,consequentemente,anossadecisorejeitarHoemfavorde
H1,concluindoqueonmeroderespostasSimdiferesignificativamenteemrelaoaostipos
1,2e3deentrevista.

RACIONAL
Se os dados de uma pesquisa se dispem numa tabela de dupla entrada com N linhas e K
colunas,possveltestarahiptesedenulidadedequeaproporooufrequnciaderespostas
dedeterminadotiposejaamesmaemcadacoluna,exceptuandoasdiferenasdevidasaoacaso.
Cochran mostrou que se a hiptese de nulidade verdadeira, isto , se no h diferena na
probabilidade, digamos de Sucesso sob cada condio (o que equivale a dizer que os
Sucessos ou Fracassos se distribuem aleatoriamente pelas linhas e colunas da tabela de
duplaentrada),ento,seonmerodelinhasmuitopequeno

K(K-1)
Q=

(Gj - G)2

__________________________________________

K Li - Li2

temdistribuioaproximadamenteQuiquadradocomgl=K1,emque:
Gj=nmerototaldeSucessosnacolunaj
__

G=mdiadosGj

Li=nmerototaldesucessosnalinhai

91
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Umaexpressoequivalentefrmulaanterior,efacilmentededutveldela,masquesimplificaos
clculos:

(K-1)
Q=

[K Gj ( Gj) ]
2

__________________________________________________

K Li - Li2

INSTRUES PASSO-A-PASSO PARA CALCULAR Q


Paradadosdicotomizados,atribuiroscore1acadaSucessoeoscore0acadaFalha.

DisporosdadosnumatabelaK.N,comKcolunaseNlinhas(N=nmerodecondiesemcada
umdosgrupos).

DeterminarovalordeQ,aplicandoafrmula.
AsignificnciadovalorobservadodeQpodeserdeterminadomedianteaobservaodoAnexo
I, pois Q recorre distribuio do Quiquadrado com gl=K1. Se a probabilidade associada
ocorrncia, sob H0, de um valor to grande quanto um valor observado de Q no supere p,
rejeitaseH0.

8.2 TESTE DE FRIEDMAN

Quandoutilizar:
EstetestepodeserconsideradoumaextensodotestedeWilcoxon,quandonecessrioutilizar
trsoumaissituaesexperimentais.Deveserutilizadoparaumdesignrelacionadoquandoos
mesmos sujeitos (ou sujeitos emparelhados) so distribudos por trs ou mais situaes
experimentais.

92
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:Suponhaqueumeditordelivrosdeestatisticaproduziuumasriedelivrosequer
escolher de entre trs tipos de ilustraes aquele que mais eficaz para os estudantes.
pedido a oito universitrios que classifiquem as obras numa escala de cinco pontos, desde
nadaboaatmuitoboa.Obtiveramseosresultadosapresentadosnatabelaseguinte.

Quadro 22: Avaliao de trs tipos de ilustraes


Situao 1
Situao 2
Situao 3
(Ilustrao A)
(Ilustrao B)
(Ilustrao C)
Result.
Ordem
Result.
Ordem
Result.

Ordem

1
2

2
1

1
1

5
5

3
3

4
3

2
2

2,5

2,5

2,5

2,5

TOTAL
MDIA

18

11

34

21

28

16

Sujeitos

2,25

4,25

3,50

RACIONAL
Uma vez que se trata de um design relacionado no qual o mesmo sujeito obtm resultados em
todas as situaes, permitido comparar os resultados de cada sujeito atravs de todas as
situaes,nosentidodeverificarmosemquesituaoobtmmaioresemenoresresultados.
Uma vez que existem mais do que duas situaes, no possvel calcular as diferenas nos
resultados de duas situaes, como era o caso do teste de Wilcoxon. Pelo contrrio, o
ordenamentodosresultadosdecadasujeitoparaastrscondiesserfeitahorizontalmenteao
longo das linhas, tal como mostra a tabela. Por exemplo, aos resultados do sujeito 1,
respectivamente2naSituao1,5naSituao2e4naSituao3,soatribudastrsordens,do
menorresultadoparaomaior:Ordem1paraaSituao1,Ordem2paraaSituao3eOrdem3
paraaSituao2;esteprocedimentosemelhanteparatodosossujeitos.Claroqueseexistissem
quatrosituaesexperimentais,osresultadosdecadasujeitoseriamordenadosde1a4.
Oprximopassocalcularostotaisdeordensparacadasituao.Seexistiremapenasdiferenas
aleatrias entre os resultados de todas as situaes, como postulado pela hiptese nula, de
esperarqueestestotaissejamaproximadamenteiguaispartindodoprincpiodequesurgiriam
algumasordensbaixas(baixosresultados)ealgumasordensaltas(altosresultados).Contudo,se
assituaesforemsignificativamentediferentes,deesperarqueseobtenhamtotaisdasordens

93
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

significativamente diferentes, com algumas situaes a terem uma preponderncia de ordens


baixas e outras uma preponderncia de ordens altas. O tamanho das diferenas entre os totais
das ordens nos dado por uma estatstica designada por Xr2. Se o valor de Xr2 for igual ou
superior aos valores crticos das Tabelas C e D (Anexo V), isso implica que as diferenas nos
totaisdasordenssosuficientementegrandesparaquesepossamconsiderarsignificativas.

INSTRUES PASSO-A-PASSO PARA CALCULAR W


Ordeneosresultadosdecadasujeitoemseparado,aolongodecadalinha,atribuindoaOrdem1
aomenorresultadoeporaadiante.
(Veja as colunas das Ordens na tabela. Note que a ordem para cada linha de resultados
correspondesordens1,2e3,dadoexistiremtrssituaes).
Calculeototaldasordensparacadasituao.

CalculeovalordeXR2apartirdafrmula
12

XR2 = ________________________ Tc2

- 3N (C + 1)

NC (C + 1)

emque
C=nmerodesituaes

C=3

N=nmerodesujeitos

N=8

T1=11;T2=21;T3=16

Tc=totaldeordensparacadasituao

Tc2=quadradodototaldeordensparacadasituao

T12=112;T22=212;T32=162

Tc2=somadosquadradosdostotaisdasordensparacadasituao:112+212+162
ClculodeXR2

12
XR2 = _____________________ (112 + 212 + 162) - 3 x 8 (3 + 1)
(8 x 3) (3 + 1)
12
XR2 =

_____________________

(121 + 441 + 256) - (24 x 4)

24 x 4
12
XR2 =

_________________

x 818 - 96

96
XR2 = 6,25

94
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Calculeosgrausdeliberdade,ouseja,onmerodesituaesmenosuma.
(gl=C1=31=2)

CONSULTA DA SIGNIFICNCIA NA TABELA


ExistemduastabelasparaconsultarosvalorescrticosdeXr2.Umadelas,aTabelaC(AnexoV),
utilizadaquandoonmerodesituaesedesujeitospequeno.ATabelaC(1)apresentaos
valoresdeXr2paratrssituaesquandoN(nmerodesujeitos)sesituaentre2e9.ATabelaC
(2)apresentaosvaloresdeXr2paraquatrosituaesquandoN(nmerodesujeitos)de2,3ou
4. A Tabela D (Anexo V) a tabela de distribuio do Quiquadrado; pode utilizla quandoa
amostra de sujeitos for superior s das Tabelas C (1) e C (2), uma vez que o Xr2 tem uma
distribuiosemelhantedoQuiquadrado.
ATabelaquedeveutilizarparaconsultarovalordeXr2,nocasodestaexperincia,aTabelaC
(1),umavezquesetratade8sujeitosexpostosa3situaesexperimentais.Aquiloquetemosde
fazer encontrar a coluna apropriada para N (nmero de sujeitos ou pares de sujeitos
emparelhados)edescobrirnacolunapaprobabilidademaisprximaquesejainferioraosnveis
de significncia convencionais. Consultando as probabilidades para N=8, o valor obtido de
Xr2=6,25equivalenteaumaprobabilidadedep<0,047,queinferioraosnveisdesignificncia
convencionais(p<0,05=).Paraconsiderarmosonveldesignificnciadep<0,01onossovalorde
Xr2teriadeser9,00,dadoquep<0,009inferiorap<0,01.SeovalordeXr2noforapresentado
naTabela,deverconsiderarovalorseguintemaisprximoquandoconsultaasprobabilidades.
Porexemplo,seovalordeXr2for5,95terdeconsideraraprobabilidadeapresentadapara5,25,
ouseja,p<0,079,quesuperiorap<0,05e,consequentemente,nosignificativa.Paraconsultaros
valoresdaTabelaC(2)deverprocedertalcomoparaaTabelaC(1).
Se tiver mais situaes e/ou sujeitos e tiver de consultar a Tabela D, aquilo que tem a fazer
localizarosvaloresdosgrausdeliberdadeaolongodacolunadaesquerda(nonossoexemplo,
gl=2, ou seja, nmero de situaes1). Depois siga ao longo da linha de probabilidades at que
encontre um dos nveis de significncia convencionais. O valor que obtivemos de Xr2=6,25
superior ao valor crtico de 5,99 apresentado na Tabela do Quiquadrado, pelo que podemos
aceitar que os nossos resultados so significativos ao nvel de significncia de p<0,05. Apesar
disso, e dado que o nosso valor de Xr2 inferior ao valor crtico de 9,21 para p<0,01, no
podemosrejeitarahiptesenulaaestenveldesignificncia.

95
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Apartirdaanliseestatsticadaexperinciapodeconcluirqueascrianasmostrampreferncias
significativamentediferentespelostrstiposdeilustraes.Emfunodasmdiasapresentadas
natabela,sabemosquepreferemaIlustraoB,querecolheuasordensmaiselevadas,seguindo
seaIlustraoCe,porltimo,aIlustraoA.Contudo,otestedeFriedmanpodeapenasindicar
que existem diferenas globais entre as situaes. Para verificar se existe uma tendncia para
uma determinada ordem de preferncia das Ilustraes, necessita de utilizar um teste de
tendncia.

96
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

9. MEDIDAS DE CORRELAO E SUAS PROVAS DE


SIGNIFICNCIA

Frequentemente,oinvestigadorquersabersedoisconjuntosdescoresestorelacionadosequal
ograudesserelacionamento.
Apresentamsemedidasnoparamtricasdecorrelaoedeprovasestatsticasparadeterminar
a probabilidade associada ocorrncia de uma correlao to grande quanto a observada na
amostra,sobahiptesedenulidadedequeasvariveissejamnorelacionadasnapopulao.
Mas de muito maior interesse podermos afirmar se determinada associao observada numa
amostradescoresindica,ouno,aprobabilidadedeassociaoentreasvariveisnapopulao
da qual se extraiu a amostra. O coeficiente de correlao, por si s, representa o grau de
associao.Asprovasdesignificnciasobreaquelecoeficientedeterminam,aumcertonvelde
probabilidade, se existe a associao na populao da qual se extraiu a amostra que serviu de
baseparaoclculodocoeficiente.

9.1 COEFICIENTE DE CORRELAO RHO DE SPEARMANRANK


CONDIES DE UTILIZAO
Estetipodecoeficientedecorrelaoutilizasequandotemos:

Testenoparamtrico(semelhanteaumadistribuiolivre),isto,nocolocarestries
quantoformadadistribuio;

Escalademedidanomnimoordinal.

97
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Podeacontecerqueoscaracteresestudadosnosejammensurveis,maspodemserordenados
ou classificados. Por exemplo, se se considera um grupo de candidatos a um certo lugar, eles
podemserexaminadossegundodoispontosdevista:conhecimentosepersonalidade.Estasduas
qualidades no podem ser medidas, mas possvel para cada uma delas efectuar uma
classificao dos candidatos. Podemos, assim, examinar se existe correlao entre estes dois
caracteres; cada par de dados (xi, yi) formado pelas ordens ocupadas por um candidato nas
duasclassificaes.
Formulrio:
6(di2)
=1-

________________

N(N2-1)

Emque:

di=diferenaentreasposiesnasduasvariveis,isto,di=xiyi
Para tal, temos que dar valores s posies: pontuao mais baixa damos o valor 1 e
assimsucessivamente.

Seasduasclassificaessoiguais,disemprezeroeentor=1eacorrelaoperfeita.Seas
ordensmaisaltasdeumaclasseestoassociadassmaisbaixasdaoutrartornasenegativoese
asduasclassificaessoinversas=1.
Ento,
-1 1

INTERPRETAO
O coeficiente de correlao obtido pode ser interpretado, tal como o coeficiente de correlao
momentoprodutodeBrawaisPearson(verestecoeficienteemtestesparamtricos).

98
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:Calcule,sabendoque:
xi
yi

18
24

17
27

14
17

13
22

13
19

12
20

11
14

9
11

7
3

5
6

Quadro 23: Coeficiente de Contingncia de RHO de Spearman-Rank

xi

posio

yi

posio

d2

18

24

-1

17

27

14

17

-3

13

4,5

22

1,5

2,25

13

4,5

19

-0,5

0,25

12

20

11

14

11

10

-1

10

=19,5

6x19,5
=1__________________=0,88

10(1021)

9.2 O COEFICIENTE DE CONCORDNCIA DE KENDALL

Quandoutilizar:
O coeficiente de concordncia de Kendall uma medida da relao entre vrios conjuntos de
postosdeNobjectosouindivduos.
Quando temos K conjuntos de postos, podemos determinar a associao entre eles
utilizandoocoeficientedeconcordnciadeKendall(W).

99
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

RACIONAL E EXEMPLO
Como soluo do problema da determinao da concordncia global entre K conjuntos de postos,
poderia parecer razovel determinar os rs entre todos os pares possveis de postos e ento calcular a
mdia desses coeficientes para determinar a associao global. Adoptando este procedimento, o
processotornaseimpraticvel,umavezquetemosdecalcularinmeroscoeficientesdecorrelaode
postos.

Assim,oclculodeWmuitomaissimpleseWtemumarelaolinearcomovalormdioders
relativo a todos os grupos. Denotando rsav o valor mdio dos coeficientes de correlao por
postosdeSpearman,Kendalmostrouque

KW1
rsav=__________

K1

Outro processo consiste em imaginar como se apresentariam dados se no houvesse


concordncia alguma entre os conjuntos de postos e, em seguida, como se apresentariam se
houvesse concordncia perfeita. O coeficiente de concordncia seria, ento, um ndice de
divergnciaentreaconcordnciaefectivaacusadapelosdadoseaconcordnciamximapossvel
(perfeita).Demodoaproximado,Wumcoeficientedestanatureza.
Suponhamos que 3 chefes de pessoal estejam encarregados de entrevistar 6 candidatos a
emprego e classificlos em postos, separadamente, segundo a capacidade de cada um para
preencheravaga.Atabelaseguintedos3conjuntosindependentesdepostosatribudospelos
chefesdepessoalX,YeZaoscandidatosaaf;altimalinhadatabelaRjdassomasdospostos
atribudosacadacandidato.
Quadro 24: Postos atribudos a 6 candidatos a emprego por 3 chefes de pessoal

Candidato

Chefe

X
Y
Z
Rj

a
1
1
6
8

b
6
5
3
14

c
3
6
2
11

d
2
4
5
11

e
5
2
4
11

f
4
3
1
8

Se os chefes de pessoal apresentassem perfeita concordncia nos seus julgamentos sobre os


candidatos, isto , se tivessem atribudo postos aos candidatos da mesma ordem, ento um
candidato teria recebido trs postos 1 e assim a sua soma de postos, Rj, seria 1+1+1=3=K. O
candidatoqueos3chefestivessemconsideradoemsegundolugarreceberiaRj=2+2+2=6=2Keo
menospromissordoscandidatosseriaRj=6+6+6=18=NK.
100
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Defacto,nocasodaconcordnciaperfeitaentreos3chefes,asvriassomasdepostos,Rj,seriam
3,6,9,12,15,18, muito embora no necessariamente nesta ordem. Em geral, quando h
concordnciaperfeitaentreKconjuntosdepostos,obtemos,paravaloressignificativosdeRj,a
sequnciaK,2K,3K,...,NK.
Poroutrolado,senotivessehavidoconcordnciaentreos3chefes,entoosdiversosRjseriam
aproximadamenteiguais.
Desteexemplo,vemosqueograudeconcordnciaentreosKjulgamentosreflectidopelograu
devarinciaentreasNsomasdepostos.W,coeficientedeconcordncia,funodessegraude
varincia.
Assim:
S
W=____________________

1/12 K2 (N3 N)
emque:
S=soma dos quadrados dos desvios observados a contar da mdia dos Rj, isto , S= (Rj
Rj/N)2;
K=nmerodeconjuntosdepostos;
N=nmerodeentidades(objectosouindivduosaqueseatribuempostos);
1/12K2(N3N)=valormximopossveldasomadosquadradosdosdesvios,isto,ovalordeS
queocorrerianocasodeconcordnciaperfeitaentreosKconjuntosdepostos.

101
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Ento,

=(8+14+11+11+11+8)/6=10,5

S=(810,5)2+(1410,5)2+(1110,5)2+(1110,5)2+(1110,5)2+(810,5)2=
6,25+12,25+0,25+0,25+0,25+6,25=25,5
Peloque
S
25,5
25,5
W=__________________________=_____________________________=_____________________=
1/12 K2 (N3 N)

1/12 x 32 (63 6)

1/12 x 9 x 210

25,5
=_______=0,16
157,5

W=0,16 exprime o grau de concordncia entre os 3 colegas fictcios ao atriburem postos aos 6
candidatosaemprego.

desalientarquearazoporqueWnopodetomarvaloresnegativosque,quandoesto
em jogo mais de dois conjuntos de postos, esses conjuntos no podem ser completamente
discordantes.Porexemplo,seXeYdiscordam,eseXtambmdiscordadeZ,entoYeZ
certamente concordaro. Isto , quando esto em jogo mais de 3 juzes, concordncia e
discordncianosoopostossimtricos.Kjuzespodemtodosconcordar,masimpossvel
todoselesdiscordaremcompletamente.Portanto,Wdeveserzeroouumnmeropositivo.

NOTA: Quando ocorrem empates, atribuemse s observaes empatadas a mdia dos


postosquelhescaberiamsenohouvesseempates.
OefeitodosempatesreduzirovalordeW.Seaproporodeempatespequena,oefeito
desprezvel, podendo continuar a usarse a frmula anterior. Se a proporo de empates
grande, pode introduzirse uma correco que aumentar ligeiramente o valor de W em
relaoaovalorqueseapresentariasemcorreco.Oelementocorrectivo:
(t3 t)

T=

_________________________

12
Emquet=nmerodeobservaesnumgrupoempatadosemrelaoaumdadoposto

102
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Ento,afrmulaser:

S
______________________________________
W=
1/12 K2 (N3 N) - T

INSTRUES PASSO-A-PASSO PARA CALCULAR W


SejaN=nmerodeobjectosouindivduosaseremclassificadosempostoseK=nmerodejuzes
classificadores.DisporospostosobservadosnumatabeladotipoKXN.
ParacadaindivduoouobjectodeterminarRj,somadospostosatribudosqueleindivduopelos
Kjuzes.
Determinar a mdia dos Rj. Exprimir cada Rj como desvio a contar dessa mdia. Elevar ao
quadradoessesdesviosesomlos,obtendoS.
SeaproporodeempatesnosKconjuntosgrande,paracalcularWutilizarafrmula

S
W=_________________________________
1/12 K2 (N3 N) - T

Emcasocontrrio,usar
S
W=

_______________________________

1/12 K2 (N3 N)

Omtodoparadeterminarseovalorobservadosignificativamentediferentedezerodepende
dotamanhodeN:
SeN7aTabela(AnexoVI)dosvalorescrticosdeSassociadoscomosWs
significativosaosnveisde0,05ede0,01;
Se N>7 podemos usar X2 = K (N 1)W para calcular um valor de X2 cuja
significncia, para g.l.=N1, possa ser comparada recorrendo Tabela do X2
(AnexoI).

103
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

CONSULTA DA SIGNIFICNCIA NA TABELA


PROVA DE SIGNIFICNCIA
PEQUENAS AMOSTRAS:

UtilizandoseaTabelaestadovalordeSparaWssignificativosaosnveisde0,05ede0,01.
Esta Tabela aplicvel para K de 3 a 20 e N de 3 a 7. Se um valor observado de S igual ou
superior ao valor exibido na Tabela para um dado nvel de significncia, ento H0 pode ser
rejeitadaquelenvel.
Por exemplo, vimos que quando K=3 chefes depessoalfictciosclassificaramN=6candidatosa
emprego,aconcordnciadosjulgamentosfoiW=0,16.ATabelaindicaqueoSassociadoquele
valordeW(25,5)nosignificativo,umavezqueScrtico(103,9)maiordoqueSobservado
(25,5).

QuandoN>7,adistribuioaproximadamenteumadistribuiodeQuiquadradocomg.l.=N
1,vindo:

S
2
_______________________
X =
1/12 KN (N + 1)

Noteseque:

_____________________________

= K (N 1) W

1/12 KN (N + 1)
E, portanto, X2 = K (N 1) W, pelo que se pode usar esta frmula que mais fcil para
determinaraprobabilidadeassociadaocorrncia,sobH0,dequalquervalortograndequanto
oWobservado.
SeovalordeX2observadoigualaousuperaovalordaTabela(AnexoI)paraumdadonvelde
significnciaeumparticularvalordeg.l.=N1,entoHo(nohrelaoentreosKconjuntosde
postos)podeserrejeitadaquelenvel.
104
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

INTERPRETAO DE W
Um valor elevado ou significativo de W pode ser interpretado como indicando que os
observadoresoujuizesestoaplicandoessencialmenteosmesmospadresaoatriburempostos
aos N indivduos em estudo. Frequentemente a sua ordenao conjunta pode servir como
padro,especialmentequandonohcritriosexternosrelevantesparaordenarosindivduos.
KendallsugerequeamelhorestimativadaverdadeiraclassificaodeNobjectos,quandoW
significativo,sejadadapelaordemdasvriassomasdepostos,Rj.Seseaceitaocritriosegundo
o qual diversos juizes concordarem na atribuio de postos a N indivduos, ento a melhor
estimativa da verdadeira ordenao desses indivduos segundo aquele critrio dada pela
ordemdasomadospostos.Assim,anossamelhorestimativaseriadadaaocandidatoaouf,pois
emambososcasosRj=0,omenorvalorobservado.

105
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

10. TESTES PARAMTRICOS PASSO-A-PASSO

10.1 CORRELAO
Quando estudamos um grupo relativamente a dois caracteres vemos, como j dissemos, que
podeexistirumarelaoentreeles.
Se medirmos os raios de vrias circunferncias e tambm os seus permetros verificamos que
existe uma relao entre eles que constante; neste caso temos dependncia funcional. Isto
querdizerqueexisteumafrmulaexprimindoamedidadosegundoemfunodadoprimeiro:
P=2r.
Suponhamos agora que registamos, durante todos os dias de um certo perodo de tempo, a
alturamximadamarnoportodaFigueiradaFozeonmerodepassageirosdalinhaPorto
Lisboa.Vsebemqueentreasduasestatsticasassimobtidasnoseencontranenhumarelao.
Diremosqueosdoiscaracteressoindependentes.
Masentreestesdoiscasosextremos,adependnciafuncionaleaindependncia,avidacorrente
ofereceumgrandenmerodeexemplosondeexisteumarelaoentreoscaracteres,masemque
existe uma impossibilidade de a formular por uma lei: o caso da dependncia estatstica.
Existeumadependnciaestatsticaentreaspessoasquemorremcomfebretifideeaspessoas
vacinadascontraestadoena.
Desdequeosdoiscaracteressejamtaisqueassuasvariaessejamsemprenomesmosentido,
ou em sentidos contrrios, pressentimos que os caracteres estejam ligados entre si: dizemos,
ento,queelesestocorrelacionadosouqueexisteumacorrelaoentreeles.
EstesmtodosdecorrelaoforamcriadosporSirFrancisGalton,quetrabalhoujuntamentecom
Pearson,nosfinsdosculoXIX.

106
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

A correlao e a regresso so dois aspectos que andam sempre muito ligados, pertencendo
EstatsticaDescritiva.Assim,importafazermosadistinoentreeles:

A correlao pode ser definida como o grau de semelhana no sentido das variaes
entreosvalorescorrespondentesdosdoiscaracteres,isto,acorrelaopreocupasecom
adescriodarelaoentrevariveis.

A regresso usada quando tentamos predizer uma varivel quando conhecemos a


outra.

TIPOS DE COEFICIENTE DE CORRELAO


Basicamente,podemosconsiderardoistiposdecoeficientesdecorrelao:
Coeficiente de correlao momentoproduto de BrawaisPearson, cujo smbolo r, e
queumatcnicadeestatsticaparamtrica;
Coeficiente de correlao Rho de SpearmanRank, cujo smbolo , e que uma
tcnicadeestatsticanoparamtrica.
Devemossalientarque,paraoclculodascorrelaes,necessriotermossempreduasmedidas
paracadasujeito.

REPRESENTAO GRFICA
representaogrficadacorrelaochamamosdiagramadedispersodepontosouscatterplot
ouscattergrame,genericamente,tomaaseguinteforma:
80

70

60

50

40
40

50

60

70

80

Figura 13: Diagrama de disperso de pontos ou scatterplot ou scattergram

107
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Suponhamosquetemosduassriesestatsticasformadaspelosvaloresxieyidedoiscaracteres.
Podemos fazer uma representao grfica dos dados representando todos os pontos (xi, yi) e
obtendoanuvemdepontos.
Segundoosdados,anuvemdepontospodeapresentardiversosaspectos.
Porexemploospontospodemdistribuirsenasemelhanadeumalinharectaoudeumacurva:
istosugereaexistnciadeumarelaofuncionalentreXeY.
Os pontos podem ser dispersos e colocados ao acaso no plano: caso das mars no porto da
FigueiradaFozeonmerodepassageirosnalinhaPortoLisboa(independncia).Tambmpode
acontecerqueospontoscubramumaporodoplanodaqualsepodedefinirocontorno;esta
formasugerequeasduasvariveisestoligadas.Limitemonosaocasomaissimplesemquea
nuvemtemumaformaalongadalembrandoumaelipseesuponhamosqueasuaorientaotal
que desde que X cresa, a varivel Y tambm cresce. A forma desta nuvem sugere a
possibilidadedaexistnciadeumarectatalqueosvaloresestimadosporestarecta,apartirdos
valoresdexi,sejamboasaproximaesdosvaloresdeyi.Nspodemosdeterminarpelomtodo
dosmnimosquadradosumarectatalqueasomadosquadradosdosdesviossejamnima.Esta
rectachamadarectaderegressodeYemXourectadeestimaodeYemX.
Mas,poderamos,deummodosemelhante,procurarumarectatalqueosvaloresdexestimados
aolongodestarecta,apartirdeyi,constituamigualmenteboasaproximaesdexi.Estarecta
chamadarectaderegressodeXemYourectadeestimaodeXemY.
Normalmente, estas rectas so distintas uma da outra. Elas sero confundidas quando existe
ligao funcional linear e so perpendiculares quando h independncia. Compreendemos,
assim, que a correlao entre os caracteres tanto maior quanto maior as rectas de regresso
estejammaisprximasumadaoutra.

108
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

COEFICIENTE DE CORRELAO MOMENTO-PRODUTO DE BRAWAIS-PEARSON


Condiesdeutilizao:
Estetipodecoeficientedecorrelaoutilizasequando:
1.

Asduasvariveissocontnuas;

2.

Adistribuioseaproximadadistribuionormal;

3.

prefervelparadistribuiesunimodais;

4.

Escalaintervalardemedida.

Formulrio
r=

(XY) - X Y
N.
sx sy

Ento:
-1 r 1

Interpretao:
Ocoeficientedecorrelaoobtidopodeseinterpretadocombaseem:
Para Cardoso:

r0,2

Correlaomuitobaixa(valoresdesprezveis)

0,2<r0,5

Correlaobaixa

0,5<r0,7

Valoressignificativos

0,7<r0,9

Altacorrelao

0,9<r1

Muitoaltacorrelao

Para Borg:
0,20<r0,35

Ligeira relao entre as variveis, embora j possam ser


estatisticamentesignificativas

0,35<r0,65 Correlaoestatisticamentesignificativaparaalmdonvelde1%

0,65<r0,85 Correlaesquetornampossveisprediesdogrupodequesodignas

r>0,85

ntimarelaoentreasvariveiscorrelacionadas

109
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Para Byrman e Cramer,


seEta,r,Rho,phi:

0,2

Correlaomuitofracaesemsignificncia

0,2<r0,39

Correlaofraca

0,4<r0,69

Correlaomoderada

0,7<r0,89

Correlaoforte

0,9<r1

Correlaomuitoelevada

Coeficientedecorrelaodnos:

Adirecoqueindicadapelosinal+ou

Aintensidadeouforaquedadapelovalorquevariaentre1e1.Seacorrelaofor
zeronoexistecorrelaoentreasvariveis(exemplo:cordosolhoseinteligncia).
Exemplo: Considere as classificaes obtidas por 10 alunos nas disciplinas
X, Y, Z e W:

Quadro 25: Correlao de Pearson

Estudante

XY

XZ

XW

YZ

YW

ZW

75

75

45

45

5625

3375

3375

3375

3375

2025

70

70

50

50

4900

3500

3500

3500

3500

2500

70

70

50

50

4900

3500

3500

3500

3500

2500

65

65

55

55

4225

3575

3575

3575

3575

3025

60

60

60

60

3600

3600

3600

3600

3600

3600

60

60

60

60

3600

3600

3600

3600

3600

3600

55

55

65

65

3025

3575

3575

3575

3575

4225

50

50

70

70

2500

3500

3500

3500

3500

4900

50

50

70

70

2500

3500

3500

3500

3500

4900

10

45

45

75

75

2025

3375

3375

3375

3375

5625

600

600

600

600

36900

35100

35100

35100

35100

36900

X=60

Y=60

Z=60

W=60

XY=36900
s2x= 90

XZ=35100
s2y= 90

s2z= 90

s2w= 90

Sabeseque:

a)CalculeocoeficientedecorrelaoentreXeYerepresentegraficamente.

b)CalculeocoeficientedecorrelaoentreXeZerepresentegraficamente.

110
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Resoluo 47:
a)
(XY) - X Y
r=_____N______________
sx sy
Ento,
36900 _ 60x60
10
r = _________________________________________
90 x 90
r= = 1
Existe uma relao positiva muito forte entre X e Y
b)
r=

(XZ) - X Z
N
..
sx sZ

Ento,
35100 _ 60x60
10
r=

________________________________________

90 x 90
r= = -1

ExisteumarelaonegativamuitoforteentreXeW,isto,quantomaiorXmenorYevice
versa.

10.2 TESTE T DE STUDENT (NO RELACIONADO)

CARACTERSTICAS DO TESTE T:
1.

Testeparaacomparaodemdias;

2.

Distribuio com forma leptocrtica, isto , as caudas da distribuio so mais


grossasdoquenadistribuionormal;

3.

Contnua;

4.

Simtrica;

5.

Deformacampanular;

6.

Variademaisinfinitoamenosinfinito;

7.

Mdia=0edesviopadrodavariveldeacordocomn;

111
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

8.

OusodeTpressupequeavarivelobservacionaltenhanapopulao(deondefoi
colhidaaamostra)distribuionormal;

9.

No existe uma distribuio t, mas sim uma famlia. Para cada n tamanho da
amostraexisteumadistribuio(umacurva)especfica;

10. medidaquencresce,ttendeaz(aaproximaoentretezcomeaaficarboaa
partirden>=30).

Requisitosparautilizarotestet:

1.Quandoasduasamostrastmamesmahomogeneidadedevarincia;

2.Osdoisgrupostenhamamesmadistribuioaproximadanormalleptocrtica;

3.Escalademedidaintervalar.

QUANDO UTILIZAR
Utilizaseparadesignsexperimentaiscomduassituaestestandoumavarivelindependente,
quandonessassituaesseencontramsujeitosdiferentesdesignsnorelacionados.
O teste t no relacionado equivalente ao teste no paramtrico U de MannWhitney; ambos
comparamdiferenasentredoisgrupos.

OBJECTIVO
O objectivo comparar a quantidade da variabilidade devida s diferenas previstas nos
resultadosentredoisgruposcomavariabilidadetotalnosresultadosdossujeitos.Asdiferenas
previstassocalculadascomoumadiferenaentreosresultadosmdiosentreosdoisgrupos.
Aestatsticatrepresentaotamanhodadiferenaentreasmdiasparaosdoisgrupos,tomando
emconsideraoavarinciatotal.Paraqueovalorobservadodetsejasignificativoterdeser
igualousuperioraosvalorescrticosdetapresentadosnatabela.

112
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

INSTRUES PASSO-A-PASSO
Elevaraoquadradocadaresultadoindividualparaambososgruposemseparado:
1.

Adicionarostotaisdosresultadosaoquadradoparacadagrupo;

2.

Elevaraoquadradotodososresultadosindividuaisparacadagrupo;

3.

Calcularamdiaparacadagrupo;

4.

Calculart:

1 - 2
t = _________________________________________________________________
x12 - ( x1)2
+ x22 - ( x2)2
______
______
n1
n2
1
1
____________________________________
__
+ __
(n1 - 1) + (n2 - 1)
n1
n2

emque:

1=mdiadogrupo1

2=mdiadogrupo2

x12=somadosquadradosparaogrupo1

x22=somadosquadradosparaogrupo2

(x1)2=resultadostotaisdogrupo1aoquadrado

(x2)2=resultadostotaisdogrupo2aoquadrado

n1=nmerodesujeitosdogrupo1

n2=nmerodesujeitosdogrupo2

Calcularg.l.:

g.l.=(n11)+(n21)

Setobservado>tcrticorejeitaseHo

Setobservado<tcrticonoserejeitaHo

113
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:paraverificarseduasdietasparaemagrecersoigualmenteeficazes,ummdicoseparouao
acaso um conjunto de pacientes em dois grupos. Cada paciente seguiu a dieta designada para o seu
grupodurante4meses.Omdicoregistouaperdadepesoemkgdecadapacienteporgrupo.Osdados
estoapresentadosnoquadroquesesegue:

Quadro 26: Teste t no relacionado

______________________________________________________________________________________
Grupo 1 (dieta 1)
Grupo 2 (dieta 2)
______________________________________________________________________________________
Resultados
Resultados
Resultados
Resultados
ao quadrado
ao quadrado
10
100
2
4
5
25
1
1
6
36
7
49
3
9
4
16
9
81
4
16
8
64
5
25
7
49
2
4
5
25
5
25
6
36
3
9
5
25
4
16
_____________________________________________________________________________________
Total
x1 = 64
x12 = 450
x2 = 37
x22 = 165
2
Mdia
1 = 6,4
= 3,7

InstruesPassoaPasso:

1.construiratabela

2.x1=64

x2=37

x12=450

x22=165

3.(x1)2=64X64=4096

(x2)2=37X37=1369

4.1=6,4

2=3,7

114
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6,4 - 3,7
t = _________________________________________________________ =
450 - 4096 + 165 - 1369
______
______
10
10
_______________________________
9+9
2,7
= ______________

1
__
10

1
+ __
10

= 3,547

3,806. 0,2
6. g.l. = (n1 - 1) + (n2 - 1) = (10 - 1) + (10 - 1) = 18

O valor de t observado (3,547) superior ao valor crtico de 2,878 (Anexo VII), indicando um
nvel de significncia de p < 0,05 para uma hiptese unicaudal ou p < 0,01 para uma hiptese
bicaudal.

10.3 TESTE T DE STUDENT (RELACIONADO)

Quandoutilizar:
Utilizaseparadesignsexperimentaiscomduassituaestestandoumavarivelindependente,
quando os mesmos sujeitos (ou emparelhados) se encontram em ambas as situaes design
relacionado.OtestetrelacionadoequivalenteaotestenoparamtricodeWilcoxon.

OBJECTIVO
Oobjectivocompararasdiferenasentreasduassituaesexperimentaiscomavariabilidade
total nos resultados. Quando os mesmos sujeitos so usados em ambas as situaes podem
compararse pares de resultados obtidos por cada indivduo quando sujeito a ambas as
situaes.

115
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Aestatsticatapresentaotamanhodasdiferenasentreosresultadosdossujeitosparaasduas
situaes.Paraquesejasignificativoovalordetterdeserigualousuperioraosvalorescrticos
databela(AnexoVII).

INSTRUES PASSO-A-PASSO
1.CalcularasdiferenasentreosresultadosdossujeitossubtraindoosresultadosdasituaoB
paraasituaoA
2.Elevaressasdiferenasaoquadrado
3.Calcularosomatriodasdiferenasobtidas(d)
4.Calcularosomatriodoquadradodasdiferenas(d2)
5.Elevaraoquadradoasdiferenastotais(d)2
6.Calculart:
d
t=

___________________________________

N d2 ( d)2
N-1

emque

d=somadasdiferenasdosresultadosAeB

d2=somadosquadradosdasdiferenas

(d)2=somadasdiferenaselevadasaoquadrado

N=nmerodesujeitos

7.Calcularg.l.:

g.l.=N1

Setobservado>tcrticorejeitaseH0

Setobservado<tcrticonoserejeitaH0

116
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:Paraverificarseaeficciadeumadietaerainfluenciadapeloministrardeumfrmaco,um
mdicodecidiuadministrar,aumgrupodeindividuosqueotinhamprocuradoparaperderpeso,um
placebo em conjunto com uma dieta que j havia administrado um ms antes aos mesmos sujeitos.
Referiu aos seus casos que aquele medicamento servia para perder apetite e ajudava a queimar
gorduras.
Registouaperdadepesoquetinhaocorridonos30diasantecedentestomadadeplaceboetrintadias
apsoplacebo.Osresultadosestonoquadroquesesegue

Quadro 27: Teste t relacionado

Sujeito

Situao A
Situao B
d
d2
(com placebo)
(s com dieta)
(A-B)
____________________________________________________________________________
1
10
2
8
64
2
5
1
4
16
3
6
7
-1
1
4
3
4
-1
1
5
9
4
5
25
6
8
5
3
9
7
7
2
5
25
8
5
5
0
0
9
6
3
3
9
10
5
4
1
1
___________________________________________________________________________
Total 64

37

d=27
d2=151
Mdia6,43,7
Resoluo50:

InstruesPassoaPasso:

1.construirtabela

2.calcularasmdias

3.d=27

4d2=151

5.(d)2=27x27=729

6. proceder aos calculos


27
t=

____________________________-

10 x 151 (27)2
10 - 1

27
=

_______________

= 27 / 9,316 = 2,90

86,78

7. g.l. = N - 1 = 10 - 1 = 9

117
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Comoovalorobservadodetde2,90superioraovalorcrticode2,821aonveldesignificncia
de p < 0,01 (unicaudal) ou p < 0,02 (bicaudal), e a mdia de perda de peso superior com o
placebo,omdicoconcluiuqueoefeitodeplacebopositivonaperdadepeso

Oponto10.3explicacomocompararmdiasdeduaspopulaes,combaseemamostrasdessas
populaes.Massvezesprecisocompararmdiasdemaisdeduaspopulaes.Porexemplo,
paraverificarsepessoascomdiferentesnveissocioeconmicos,isto,alto,mdioebaixotm,
emmdia,omesmopesocorporal,precisocompararmdiasdetrspopulaes.
ParacompararmdiasdemaisdeduaspopulaesaplicaseotesteF,naformaqueaseguirse
descreve, desde que a varivel em estudo tenha distribuio normal ou aproximadamente
normal.Masantesdemostrarcomosefazesseteste,convmapresentarumexemplo.
Imaginequequatrogrupos,todascomcincoelementos,conduziramaosdadosapresentadosnoquadro
28. As mdiasdessasamostrasestonaltimalinhadessequadro.Serqueasdiferenasdasmdias
dasamostrassosuficientementegrandesparaquesepossaafirmarqueasmdiasdaspopulaesso
diferentes?Pararesponderaestapergunta,precisoumtesteestatstico.

Quadro 28: Dados de 4 amostras e respectivas mdias

11

40

25

25

10

118
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

10.4 ANLISE DE VARINCIA

10.4.1 Anlise da Varincia com Igual Tamanho

Se a varivel em estudo tem distribuio normal ou aproximadamente normal, para comparar


maisdeduasmdiasaplicaseotesteF.
Primeiro,precisoestudarascausasdevariao.Porqueosdadosvariam?Umaexplicaoo
factodeasamostrasproviremdepopulaesdiferentes.Outraexplicaooacaso,porqueat
mesmoosdadosprovenientesdeumamesmapopulaovariam.
O teste F feito atravs de uma anlise de varincia, que separa a variabilidade devido aos
tratamentos (no exemplo, devido s amostras terem provindo de populaes diferentes) da
variabilidaderesidual,isto,devidoaoacaso.ParaaplicarotesteFprecisofazerumasriede
clculos,queexigemconhecimentodanotao.

O quadro 29 apresenta os dados de k tratamentos, cada um com r repeties (no exemplo,


denominamse repeties os elementos da mesma amostra). A soma das repeties (r) de um
mesmotratamentoconstituiototaldessetratamento(T).Ototalgeral(T)dadopelasomadosk
totaisdetratamentos.

Quadro 29: Notao para anlise da varincia

Total
N. de repeties
Mdia

...

Total

x11

X21

X31

xk1

x12

X22

X32

...

xk2

x1r

X2r

X3r

Xkr

T1

T1

T1

T1

T=x
N=kr

Parafazeraanlisedevarinciaprecisocalcularasseguintesquantidades:
119
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

1.passo:
a)

osgrausdeliberdade(gl)dosgrupos:k1

b)

gldototal:n1

c)

gldosresiduos:(n1)(k1)=nk

2.passo:
a)

calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedividido
pelonmerodedados.

FORMULA:

b)

calcularaSomadosQuadradosTotal(SQT)

FORMULA:
c)

SQR = SQT-SQTr

calcularoQuadradomdiodoTotaldecadarepetio(QMTr)

FORMULA:

f)

SQTr = T2 - C
r

calcularaSomadosQuadradosdosResduos(SQR)

FORMULA:
e)

SQT = x2-C

calcularaSomadoQuadradodoTotaldecadarepetio(SQTr)

FORMULA:

d)

C = (x)2
n

QMTr = SQTr
k-1

calcularoQuadradomdiodoTotaldoResiduo(QMR)

FORMULA:

QMR = SQR
n-k

120
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

g)

calcularovalordeF

F = QMTr
QMR

FORMULA:

3.Passo:compararoFcalculadocomovalordadonatabeladeF,aoniveldesignificncia
estabelecido,observandoosk1grausdeliberdadenonumeradoreosnkgrausdeliberdadeno
denominador(colunadaesquerda).

Exemplo:Umprofissionaldesaderecmcontratadoparaacompanharumconjuntodeatletasdealta
competio, verificou, pelos registos clnicos deixados pelo seu antecessor, que alguns atletas com o
mesmo tipo de leso(emgraueextenso)tinhammaisrecidivasqueoutros,apesardascondiesde
treino e o tempo de recuperao ser o mesmo. Colocou a hiptese de que tal acontecimento se podia
deversdiferentesteraputicasqueeramutilizadasparatratarasmesmasleses.Osresultadospodem
serobservadosnoquadroquesesegue:

Quadro 30: recidivas por tratamento

Tratamento

Tratamento

Tratamento

Tratamento

11

40

25

25

10

1.passo:
a)

osgrausdeliberdade(gl)dosgrupos:k1=41=3

b)

gldototal:n1=201=19

c)

gldosresiduos:nk=204=16

121
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

2.passo:
a)

calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedivididopelo
nmerodedados.

b)

C = (x)2 = (11+8+5+4+8+5+7+4+5+2+3+2+8+5+3+8+5+7)2 = 1002 = 500


N
20
20

calcularaSomadosQuadradosTotal(SQT)

SQT = x2-C =
112+82+52+42+82+52+72+42+52+22+32+22+82+52+32+82+52+72 - 500
= 658-500
=158

c)

calcularaSomadoQuadradodoTotaldecadarepetio(SQTr)

SQTr = T2 C = 402+252+252+102 - 500


R
5
= 590-500
= 90
d)

calcularaSomadosQuadradosdosResduos(SQR)

SQR = SQT-SQTr = 158-90


= 68

e)

calcularoQuadradomdiodoTotaldecadarepetio(QMTr)

QMTr = SQTr = 90 = 30
k-1
3

f)

calcularoQuadradomdiodoResduo(QMR)

QMR = SQR = 68 = 4,25


n-k 16

g)

calcularovalordeF

F = QMTr = 30 = 7,06
QMR
4,25
122
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.passo:irtabelaFparaumnveldesignificncia(p)de5%(0,05)eobservarqualoFterico
para 3 e 16 graus de liberdade (anexo). Como o valor calculado (7,06) maior que o da tabela
(3,24),conclumosqueasmdiasdasrecidivasdiferememfunodotratamento,paraumnvel
designificnciade0,05.
Aacompanharestecomentrio,osvalorescalculadosdevemserapresentadosnumquadro,da
seguinteforma:

Quadro 31: ANOVA

Causas de
gl

SQ

QM

90

30

variao
Tratamentos

<0,05
7,06

Resduo

16

68

Total

19

158

4,25

Mas,comosepodeobservar,apesardatabelamostrarqueexistemdiferenassignificativas,no
nosinforma,quetratamentosqueproduzemdiferenasequaissosemelhantes.Semprequeas
diferenas so significativas, e s nesse caso, temos que proceder s comparaes posteriori
(PostHoc). Podemonos socorrer de diversos testes (LSD; Bonferroni; Sidak; Scheffe; SNK;
Tukey;etc.),agrandediferenaentreelesresidenotipodedistribuioemqueassentameno
tipo de ajustamento). Apresentaremos de seguida apenas o teste de Tukey, por ser dos mais
utilizadoseomaissimplesdecalcular,quandorecorremosaoclculomanual.

10.4.1.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS


O teste Tukey permite estabelecer a diferena mnima significante, ou seja, a menor diferena
entreasmdiasquedevesertomadacomosignificativaemdeterminadonveldesignificncia.
Essadiferena(dms)dadapor:

dms =q

QMR
r

Ondequmvalordadoemtabela(Anexo____)
QMRoquadradomdiodoresiduodaANOVA
ronmeroderepeties

123
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

assim,seconsultarmosatabelaverificamosqueoqparacompararquatrotratamentoscom16gl
noresiduode4,05.comoQMR=4,25er=5,temos:

dms =4,05 4,25 = 3,73


5

DeacordocomotestedeTukey,duasmdiassoestatisticamentediferentessemprequeovalor
absolutodadiferenaentreelasforigualousuperioraovalordadms.
Passemosentoobservaodosvalores:

Quadro 32: post-hoc das recidivas

Pares de mdias

Valor absoluto da
diferena

A-B

(8-5) 3

A-C

(8-5) 3

ns

A-D

(8-2) 6

<0,05

B-C

(5-5) 0

ns

B-D

(5-2) 3

ns

C-D

(5-2) 3

ns

dms

p
ns

3,73

fcil de observar que s existem diferenas entre a mdia dos tratamentos A e a mdia dos
tratamentos D, em que o tratamento D aquele com que se obtm, significativamente, menos
recidivas

124
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

10.4.2 ANLISE DE VARINCIA COM DIFERENTES


TAMANHOS

Opesquisador,nemsempretemamostrasdomesmotamanho,mesmoassimpossivelconduzir
uma anlise da varincia (ANOVA). Alis todos os clculos, com excepo SQTr, so feitos da
mesmaformaemambasassituaes.
Assimemvezdefazerasomadosquadradospelafrmula

SQTr = T2 - C
r

Utiliza:
FORMULA:

SQTr = T12 + T22 ++ Tk2


r2
rk
r1

-C

Onde C a correco definida anteriormente

Paramaisfcildeentenderobserveoseguinteexemplo:

Quadro 33: mdias por tratamento

Tratamento A

Tratamento B

Tratamento C

15

23

19

10

16

15

13

19

21

18

18

14

15

84

16
76

1.passo:
a)

osgrausdeliberdade(gl)dosgrupos:k1=31=2

b)

gldototal:n1=151=14

c)

gldosresiduos:nk=142=12

125
Margarida Pocinho e Joo Paulo de Figueiredo

85

ESTATSTICAEBIOESTATSTICA

2.passo:
a) calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedividido
pelonmerodedados.

C = (x)2 = 2452 = 4001,67


n
15

b) calcularaSomadosQuadradosTotal(SQT)

SQT = x2-C = 152+102+132++162 4001,67


=159,33
c) calcularaSomadoQuadradodoTotaldecadarepetio(SQTrat)

SQTrat = T12 + T22 ++ Tk2 - C


r2
rk
r1
SQTr = 842+762+852 4001,67
6
4
5
= 63,33
d) calcularaSomadosQuadradosdosResduos(SQR)

SQR = SQT-SQTr = 159,33-63,33


= 96
e) calcularoQuadradomdiodoTotaldecadarepetio(QMTr)

QMTr = SQTr = 63,33 = 31,67


k-1
2

f) calcularoQuadradomdiodoResduo(QMR)

QMR = SQR = 96 = 8
n-k 12

g) calcularovalordeF

F = QMTr =
QMR

31,67
8

= 3,96

126
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.passo:irtabelaFparaumnveldesignificncia(p)de5%(0,05)eobservarqualoFterico
para 2 e 12 graus de liberdade (anexo). Como o valor calculado (3,96) maior que o da tabela
(3,89),conclumosqueasmdiasdossujeitosdiferememfunodotratamento,paraumnvel
designificnciade0,05.
Osvalorescalculadosdevemserapresentadosdaseguinteforma:

Quadro 34: ANOVA

Causas de variao

gl

SQ

QM

Tratamentos

63,33

31,67

Resduo

12

96

Total

14

159,33

3,96

<0,05

Como as diferenas so significativas, temos que proceder s comparaes posteriori (Post


Hoc).OresultadodotestedeTukeyoseguinte:

10.4.2.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS


OtesteTukeyparaamostrascomtamanhosdiferentesdadapelaseguintefrmula:

dms =q

1+ 1
ri
rj

QMR
2

Nocasodoexemplo,paracompararamdiadeAcomamdiadeBtemse:

dms (A;B) =3,77


dms (A;B) =4,87

1 +
6

1
4

8,00
2

Nocasodoexemplo,paracompararamdiadeAcomamdiadeCtemse:

dms (A;C) =3,77


dms (A;C) =4,57

1+
6

1 8,00
5
2

Nocasodoexemplo,paracompararamdiadeBcomamdiadeCtemse:

127
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

dms (B;C) =3,77


dms (B;C) =5,06

1 +
4

1
5

8,00
2

DeacordocomotestedeTukey,duasmdiassoestatisticamentediferentessemprequeovalor
absolutodadiferenaentreelasforigualousuperioraovalordadms.
Passemosentoobservaodosvalores:

Quadro 35: post-hoc

Valor absoluto da
Pares de mdias

dms

diferena
A-B

|14-19| = 5

4,87

<0,05

A-C

|14-17| = 3

4,57

ns

B-C

|19-17| = 2

5,06

ns

ConcluisequeemmdiaAsignificativamentediferentedeB,aonveldesignificnciade0,05.

128
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

ANEXOS

129
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo I
TABELADOQUIQUADRADO(X2)

130
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo II
TABELADEU

131
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo III
TABELADEWILCOXON

132
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo IV
TABELAH

133
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo V
TABELASDEFRIEDMAN

134
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo VI
TABELAS(TABELADEKENDAL)

135
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo VII
TABELAT

136
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo VIII
TABELAZ

137
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo IX
TABELAF

138
Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo X
TABELADOSVALORESDEq

139
Margarida Pocinho e Joo Paulo de Figueiredo

Você também pode gostar