Escolar Documentos
Profissional Documentos
Cultura Documentos
NDICE GERAL
I - INTRODUO .............................................................................................................................................5
1. NOES GERAIS ..........................................................................................................................................6
2. POPULAO E AMOSTRA ............................................................................................................................9
3. MTODOS DE AMOSTRAGEM ....................................................................................................................11
DE
MANN-WHITNEY .........................................................................................................70
ESTATSTICAEBIOESTATSTICA
COEFICIENTE DE CONCORDNCIA DE
KENDALL...........................................................................99
ANEXOS ........................................................................................................................................................129
Anexo I ...................................................................................................................................................130
Anexo II ..................................................................................................................................................131
Anexo III.................................................................................................................................................132
Anexo IV ................................................................................................................................................133
Anexo V..................................................................................................................................................134
Anexo VI ................................................................................................................................................135
Anexo VII ...............................................................................................................................................136
Anexo VIII ..............................................................................................................................................137
Anexo IX ................................................................................................................................................138
Anexo X ..................................................................................................................................................139
2
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
NDICE DE ILUSTRAES
ESTATSTICAEBIOESTATSTICA
4
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
I - INTRODUO
Desde sculos o homem tem, muitas vezes, tomado notas de coisas e de pessoas, no com o
nico fim de acumular nmeros, mas com a esperana de utilizar os dados do passado para a
resoluodeproblemasdopresenteassimcomoparaaprevisodeacontecimentosfuturos.No
entanto,osucessoquantoaesteobjectivosfoipossvelemdatamuitorecente:snofinaldo
sculoXIXe,sobretudo,noprincpiodosculoXXque,comaaplicaodeprobabilidadesaos
problemassobreainterpretaodosdadosrecolhidos,foipossvelresolveralgunsdeles.
AEstatsticaconquistou,hoje,oseulugarentreascincias.Opoderdoseumtodo,sobretudo,
afirmado nas ltimas dcadas e aplicase, agora, nos domnios mais variados. At aqui, s um
pequenonmerodepessoassepreocupoucomestudosestatsticos,querpelanaturezadassuas
investigaes, quer por causa da sua utilidade para as diferentes profisses. O valor e a
importnciadomtodoestatsticoresidemnoesforoparamelhorcompreenderonossomundo,
tomaravilhosamentecomplexo,tantonopontodevistafsicocomosocial,levamnosasonhar
queelesetorneobjectodeumconhecimentocomoasoutrascincias.Avidacorrentelevanosa
decisesparapassardoconhecidoaodesconhecido,daexperinciapreviso.
Este curso tem por fim fornecer conhecimentos estatsticos (sem ter muitos conhecimentos
matemticos) e saber interpretar resultados que podem ser obtidos atravs de programas de
computador.
5
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
1. NOES GERAIS
Paraalgumaspessoas,aEstatsticanosenoumquadrodecolunasmaisoumenoslongasde
nmeros que dizem respeito populao, indstria ou ao comrcio, como se v
frequentementeemrevistas;paraoutras,eladgrficosmostrandoavariaonotempodeum
facto econmico ou social, a produo ou os nmeros relativos aos negcios de uma empresa,
assimcomoseencontranosescritriosdeempresasprivadas.
To diferenciados se apresentam os mtodos estatsticos que no possvel estabelecer uma
definio que os contenha a todos. Apesar disso, apresentamos a seguir uma definio que,
emboranecessariamenteincompletacomoqualqueroutra,temavantagemdeintroduziroaluno
namatria.
AEstatsticatemcomofinalidadeelaborardeumasntesenumricaqueevidencieoquedemais
generalizadoesignificativoexistanumconjuntonumerosodeobservaes.
O grande nmero de observaes de que se parte reflecte uma diversidade tal que se torna
ininteligvel a sua interpretao. Para que, a partir dessa diversidade se possa comear a
entender logo, tornase necessrio reduzir sucessivamente as observaes, ganhandose em
generalidadeoquesevaiperdendoemindividualidade.
A sntese implica, assim, que nos desprendamos do que particular e individual para nos
atermos ao que existe de mais geral no conjunto das observaes; medida que a sntese
progride,vaiseperdendoocontactocomasparticularidadesimediatas.
Destemodo,aEstatsticanoseocupadoqueexcepcional,masapenasdoquegeral:nose
interessa pelo indivduo, mas por grupos de indivduos; no se ocupa, em suma, de uma s
medio,masdeumconjuntodemedies.
Acrescentese,ainda,queasntesenumrica.Queristodizerqueseprescindeinteiramentedas
palavras e dos recursos literrios de mais ou menos efeito que elas possibilitam. Alcanase a
sntesepelorecursoexclusivodosnmeros.
6
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
7
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
FrancisGalton(18221911),apresentanoesderegressoecorrelao;
KarlPearson(18571936)apresentaamaisbelaeacabadateoriadeEstatstica,ficandotambm
conhecidopelosseuscoeficientes;
FishereosseustrabalhossobreinfernciaEstatsticaderamtambmumgrandecontributoao
desenvolvimentodaEstatstica.
Em 1943,dseumagrandereviravolta,umavezqueotratamentodedadosdeixadeserfeito
manualmenteepassaasercomputadorizado.
MtodoEstatstico:
Tcnicausadaparaobter,analisareapresentardadosnumricos;
Mtodocientficocujafinalidadeoestudodaspropriedadesnumricas
dosconjuntosdosfactos.
OMtodoEstatstico,segundoateoriadeCramer,pressupeasseguintesfases:
Recolhadedadosestatsticos:obtenodaamostraapartirdapopulao,
devendo depurar e rectificar os dados estatsticos, que no seu conjunto
sodenominadossrieestatstica.
Descrio:conjuntodeoperaes,numricasougrficas,efectuadassobre
os dados estatsticos determinando a sua distribuio; procedese sua
ordenao,codificaoerepresentaopormeiodequadrosetabelas.
Anlise: consiste em tirar concluses sobre a distribuio da populao,
determinaroseugraudeconfianaeaindaformularhipteses,tentando
verificlas,quantoaofenmenoemestudo.
Predio: uma previso do comportamento do fenmeno em estudo,
tendoemcontaadefiniodadistribuioestatstica.
8
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
2. POPULAO E AMOSTRA
Populao: somatrio dos indivduos ou elementos, com qualquer caracterstica comum e que
estosujeitosaumaanliseestatstica,portereminteresseparaoestudo.
Quantosuaorigempodeser:
Conjuntodepessoas;
Conjuntodeobjectos;
Conjuntodeacontecimentos.
Quantosuanaturezapodeser:
Existenteoureal;
Hipotticaounototalmenteexistente;
Conjuntofinito;
Conjuntoinfinito.
Podeaindaser:
Amostra:umsubconjuntoretiradodapopulao,quesesupeserrepresentativodetodasas
caractersticas da mesma, sobre o qual ser feito o estudo, com o objectivo de serem tiradas
conclusesvlidassobreapopulao.
Amostragem: o procedimento pelo qual um grupo de pessoas ou um subconjunto de uma
populao escolhido com vista a obter informaes relacionadas com um fenmeno, e de tal
formaqueapopulaointeiranosinteressaestejarepresentada
OPlanodeAmostragemserveparadescreveraestratgiaautilizarparaseleccionaraamostra.
Este plano fornece os detalhes sobre a forma de proceder relativamente utilizao de um
mtododeamostragemparadeterminadoestudo.
9
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Logo que o investigador delimite a populao potencial para o estudo, ele deve precisar os
critriosdeselecodosseuselementos.
Certoscritriosdizemrespeitoscaractersticasrequeridasparaqueumelementoousujeitofaa
partedaamostra:
Aamplitudedaidadedosparticipantes;
Condiesdesadeprecisas.
Igualmentecertoscritriosdefinemossujeitosquenofaropartedoestudo:
Populao
Populao-alvo
Amostra
10
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Comoseignorasetodasascaractersticasdapopulaoestopresentesnumaamostradadoque
estassomuitasvezesdesconhecidas,admitesequeexistesempreumgraudeerro.
ERRODEAMOSTRAGEM:adiferenaqueexisteentreosresultadosobtidosnumaamostrae
osqueteriamsidoobtidosnapopulaoalvo.
Duassoluesexistemparareduziraomnimooerroamostral:
1. Retirar de forma aleatria e um nmero suficiente de sujeitos que faro parte da
amostra.
2. Procurar reproduzir o mais fielmente possvel a populao pela tomada em conta das
caractersticasconhecidasdesta.
3. MTODOS DE AMOSTRAGEM
3.1 AMOSTRAGENS PROBABILSTICAS E NOPROBABILSTICAS
3.1.1 As Amostras Probabilsticas
11
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
TiposdeAmostragem:
a) AAmostragemAleatriaSimples;
b) AAmostragemAleatriaEstratificada;
c) AAmostragememCachos;
d) AAmostragemSistemtica.
AAmostragemaleatriasimplesumatcnicasegundoaqualcadaumdoselementos(sujeitos)
quecompeapopulaoalvotemigualprobabilidadedeserescolhidoparafazerpartedeuma
amostra.Aamostragemaleatriasimplesconsisteemelaborarumalistanumricadeelementos
deondesetira,comaajudadeumatabeladenmerosaleatrios,umasriedenmerospara
constituiraamostra.
AAmostragemaleatriaestratificadaumavariantedaamostraaleatriasimples.Estatcnica
consisteemdividirapopulaoalvoemsubgruposhomogneoschamadosestratoseaseguir
tirar de forma aleatria uma amostra de cada estrato. A Amostragem aleatria estratificada
utilizadaquandoapopulaointeirareconhecidaporcertascaractersticasprecisas,taiscomoa
idade, o sexo, a incidncia de uma condio de sade, tudo isto para assegurar a melhor
representatividadepossvel.
12
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
P o p u la o - A lv o
2 0 0 0 e s tu d a n te s e m
S o c ia is
C i n c ia s
C la s s ific a o
E s tr a t ific a o P r o p o r c io n a l
E s tra to 1
E s tra to 2
E s tra to 3
D o u to ra m e n to
M e s tra d o
L ic e n c ia tu r a
400 = 20%
600 = 30%
1000 = 50%
E s c o lh a A le a t r ia
E s tr a t ific a o N o - P r o p o r c io n a l
A m o s tra = 2 0 0
E s c o lh a A le a t r ia d e 1 0 % e m
c a d a E s tra to
4 0 E s tu d a n te s
6 0 E s tu d a n te s
1 0 0 E s tu d a n te s
D o u to ra m e n to
M e s tra d o
L ic e n c ia t u r a
AMOSTRAGEM EM CACHOS
Consiste em retirar de forma aleatria os elementos por cachos em vez de unidades. til
quandooselementosdapopulaoestonaturalmenteporcachoseporissodevemsertratados
comogruposouquandonopossvelobterumalistagemdetodososelementosdapopulao
alvo.
AMOSTRAGEM SISTEMTICA
Consistequandoexisteumalistaordenadadeelementosdapopulao.EstatcnicaconsisteK
elementosdessalistasendooprimeiroelementodaamostraretiradoaoacaso.
Ointervaloentreoselementoscorresponderazoentreotamanhodapopulaoedaamostra.
Exemplo:Sepretenderumaamostrade100indivduoseapopulaoforde1000osistemaser
1000:100=10 (dez em dez o sistema), isto , ser includo um elemento da lista de 10 em 10
indivduosapartirdo1.n.sorteado.
13
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Importante
Se se utilizar uma amostragem por cachos ou outros tipos de agrupamentos, a amostra s
consideradaprobabilsticaseosgruposforamescolhidosaoacasoantesdarepartioaleatria
dossujeitosnosgrupos.
umprocedimentodeselecosegundooqualcadaelementodapopulaonotemamesma
probabilidadedeserescolhidoparaformaraamostra.
Estetipodeamostragemtemoriscodesermenosrepresentativaqueaprobabilsticanoentanto
muitas vezes o nico meio de construir amostras em certas disciplinas profissionais
nomeadamentenareadasade.
TiposdeAmostragensNoProbabilsticas:
a)
AAmostragemAcidentaloudeConvenincia;
b)
AAmostragemporCotas;
c)
AAmostragemdeSelecoRacionalouTipicidade;
d)
AAmostragemporRedesouBoladeNeve.
formada por sujeitos facilmente acessveis, que esto presentes num determinado local e
momentopreciso.
Exemplo: pessoas hospitalizadas. Um investigador pode ter acesso a uma unidade hospitalar
paraconstituirumaamostradepacienteshospitalizados.
Nestetipodeamostratemavantagemdesersimplesemorganizarepoucoonerosa,todaviaeste
tipodeamostraprovocaenviesamentos,poisnadaindicaqueasprimeiras30a40pessoassejam
14
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Idnticaamostragemaleatriaestratificadadiferindodestaapenaspelofactodossujeitosno
seremescolhidosaleatoriamentenointeriordecadaestratooudecadagrupo.
Temporbaseojulgamentodoinvestigadorparaconstituirumaamostradesujeitosemfuno
doseucarctertpico.
Por exemplo: o estudo de casos extremos ou desviantes como uma patologia rara ou uma
instituio.
Consisteemescolhersujeitosqueseriamdifceisdeencontrardeoutraforma.Tomaseporbase,
redessociaisamizadeseconhecimentos.
Porexemplo:ImigrantesdeLeste.
Quando o investigador encontra sujeitos que satisfazem os critrios escolhidos pedelhes que
indiquemoutraspessoasdecaractersticassimilares.
15
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Aamostradependeda:
1. Extensodouniverso;
2. DoNveldeConfiana;
3. DoErroMximopermitido;
4. Dapercentagemcomqueofenmenoseverifica.
F rm ula:
n= 2 . (p.q)
e2
n=Tamanhodaamostra
=Nveldeconfianaescolhidoexpressoemndesviospadro(s)
p=%comoqualofenmenoseverifica
q=%complementar(100p)
e=Erromximopermitido
16
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Sedesejarmosumnveldeconfianabastantealtosuperiora99%aplicaseafrmuladostrs
desvios.
Logo,odesvio(s)2seriaiguala32=9
Seoerromximoforde2%oe2seriguala22=4
Exemplo:Seforpossveladmitirqueonmerodecaptaesdeguaemprofundidadesesituam
porvoltados50%,noultrapassandoesta%,entop=50e,consequentemente,q=10050ouseja
50.Assim,temseaequao
n= 9 . (50.50) = 5625
4
Isto,paraatendersexignciasestabelecidas,on.decaptaesaanalisarseria5625.
Setodavia,foraceiteonveldeconfianade95%(2desvios)eumerromximode5%on.de
elementosserbemmenor.
osclculos.
n=2 . (p.q)
e2
n= 4 . (50.50) = 400
25
Convmlembrarquesemprequenosejapossvelestimarumapercentagemdofenmeno,deve
utilizarsesemprep=50
17
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Aamostradependeda:
1. Extensodouniverso;
2. DoNveldeConfiana;
3. DoErroMximopermitido;
4. Dapercentagemcomqueofenmenoseverifica.
Frmula
Onde:
n=Tamanhodaamostra
=nveldeconfianaescolhido,expressoemnmerosdedesviospadro
p=percentagemdofenmeno
q=percentagemcomplementar
N=tamanhodapopulao
e2=erromximopermitido
Exemplo:Verificarquantosdos100empregadosdeumacantinacumpremcorrectamenteas
normasdehigieneeseguranadotrabalho.
Presumesequeessen.nosejasuperiora30%dototal;desejaseumnveldeconfianade95%
(2desvios)etoleraseumerroat3%.
Ento,n=90,4Logodeveroserpesquisados90empregados.
Confirmeaplicandoafrmula
Mas,seapopulaofossede10.000empregados,comosmesmoscritriosanteriormente
referidos,ento:
n= 4 . (30.70).10000 = 853
(9.9999)+4.(30.70)
18
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Otamanhoptimodeumaamostra,nodependetantodotamanhodapopulaomassimde
doisparmetrosestatsticos:amargemdeerroeonveldeconfiana
MargemdeerroUmaamostrarepresentaaproximadamente(enuncaexactamente)uma
populao.Amedidadesteaproximadamenteachamadamargemdeerro,elidoassim:
seumapesquisatemumamargemdeerrode2%eaDoenaCardacateve25%deprevalncia
naamostrarecolhida,podemosdizerque,naqueleinstante,napopulao,elateruma
prevalnciaentre23%e27%(25%menos2%e25%mais2%).
NveldeconfianaAspesquisassofeitascomumparmetrochamadonveldeconfiana,
geralmentede95%.Estes95%queremdizeroseguinte:serealizarmosumaoutrapesquisa,com
umaamostradomesmotamanho,nasmesmasdataselocaisecomomesmoinstrumentode
recolhadedados,humaprobabilidadede95%dequeosresultadossejamosmesmos(euma
probabilidadede5%,claro,dequetudodifira).
Quandojseefectivouumapesquisaesedesejaconheceramargemdeerroutilizadaaplicase:
p =
Frmula
(p.q)
n
Onde:
n=Tamanhodaamostra
p=Erropadrooudesviodapercentagemcomqueseverificadeterminadofenmeno
p=percentagemdofenmeno
q=percentagemcomplementar
19
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Exemplo:Numapesquisaefectuadacom1000adultos,verificouseque30%bebemcafpelo
menosumavezpordia.Qualaprobabilidadedequetalresultadosejaverdadeiroparatodoo
universo.
p =
(30.70)
1000
p = 1,45
Comoovalorencontrado(margemdeerro)correspondeaumdesvio,entoparadoisdesvios
(95,5%),temos1,45*2=2,90.
Para3desviosotriplo(4,35).
Istosignificaque,porexemplo,paraumnveldeconfianade95%(2desvios)oresultadoda
pesquisaapresentarcomomargemdeerro2,90paramaisoumenos.
provvel,portanto,queon.deconsumidoresdecafestejaentre27,10%(30%2,90)e32,90%
(30%+2,90).
Frmula
Z 2 ( /2 ) p (1 -p )
d2
Emque
p=fenmeno]
=erro
{SeIC(intervalodeconfiana)=95%,=5%(0,05)}Ento
/2=0,05/2=0,025
Z(/2)=Z(0,025)=1,96
d=nmerodedesvios
20
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Assimparaumfenmenoquetenhaumaprevalnciade25%,osresultadosseriam:
Emtermosestatsticosconsideramosqueumaamostra:Pequenasen<30
CUIDADOS
1. Imparcialidade:todososelementosdevemteramesmaprobabilidadeeoportunidadede
seremescolhidos;
2. Representatividade: deve conter em proporo todas as caractersticas que a populao
possui,qualitativaequantitativamente,demodoaquenosetornetendenciosa;
3. Tamanho: suficientemente grande de modo a fornecer as principais caractersticas, por
outroladopequenaparaeconomizartempo,dinheiroepessoal.
OestudoEstatsticorecaisobreaamostra,noentantoestefeitodemodopormenorizadoacada
umdoselementosdaamostra,quesodesignadosporIndivduoouUnidadeEstatstica.
Unidade Estatstica: o factor elementar, o objecto de anlise, que independentemente da sua
naturezatemquepossuirumadefinioprecisa.
AsprincipaiscaractersticasdeumaboaunidadeEstatsticaso:
1. Propriedadeouadequaoaoobjectivodainvestigao;
2. Clareza;
3. Mensurabilidade;
4. Comparabilidade.
21
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
NoestudodecadaunidadeEstatstica,surgemresultadosindividuaiscomosquaissofeitasas
infernciassobreapopulao.EstesresultadostmonomedeDadoEstatstico.
DadoEstatstico:oresultadodoestudoefectuadoacadaunidadeEstatsticatendoemcontaa
suaindividualidade,sendoestedepoistratadodemodoapermitirinferirsobreacolectividade
queaintegra(populao).
Ao ser efectuada uma anlise Estatstica a uma populao, os aspectos (caractersticas) que se
tmemconta,umouvrios,sodenominadosporVarivelEstatstica.
UmavarivelEstatsticapodeser:
1. Qualitativa:seasuanaturezaquevariadeelementoparaelemento.
Asvariveisqualitativasdividem:seem:
a. Variveisnominais:quandooseusignificadosseentendeemfunodonomee
o nmero ou cdigo que se lhe atribua no nos d nenhuma informao (sexo,
cordeolhos,graudeparentesco,tipodepatologia,presena/ausnciadefactores
derisco,etc.).
b. Variveis ordinais: quando existe uma ordenao possivel (gravidade de uma
leso,classesocial,graudeescolaridade,etc.).
22
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Tendoemcontaonmerodeatributos(caractersticas)queestoaserestudadas,asvariveis
podemser:
1. Unidimensionais:seapenascorrespondeaumatributo
2. Bidimensionais:secorrespondeadoisatributos;
3. Pluridimensionais:secorrespondeavriosatributos.
Incompatveis:cadaunidadeEstatsticanopodepertencersimultaneamentea
duasoumaismodalidades;
2.
Aescolhadasmodalidadesdeveserfeitadeacordocomasinformaespossudas.Noentanto,
surgemsituaesemquehnecessidadedeseaumentarumamodalidadesuplementar.
23
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Oparmetrotodaafunodefinidaapartirdosdadosnumricosdeumapopulao.
Exemplo:consideremosasseguintesnotasemEstatstica101110159
Mdia =xi/n = 55/5 = 11
Ovalor11oparmetro(resultadodamdiaaritmtica).
Odadoestatsticotodaafunodefinidaapartirdosdadosnumricosdeumaamostra.
Exemplo:consideremosaamostra:1010
Mdia =xi/n = 20/2 = 10
24
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Depoisdetermosdefinidoalgumasnoesbsicasdeestatstica,tratarse,aseguir,dasegunda
fasedeumestudoestatstico.Comojreferimos,osdadosnumricosrecolhidosregistamseem
sriesestatsticase,paraseremanalisados,devemserordenadoserepresentadosemquadrose
emgrficos.
Quandotrabalhamoscomumavariveldiscretaoudescontnuafalamosemseriaoequando
trabalhamoscomumavarivelcontnuafalamosemclassificao.
Como j referimos anteriormente, uma seriao implica que a varivel seja discreta (exemplo:
nmerodefilhosdeumcasal,nmerodedivisesdeumacasa,etc.).
Oquadrogeraldeumaseriaoestexpressonoquadroquesesegue.
Quadro 1: Quadro Geral de Seriao
Varivel
Frequncias
absolutas
Frequncias
acumuladas
X1
n1
n1
X2
n2
n1+ n2
X3
n3
n1+ n2+ n3
Xi
ni
Xk
nk
Total
N
Legenda: Distribuio de frequncias de uma varivel discreta
Frequncias
relativas
n1
N
n2
N
n3
N
ni
N
nk
N
1
Frequncias
relativas
acumuladas
n1
N
n1+n2
N
n1+ n2+n3
N
n1+ n2++ ni
N
Na primeira coluna temos os valores que a nossa varivel X toma (x1, x2, ..., xk). Esta coluna
podesertambmdenominadaporxi.
Nasegundacolunaapresentamosasfrequnciasabsolutassimplesouefectivas,isto,onmero
devezesquecadavalorfoiobservadoouonmerodevezesquecadavalorsurgenaamostra.
25
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Estacolunapodetambmserdenominadaporni.Devemoslembraraquiqueonmerototalde
indivduos pertencentes populao/ou amostra chamase efectivo total e designase por n,
devendosempreverificarsequeni=n.
Naterceiracolunapodemosvisualizarasfrequnciasacumuladas,isto,asomadasfrequncias
absolutas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser
tambmdenominadaporN(xi).Assim,
N(xi) = ni
xi<x
Na quarta coluna apresentamos as frequncias relativas simples. Esta coluna pode ser tambm
denominadaporfi,emquefi=ni/ne,detalmodoque,fi=1;afrequnciarelativaexpressa,
emgeral,empercentagem.
Na quinta coluna temos as frequncias relativas acumuladas, isto , a soma das frequncias
relativas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser
tambm denominada por F(xi); a frequncia relativa acumulada expressa, em geral, em
percentagem.
Exemplo:ConstruaoquadrodefrequnciasparaavarivelXquetomaosseguintesvalores:
xi
14
14
13
12
11
12
10
xi
ni
fi=ni/n
N(xi)
F(xi)
10
1/9
1/9
11
1/9
2/9
12
3/9
5/9
13
2/9
7/9
14
2/9
9/9
ni = 9
fi = 1
em que n = 9
26
Margarida Pocinho e Joo Paulo de Figueiredo
13
12
ESTATSTICAEBIOESTATSTICA
Como j referimos anteriormente, uma classificao implica que a varivel seja contnua
(exemplo:atemperaturadeumcorpo,aalturadeumapessoa,aduraodecertofenmeno,etc.
variveisrelacionadascomoespao,otempoouamassa).
Quadro 3: Quadro de Frequncias
Frequncias
Marcas da
Frequncias
Frequncias
Frequncias
classe
absolutas
acumuladas
relativas
Classes
relativas
acumuladas
c0-c1
X1
c1-c2
n1
X2
c2-c3
n2
X3
n3
n1
n1
n2
n1+n2
n1
n1+ n2
N
n3
n1+ n2+n3
ni
n1+ n2++ ni
n1+ n2+ n3
ci-1-ci
Xi
ni
ci-1-ck
Xk
nk
nk
1
N
Total
Naprimeiracolunatemosasclasses.Porconveno,asclassessoabertassuperiormente,com
excepodaltimaclasse,naturalmente.
Nasegundacolunatemosasmarcasdaclasse.Estacolunapodesertambmdesignadaporxi.A
marcadeumaclasseopontomdiodessaclasse,ouseja,opontoequidistantedosextremos
deumaclasse.
Exemplo:classec0c1 x1=(c0+c1)/2
Naterceiracolunaapresentamosasfrequnciasabsolutassimplesouefectivas,ouseja,onmero
devezesqueosvaloresdedeterminadaclasseforamobservados.Estacolunapodesertambm
denominada por ni. Mais uma vez, ni = n (nmero total de indivduos pertencentes
populao/ouamostra,aquesechamaefectivototal).
Na quarta coluna apresentamos as frequncias acumuladas, isto , a soma das frequncias
absolutas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser
tambmdenominadaporN(i).
27
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Na quinta coluna temos as frequncias relativas simples. Esta coluna pode ser tambm
denominadaporfi,emquefi=ni/ne,detalmodo,quefi=1.
Na sexta coluna apresentamos as frequncias relativas acumuladas, isto , a soma das
frequncias relativas correspondentes a valoresinferioresaumdeterminadovalor.Estacoluna
podesertambmdenominadaporF(i).
NumaclassificaohabitualrepresentarmosporKonmerodeclasses(emgeralKvariaentre
5e20,inclusive)eporAaamplitude(emqueA=xmximoxmnimo).
Ento,
- Se K dado = A/K
- Se dado K=A/ , sendo a amplitude do intervalo de
classe e A a amplitude do intervalo
da amostra
Exemplo:Construaoquadrodefrequnciascomosseguintesdados:
Classes [20-23[ [23-26[ [26-29[ [29-32[ [32-35[ [35-38]
ni
2
5
7
10
4
2
Quadro 4: Quadro de Frequncias
Classes
ni
ni
fi
N(i)
F(i)
x'i
[20-22]
2/30
2/30
21
[23-25]
5/30
7/30
24
[26-28]
7/30
14
14/30
27
[29-31]
10
10/30
24
24/30
30
[32-34]
4/30
28
28/30
33
[35-38]
2/30
30
30/30
36
= 30
fi
= 1em que n = 30 e = 3
28
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
29
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Sobestadesignaoagrupamseosparmetrosque,ounosindicamalgodeassocivelaoncleo
ou centro da distribuio, ou nos permitem compartimentla. Vamos considerar as seguintes
medidasdetendnciacentraloudeposio:mdia,mediana,modaequantis.
3.8.1 Mdia
MDIA ARITMTICA
Amdiaaritmticaopontodeequilbriodosdados,isto,tendoumconjuntodenvaloresx1,
x2,...,xndeumavarivelXoquocienteentreasomadessesvaloreseonmerodeles.
Amdiaaritmticapodeserrepresentadapelaseguintefrmulamatemtica:
x = xi / n
Numaamostraseriadaosvaloresx1,x2,...,xkocorremn1,n2,...,nkvezes,respectivamente,a
mdiaaritmticaser
x = nixi / n = fixi
Exemplo:Calculeamdiaaritmtica,sabendoque
xi
ni
4
2
6
4
7
5
8
3
xi
ni
nixi
24
35
24
10
20
=16
=111
Ento,
x = nixi / n = 111/16= 6,94
30
Margarida Pocinho e Joo Paulo de Figueiredo
10
2
ESTATSTICAEBIOESTATSTICA
Exemplo:Calculeamdiaaritmtica,sabendoque
Classes
ni
[3-5[
2
[5-7[
4
Classes
ni
x'i
nix'i
[3-5[
3,5
[5-7[
5,5
22
[7-9[
7,5
37,5
[9-11[
9,5
28,5
[11-13]
12
24
=16
=119
Ento:
x = nix'i / n = 119/16 = 7,43
Temos de salientar que quando usamos a marca da classe estamos a colocar um certo erro de
agrupamento,peloquedevemosconsideraraCorrecodeSheppard,detalmodoque:
x semelhante a x
Relativamentespropriedadesdamdiaaritmticapodemosenunciarduas:
Somandoousubtraindoumaconstanteatodososvaloresobservados,amdiaresultante
ficaraumentadaoudiminuda,respectivamente,dessaconstante;
Multiplicandooudividindoosvaloresobservadosporumaconstantediferentedezero,a
mdiaresultanteficarmultiplicadaoudividida,respectivamente,poressaconstante.
31
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Porsuavezassociaseax1,x2,...,xkcertosfactoresdeponderaooupesosp1,p2,...,pkque
dependemdosignificadoouimportnciaatribudasobservaes.Assim,afrmulamatemtica
damdiaser:
x p = pixi / pi
Exemplo 9: Umprofessordematemticaquersaberamdiapoderadadassuasavaliaesnas
quatroturmasemquelecciona,sabendoqueotestetinhaumaponderaode30%eotrabalho
umaponderaode70%:
TurmaAMdiadanotadoteste=65%
Mdiadanotadotrabalho=78%
TurmaBMdiadanotadoteste=60%
Mdiadanotadotrabalho=70%
TurmaCMdiadanotadoteste=40%
Mdiadanotadotrabalho=28%
TurmaDMdiadanotadoteste=80%
Mdiadanotadotrabalho=75%
Determineamdiaponderadadasquatroturmasemconjunto.
xp=pixi/pi
[((65*30)/100)
((78*70)/100)
((60*30)/100)
((70*70)/100)
Sepreferirmosemquadroaresoluoser
Quadro 7: Clculo da mdia ponderada
xi
pi
pixi
65
30
1950
60
30
1800
40
30
1200
80
30
2400
78
70
5460
70
70
4900
28
70
1960
75
70
5250
400
24920
x p = pixi / pi=24920/400=62,3
32
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Para alm da mdia aritmtica e da mdia aritmtica ponderada, temos tambm a mdia
geomtrica, a mdia harmnica e a mdia quadrtrica (a estes trs tipos de mdias no iremos
fazerqualquerreferncia).
3.8.2 Mediana
Amedianadeumasriedenobservaesx1,x2,...,xndeumavarivelXovalorqueocupaa
posiocentralquandoasobservaesestoordenadasporordemcrescenteoudecrescente,isto
,amedianadeumavarivelestatsticaovalordessavariveltalqueafrequnciadosvalores
que lhe so inferiores a mesma que a frequncia dos valores que lhe so superiores.
Representase,habitualmente,porMd.
Amedianausadaquandonaamostrahvaloresexcntricosemrelaoaoutrosvalores.
Paraoclculodamediana,temosdeconsiderarduassituaes:ocasoemqueNmpareocaso
emqueNpar.
N
MPAR:
Amedianaumvalorobservado,detalmodoqueolugarqueocupadadopelafrmula
Md = (N +1) / 2
Exemplo:Determineamedianaparaaseguintesriededados:
5
Ordenandoporordemcrescente,vem56789
ComoNmpar,ento
Md=(N+1)/2=(5+1)/2=6/2=3
Seamedianaocupaaterceiraposioouterceirotermo,oseuvalor7
33
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
PAR:
Amediananocoincidecomnenhumvalorobservadoficandocompreendidaentredoisvalores
centrais classemediana;convencionousetomarparamedianaamdiadestesdoisvalores.A
posioqueamedianaocupadadapelafrmula
Md = mdia dos valores que se encontram na posio N / 2 e (N / 2) + 1
Exemplo:Determineamedianaparaaseguintesriededados
5
12
Ordenandoporordemcrescente,vem5678912
ComoNpar,ento N/2=6/2=3;(N/2+1)=3+1=4
Assim,aclassemedianaocupadapelasposies3e4,ouseja,pelosvalores7e8,peloquea
Md=(7+8)/2=15/2=7,5
3.8.3 Moda
A moda (ou valor modal) de uma srie de n valores x1, x2, ..., xn de uma varivel X o valor
ondeafrequnciaatingeomximo(relativo).Representase,habitualmente,porMo.
AMOSTRA SERIADA:
Amodaovalordavarivelcommaiorefectivo,isto,seumavariveldiscreta,a(s)moda(s)
(so)o(s)valor(es)davarivelestatsticaqueseobserva(m)commaiorfrequncia.
Exemplo:Determineamodaparaaseguintesriedevalores
xi
10
ni
Amoda8.
34
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
AMOSTRA CLASSIFICADA:
Nestecasofalamosemclassemodal,tomandoseparamodaamarcadaclasse.Assim,amoda
deumavarivelcontnuaXtodoovalordeXparaoqualafunodefrequncia(absolutaou
relativa)atingeummximolocal.
Exemplo:Determineamodaparaaseguintesriedevalores
classes [2-4[
ni
[4-6[
[6-8[
[8-10[
[10-12]
10
Aclassemodal[810[,peloqueamoda=(8+10)/2=18/2=9
MdiaModa=3(MdiaMediana)
Vejamos,agora,arelaoexistenteentreestastrsmedidasnocasodasfigurasqueseseguem
35
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
A medida de tendncia central mais usada a mdia aritmtica, que apresenta em relao
medianaemodavantagensapreciveis,taiscomo:
facilmentecalculvel;
aquemelhorseprestaaulterioresanlisesestatsticas;
Dependedetodososvaloresdasrie;
umamedidadetendnciacentralparticularmenteestvel,variandoomenospossvel
deamostraparaamostraextradasdamesmapopulao;
Podesertratadaalgebricamente.
Existem,todavia,casosemqueainformaofornecidapelamedianaoupelamoda,pareceser
maiscompletadoqueafornecidapelamdiaaritmtica,comopassamosaindicar.
36
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
MEDIANA:
Estamedidadetendnciacentraldeverutilizarsequando:
Sedesejaconheceropontomdioexactodadistribuio;
Existemresultadosextremosqueafectariamgrandementeamdia.Importasalientarque
a mediana no influenciada pelos resultados extremos exemplo: na srie
10,13,15,16,18,19,21,tantoamdiacomoamedianaso16;sesubstituirmos21por50eos
restantesresultadospermaneceremosmesmos,amediana16eamdiaserde20,1;
MODA:
Estamedidadetendnciacentraldeverutilizarsequando:
Umamedidarpidaeaproximadadatendnciacentralforsuficiente;
Sedesejaconhecerovalormaistpicodeumadistribuioexemplos:descreveroestilo
devestidousadopelamulhermdia,salriopreponderanteemdeterminadaempresa.
desalientarque,apesardasvantagensapresentadasparaamoda,estatemadesvantagemde
serdedeterminaoimprecisa,nocasodasvariveiscontnuas.
37
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
3.8.4 Quantis
Chamasequantildeordempcom0p1erepresentase,habitualmente,porCpaovalordex
talqueF(x)=p.
Algunsquantistmdenominaesespeciais:
QUARTIS:
Osquartisdividemasrieordenadaem4partesiguais,contendocadaumadelas1/4ou25%das
observaes.
Q1=1quartil(correspondeaoquantildeordemp=1/4)
Q2=2quartil(correspondeaoquantildeordemp=1/2)
Q3=3quartil(correspondeaoquantildeordemp=3/4)
Assim, Q1 o valor da varivel estatstica que deixa atrs de si 25% das observaes; Q2 o
valordavarivelestatsticaquedeixaatrsdesi50%dasobservaeseQ3ovalordavarivel
estatsticaquedeixaatrsdesi75%dasobservaes.A(Q1Q3)chamaseintervalointerquartil
eointervaloaoqualpertencem50%dasobservaes,deixando25%paraadireitae25%paraa
esquerda.
de notar que dizer que os quartis dividem a srie em 4 partes iguais no significa que, por
exemplo, os intervalos (Q1, Q2) e (Q2, Q3) tm a mesma amplitude, mas sim que contm o
mesmonmerodeobservaes.
DECIS:
Os decis dividem a srie ordenada em 10 partes iguais, contendo cada uma delas 1/10 ou 10%
dasobservaes.
D1=1decil(correspondeaoquantildeordemp=1/10)
D2=2decil(correspondeaoquantildeordemp=2/10)
38
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
CENTIS:
Oscentisdividemasrieordenadaem100partesiguais,contendocadaumadelas1/100ou1%
dasobservaes.
C1=1centil(correspondeaoquantildeordemp=1/100)
C2=2centil(correspondeaoquantildeordemp=2/100)
Comopodemosobservarnafigura18
Q1=C25
Q2=Md=D5=C50
Q3=C75
D1=C10
D2=C20
39
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Uma medida de tendncia central no nos d, s por si, uma informao exaustiva da
distribuio considerada; pelo contrrio, a capacidade que se lhe atribui de representar os
elementos de uma distribuio depende do modo como estes se concentram ou dispersam em
torno dela. Assim, podemos dizer que os parmetros de tendncia central no so suficientes
para caracterizar uma srie estatstica, apesar de a mediana e os quantis darem j uma ideia
sumriadomodocomoestodistribudasasobservaes.
Consideremososeguinteexemplo:Doisgruposdealunoscomasseguintesclassificaes
A
B
2
8
3
9
10
10
16
11
19
12
AMPLITUDE TOTAL
Aamplitudetotaladiferenaentreomaiorvaloreomenorvalor,isto,aamplitudetotalde
uma varivel estatstica a diferena entre o valor mximo e o valor mnimo dos valores
40
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
observados.aformamaissimplesdeavaliaradispersodosdados,detalmodoquequanto
maiorforaamplitudetotalmaioradispersodosdados.
A amplitude total pode ser tambm denominada de intervalo total ou campo de variao;
representase,habitualmente,porAeapenasusavaloresextremos.
Numaamostraseriada:
A=xmximoxmnimo
Numaamostraclassificada:
A=extremosuperiordaltimaclasseextremoinferiordaprimeiraclasse
Se alguma destas classes for de amplitude indeterminada no possvel definir o intervalo de
variao.
Aamplitudetotalapresentaasseguintesdesvantagens:
Emborasejafcildecalcular,aamplitudetotaldependesomentedosvaloresextremos,queso,
geralmente,osmenosfrequenteseosmenossignificativosdeumadistribuio,desprezandose
os valores intermdios que so os mais frequentes. Alm disso, os valores extremos so
vulgarmenteanmalosemuitovariveis,consoanteaamostraqueseretiredeumapopulao,
detalmodoqueduasdistribuiespodemteramesmaamplitudetotal,masdispersesmuito
diferentes.
Outro inconveniente da amplitude total consequncia de no tomar em considerao as
frequnciasdasobservaes.
Exemplo:CalculeaamplitudetotaldogrupoG,sabendoque:
G=
10
16
19
41
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
AMPLITUDE INTERQUARTIS
Osquartisfornecemindicaoquantoformacomoasobservaessedistribuememtornoda
mediana.
Como o 1 e o 3 quartis representam valores abaixo dos quais esto, grosso modo,
respectivamente, 25% e 75% das observaes, entre eles existiro, assim, 50% das observaes
centrais. Consequentemente, quanto mais aproximados estiverem estes quartis, maior ser a
concentraodasobservaesemtornodamediana.
AamplitudeinterquartispodeserdefinidacomoadiferenaentreoQuartil3eoQuartil1.Esta
medida de disperso pode ser tambm denominada de intervalo interquartis ou intervalo
quartlico.
Como podemos observar na figura 8, quanto mais achatada a curva, maior a amplitude e
quantomaioraamplitudeinterquartlicamaisdispersaadistribuio.
Q1
Md
Q3
Exemplo:Calculeaamplitudeinterquartis,sabendoqueQ3=177,46eQ1=166,88.
Q=Q3Q1=177,46166,88=10,58
Podemostambmcalcularaamplitudesemiinterquatisouintervalointerquartlicoouintervalo
semiquartil ou desvio quartlico ou amplitude semiinterquartlico, que se representa,
habitualmente,porQepodeserdefinidadoseguintemodo:
Q = (Q3-Q1) / 2
Adistribuiotantomaisdispersaquantomaiorforaamplitudeinterquartis.
Podemos enumerar as vantagens e as desvantagens do uso da amplitude interquartis e da
amplitudesemiinterquartis:
42
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Estas medidas so mais completas do que a amplitude total, porque usam dois valores menos
extremos(Q1eQ3).Noentanto,tmaindaalimitaodenoentrarememlinhadecontacoma
disposio das frequncias nos intervalos definidos pelos valores separados exemplo: a
amplitudeinterquartisseramesma,queras50%dasobservaesseacumulemnumsponto,
querestejamuniformementedistribudasporesseintervalointerquartis.
As medidas de disperso que passaremos a descrever no tm esta limitao, porquanto o seu
clculodependedetodososvaloresdasrie.
DESVIO
Dadosnvaloresx1,x2,...,xndeumavarivelX,chamasedesviodecadavalorxiemrelao
constantec,adiferenadexiparac,isto,
xi - c
NotesequeosdesviosdavarivelXemrelaoac,isto,(x1c),(x2c),...,(xnc)constituemosn
valoresdavarivelXc.
DESVIO MDIO
Falamosemdesviomdioquandoconsideramososdesviosdecadavalorxiemrelaomdia
aritmtica,isto:
xi-x
O simples total destes desvios no pode ser utilizado como medida de disperso, por ser
identicamentenulo.Defacto,paranvaloressingulares,terse:
(xi-x)=0
Noentanto,oquocienteentreasomadosmdulosdestesdesvioseonmerodeles,jpodeser
consideradocomomedidadedisperso
D.M.= |xi-x | / n
43
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Exemplo20:CalculeodesviomdioparaA=453
xi
xi-x
|xi-x |
4-4=0
5-4=1
3-4=-1
=12
3-4=-1
= 2
x = xi / n =12/3=4
D.M.= |xi-x| / n = 2/3=0,67
Observao:tambmseutilizaodesviomdioemrelaoaqualqueroutramedidadeposio
central.
Numaamostraseriadatemos:
D.M.= ni |xi-x| / n = fi |xi-x|
Numaamostraclassificada,osdesviosemrelaomdiaaritmticasocalculadosapartirdos
pontosmdiosdecadaclasse,ouseja:
D.M.= ni |x'i-x'| / n = fi |x'i-x'|
44
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
classes
ni
[4-6[
1
[6-8]
2
Classes
ni
xi
xi-x
|xi-x|
ni|xi-x|
[4-6[
4,5
4,5-6,2
1,7
1,7
[6-8]
7-6,2
0,8
1,6
=2,4
x' = nix'i / n = [(1x4,5) + (2x7)] / 3 = 6,2
=3,3
Ento,odesviomdio
D.M.= ni |x'i-x'| / n = 3,3 /3 = 1,1
Odesviomdioapresentaaseguintedesvantagem:
Embora dependa de todos os valores observados, o desvio mdio tem a desvantagem de
considerarosvaloresabsolutosdosdesvios,oqueimpedeoseutratamentoalgbrico.
VARINCIA
Outramaneiradeeliminarmosossinaisdosdesvios,consisteemelevlosaoquadrado.Porisso,
em vez da mdia dos valores absolutos dos desvios considerase a mdia dos quadrados dos
desvios.Obtmse,assim,umaoutramedidadedispersobastanteusadaavarincia.
Dados n valores x1, x2, ..., xn de uma varivel X, chamase varincia e representase,
habitualmente,pors2ous2xamdiaaritmticadosquadradosdosdesviosemrelaomdia
dessasvalores,isto:
S2 = (xi-x)2 / n
Exemplo 22: Calcule a varincia para X=17,18,19,20,21
Resoluo 22:
x = xi / n = (17+18+19+20+21) / 5 = 19
Ento,avarincia:
Quadro 10: Clculo da Varincia
xi
17
18
19
20
21
N=5
(xi-x)
17-19=-2
18-19=-1
19-19=0
20-19=1
21-19=2
(xi-x)2
4
1
0
1
4
=10
S2 = (xi-x)2/ n = 10/5 = 2
45
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Sex1,x2,...,xnocorremn1,n2,...,nkvezes,respectivamente,temos
Paraumaamostraseriada:
S2 = ni (xi-x)2 / n = fi (xi-x)2
Paraumaamostraclassificada:
S'2 = ni (x'i-x ')2 / n = fi (x'i-x ')2
Exemplo23:Calculeavarinciaparaadistribuiocujamdia103
Classes [85-90[ [90-95[ [95-100[ [100-105[ [105-110[ [110-115[ [115-120]
ni
12
25
38
85
93
16
9
Quadro 11: Clculo da Varincia
Classes
ni
xi
(nixi)
(xi-x)
(xi-x)2
ni(xi-x)2
85-90
12
87
1044
-15,5
240,25
2883
90-95
25
92
2300
-10,5
110,25
2756,25
95-100
38
97
3686
-5,5
30,25
1149,5
100-105
85
102
8670
-0,5
0,25
21,25
105-110
93
107
9951
4,5
20,25
1883,25
110-115
16
112
1792
9,5
90,25
1444
115-120
117,5
1057,5
15
225
2025
278
28500,5
12162,25
x = (nixi) / n
=28500,5/278
=102,5
Ento,avarincia
S'2 = ni (x'i-x)2/ n = 12162,25/ 278 = 43,7491
Podemos,agora,enumeraraspropriedadesdavarincia:
46
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Multiplicandooudividindotodososvaloresobservadosporumaconstantediferentede
zero, a varincia resultante vir multiplicada ou dividida, respectivamente, pelo
quadradodessaconstante.
CORRECODESHEPPARD:
Aocalcularseamdiaeavarinciadaamostraclassificadaatravsdadistribuioempricadas
marcas, cometese um certo erro (erro de agrupamento), pois supomos que as observaes
agrupadas em cada classe tm todas o valor da respectiva marca. Todavia, existem frmulas
correctivas devidas a Sheppard, isto ,na variancia, ao valor calculado deve subtrairse 1/12 ao
quadradodaamplitudedasclasses(a)
s2x = s2x' - a2/12 assim,nonossoexemploanterior,avarianciacorrigida
era
s2x =43,7491 - 52
12
s2x =41.666
DESVIOPADRO
O desvio padro pode ser definido como a raiz quadrada da varincia, representandose,
habitualmente,porsx,isto:
sx =
s 2x
Ainda que a varincia nos d uma boa informao sobre a distribuio ou variabilidade dos
valores observados em relao sua mdia, apresenta, no entanto, a desvantagem de no se
exprimirnamesmaunidadeaqueestoreferidososdadosiniciais.Contudo,estadesvantagem
poder ser eliminada se extrairmos a raiz quadrada da varincia. A nova medida chamase
desviopadrooudesvioquadrtico.
Numaamostraseriada,temos:
sx =
s 2x
47
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Exemplo:Calculeodesviopadro,sabendoqueavarinciadeumaamostraseriada2.
sx =
s2x = 2 = 1,414
Numaamostraclassificada,temos:
sx =
s2x
Exemplo: Calcule o desvio padro, sabendo que a varincia corrigida de uma amostra
classificada4327,16.
sx =
s2x
=4327,16 = 65,78
AUTILIZAODASMEDIDASABSOLUTASDEDISPERSO
Amplitudetotal
Utilizasequando:
Osdadosforemmuitorarosoudemasiadodispersosparasejustificaroclculodeuma
medidamaisprecisadedisperso;
Forapenasnecessriooconhecimentodosresultadosextremos;
Desejamosumndicemuitorpidodedisperso.
Amplitudeinterquartlica
Utilizasequando:
Amedianaamedidadetendnciacentralusada;
Existirem resultados extremos que poderiam afectar o desvio padro de uma maneira
desproporcionada;
Adistribuiotruncada;
Adistribuioapresentaumaforteassimetria.
48
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Desviomdio
Utilizasequando:
Desejamosponderartodososdesviosemrelaomdiadeacordocomasuagrandeza;
Osdesviosextremosinfluenciaremindeterminadamenteodesviopadro.
DesviopadroeVarincia
Utilizamsequando:
Seprocuraumamedidadedispersoemrelaocomacurvanormal;
Tiveremdesercalculadosposteriormentecoeficientesdecorrelaoeoutrasestatsticas;
Sedesejarobterumamedidaqueserevistadeummximodeestabilidade;
Sesetratasomentededescreverumadistribuioprefereseodesviopadrovarincia.
Avarinciaintervmsobretudonaanliseestatstica.
DistribuioA:xA=30
sA=10
DistribuioB:xB=600
sB=20
49
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Exemplo26:Adistribuiodospesosedasalturasdeumgrupodeestudantesdedeterminada
Universidadeconduziuaosseguintesresultados:
X:Pesos
Mdia=57,5Kg
DesvioPadro=7,5Kg
Y:Alturas
Mdia=170cm
DesvioPadro=7,1cm
Determineocoeficientededispersoparacadaumadasdistribuiese,depois,indiqueemqual
delasadispersorelativamaior.
Vx=sx/x=7,5Kg/57,5Kg=0,130=13%
Vy=sy/Y=7,1cm/170cm=0,042=4,2%
Assim,podemosdizerqueadispersorelativamaisacentuadanadistribuiodospesos(X).
Adispersomaiornadistribuioquetivermaiorcoeficientededisperso.
Se pretendermos estabelecer comparaes entre disperses absolutas, devemos usar o desvio
padro,detalmodoquequantomaiorforodesviopadromaiorseradisperso.
Se pretendermos estabelecer comparaes entre disperses relativas, devemos usar um
coeficiente de disperso, de tal modo que quanto maior for o coeficiente de disperso V maior
seradisperso.
50
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
A distribuio normal apresenta uma curva em forma de sino, como mostra a figura 9. A sua
principalcaractersticaadeastrsmedidasdetendnciacentralmdia,medianaemodaSe
encontrarem todas no mesmo ponto da curva, ou seja, todas terem o mesmo valor ou, pelo
menos,valoresmuitoprximos.SeOselementosqueconstituemumadistribuioestomuito
prximosoumuitodispersos,encontraremosformassemelhantesdafigura10.
ESTATSTICAEBIOESTATSTICA
nossobreopadroderesultadosmuitoembreve,masnestafasereferiremosoutracaracterstica
muito importante da distribuio normal. Tericamente, a curva nunca toca o eixo horizontal,
mas aproximase dele infinitamente. Esta uma propriedade matemtica da distri buio que
no se reflecte na recolha de dados real. No nos cruzamos com seres humanos com
dimensesgigantescasoumicroscspicas!
Entoaspropriedadesdadistribuionormalsoasseguintes:
1)simtrica;
2)Temformadesino;
3) A mdia, a mediana e a moda encontramse no mesmo
pontodacurva;
4)Temduaspontasquenuncatocamoeixohorizontal.
Podemos perguntarnos quo rgida a distribuio normal relativamente aos elementos. Por
outras palavras, quanto pode uma curva desviarse da forma de sino e continuar a ser
consideradanormal?Geralmente,usamosduasabordagensparatomarmosestetipodedeciso;
na verdade, este problema mais importante do que o leitor pode pensar, pois existem testes
estatsticos,descritosmaisfrente,quespodemrealizarseseoselementosforemnormalmente
distribudos. Uma das abordagens baseiase na observao dos dados por averiguao, para
lhe darmos um nome mais respeitvel. Se o conjunto de nmeros for extenso, tornarse mais
fcil desenhar uma distribuio de frequncias. A outra abordagem reside em seguir um dos
procedimentos matemticos para determinar se um conjunto de resultados normalmente
distribudo. A verso do teste do quiquadrado que inclumos neste manual um desses
procedimentos.Naverdade,improvvelquenestafasedasuacarreiraestatsticanecessitede
saber com grande preciso se uma distribuio considerada normal ou no, pelo que o teste
grficodevebastar.Noentanto,devesersensvelaoproblema.
52
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Suponhamos que temos um conjunto de nmeros cuja mdia 50 e cujo desvio padro 5.
Chamamos a este valor (centmetros, segundos, pontos numa escala, ou outra coisa qualquer)
um desvio padro. Dez centmetros, segundos, etc., seriam dois desvios padro e quinze
centmetros,segundos,etc.,trsdesviospadro...semprecomrefernciaaoconjuntoatravsdo
qual obtivemos o valor 5. como se pudssemos tirar o desvio padro e transformlo numa
unidadedemedidadeumaescala;comosedissssemosqueumapolegadaso2,54cm.Nunca
misturaramos polegadas e centmetros nos mesmos clculos, mas poderamos converter uma
unidade na outra. Do mesmo modo, no misturamos resultados de desvios padro com
resultadosreais,masconvertemosumaescalanaoutra.
Voltemos s propores de nmeros em diferentes partes da distribuio. Se retirarmos uma
partedacurvaentreamdia,queestamarcadanoeixohorizontaldafiguraqueseseguecomo
50,eumdesviopadro,marcadonoeixohorizontalcomo55,sabemosquedevemostercercade
um tero de todos os resultados neste conjunto, porque o que acontece sempre com a
distribuio normal. De uma forma mais precisa, a proporo exacta do nmero total de
resultados que se encontram entre a mdia e um desviopadro acima da mdia(50e55neste
caso)34,13%.Comoadistribuionormalsimtrica,deveverificarseamesmacoisaabaixo
damdia,isto,devemosteroutros34,13%dosresultadosentreosvalores50e45sendo45o
valordamdiamenosumdesviopadrode5pontos.Observemosasduaspartesasombreado.
Aaritmticaelementardiznosque68,26%dototaldosresultadosseencontramentreosvalores
45e55,pertencendo31,74%aosvaloresextremosqueseencontramnosoutrosdoislados.Mais
umavez,asimetriadacurvasignificaque,paraestaproporo,metadede31,74%,ouseja,15,87
%,encontrasedecadaumdosladosdadistribuio.Poroutraspalavras,cercade16%detodos
osnmerosnesteconjuntoseromenoresdoque45,sendoamesmaquantidademaiordoque
55.
53
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Exemplo: Suponhamos que o professor obtm os resultados de um teste de leitura feito a 200
crianas.Osresultadossonormalmentedistribudoscomumamdiade60eumdesviopadro
de 8. A partir das propriedades da distribuio normal, sabemos que cerca de dois teros dos
resultados,isto,aquelesqueforamobtidoscomcercade136crianas,encontrarseoentreos
52eos68pontos.Cercade32crianas(16%)teroresultadosabaixode52ecercade32tero
resultadosacimade68.Josreferimostodos.Suponhamosentoqueospaisdeumacrianaque
obteve 68 gostariam de saber algo acerca do progresso do seu filho. Quando souberam que o
resultado da criana estava acima da mdia, ficaram contentes, mas gostariam de saber,
posteriormente,quoacimadamdiaseencontra,relativamenteaosoutros50%decrianasque
tambmobtiveramresultadosacimadamdia.Poroutraspalavras,ospaispretendemsaber
qualaposiorelativadodesempenhodofilho.Seosresultadosestivessemtodosmuitoperto
da mdia, sendo a nota mxima 68, os pais continuariam encantados. Ficariam, porm, menos
satisfeitos se soubessem que a nota mxima tinha sido 90, com um grande conjunto de notas
altas,acimade70.Noentanto,oprofessorsabequeodesviopadrodasnotasfoi8e,porisso,
umterodetodososresultadosestavaentre60e68.Sabendoque50%dosresultadosobtidos
estavamabaixodamdia,podemosperceberqueaposiodestacrianaestaonvelde84%
dosresultados,napartesuperiordetodososresultados.Afinal,ospaistmrazesparaestarem
contentes! Se a criana tivesse obtido 76, os pais teriam muito mais razes para estarem
orgulhosos, pois saberiam que o seu filho estava acima de 98 % das outras crianas (nota 76 e
dois desviospadro acima da mdia);umanota84colocariaomeninonaposioinvejvelde
estar acima de 99,87 % das outras crianas por outras palavras, num grupo de 200 crianas,
54
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
55
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
A posio da criana exactamente a meio entre os pontos 60 e 68. Significar isto que a sua
posionogrupoopontocentralentreamdiade50%e84%danota68?Isto,encontrarse
acrianaacimade67%doscolegas?Olhemoscuidadosamenteparaasduasporesdacurva
que est dividida pela linha ao nvel da nota 64. Sero simtricas? No e aqui temos um
problemaquetornaoclculodeumaposiorelativamuitomaiscomplicadoecansativodoque
gostaramos. Quanto mais nos afastamos da mdia, menos resultados correspondem s
diferentes propores. Assim, se tivermos duas pores entre 60 e 64 e entre 64 e 68, haver
menos resultados neste ltimo intervalo. Haver ainda menos no intervalo sguinte, entre as
notas 68 e 72, e assim sucessivamente. Isto tambm verdadeiro para os resultados abaixo da
mdia,mas,nestecaso,soosresultadosmaiselevados,enoosmaisbaixos,queseencontram
maispertodamdia.Hmuitomenosresultadosentre44e48doqueentre48e52,apesarde,
em ambos os casos, a variao de notas ser de 4 pontos, ou seja, meio desviopadro. Quando
olhamosparaaformadeumadistribuionormal,otamanhodiferentedasproporesquecada
desviopadro compreende parece bvio. No entanto, o problema de decidir a posio relativa
de uma nota 64, quando comparada com os resultados, no desapareceu. Como podemos
determinla? A resposta dada atravs de resultados z. Os resultados z correspondem a
desviospadroe,naverdade,sovirtualmenteamesmacoisa,exceptonofactodeumresultado
zsereferirsempreposiodeumpontoemrelaoamdia.Istovaitornarseclaroembreve.
Paraj,pensemosqueumresultadozde1amesmacoisaqueumdesviopadrode1,queum
resultado z de 2 e um dp 2, e assim por diante. Como no h, virtualmente, nada numa
distribuionormaldepoisdoterceirodesviopadroouresultadozemqualquerdasdireces
,r,aroqueosdesviospadroouosresultadoszincluamovalor4.Ecomumreferirmonosaos
resultadoszcomomaisoumenos;aosdesviospadrodescrevemoloscomosituandoseacima
ouabaixodamdia,emvezdemaisoumenos.Umdesviopadrotemumvalordefinidono
varivel, enquanto um resultado z se refere a uma posio relativa na curva e referido em
funo da mdia. Como, at agora, um resultado z tem o mesmo significado que um desvio
padroacimadamdia,podemosconsiderarqueosresultadoszeosdesviospadrosoiguais.
No entanto, um desviopadro pode referirse a um conjunto de resultados que distem um
desviopadro de qualquer ponto da curva, enquanto os resultados z tm posies fixas. Um
resultado z de + 1 corresponde exactamente a um desviopadro acima da mdia, e no a
qualquer conjunto de resultados que constituam um desviopadro. Voltemos ao problema do
resultadode64esuaposiorelativa.Sabemosqueasuaposioexactamentemetadedeum
desviopadroacimadamdia,peloquelhedamosumresultadozde+0,5.
56
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
H tabelas que nos permitem ver muito facilmente onde os resultados z se situam na curva
normal(AnexoVIII).Vejamoscomoutilizlas.Utilizaremosonossoexemplode64,cujovalorz
+0,5.
Lemos o valor na primeira coluna da esquerda, encabeada por z, at chegarmos ao valor 0,5.
Olhamos para a coluna direita e vemos o nmero 19,15. Temos de somar 50%, de modo a
obtermos o valor 69,15. Sabemos ento que h 69,15% dos resultados abaixo de 64 e 30,85%
acima. Devemos arredondar os valores para 69% e 31%, respectivamente. Consideremos outro
exemplo,destavezcomovalor65.Estevalorest5pontosacimadamdiaeodesviopadro
paraoconjuntode8.Umresultadode5pontosacimadamdia5/8dedesviopadroacima
damdia.Sefizermosascontas,sabemosquez+0,63.Comoseencontraacimadamdia,oseu
valor positivo. Voltemos tabela 51. Como z tem, desta vez, duas casas decimais, os
procedimentos vo ser um pouco diferentes. O valor imediatamente direita (22,7) a
percentagemcorrectaparaumresultadozde0,6.Noentanto,onossoresultado0,63,peloque
temosdeandartrscolunasdatabelaataovalor0,03,notopo.Estevalor,somadoaovalor0,6,
dnos o z de 0,63 ou seja, 23,57. Como o nosso z positivo, devemos somarlhe 50% para
obtermos o valor final de 73,57. Assim, a nota 65 est frente de 74% da escala. Podemos ver
pelatabelaque49%detodasasnotasemcadaumdosladosdacurvaestoincludasnumzde
2,33ouumbocadinhomaisabaixo,parasermosmaisprecisos).Notemosque,matematicamente,
ascaudasdacurvanuncatocamoeixohorizontal,nemincluemtodososresultadospossveis.
Reparemosagoranaposiorelativadeumapessoaqueobtenhaumresultadoabaixodamdia,
digamosumanota41naamostraoriginal.Estanotaest19pontosabaixodamdia,apenasum
poucomenosdoquedoisdesviospadro.Parasermosprecisos,est19/8ou2,375abaixo.Oseu
zser2,375.NatabelaSIiemanexovemosqueumzde+2,3inclui48,93%dosresultados,mas
onossoresultadozovalorumpoucosuperiorde2,375.Anossatabelaspodeserusadacom
duascasasdecimais,peloquevamosarredondarestevalorpara2,38.Paramos,destavez,junto
dacolunade0,08eobtemosovalor49,13.Assim,umzde+2,38inclui50%+49,13%=99,13%de
todososresultados.Atagoratudobem,masoproblemaqueonossovaloreranegativo.Basta
virarmosanossacurvaaocontrrioetrabalharmoscomasuaimagemaoespelho.Assim,como
nosso valor 2,38 sabemos que 99,13% de todas as notas da distribuio esto acima dele e
apenas0,87%abaixo.Seconsiderarmosestapequenaproporode1%,devemosesperarque,na
nossaamostrade200indivduos,1%,ouseja,doisindivduostenhamnotasinferioresa41.No
57
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
outroextremodasnotas,devemosesperarqueapenasdoisalunostenhamnotasde19oumais
pontosacimadamdia,ouseja,notasqueexcedamos79%.
Omododeobterovalorzdadopelaexpressoformal
Z=
Seodesvioemrelaomdiativerumsinalpositivoounegativo,seestiveracimaouabaixoda
mdia,respectivamente,zficarcomosinalcorrecto.
Nota: : tenha cuidado quando trabalhar com z e dp, de modo a uslos sempre que os dados
atravs dos quais foram obtidos sigam uma distribuio normalOuaproximadamentenormal.
Deoutromodo,arranjarconfuses
58
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Paramtricos:calculaasdiferenasnumricasexactasentreosresultados.
Noparamtricos:apenasconsideramsecertosresultadossosuperioresouinferioresaoutros
resultados.
REQUISITOSPARAUTILIZAODETESTESPARAMTRICOS
Quando se pretende empregar um teste t de Student ou uma anlise da varincia para fazer
comparaesentreamostras(testesparamtricos),existeumalistaderequisitosqueinclui,entre
outros:
1. queavariveltenhasidomensuradanumnvelmnimointervalar;
2. queadistribuiosejasimtricaemesocurtica;
3. queacaractersticaestudada(varivel)tenhadistribuionormalnumadadapopulao.
Semprequenosepode,honestamente,admitirasimetriaeanormalidadededistribuio,ou
osdadosforamrecolhidosnumnveldemensuraoinferioraointervalar,devemosrecorrera
testesquenoincluemanormalidadedadistribuioounvelintervalardemensurao.Esses
testeschamamsenoparamtricos
VANTAGENSDOSTESTESNOPARAMTRICOS
Podemserutilizados,mesmoquandoosseusdadosspodemsermedidosnumnvelordinal,
isto , quando for apenas possvel ordenlos por ordem de grandeza) podem ser utilizados
mesmoquandoosseusdadossoapenasnominais,isto,quandoossujeitospodemapenasser
classificadosemcategorias.
59
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
PODERDEUMTESTE
OpoderdeumtesteaprobabilidadederejeitarmosaH0quandoelarealmentenula
Os testes mais poderosos (os que tm maior probabilidade) de rejeio de H0, so testes que
possuemprrequisitosmaisdifceisdesatisfazer(testesparamtricoscomoteF).
As alternativas no paramtricas exigem muito menos prrequisitos mas produzem testes de
significnciacommenospoderqueoscorrespondentesparamtricos.
EMCONSEQUNCIA
Ao rejeitarse a H0 sem preencher as exigncias mnimas dos testes paramtricos, mais
provvelqueessarejeiosejafalsa(serejeitaraH0quandoelaverdadeiracometeumerrode
tipoI;seaceitaraH0quandoelafalsacometeumerrodetipoII).Quandoosrequisitosdeum
testeparamtricosoviolados,tornaseimpossvelconheceroseupodereasuadimenso()
obvioqueosinvestigadoresquerem,atodoocusto,rejeitaraH0quandoelamesmofalsa,
evitandoumerrodetipoI.
Otesteidealseriaaqueleque=0e=1,oqueimplicariaqueotesteconduziriasempredeciso
correcta,contudoestetesteidealraramenteexiste.
Aprobabilidadedoerrode1espciedeveserreduzida,fixandotericoem0,1;0,05ou0,01.o
valor fixado para depende da importncia que se d ao facto de rejeitar a H0 quando esta
verdadeira.
Umailustraodestepontodevistapodeserfeitacomoseguinteexemplo:
Umapessoainocenteatprovadocontrrio
H0:Apessoainocente
H1:Apessoaculpada
ErroI:Apessoacondenadamasestinocente
ErroII:Apessoaabsolvidamasculpada
60
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
ASSIM
Fixada a probabilidade do erro de tipo I (dimensodoteste),otestemaispotenteaqueleem
que a escolha da regio critica minimiza a probabilidade do erro de 2 espcie. Dizse tambm
queestaregiocriticaamaispotente.
Facilmenteseconcluiqueotestemaispotenteaqueleque,umavezfixadaaprobabilidadede
rejeitar a H0, quando ela verdadeira, maximiza a potncia ou a capacidade para rejeitar a
mesmahiptesequandoestafalsa.
PRESSUPOSTOS
Para saber se uma varivel simtrica dividimos o coeficiente assimetria (Skewness) pelo erro
padroeseoresultadoestiverentre2e2adistribuiosimtrica.
Parasaberseumavarivelmesocurticadividimosocoeficientedeachatamento(Kurtosis)pelo
erropadroeseoresultadoestiverentre2e2adistribuiomesocurtica.
Mas se os resultados de um teste paramtrico, no cumpriram com os requisitos (no mnimo
dados intervalares; distribuio simtrica, mesocurtica e normal), ento no tm interpretao
significativa.
Quando acontecem estes factos, a maioria dos investigadores opta por testes de significncia
noparamtricos.
61
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
PARAESCOLHERQUALQUERTIPODETESTEESTATSTICO
Distinguirseanossaamostraconstitudapelosmesmossujeitosemtodasassituaesouse
formadapordiferentessujeitosparacadasituao
INTERSUJEITOSOUDESIGNNORELACIONADO
estetipodedesignutilizadoquandoumindivduoouobjectoavaliadoapenasumavez.A
comparao efectuado entre os grupos de sujeitos/ objectos cujos resultados so no
relacionados.
Desvantagem: conjunto das diferenas individuais na forma como os sujeitos reagem ou
respondemtarefa.
INTRASUJEITOSOUDESIGNRELACIONADO
Acomparaofeitaentreosmesmossujeitos(sujeitosdomesmogrupo).
Aimportnciadestesdesignsaeliminaodequaisquerparticularidadesindividuais,umavez
queficamigualizadasemtodasassituaes.
Desvantagem:Efeitodememriaeaprendizagem.
AMOSTRASEMPARELHADAS
Igualizamsesujeitosdiferentesmasemparelhados,emtermosdeidade,sexo,profissoeoutras
caractersticasgeraisqueparecemimportantesparacadapesquisaemparticular.
estes tipos de designs podem ser considerados de designs relacionados, uma vez que
controladonassuascaractersticasrelevantes.
Desvantagem: Dificuldade em encontrar sujeitos que permitam o emparelhamento de todas as
caractersticasrelevantes.
Dificuldadesarranjargrandesamostras.
62
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
QUANDOUTILIZAR
Utilizasequandoosdadossonominais,peloqueemvezdesemediremresultadosdossujeitos
apenassepodemdistribuirossujeitosporumaoumaiscategorias.
OQuiQuadrado(X2)testaahipteseexperimentalqueprevquantossujeitosdecadagruposo
distribudosporumadeterminadacategoria.
OX2umtesteestatsticonoparamtrico,sendoumdosmaisutilizadosebastanteaplicadoem
diferentes planeamentos experimentais. O X2 muito usado mesmo ao nvel da estatstica
multivariada(nosentidodeobterograudeadernciaentreomodeloobtidoeoterico).
OBJECTIVO
Oobjectivocompararfrequnciasobservadascomfrequnciastericasouesperadas,ouseja,
verificaroseugraudeaproximao,quepodesergrande(=0)oupequeno(>0).
63
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Assim,oobjectivocompararasfrequnciasobservadasemcadaumadasclulasdeumatabela
de contingncia com as diferenas esperadas. O teste compara o nmero de sujeitos que se
distribuem por uma determinada categoria com o nmero de sujeitos que se esperaria se
distribussemporessamesmacategoria,casonoexistissemdiferenas.
OtestedoX2reflecteotamanhodasdiferenasentreasfrequnciasobservadaseesperadas.Para
sersignificativo,ovalordeX2deverserigualousuperioraosvalorescrticosdatabela(Anexo
I).
INSTRUESPASSOAPASSO
1. Calcular as frequncias esperadas (E) para cada clula, multiplicando os dois totais parciais
relevantesparacadaumaedividindopelonmerototaldesujeitos.
2.CalcularX2:
(O-E)2
X2
______________
emque:
O=frequnciasobservadasparacadaclula;
E=frequnciasesperadasparacadaclula.
3.Calcularosgrausdeliberdade:
g.l. = (r-1) (c-1)
emque
r=nmerodelinhasdatabeladecontingncia
c=nmerodecolunasdatabeladecontingncia
SeX2observado>X2crticorejeitaseH0
SeX2observado<X2crticonoserejeitaH0
Especificandoparaumatabeladeduplaentrada2X2:
g.l.=(nmerodecolunas1)(nmerodelinhas1)=1X1=1
64
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
A
C
A+C
B
D
B+D
A+B
C+D
N
N (AD - CB)2
X2 = _________________________________________
(A+C) (C+D) (A+C) (B+D)
Quandoumatabelatemmaisdeduasentradas:
g.l.=(nmerodecolunas1)(nmerodelinhas1)
X2 = (total de linha) (total de coluna)
(total geral)
Exemplo:Suponhaquequerestudarseosestudantesdecinciassociaisutilizamummtodode
estudo significativamente diferente daquele que utilizado pelos estudantes de tecnologia.
Escolheramsedoisgrupos,umcompostopor50estudantesdecinciassociaiseooutropor50
estudantes de tecnologia. Enviouse um questionrio aos 100 estudantes pedindolhes que
indicassememqualdasseguintescategoriasmelhorseenquadraoseumtododeestudo:estudo
dirioregular,estudoirregularemperodosconcentradosdetrabalhointensivoouumamistura
dosdois.Foramrecebidas44respostasdosestudantesdecinciassociaise42dosestudantesde
tecnologia.Colocouseahipoteseexperimental(H1)dequeotipodeestudodependiadocurso
frequentado
Os resultados so apresentados na forma de uma tabela 2X3, designada por tabela de
contingncia(crosstab).Asclulasquerepresentamcadaumadascategoriassonumeradasde
1a6.
Quadro 12: Tabela de Contingncia (Crosstab)
Tipo de estudo
Regular
Grupo 1
Estudantes de
Cincias
Sociais
Grupo 2
Estudantes de
Tecnologia
Totais dos
padres de
estudo
Irregular
2
6
5
10
16
23
E=24,05
44
24
E=22,95
42
6
8
E=7,81
Total parcial do
nmero
de
estudantes
3
15
E=11,77
E=8,19
4
Misto
E=11,23
23
47
65
Margarida Pocinho e Joo Paulo de Figueiredo
N=86
ESTATSTICAEBIOESTATSTICA
Resoluo49:
InstruesPassoaPasso:
1.calcularasfrequenciaesperadas(E)
Clula1:E=16X44/86=8,19
Clula2:E=23X44/86=11,77
Clula3:E=47X44/86=24,05
Clula4:E=16X42/86=7,81
Clula5:E=23X42/86=11,23
Clula6:E=47X42/86=22,95
2.Aplicarafrmula:
(O-E)2
X2
________________
E
X2 = (6-8,19)2 + (15-11,77)2 + (23-24,05)2 + (10-7,81)2 + (8-11,23)2 + (24-22,95)2
8,19
11,77
24,05
7,81
11,23
22,95
X2 = 0,59 + 0,89 + 0,05 + 0,61 + 0,93 + 0,05 = 3,12
3.Calcularosgrausdeliberdade(gl)
g.l. = (r - 1) (c - 1) = (2 -1) (3 - 1) = 2
4. Consultar a tabela (Anexo I)
Para
p=0,05 e gl=2
x2 critico=5,99
Concluses:DadoqueovalorobservadodeX2apenasde3,12,ouseja,inferioraovalorcrtico
de5,99parap<0,05,oresultadodaexperincianosignificativo.Aceitasehiptesenulade
que os padres de estudo dos estudantes de cincias sociais e de tecnologia no diferem,
rejeitandosedestaformaanossahipoteseexperimental(H1).
66
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
OstestesUdeMannWhitney;Wilcoxon;HdeKruskalWallis;rhodeSpearman;taudeKendall
e Friedman, exigem o recurso a ordenaes de resultados para efectuar os seus clculos. Neste
sentidocomearemosporexplicarosprocedimentosdeordenaoderesultados
Ordenamentoglobalderesultados(designsnorelacionadosparasujeitosdiferentes):
1.
2.
Osresultadosnulosde0socontadoscomooresultadomaisbaixopossvel,sendo
lheatribudaaordemmaisbaixa.
3.
Exemplo:ordenarumgrupoemfunodon.defactoresderisco:
N. de Factores
de risco
6
Ordem
4
12
Se existir um
zero este deve
ser considerado
o valor mais
baixo.
Noscasosemqueexistemresultadosiguaisutilizaseadoslugaresquedeviaocupar.
67
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Exemplo:
N. de FR.
Ordem
6,5
6,5
AssimossujeitoscomumFactorderiscoso3(1+1+1)queocupariamo1.2.3.lugar
Ento3+2+1=6:(1+1+1)=2
Com4factoresderiscotemos2sujeitosqueocupariamo6.e7.lugar
Ento6+7=13:(1+1)=6,5
2.
Diferenasidnticasentreresultadossoordenadasdamesmaformaqueresultados
idnticos,atribuindoseumaordemmdiaresultantedaglobalidadedeordensque
essasdiferenasdeveriamocupar;
3.
Resultadosnulosde0socontadoscomooresultadomaisbaixopossvelquandose
calculamdiferenasentreresultados;
4.
Contudo, quando existe igualdade entre resultados que originem uma diferena
nula entre as situaes experimentais, estes no so ordenados, sendo retirados da
anlise;
5.
Diferenaspositivasenegativassoordenadasemconjuntocomosesetratassede
umordenamentosimplesderesultados,ignorandoossinaispositivosenegativos.
68
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Exemplo: Suponha que quer ordenar as diferenas entre o nmero de frases correctas que
um grupo de crianas com suspeita de perda auditiva produziu antes da colocao de um
aparelhoauditivoeapsacolocaodaquele.
N de frases correctas
antes do aparelho
auditivo
N de frases correctas
depois do aparelho
auditivo
diferenas
ordem
6,5
6,5
10
Ao contrrio do que acontece nos casos das amostras relacionadas quando a diferena entre 2
situaes nula nas amostras relacionas a este tipo de resultado no atribuda nenhuma
ordem, sendo que o resultado nem sequer considerado na anlise. No ordenamento de
resultados negativos em amostras relacionadas ignoramse os sinais quando se ordenam os
resultados.
estudarmos
as
diferenas
entre
dois
grupos
podemos
utilizar
grupos
relacionados/emparelhadosougruposindependentes.Nocasodeduasamostrasindependentes
determinamos se as diferenas nas amostras constituem uma evidncia convincente de uma
diferenanosprocessosdetratamentoaelasaplicados.
Conquanto o uso de duas amostras relacionadas em projectos de pesquisa tenha mritos
indiscutveis, a sua aplicao, em geral, no prtica. Frequentemente, a natureza da varivel
dependente impede a utilizao dos indivduos como seus prprios controlos, tal como ocorre
quandoavariveldependenteosuicidiotentado;umproblemaquepodeacontecerumanica
vez. Pode ser tambm impossvel delinear um projecto que utilize pares de dados, talvez por
69
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
desconhecimento,porpartedoinvestigador,devariveisteisquepossamformarpares,oupela
impossibilidade de obter mensuraes adequadas de alguma varivel de reconhecida
importnciaou,enfim,porquesimplesmentenosedispedeparesadequados.
Quandoautilizaodeduasamostrasrelacionadasnoprticaouadequada,podemosutilizar
duasamostrasindependentes.Emtaisprojectos,asduasamostraspodemserobtidasporumde
doismtodos:
a) Podemserextradasaleatoriamentededuaspopulaes;
b) Podemdecorrerdaatribuioaleatriadedoistratamentosaosmembrosde
umaamostradeorigemarbitrria.
Nota:Emnenhumdestescasosseexigequeasamostrastenhamomesmotamanho.
QuandoUtilizar:
Dadasduasamostras,detamanhosn1en2,possvel,medianteaprovaUdeMannWhitney,
saberseambasasamostraspodemserconsideradasprovenientesdamesmapopulao.
Como j se sabe, a estatstica paramtrica s pode ser usada desde que os dados tenham sido
mensurados, no mnimo, no nvel intervalar. Alm disso, as amostras devem ser aleatrias,
independenteseavarivelobservacionalprecisadeterdistribuionormalnapopulao.
70
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Exemplo:Suponhaquequerinvestigaron.dequeixasdolorosasduranteumtratamentoa
ummesmoproblemateraputico(controladaagravidadeeaextensodaleso)emquese
utilizaram duas tcnicas diferentes. A hipotese experimental supe que durante a
utilizaodatcnicaBqueodoenteseapresentamaisqueixoso.
Quadro 15: Resultados do registo das queixas
Paciente
Ordem (1)
Ordem (2)
1
2
3
4
5
6
TOTAL
MDIA
3
4
2
6
2
5
22
3,67
3
4
1,5
7,5
1,5
5,5
T1=23
9
7
5
10
6
8
45
7,5
11
9
5,5
12
7,5
10
T2=55
RACIONAL
OracionalqueestportrsdotesteUdeMannWhitneybastantesemelhanteaodoteste
deWilcoxon.Adiferenafundamentalentreasduasresidenofactodosegundoseaplicara
designs relacionados e o U se aplicar a designs norelacionados, utilizando, portanto,
sujeitos diferentes. O teste de Wilcoxon analisa as diferenas entre a performance dos
mesmos sujeitos (ou pares de sujeitos emparelhados) submetidos a duas situaes
experimentais. Com um design norelacionado no temos uma base que nos permita
comparardiferenasentreparesderesultados.Assim,otesteUdeMannWhitneyordenaos
resultadosdetodosossujeitosemambasassituaescomosefossemapenasumconjunto
simplesderesultados.
Se as diferenas entre as situaes forem aleatrias, como postulado pela hiptese nula,
entoosresultadosdevemseraproximadamenteosmesmose,consequentemente,asordens
devem ser tambm aproximadamente as mesmas para as duas situaes. Se houver uma
preponderncia de ordens altas ou baixas numa situao ou na outra, ento porque a
diferenanototaldosresultadosordenadosparacadasituaodevidaaosefeitosprevistos
da varivel independente e no ao acaso. Se a soma total das ordens for muito baixa para
uma das situaes, ento ter de haver uma preponderncia de ordens elevadas na outra
situao. Quanto menor for U mais significativas sero as diferenas entre as ordens das duas
situaes.
71
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Seleccioneomaiortotaldasordens.
T2=55
CalculeovalordeUatravsdafrmula
Nx (nx + 1)
__________________
U = n1.n2 +
- Tx
emque:
n1=nmerodesujeitosnogrupo1
n1=6
n2=nmerodesujeitosnogrupo2
n1=6
Tx=maiortotaldeordens
Tx=T2=55
Nx=nmerodesujeitosdogrupocomomaiortotaldeordens
Nx=6
ClculodeU
6x7
U=6x6+
_______________
- 55 = 36+21-55=2
Quando existe o mesmo nmero de sujeitos em cada situao rapidamente se torna mais fcil
verificar qual o maior total de ordens. Normalmente, prefervel ter um nmero idntico de
sujeitosemcadagrupo;noentanto,setiverdeutilizarumnmerodesigualdesujeitosemcada
grupo,poderfazlo.Emcasodedvida,calculeUparaambasasordenstotais,seleccionando
onapropriadoacadacasoe,depois,considereoUmaispequeno.
72
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
73
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Empregamseasprovasestatsticasdeduasamostrasquandooinvestigadordesejadeterminar
sedoistratamentossodiferentesouseumtratamentomelhordoqueooutro.Emcadacaso,
comparase o grupo em que se aplicou o tratamento com outro que no sofreu nenhum
tratamentoouquesofreutratamentodiferente.
Em tais comparaes de dois grupos observamse, por vezes, diferenas significativas que no
soresultantesdotratamentoaplicado.
Umadasmaneirasdesuperaradificuldadedecorrentedaintroduodediferenasextrnsecas
entredoisgruposconsisteemutilizarnapesquisaduasamostrasrelacionadas,isto,relacionar
de alguma forma as duas amostras estudadas. Tal relacionamento pode ser conseguido
utilizandosecadaindivduocomoseuprpriocontroloouentoformandoparesdeindivduos
e, em seguida, associando os dois membros de cada par s duas condies. Quando um
indivduo serve como o seu prprio controlo, ele submetido a ambos os tratamentos em
ocasies diferentes. Quando se utiliza o mtodo do emparelhamento devem procurar
seleccionarse,paracadapar,indivduosquesejamtosemelhantesquantopossvelemrelaoa
quaisquervariveisextrnsecasquepossaminfluenciarosresultadosdapesquisa.
Sempre que possvel, o mtodo de utilizao do indivduo como o seu prprio controlo
(contrabalanando a ordem em que se aplicam os tratamentos ou mtodos) prefervel ao
mtododeemparelhamento.Earazodissoquelimitadaanossacapacidadeparaformaros
paresadequadamente,emconsequnciadonossodesconhecimentodasvariveisrelevantesque
determinam o comportamento. A validade por emparelhamento est na razo directa do
investigador para determinar como formar os pares, e essa capacidade quase sempre muito
limitada. Essa dificuldade contornada quando se utiliza cada indivduo como seu prprio
controlo;nosepodepretenderrelacionamentosmaisprecisosdoqueaprpriaidentidade.
74
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Quandoutilizar:
A prova de McNemar para a significncia de mudanas particularmente aplicvel aos
planeamentosdotipoantesedepois,emquecadaindivduoutilizadocomooseuprprio
controlo e a mensurao se faz ao nvel de uma escala nominal ou ordinal. Pode, assim, ser
usada para testar a eficincia de determinada tcnica (reunies, folhetos, visita, etc.) sobre as
prefernciaseleitoraisarespeitodevrioscandidatos.
Nestescasos,cadapessoapodeservircomooseuprpriocontrolo,utilizandoseamensurao
emescalanominalparaavaliarasalteraesdasituaoapsemrelaosituaoantes.
Exemplo: Suponha que um profissional de sade est interessado em estudar os
comportamentos resultantes da iniciao de obesos prtica do exercicio fisico. Este
profissional observou ao longo dos anos que os obesos utilizam preferencialmente o
elevadorparasedirigiremsuaconsultacujoconsultrioerano1.andar.Colocaahipotese
de que os obesos que tiveram como terapeutica exerccio fsico comeariam a usar
preferencialmenteasescadas.Afimdetestarahipoteseotcnicoobserva25doentesemque
ministrou como exerccio fsico caminhar uma hora por dia cinco vezes por semana.
Decorrido um ms de exercicio ele observa os mesmos 25 doentes e faz a classificao
comportamentos.Osdadossoosseguintes:
Preferncia antes da
teraputica
Escadas
Elevador
Elevador
(A)
14
Escadas
(C)
(B)
(D)
HIPTESE DE NULA:
H0: Para os obesos que modificaram a sua atitude, a probabilidade de mudar o percurso do
elevador para as escadas (PA) igual probabilidade de mudar de mudar das escadas para o
elevador(PD)eambassoiguaisa.Isto,
H0:PA=PD=1/2
H1:PA>PD
75
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
PROVA ESTATSTICA:
Utilizase a prova de McNemar para significncia de mudanas, porque o estudo utiliza duas
amostras relacionadas, do tipo antesedepois e utiliza a escala de medida nominal
(classificativa).
Nveldesignificncia:
p=0,05
N=25
Distribuioamostral:
AdistribuioQuiquadradocom1graudeliberdadedumaboaaproximaodadistribuio
amostraldeQuiquadrado,talcomocalculadapelafrmula.
RegiodeRejeio:
ComoH1especificaosentidodadiferenaprevista,aregioderejeiounilateral.Consistede
todos os valores de Quiquadrado que so to grandes que acusem uma probabilidade
unilateral,associadasuaocorrnciasobH0nosuperiora0,05.
Deciso:
Estamosinteressadosnosobesoscujocomportamentoacusaalterao:representadosnasclulas
AeD.
Paraosdados,temos:
(A-D - 1)2
X2 =
_________________________
A+D
(4-3 - 1)2
=
__________________
(1 - 1)2
=
4+3
___________________
0
=
__________
=0
Sendo0valorobservadodex2=0,devemosconsultaratabela(AnexoI)paraobterovalorcritico,
no esquecendo que temos uma amostra unicaudal a um nivel de 0,05. consultando a tabela
observamosumx2criticode5,41.
Racional
Paracompararasignificnciadequalquermudanaobservada,porestemtodo,constriseuma
tabela de frequncias de 4 casas para representar o 1 e o 2 conjunto de reaces dos mesmos
76
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
ANTES
DEPOIS
+
-
A
C
+
B
D
Notesequeoscasosqueacusammodificaesentrea1ea2reacoaparecemnasclulasAe
D.UmindivduolocalizadonaclulaAsepassoude+paraenaclulaDsepassoude
para+.Naausnciademodificao,oindivduoclassificadonaclulaB(reaco+antes
edepois)ounaclulaC(reacoantesedepois).
Como A e D representa o nmero total de indivduos que acusam modificao, a perspectiva,
sobahiptesedenulidade,seriaque(A+D)acusassemmodificaesnumsentidoe(A+D)
acusassemmodificaesnoutrosentido.Ouseja,(A+D)afrequnciaesperada,sobH0,tanto
naclulaAcomonaclulaD.
NaprovadeMcNemardesignificnciademudana,estamosinteressadosapenasnasclulasA
e D. Portanto, A=nmero de casos observados na clula A, D=nmero de casos observados na
clulaDe(A+D)=nmeroesperadodecasostantonasclulasAcomoD,ento
(A-D)2
X2
_____________
A+D
comgrausdeliberdade=1
77
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Aaproximao,peladistribuiodoQuiquadrado,dadistribuioamostraldafrmulatornase
excelenteseseintroduzirumacorrecodecontinuidade.Talcorreconecessria,porquese
utilizou um distribuio contnua (Quiquadrado) para aproximar uma distribuio discreta.
Quando todas as frequncias esperadas so pequenas, tal aproximao pode ser fraca. A
correcodecontinuidade(Yates,1934)constituiumatentativaderemoodessafontedeerro.
Comacorrecodecontinuidade,temse:
(A-D - 1)2
X2 = ________________________________
A+D
Estaexpressoindicaquesedevesubtrair1dovalorabsolutodadiferenaentreAeDantesde
elevaraoquadrado.OgraudesignificnciadequalquervalorobservadodeQuiquadrado,tal
comocalculadoatravsdafrmula,determinadomedianterefernciaaumaTabela(AnexoI).
SeovalorobservadodeQuiquadradoiguala,oumaiordoque,ovalorexibidonaTabelapara
determinadonveldesignificnciacomgl=1,aimplicaoqueexisteefeitosignificativonas
reacesantesedepois.
E=1/2 (A+D)
Se as frequncias esperadas so inferiores a 5, empregar a prova binomial em substituio
provadeMcNemar.
Seasfrequnciasesperadasnosoinferioresa5,calcularovalordeX2atravsdafrmula
(A-D - 1)2
X2 =
_______________________
A+D
Mediante referncia Tabela (Anexo I), determinar a probabilidade, sob H0, associado a um
valortograndequantoovalorobservadodeX2.Sesetratadeumaprovaunilateral,dividirpor
78
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
2 o valor da probabilidade exibido na Tabela. Se o valor de p, dado pela Tabela para o valor
observadodeX2comgl=1,nosuperap,rejeitaseH0emfavordeH1.
Situao A
Situao B
sujeitos
(com aparelho)
(sem aparelho)
d (A-B)
1
2
3
4
5
6
7
8
9
10
TOTAL
MDIA
3
4
3
1
5
2
3
4
1
3
29
2,9
5
5
2
5
4
5
5
4
5
5
45
4,5
-2
-1
+1
-4
+1
-3
-2
0
-4
-2
Ordem de d
5(-)
2(-)
2(+)
8,5(-)
2(+)
7(-)
5(-)
8,5(-)
5(-)
79
Margarida Pocinho e Joo Paulo de Figueiredo
Ordem das
Ordem das
diferenas
diferenas
positivas
negativas
5
2
2
8,5
2
7
5
8,5
5
41
ESTATSTICAEBIOESTATSTICA
RACIONAL
OobjectivodotestedossinaisdeWilcoxoncompararasperformancesdecadasujeito(oupares
de sujeitos) no sentido de verificar se existem diferenas significativas entre os seus resultados
nasduassituaes.OsresultadosdaSituaoBsosubtradosdosdaSituaoAediferena
resultante (d) atribudo o sinal mais (+) ou, caso seja negativa, o sinal menos (). Estas
diferenassoordenadasemfunodasuagrandeza(independentementedosinalpositivoou
negativo).Oordenamentoassimobtidodepoisapresentadoseparadamenteparaosresultados
positivos e negativos. O menor dos valores deste segundo, dlhe o valor de uma estatstica
designadaporW,quepodeserconsultadanaTabeladesignificnciaapropriada.
Aideiaqueseexistiremapenasdiferenasaleatrias,talcomopostuladopelahiptesenula,
ento haver aproximadamente o mesmo nmero de ordens elevadas e de ordens inferiores
tantoparaasdiferenaspositivascomonegativas.Seseverificarumaprepondernciadebaixos
resultados para um dos lados, isso significa a existncia de muitos resultados elevados para o
outrolado,indicandoumadiferenaemfavordeumadassituaes,superiorquiloqueseriade
esperarseosresultadossedevessemaoacaso.DadoqueaestatsticaWreflecteomenortotalde
ordens, quanto menor for o W mais significativas sero as diferenas nas ordenaes entre as
duassituaes.
Calculeadiferenadentrecadaparderesultados,atribuindoosinalmaisoumenos.
Vejaacolunad(AB)
2.
3.
Emseparado,juntetambmaordenaocorrespondenteaossinaisdiferentes(+ou).
Vejaostotaisparaordenamentosdediferenaspositivasedediferenasnegativasnas
respectivascolunas
80
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
4.
ConsidereomenordostotaisdasordenscomoW.
ValorobservadodeW=4,umavezqueototaldasordensparaasdiferenaspositivas
omenor
5.
ConteonmerodeparesdesujeitosN(noconsidereasigualdades).
N=101=9
81
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
ESTATSTICAEBIOESTATSTICA
Quando n > 5 por grupo de respondentes, a significncia de H pode ser determinada por
recorrncia Tabela do Quiquadrado (Anexo I). Para testar diferenas entre amostras de
tamanhoinferiora6,deverecorreratabelasespeciais(AnexoIV).
QUANDO UTILIZAR
EstetestepodeserconsideradoumaextensodotesteUdeMannWhitneyquandonecessitamos
de utilizar trs ou mais situaes. Deve ser utilizado em designs norelacionados quando
sujeitosdiferentessodistribudosportrsoumaissituaes.
Exemplo:Suponhaqueestamosinteressadosemdescobrirseexistemdiferenasnoacessoa
uma pgina da internet em funo da caracteristica: muito ilustrada, com algumas
ilustraes e, sem ilustraes. Alocmos trs pginas na internet com o mesmo assunto e
titulo durante 4 meses. A seguir verificmos o nmero de vezes que formam acedidas
durantequatrosbadosseguidos.Osresultadosforam.
Quadro 19: Nmero de ideias relembradas para trs tipos de testes
Sujeitos do
grupo 1
(pgina muito
ilustrada)
Sabado
Sabado
Sabado
Sabado
TOTAL
MDIA
1
2
3
4
Resul
19
21
17
16
73
18,25
Ordem
10
11
9
8
38
Sujeitos do
grupo 2
(pgina com
algumas
ilustraes)
Resul
14
15
9
Ordem
6
7
1
38
12,67
14
Sujeitos do
grupo 3
(Pgina sem
ilustraes)
Result.
12
12
13
10
47
11,75
Ordem
3,5
3,5
5
2
14
RACIONAL
Este teste pretende determinar se os resultados so significativamente diferentes para trs ou
mais grupos. Uma vez que todos os resultados foram, em principio, obtidos por sujeitos
diferentes a nica forma de verificarmos as diferenas entre as situaes ordenlas em
conjunto, como se se tratassem apenas de um conjunto de resultados, tal como havamos
efectuado no teste U de MannWhitney. Isto acontece porque, no temos uma base para
compararresultadosdosmesmossujeitosoudesujeitosemparelhadosemdiferentessituaes,
comocomotesteUdeMannWhitneyparadesignsrelacionados.
Este ordenamento global, quando posteriormente adicionamos as ordens de cada coluna em
separado,permitenosobterototaldasordensparacadasituao.Seexistiremapenasdiferenas
aleatriasentreassituaes,comopostuladonahiptesenula,deesperarqueordensaltase
83
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
baixassedistribuamdeformaaproximadamenteequivalentepelasdiferentessituaes.Mas,se
pelocontrrio,houverumaprepondernciadealtosoubaixosresultadosemqualquerumadas
situaes, provvel que tal facto reflicta diferenas significativas devidas varivel
independente.
OvalordasdiferenasentreostotaisdasordensdadopelaestatsticadesignadaporH.Desde
queahipteseexperimentalprevejaaexistnciadediferenassignificativasentreassituaes,o
valor que obtivermos de H dever ser igual ou superior ao valor crtico da Tabela, para que
possaserconsideradosignificativo.
T 2
12
c
= ________________ __________ - 3 (N + 1)
N (N + 1)
n
c
em que:
N=nmerototaldesujeitos
N=11
nc=nmerodesujeitosemcadagrupo
n1=4;n2=3;n3=4
Tc=totaldeordensparacadasituao,ouseja,
ostotaisdasordensparacadacoluna
T1=38;T2=14;T3=14
Tc2=totaldasordensparacadasituao,cadaumelevadoaoquadrado
T12=382;T22=142;T32=142
84
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Tc2= somadosquadradosdostotaisdasordensparacadasituaodividido
n c
pelonmerodesujeitosdessasituao:
12
T 2
c
= ____________ ______ - 3 (N + 1)
N (N + 1)
n
c
12
- 3 (11 + 1)
11 (11 + 1)
12
- 3 x 12
132
ESTATSTICAEBIOESTATSTICA
valorqueobtivemosH=7,26superioraovalorcrticode5,99parap<=0,05,peloquepodemos
aceitar que o resultado significativo a este nvel. Dar conta que esta probabilidade menos
significativa de que quando utilizamos a Tabela anterior. Isso acontece porque essa Tabela
especialmenteconcebidaparanosdarasprobabilidadescomumpequenonmerodesujeitose
desituaes.
Notar tambm que o teste de KruskalWallis apenas lhe pode dizer que existem diferenas
globais nos resultados entre as situaes experimentais. Na tabela apresentada parece existir
uma tendncia para consultar pginas com mais ilustraes do que sem ilustraes. Mas para
podertestarseessatendnciarealmenteexiste,terdeutilizarumtestedetendncia.
86
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Soestatsticasparacomprovarasignificnciadediferenasentretrsoumaisgrupos,ouseja,
paracompararahiptesedenulidadedequeK(3oumais)amostrastenhamsidoextradasda
mesmapopulaooudepopulaesidnticas.
As circunstncias exigem, por vezes, o recurso a um experimento que nos permita estudar
simultaneamente mais de duas amostras ou condies. Quando se trata de comparar trs ou
maisamostrasoucondiesdeumexperimento,necessrioaplicarumaprovaestatsticaque
indique se h alguma diferena global entre as K amostras ou condies, antes que possamos
cogitardecomprovarasignificnciadadiferenaentreduasamostrasquaisquer.
Squandoumaprovaglobal(provadeKamostras)nosautorizaarejeitarahiptesenulaque
podemosempregarumprocessoparadeterminardiferenassignificativasentreduasquaisquer
dasKamostras.
Estas provas noparamtricas tm a vantagem de permitir o estudo da significncia de dados
que,inerentemente,seapresentamapenassobaformaclassificativaouempostos.
HdoisplanosbsicosparacompararKgrupos:
1.
Noprimeirodeles,asKamostrasdeigualtamanhosopostasemcorrespondncia
de acordo com determinado(s) critrio(s) que podem afectar os valores das
observaes.Nalgunscasos,essacorrespondnciaobtmsecomparandoosmesmos
indivduosoucasossobtodasasKcondiesouentocadaumdosNgrupospode
ser mensurado sob todas as K condies. Em tais planos, devem usarse provas
estatsticasparaKamostrasrelacionadas;
2.
87
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Quandoutilizar:
A prova de McNemar para duas amostras pode ser estendida para aplicao a pesquisas que
envolvem mais de duas amostras. Essa extenso, que constitui a prova Q de Cochran para K
amostras relacionadas, proporciona um mtodo para comparar se trs ou mais conjuntos
correspondentes de frequncias ou propores diferem entre si significativamente. A
correspondncia pode basearse em caractersticas relevantes dos diferentes indivduos ou no
facto de os mesmos indivduos serem observados sob condies diferentes. A prova Q de
Cochranadaptaseespecialmenteaocasoemqueosdadosseapresentamnumaescalanominal
ousobaformadeinformaoordinaldicotomizada.
Exemplo: Suponha que estamos interessados em saber se a atitude de um entrevistador
influencia a aceitao de participao num estudo por inqurito. Poderemos treinar o
entrevistadorparaefectuarassuasentrevistasdetrsmaneirasdiferentes:
1.
Demonstrandointeresse,cordialidade,entusiasmo;
2.
Demonstrandoformalismo,reservaecortesia;
3.
Demonstrandomodoabrupto,formalismoeaspereza.
88
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Conjunto
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Resposta
Resposta
Resposta
entrevista 1
entrevista 2
entrevista 3
1
2
1
1
2
2
2
1
2
1
2
2
2
2
2
2
2
2
1
2
2
1
1
2
2
2
1
1
2
2
2
2
2
2
2
2
1
1
1
1
1
1
1
1
1
1
2
2
1
1
1
2
1
1
RespostasSim(1)eNo(2)dadaspordonasdecasaatrstiposdeentrevistas
HIPTESE NULA:
AprobabilidadedeumSimamesmaparaostrsgruposdeentrevistas.
H1:AsprobabilidadesdeumSimdiferemconformeotipodeentrevista.
PROVA ESTATSTICA:
Escolhese a prova Q de Cochran, porque os dados se referem a mais de dois grupos
relacionados(K=3)eapresentamsedicotomizadossobaformaSimeNo.
NVEL DE SIGNIFICNCIA:
p=0,01
N=18
89
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
DISTRIBUIO AMOSTRAL:
Sobahiptesedenulidade,QtemumadistribuioaproximadamenteQuiquadradocomgl=1.
Isto,aprobabilidadeassociadaocorrncia,sobHo,dequalquervalortograndequantoum
valorobservadodeQpodeserdeterminadamedianterefernciaTabela.
REGIO DE REJEIO:
Consiste em todos os valores de Q to grandes quanto a probabilidade associada sua
ocorrncia,sobHo,nosejasuperiorap=0,01.
DECISO:
RecodificmosSimpor1eNopor0.
Quadro 21: Q de Cochran
Conjunto
Resposta
entrevista
1
Resposta
entrevista
2
Resposta
entrevista
3
Li
Li2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
0
1
0
0
1
1
1
0
1
0
1
1
1
1
1
1
1
1
0
1
1
0
0
1
1
1
0
0
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
1
0
0
0
2
1
0
1
2
2
1
1
0
3
3
2
2
2
3
2
2
0
4
1
0
1
4
4
1
1
0
9
9
4
4
4
9
4
4
G1=13
G2=13
G3=3
Total
Li=nmerototalderespostasSimparacadalinha
K=nmerodecolunas
N=nmerodelinhas
90
Margarida Pocinho e Joo Paulo de Figueiredo
Li=29 Li263
ESTATSTICAEBIOESTATSTICA
Substituindoestesvaloresnafrmula,vem:
(K-1)
Q=
[K Gj
( Gj)2
(3-1)
_____________________________________________
[ 3X (13
K Li - Li2
]
= 16,7
3X29 - 63
Emque
K=n.degrupos
Gj=n.totaldesucessos
______________________________________________________
ATabela(AnexoI)indicaqueQ16,7temumaprobabilidadedeocorrncia,sobHo,p<0,001,
quandogl=K1=31=2.Essaprobabilidadeinferioraonveldesignificnciadep=0,01.Ovalor
deQestnaregioderejeioe,consequentemente,anossadecisorejeitarHoemfavorde
H1,concluindoqueonmeroderespostasSimdiferesignificativamenteemrelaoaostipos
1,2e3deentrevista.
RACIONAL
Se os dados de uma pesquisa se dispem numa tabela de dupla entrada com N linhas e K
colunas,possveltestarahiptesedenulidadedequeaproporooufrequnciaderespostas
dedeterminadotiposejaamesmaemcadacoluna,exceptuandoasdiferenasdevidasaoacaso.
Cochran mostrou que se a hiptese de nulidade verdadeira, isto , se no h diferena na
probabilidade, digamos de Sucesso sob cada condio (o que equivale a dizer que os
Sucessos ou Fracassos se distribuem aleatoriamente pelas linhas e colunas da tabela de
duplaentrada),ento,seonmerodelinhasmuitopequeno
K(K-1)
Q=
(Gj - G)2
__________________________________________
K Li - Li2
temdistribuioaproximadamenteQuiquadradocomgl=K1,emque:
Gj=nmerototaldeSucessosnacolunaj
__
G=mdiadosGj
Li=nmerototaldesucessosnalinhai
91
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Umaexpressoequivalentefrmulaanterior,efacilmentededutveldela,masquesimplificaos
clculos:
(K-1)
Q=
[K Gj ( Gj) ]
2
__________________________________________________
K Li - Li2
DisporosdadosnumatabelaK.N,comKcolunaseNlinhas(N=nmerodecondiesemcada
umdosgrupos).
DeterminarovalordeQ,aplicandoafrmula.
AsignificnciadovalorobservadodeQpodeserdeterminadomedianteaobservaodoAnexo
I, pois Q recorre distribuio do Quiquadrado com gl=K1. Se a probabilidade associada
ocorrncia, sob H0, de um valor to grande quanto um valor observado de Q no supere p,
rejeitaseH0.
Quandoutilizar:
EstetestepodeserconsideradoumaextensodotestedeWilcoxon,quandonecessrioutilizar
trsoumaissituaesexperimentais.Deveserutilizadoparaumdesignrelacionadoquandoos
mesmos sujeitos (ou sujeitos emparelhados) so distribudos por trs ou mais situaes
experimentais.
92
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Exemplo:Suponhaqueumeditordelivrosdeestatisticaproduziuumasriedelivrosequer
escolher de entre trs tipos de ilustraes aquele que mais eficaz para os estudantes.
pedido a oito universitrios que classifiquem as obras numa escala de cinco pontos, desde
nadaboaatmuitoboa.Obtiveramseosresultadosapresentadosnatabelaseguinte.
Ordem
1
2
2
1
1
1
5
5
3
3
4
3
2
2
2,5
2,5
2,5
2,5
TOTAL
MDIA
18
11
34
21
28
16
Sujeitos
2,25
4,25
3,50
RACIONAL
Uma vez que se trata de um design relacionado no qual o mesmo sujeito obtm resultados em
todas as situaes, permitido comparar os resultados de cada sujeito atravs de todas as
situaes,nosentidodeverificarmosemquesituaoobtmmaioresemenoresresultados.
Uma vez que existem mais do que duas situaes, no possvel calcular as diferenas nos
resultados de duas situaes, como era o caso do teste de Wilcoxon. Pelo contrrio, o
ordenamentodosresultadosdecadasujeitoparaastrscondiesserfeitahorizontalmenteao
longo das linhas, tal como mostra a tabela. Por exemplo, aos resultados do sujeito 1,
respectivamente2naSituao1,5naSituao2e4naSituao3,soatribudastrsordens,do
menorresultadoparaomaior:Ordem1paraaSituao1,Ordem2paraaSituao3eOrdem3
paraaSituao2;esteprocedimentosemelhanteparatodosossujeitos.Claroqueseexistissem
quatrosituaesexperimentais,osresultadosdecadasujeitoseriamordenadosde1a4.
Oprximopassocalcularostotaisdeordensparacadasituao.Seexistiremapenasdiferenas
aleatrias entre os resultados de todas as situaes, como postulado pela hiptese nula, de
esperarqueestestotaissejamaproximadamenteiguaispartindodoprincpiodequesurgiriam
algumasordensbaixas(baixosresultados)ealgumasordensaltas(altosresultados).Contudo,se
assituaesforemsignificativamentediferentes,deesperarqueseobtenhamtotaisdasordens
93
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
CalculeovalordeXR2apartirdafrmula
12
- 3N (C + 1)
NC (C + 1)
emque
C=nmerodesituaes
C=3
N=nmerodesujeitos
N=8
T1=11;T2=21;T3=16
Tc=totaldeordensparacadasituao
Tc2=quadradodototaldeordensparacadasituao
T12=112;T22=212;T32=162
Tc2=somadosquadradosdostotaisdasordensparacadasituao:112+212+162
ClculodeXR2
12
XR2 = _____________________ (112 + 212 + 162) - 3 x 8 (3 + 1)
(8 x 3) (3 + 1)
12
XR2 =
_____________________
24 x 4
12
XR2 =
_________________
x 818 - 96
96
XR2 = 6,25
94
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Calculeosgrausdeliberdade,ouseja,onmerodesituaesmenosuma.
(gl=C1=31=2)
95
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Apartirdaanliseestatsticadaexperinciapodeconcluirqueascrianasmostrampreferncias
significativamentediferentespelostrstiposdeilustraes.Emfunodasmdiasapresentadas
natabela,sabemosquepreferemaIlustraoB,querecolheuasordensmaiselevadas,seguindo
seaIlustraoCe,porltimo,aIlustraoA.Contudo,otestedeFriedmanpodeapenasindicar
que existem diferenas globais entre as situaes. Para verificar se existe uma tendncia para
uma determinada ordem de preferncia das Ilustraes, necessita de utilizar um teste de
tendncia.
96
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Frequentemente,oinvestigadorquersabersedoisconjuntosdescoresestorelacionadosequal
ograudesserelacionamento.
Apresentamsemedidasnoparamtricasdecorrelaoedeprovasestatsticasparadeterminar
a probabilidade associada ocorrncia de uma correlao to grande quanto a observada na
amostra,sobahiptesedenulidadedequeasvariveissejamnorelacionadasnapopulao.
Mas de muito maior interesse podermos afirmar se determinada associao observada numa
amostradescoresindica,ouno,aprobabilidadedeassociaoentreasvariveisnapopulao
da qual se extraiu a amostra. O coeficiente de correlao, por si s, representa o grau de
associao.Asprovasdesignificnciasobreaquelecoeficientedeterminam,aumcertonvelde
probabilidade, se existe a associao na populao da qual se extraiu a amostra que serviu de
baseparaoclculodocoeficiente.
Testenoparamtrico(semelhanteaumadistribuiolivre),isto,nocolocarestries
quantoformadadistribuio;
Escalademedidanomnimoordinal.
97
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Podeacontecerqueoscaracteresestudadosnosejammensurveis,maspodemserordenados
ou classificados. Por exemplo, se se considera um grupo de candidatos a um certo lugar, eles
podemserexaminadossegundodoispontosdevista:conhecimentosepersonalidade.Estasduas
qualidades no podem ser medidas, mas possvel para cada uma delas efectuar uma
classificao dos candidatos. Podemos, assim, examinar se existe correlao entre estes dois
caracteres; cada par de dados (xi, yi) formado pelas ordens ocupadas por um candidato nas
duasclassificaes.
Formulrio:
6(di2)
=1-
________________
N(N2-1)
Emque:
di=diferenaentreasposiesnasduasvariveis,isto,di=xiyi
Para tal, temos que dar valores s posies: pontuao mais baixa damos o valor 1 e
assimsucessivamente.
Seasduasclassificaessoiguais,disemprezeroeentor=1eacorrelaoperfeita.Seas
ordensmaisaltasdeumaclasseestoassociadassmaisbaixasdaoutrartornasenegativoese
asduasclassificaessoinversas=1.
Ento,
-1 1
INTERPRETAO
O coeficiente de correlao obtido pode ser interpretado, tal como o coeficiente de correlao
momentoprodutodeBrawaisPearson(verestecoeficienteemtestesparamtricos).
98
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Exemplo:Calcule,sabendoque:
xi
yi
18
24
17
27
14
17
13
22
13
19
12
20
11
14
9
11
7
3
5
6
xi
posio
yi
posio
d2
18
24
-1
17
27
14
17
-3
13
4,5
22
1,5
2,25
13
4,5
19
-0,5
0,25
12
20
11
14
11
10
-1
10
=19,5
6x19,5
=1__________________=0,88
10(1021)
Quandoutilizar:
O coeficiente de concordncia de Kendall uma medida da relao entre vrios conjuntos de
postosdeNobjectosouindivduos.
Quando temos K conjuntos de postos, podemos determinar a associao entre eles
utilizandoocoeficientedeconcordnciadeKendall(W).
99
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
RACIONAL E EXEMPLO
Como soluo do problema da determinao da concordncia global entre K conjuntos de postos,
poderia parecer razovel determinar os rs entre todos os pares possveis de postos e ento calcular a
mdia desses coeficientes para determinar a associao global. Adoptando este procedimento, o
processotornaseimpraticvel,umavezquetemosdecalcularinmeroscoeficientesdecorrelaode
postos.
Assim,oclculodeWmuitomaissimpleseWtemumarelaolinearcomovalormdioders
relativo a todos os grupos. Denotando rsav o valor mdio dos coeficientes de correlao por
postosdeSpearman,Kendalmostrouque
KW1
rsav=__________
K1
Candidato
Chefe
X
Y
Z
Rj
a
1
1
6
8
b
6
5
3
14
c
3
6
2
11
d
2
4
5
11
e
5
2
4
11
f
4
3
1
8
ESTATSTICAEBIOESTATSTICA
Defacto,nocasodaconcordnciaperfeitaentreos3chefes,asvriassomasdepostos,Rj,seriam
3,6,9,12,15,18, muito embora no necessariamente nesta ordem. Em geral, quando h
concordnciaperfeitaentreKconjuntosdepostos,obtemos,paravaloressignificativosdeRj,a
sequnciaK,2K,3K,...,NK.
Poroutrolado,senotivessehavidoconcordnciaentreos3chefes,entoosdiversosRjseriam
aproximadamenteiguais.
Desteexemplo,vemosqueograudeconcordnciaentreosKjulgamentosreflectidopelograu
devarinciaentreasNsomasdepostos.W,coeficientedeconcordncia,funodessegraude
varincia.
Assim:
S
W=____________________
1/12 K2 (N3 N)
emque:
S=soma dos quadrados dos desvios observados a contar da mdia dos Rj, isto , S= (Rj
Rj/N)2;
K=nmerodeconjuntosdepostos;
N=nmerodeentidades(objectosouindivduosaqueseatribuempostos);
1/12K2(N3N)=valormximopossveldasomadosquadradosdosdesvios,isto,ovalordeS
queocorrerianocasodeconcordnciaperfeitaentreosKconjuntosdepostos.
101
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Ento,
=(8+14+11+11+11+8)/6=10,5
S=(810,5)2+(1410,5)2+(1110,5)2+(1110,5)2+(1110,5)2+(810,5)2=
6,25+12,25+0,25+0,25+0,25+6,25=25,5
Peloque
S
25,5
25,5
W=__________________________=_____________________________=_____________________=
1/12 K2 (N3 N)
1/12 x 32 (63 6)
1/12 x 9 x 210
25,5
=_______=0,16
157,5
W=0,16 exprime o grau de concordncia entre os 3 colegas fictcios ao atriburem postos aos 6
candidatosaemprego.
desalientarquearazoporqueWnopodetomarvaloresnegativosque,quandoesto
em jogo mais de dois conjuntos de postos, esses conjuntos no podem ser completamente
discordantes.Porexemplo,seXeYdiscordam,eseXtambmdiscordadeZ,entoYeZ
certamente concordaro. Isto , quando esto em jogo mais de 3 juzes, concordncia e
discordncianosoopostossimtricos.Kjuzespodemtodosconcordar,masimpossvel
todoselesdiscordaremcompletamente.Portanto,Wdeveserzeroouumnmeropositivo.
T=
_________________________
12
Emquet=nmerodeobservaesnumgrupoempatadosemrelaoaumdadoposto
102
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Ento,afrmulaser:
S
______________________________________
W=
1/12 K2 (N3 N) - T
S
W=_________________________________
1/12 K2 (N3 N) - T
Emcasocontrrio,usar
S
W=
_______________________________
1/12 K2 (N3 N)
Omtodoparadeterminarseovalorobservadosignificativamentediferentedezerodepende
dotamanhodeN:
SeN7aTabela(AnexoVI)dosvalorescrticosdeSassociadoscomosWs
significativosaosnveisde0,05ede0,01;
Se N>7 podemos usar X2 = K (N 1)W para calcular um valor de X2 cuja
significncia, para g.l.=N1, possa ser comparada recorrendo Tabela do X2
(AnexoI).
103
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
UtilizandoseaTabelaestadovalordeSparaWssignificativosaosnveisde0,05ede0,01.
Esta Tabela aplicvel para K de 3 a 20 e N de 3 a 7. Se um valor observado de S igual ou
superior ao valor exibido na Tabela para um dado nvel de significncia, ento H0 pode ser
rejeitadaquelenvel.
Por exemplo, vimos que quando K=3 chefes depessoalfictciosclassificaramN=6candidatosa
emprego,aconcordnciadosjulgamentosfoiW=0,16.ATabelaindicaqueoSassociadoquele
valordeW(25,5)nosignificativo,umavezqueScrtico(103,9)maiordoqueSobservado
(25,5).
QuandoN>7,adistribuioaproximadamenteumadistribuiodeQuiquadradocomg.l.=N
1,vindo:
S
2
_______________________
X =
1/12 KN (N + 1)
Noteseque:
_____________________________
= K (N 1) W
1/12 KN (N + 1)
E, portanto, X2 = K (N 1) W, pelo que se pode usar esta frmula que mais fcil para
determinaraprobabilidadeassociadaocorrncia,sobH0,dequalquervalortograndequanto
oWobservado.
SeovalordeX2observadoigualaousuperaovalordaTabela(AnexoI)paraumdadonvelde
significnciaeumparticularvalordeg.l.=N1,entoHo(nohrelaoentreosKconjuntosde
postos)podeserrejeitadaquelenvel.
104
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
INTERPRETAO DE W
Um valor elevado ou significativo de W pode ser interpretado como indicando que os
observadoresoujuizesestoaplicandoessencialmenteosmesmospadresaoatriburempostos
aos N indivduos em estudo. Frequentemente a sua ordenao conjunta pode servir como
padro,especialmentequandonohcritriosexternosrelevantesparaordenarosindivduos.
KendallsugerequeamelhorestimativadaverdadeiraclassificaodeNobjectos,quandoW
significativo,sejadadapelaordemdasvriassomasdepostos,Rj.Seseaceitaocritriosegundo
o qual diversos juizes concordarem na atribuio de postos a N indivduos, ento a melhor
estimativa da verdadeira ordenao desses indivduos segundo aquele critrio dada pela
ordemdasomadospostos.Assim,anossamelhorestimativaseriadadaaocandidatoaouf,pois
emambososcasosRj=0,omenorvalorobservado.
105
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
10.1 CORRELAO
Quando estudamos um grupo relativamente a dois caracteres vemos, como j dissemos, que
podeexistirumarelaoentreeles.
Se medirmos os raios de vrias circunferncias e tambm os seus permetros verificamos que
existe uma relao entre eles que constante; neste caso temos dependncia funcional. Isto
querdizerqueexisteumafrmulaexprimindoamedidadosegundoemfunodadoprimeiro:
P=2r.
Suponhamos agora que registamos, durante todos os dias de um certo perodo de tempo, a
alturamximadamarnoportodaFigueiradaFozeonmerodepassageirosdalinhaPorto
Lisboa.Vsebemqueentreasduasestatsticasassimobtidasnoseencontranenhumarelao.
Diremosqueosdoiscaracteressoindependentes.
Masentreestesdoiscasosextremos,adependnciafuncionaleaindependncia,avidacorrente
ofereceumgrandenmerodeexemplosondeexisteumarelaoentreoscaracteres,masemque
existe uma impossibilidade de a formular por uma lei: o caso da dependncia estatstica.
Existeumadependnciaestatsticaentreaspessoasquemorremcomfebretifideeaspessoas
vacinadascontraestadoena.
Desdequeosdoiscaracteressejamtaisqueassuasvariaessejamsemprenomesmosentido,
ou em sentidos contrrios, pressentimos que os caracteres estejam ligados entre si: dizemos,
ento,queelesestocorrelacionadosouqueexisteumacorrelaoentreeles.
EstesmtodosdecorrelaoforamcriadosporSirFrancisGalton,quetrabalhoujuntamentecom
Pearson,nosfinsdosculoXIX.
106
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
A correlao e a regresso so dois aspectos que andam sempre muito ligados, pertencendo
EstatsticaDescritiva.Assim,importafazermosadistinoentreeles:
A correlao pode ser definida como o grau de semelhana no sentido das variaes
entreosvalorescorrespondentesdosdoiscaracteres,isto,acorrelaopreocupasecom
adescriodarelaoentrevariveis.
REPRESENTAO GRFICA
representaogrficadacorrelaochamamosdiagramadedispersodepontosouscatterplot
ouscattergrame,genericamente,tomaaseguinteforma:
80
70
60
50
40
40
50
60
70
80
107
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Suponhamosquetemosduassriesestatsticasformadaspelosvaloresxieyidedoiscaracteres.
Podemos fazer uma representao grfica dos dados representando todos os pontos (xi, yi) e
obtendoanuvemdepontos.
Segundoosdados,anuvemdepontospodeapresentardiversosaspectos.
Porexemploospontospodemdistribuirsenasemelhanadeumalinharectaoudeumacurva:
istosugereaexistnciadeumarelaofuncionalentreXeY.
Os pontos podem ser dispersos e colocados ao acaso no plano: caso das mars no porto da
FigueiradaFozeonmerodepassageirosnalinhaPortoLisboa(independncia).Tambmpode
acontecerqueospontoscubramumaporodoplanodaqualsepodedefinirocontorno;esta
formasugerequeasduasvariveisestoligadas.Limitemonosaocasomaissimplesemquea
nuvemtemumaformaalongadalembrandoumaelipseesuponhamosqueasuaorientaotal
que desde que X cresa, a varivel Y tambm cresce. A forma desta nuvem sugere a
possibilidadedaexistnciadeumarectatalqueosvaloresestimadosporestarecta,apartirdos
valoresdexi,sejamboasaproximaesdosvaloresdeyi.Nspodemosdeterminarpelomtodo
dosmnimosquadradosumarectatalqueasomadosquadradosdosdesviossejamnima.Esta
rectachamadarectaderegressodeYemXourectadeestimaodeYemX.
Mas,poderamos,deummodosemelhante,procurarumarectatalqueosvaloresdexestimados
aolongodestarecta,apartirdeyi,constituamigualmenteboasaproximaesdexi.Estarecta
chamadarectaderegressodeXemYourectadeestimaodeXemY.
Normalmente, estas rectas so distintas uma da outra. Elas sero confundidas quando existe
ligao funcional linear e so perpendiculares quando h independncia. Compreendemos,
assim, que a correlao entre os caracteres tanto maior quanto maior as rectas de regresso
estejammaisprximasumadaoutra.
108
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Asduasvariveissocontnuas;
2.
Adistribuioseaproximadadistribuionormal;
3.
prefervelparadistribuiesunimodais;
4.
Escalaintervalardemedida.
Formulrio
r=
(XY) - X Y
N.
sx sy
Ento:
-1 r 1
Interpretao:
Ocoeficientedecorrelaoobtidopodeseinterpretadocombaseem:
Para Cardoso:
r0,2
Correlaomuitobaixa(valoresdesprezveis)
0,2<r0,5
Correlaobaixa
0,5<r0,7
Valoressignificativos
0,7<r0,9
Altacorrelao
0,9<r1
Muitoaltacorrelao
Para Borg:
0,20<r0,35
0,35<r0,65 Correlaoestatisticamentesignificativaparaalmdonvelde1%
0,65<r0,85 Correlaesquetornampossveisprediesdogrupodequesodignas
r>0,85
ntimarelaoentreasvariveiscorrelacionadas
109
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
0,2
Correlaomuitofracaesemsignificncia
0,2<r0,39
Correlaofraca
0,4<r0,69
Correlaomoderada
0,7<r0,89
Correlaoforte
0,9<r1
Correlaomuitoelevada
Coeficientedecorrelaodnos:
Adirecoqueindicadapelosinal+ou
Aintensidadeouforaquedadapelovalorquevariaentre1e1.Seacorrelaofor
zeronoexistecorrelaoentreasvariveis(exemplo:cordosolhoseinteligncia).
Exemplo: Considere as classificaes obtidas por 10 alunos nas disciplinas
X, Y, Z e W:
Estudante
XY
XZ
XW
YZ
YW
ZW
75
75
45
45
5625
3375
3375
3375
3375
2025
70
70
50
50
4900
3500
3500
3500
3500
2500
70
70
50
50
4900
3500
3500
3500
3500
2500
65
65
55
55
4225
3575
3575
3575
3575
3025
60
60
60
60
3600
3600
3600
3600
3600
3600
60
60
60
60
3600
3600
3600
3600
3600
3600
55
55
65
65
3025
3575
3575
3575
3575
4225
50
50
70
70
2500
3500
3500
3500
3500
4900
50
50
70
70
2500
3500
3500
3500
3500
4900
10
45
45
75
75
2025
3375
3375
3375
3375
5625
600
600
600
600
36900
35100
35100
35100
35100
36900
X=60
Y=60
Z=60
W=60
XY=36900
s2x= 90
XZ=35100
s2y= 90
s2z= 90
s2w= 90
Sabeseque:
a)CalculeocoeficientedecorrelaoentreXeYerepresentegraficamente.
b)CalculeocoeficientedecorrelaoentreXeZerepresentegraficamente.
110
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Resoluo 47:
a)
(XY) - X Y
r=_____N______________
sx sy
Ento,
36900 _ 60x60
10
r = _________________________________________
90 x 90
r= = 1
Existe uma relao positiva muito forte entre X e Y
b)
r=
(XZ) - X Z
N
..
sx sZ
Ento,
35100 _ 60x60
10
r=
________________________________________
90 x 90
r= = -1
ExisteumarelaonegativamuitoforteentreXeW,isto,quantomaiorXmenorYevice
versa.
CARACTERSTICAS DO TESTE T:
1.
Testeparaacomparaodemdias;
2.
3.
Contnua;
4.
Simtrica;
5.
Deformacampanular;
6.
Variademaisinfinitoamenosinfinito;
7.
Mdia=0edesviopadrodavariveldeacordocomn;
111
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
8.
OusodeTpressupequeavarivelobservacionaltenhanapopulao(deondefoi
colhidaaamostra)distribuionormal;
9.
No existe uma distribuio t, mas sim uma famlia. Para cada n tamanho da
amostraexisteumadistribuio(umacurva)especfica;
10. medidaquencresce,ttendeaz(aaproximaoentretezcomeaaficarboaa
partirden>=30).
Requisitosparautilizarotestet:
1.Quandoasduasamostrastmamesmahomogeneidadedevarincia;
2.Osdoisgrupostenhamamesmadistribuioaproximadanormalleptocrtica;
3.Escalademedidaintervalar.
QUANDO UTILIZAR
Utilizaseparadesignsexperimentaiscomduassituaestestandoumavarivelindependente,
quandonessassituaesseencontramsujeitosdiferentesdesignsnorelacionados.
O teste t no relacionado equivalente ao teste no paramtrico U de MannWhitney; ambos
comparamdiferenasentredoisgrupos.
OBJECTIVO
O objectivo comparar a quantidade da variabilidade devida s diferenas previstas nos
resultadosentredoisgruposcomavariabilidadetotalnosresultadosdossujeitos.Asdiferenas
previstassocalculadascomoumadiferenaentreosresultadosmdiosentreosdoisgrupos.
Aestatsticatrepresentaotamanhodadiferenaentreasmdiasparaosdoisgrupos,tomando
emconsideraoavarinciatotal.Paraqueovalorobservadodetsejasignificativoterdeser
igualousuperioraosvalorescrticosdetapresentadosnatabela.
112
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
INSTRUES PASSO-A-PASSO
Elevaraoquadradocadaresultadoindividualparaambososgruposemseparado:
1.
Adicionarostotaisdosresultadosaoquadradoparacadagrupo;
2.
Elevaraoquadradotodososresultadosindividuaisparacadagrupo;
3.
Calcularamdiaparacadagrupo;
4.
Calculart:
1 - 2
t = _________________________________________________________________
x12 - ( x1)2
+ x22 - ( x2)2
______
______
n1
n2
1
1
____________________________________
__
+ __
(n1 - 1) + (n2 - 1)
n1
n2
emque:
1=mdiadogrupo1
2=mdiadogrupo2
x12=somadosquadradosparaogrupo1
x22=somadosquadradosparaogrupo2
(x1)2=resultadostotaisdogrupo1aoquadrado
(x2)2=resultadostotaisdogrupo2aoquadrado
n1=nmerodesujeitosdogrupo1
n2=nmerodesujeitosdogrupo2
Calcularg.l.:
g.l.=(n11)+(n21)
Setobservado>tcrticorejeitaseHo
Setobservado<tcrticonoserejeitaHo
113
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Exemplo:paraverificarseduasdietasparaemagrecersoigualmenteeficazes,ummdicoseparouao
acaso um conjunto de pacientes em dois grupos. Cada paciente seguiu a dieta designada para o seu
grupodurante4meses.Omdicoregistouaperdadepesoemkgdecadapacienteporgrupo.Osdados
estoapresentadosnoquadroquesesegue:
______________________________________________________________________________________
Grupo 1 (dieta 1)
Grupo 2 (dieta 2)
______________________________________________________________________________________
Resultados
Resultados
Resultados
Resultados
ao quadrado
ao quadrado
10
100
2
4
5
25
1
1
6
36
7
49
3
9
4
16
9
81
4
16
8
64
5
25
7
49
2
4
5
25
5
25
6
36
3
9
5
25
4
16
_____________________________________________________________________________________
Total
x1 = 64
x12 = 450
x2 = 37
x22 = 165
2
Mdia
1 = 6,4
= 3,7
InstruesPassoaPasso:
1.construiratabela
2.x1=64
x2=37
x12=450
x22=165
3.(x1)2=64X64=4096
(x2)2=37X37=1369
4.1=6,4
2=3,7
114
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
6,4 - 3,7
t = _________________________________________________________ =
450 - 4096 + 165 - 1369
______
______
10
10
_______________________________
9+9
2,7
= ______________
1
__
10
1
+ __
10
= 3,547
3,806. 0,2
6. g.l. = (n1 - 1) + (n2 - 1) = (10 - 1) + (10 - 1) = 18
O valor de t observado (3,547) superior ao valor crtico de 2,878 (Anexo VII), indicando um
nvel de significncia de p < 0,05 para uma hiptese unicaudal ou p < 0,01 para uma hiptese
bicaudal.
Quandoutilizar:
Utilizaseparadesignsexperimentaiscomduassituaestestandoumavarivelindependente,
quando os mesmos sujeitos (ou emparelhados) se encontram em ambas as situaes design
relacionado.OtestetrelacionadoequivalenteaotestenoparamtricodeWilcoxon.
OBJECTIVO
Oobjectivocompararasdiferenasentreasduassituaesexperimentaiscomavariabilidade
total nos resultados. Quando os mesmos sujeitos so usados em ambas as situaes podem
compararse pares de resultados obtidos por cada indivduo quando sujeito a ambas as
situaes.
115
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Aestatsticatapresentaotamanhodasdiferenasentreosresultadosdossujeitosparaasduas
situaes.Paraquesejasignificativoovalordetterdeserigualousuperioraosvalorescrticos
databela(AnexoVII).
INSTRUES PASSO-A-PASSO
1.CalcularasdiferenasentreosresultadosdossujeitossubtraindoosresultadosdasituaoB
paraasituaoA
2.Elevaressasdiferenasaoquadrado
3.Calcularosomatriodasdiferenasobtidas(d)
4.Calcularosomatriodoquadradodasdiferenas(d2)
5.Elevaraoquadradoasdiferenastotais(d)2
6.Calculart:
d
t=
___________________________________
N d2 ( d)2
N-1
emque
d=somadasdiferenasdosresultadosAeB
d2=somadosquadradosdasdiferenas
(d)2=somadasdiferenaselevadasaoquadrado
N=nmerodesujeitos
7.Calcularg.l.:
g.l.=N1
Setobservado>tcrticorejeitaseH0
Setobservado<tcrticonoserejeitaH0
116
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Exemplo:Paraverificarseaeficciadeumadietaerainfluenciadapeloministrardeumfrmaco,um
mdicodecidiuadministrar,aumgrupodeindividuosqueotinhamprocuradoparaperderpeso,um
placebo em conjunto com uma dieta que j havia administrado um ms antes aos mesmos sujeitos.
Referiu aos seus casos que aquele medicamento servia para perder apetite e ajudava a queimar
gorduras.
Registouaperdadepesoquetinhaocorridonos30diasantecedentestomadadeplaceboetrintadias
apsoplacebo.Osresultadosestonoquadroquesesegue
Sujeito
Situao A
Situao B
d
d2
(com placebo)
(s com dieta)
(A-B)
____________________________________________________________________________
1
10
2
8
64
2
5
1
4
16
3
6
7
-1
1
4
3
4
-1
1
5
9
4
5
25
6
8
5
3
9
7
7
2
5
25
8
5
5
0
0
9
6
3
3
9
10
5
4
1
1
___________________________________________________________________________
Total 64
37
d=27
d2=151
Mdia6,43,7
Resoluo50:
InstruesPassoaPasso:
1.construirtabela
2.calcularasmdias
3.d=27
4d2=151
5.(d)2=27x27=729
____________________________-
10 x 151 (27)2
10 - 1
27
=
_______________
= 27 / 9,316 = 2,90
86,78
7. g.l. = N - 1 = 10 - 1 = 9
117
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Comoovalorobservadodetde2,90superioraovalorcrticode2,821aonveldesignificncia
de p < 0,01 (unicaudal) ou p < 0,02 (bicaudal), e a mdia de perda de peso superior com o
placebo,omdicoconcluiuqueoefeitodeplacebopositivonaperdadepeso
Oponto10.3explicacomocompararmdiasdeduaspopulaes,combaseemamostrasdessas
populaes.Massvezesprecisocompararmdiasdemaisdeduaspopulaes.Porexemplo,
paraverificarsepessoascomdiferentesnveissocioeconmicos,isto,alto,mdioebaixotm,
emmdia,omesmopesocorporal,precisocompararmdiasdetrspopulaes.
ParacompararmdiasdemaisdeduaspopulaesaplicaseotesteF,naformaqueaseguirse
descreve, desde que a varivel em estudo tenha distribuio normal ou aproximadamente
normal.Masantesdemostrarcomosefazesseteste,convmapresentarumexemplo.
Imaginequequatrogrupos,todascomcincoelementos,conduziramaosdadosapresentadosnoquadro
28. As mdiasdessasamostrasestonaltimalinhadessequadro.Serqueasdiferenasdasmdias
dasamostrassosuficientementegrandesparaquesepossaafirmarqueasmdiasdaspopulaesso
diferentes?Pararesponderaestapergunta,precisoumtesteestatstico.
11
40
25
25
10
118
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Total
N. de repeties
Mdia
...
Total
x11
X21
X31
xk1
x12
X22
X32
...
xk2
x1r
X2r
X3r
Xkr
T1
T1
T1
T1
T=x
N=kr
Parafazeraanlisedevarinciaprecisocalcularasseguintesquantidades:
119
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
1.passo:
a)
osgrausdeliberdade(gl)dosgrupos:k1
b)
gldototal:n1
c)
gldosresiduos:(n1)(k1)=nk
2.passo:
a)
calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedividido
pelonmerodedados.
FORMULA:
b)
calcularaSomadosQuadradosTotal(SQT)
FORMULA:
c)
SQR = SQT-SQTr
calcularoQuadradomdiodoTotaldecadarepetio(QMTr)
FORMULA:
f)
SQTr = T2 - C
r
calcularaSomadosQuadradosdosResduos(SQR)
FORMULA:
e)
SQT = x2-C
calcularaSomadoQuadradodoTotaldecadarepetio(SQTr)
FORMULA:
d)
C = (x)2
n
QMTr = SQTr
k-1
calcularoQuadradomdiodoTotaldoResiduo(QMR)
FORMULA:
QMR = SQR
n-k
120
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
g)
calcularovalordeF
F = QMTr
QMR
FORMULA:
3.Passo:compararoFcalculadocomovalordadonatabeladeF,aoniveldesignificncia
estabelecido,observandoosk1grausdeliberdadenonumeradoreosnkgrausdeliberdadeno
denominador(colunadaesquerda).
Exemplo:Umprofissionaldesaderecmcontratadoparaacompanharumconjuntodeatletasdealta
competio, verificou, pelos registos clnicos deixados pelo seu antecessor, que alguns atletas com o
mesmo tipo de leso(emgraueextenso)tinhammaisrecidivasqueoutros,apesardascondiesde
treino e o tempo de recuperao ser o mesmo. Colocou a hiptese de que tal acontecimento se podia
deversdiferentesteraputicasqueeramutilizadasparatratarasmesmasleses.Osresultadospodem
serobservadosnoquadroquesesegue:
Tratamento
Tratamento
Tratamento
Tratamento
11
40
25
25
10
1.passo:
a)
osgrausdeliberdade(gl)dosgrupos:k1=41=3
b)
gldototal:n1=201=19
c)
gldosresiduos:nk=204=16
121
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
2.passo:
a)
calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedivididopelo
nmerodedados.
b)
calcularaSomadosQuadradosTotal(SQT)
SQT = x2-C =
112+82+52+42+82+52+72+42+52+22+32+22+82+52+32+82+52+72 - 500
= 658-500
=158
c)
calcularaSomadoQuadradodoTotaldecadarepetio(SQTr)
calcularaSomadosQuadradosdosResduos(SQR)
e)
calcularoQuadradomdiodoTotaldecadarepetio(QMTr)
QMTr = SQTr = 90 = 30
k-1
3
f)
calcularoQuadradomdiodoResduo(QMR)
g)
calcularovalordeF
F = QMTr = 30 = 7,06
QMR
4,25
122
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
3.passo:irtabelaFparaumnveldesignificncia(p)de5%(0,05)eobservarqualoFterico
para 3 e 16 graus de liberdade (anexo). Como o valor calculado (7,06) maior que o da tabela
(3,24),conclumosqueasmdiasdasrecidivasdiferememfunodotratamento,paraumnvel
designificnciade0,05.
Aacompanharestecomentrio,osvalorescalculadosdevemserapresentadosnumquadro,da
seguinteforma:
Causas de
gl
SQ
QM
90
30
variao
Tratamentos
<0,05
7,06
Resduo
16
68
Total
19
158
4,25
Mas,comosepodeobservar,apesardatabelamostrarqueexistemdiferenassignificativas,no
nosinforma,quetratamentosqueproduzemdiferenasequaissosemelhantes.Semprequeas
diferenas so significativas, e s nesse caso, temos que proceder s comparaes posteriori
(PostHoc). Podemonos socorrer de diversos testes (LSD; Bonferroni; Sidak; Scheffe; SNK;
Tukey;etc.),agrandediferenaentreelesresidenotipodedistribuioemqueassentameno
tipo de ajustamento). Apresentaremos de seguida apenas o teste de Tukey, por ser dos mais
utilizadoseomaissimplesdecalcular,quandorecorremosaoclculomanual.
dms =q
QMR
r
Ondequmvalordadoemtabela(Anexo____)
QMRoquadradomdiodoresiduodaANOVA
ronmeroderepeties
123
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
assim,seconsultarmosatabelaverificamosqueoqparacompararquatrotratamentoscom16gl
noresiduode4,05.comoQMR=4,25er=5,temos:
DeacordocomotestedeTukey,duasmdiassoestatisticamentediferentessemprequeovalor
absolutodadiferenaentreelasforigualousuperioraovalordadms.
Passemosentoobservaodosvalores:
Pares de mdias
Valor absoluto da
diferena
A-B
(8-5) 3
A-C
(8-5) 3
ns
A-D
(8-2) 6
<0,05
B-C
(5-5) 0
ns
B-D
(5-2) 3
ns
C-D
(5-2) 3
ns
dms
p
ns
3,73
fcil de observar que s existem diferenas entre a mdia dos tratamentos A e a mdia dos
tratamentos D, em que o tratamento D aquele com que se obtm, significativamente, menos
recidivas
124
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Opesquisador,nemsempretemamostrasdomesmotamanho,mesmoassimpossivelconduzir
uma anlise da varincia (ANOVA). Alis todos os clculos, com excepo SQTr, so feitos da
mesmaformaemambasassituaes.
Assimemvezdefazerasomadosquadradospelafrmula
SQTr = T2 - C
r
Utiliza:
FORMULA:
-C
Paramaisfcildeentenderobserveoseguinteexemplo:
Tratamento A
Tratamento B
Tratamento C
15
23
19
10
16
15
13
19
21
18
18
14
15
84
16
76
1.passo:
a)
osgrausdeliberdade(gl)dosgrupos:k1=31=2
b)
gldototal:n1=151=14
c)
gldosresiduos:nk=142=12
125
Margarida Pocinho e Joo Paulo de Figueiredo
85
ESTATSTICAEBIOESTATSTICA
2.passo:
a) calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedividido
pelonmerodedados.
b) calcularaSomadosQuadradosTotal(SQT)
f) calcularoQuadradomdiodoResduo(QMR)
QMR = SQR = 96 = 8
n-k 12
g) calcularovalordeF
F = QMTr =
QMR
31,67
8
= 3,96
126
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
3.passo:irtabelaFparaumnveldesignificncia(p)de5%(0,05)eobservarqualoFterico
para 2 e 12 graus de liberdade (anexo). Como o valor calculado (3,96) maior que o da tabela
(3,89),conclumosqueasmdiasdossujeitosdiferememfunodotratamento,paraumnvel
designificnciade0,05.
Osvalorescalculadosdevemserapresentadosdaseguinteforma:
Causas de variao
gl
SQ
QM
Tratamentos
63,33
31,67
Resduo
12
96
Total
14
159,33
3,96
<0,05
dms =q
1+ 1
ri
rj
QMR
2
Nocasodoexemplo,paracompararamdiadeAcomamdiadeBtemse:
1 +
6
1
4
8,00
2
Nocasodoexemplo,paracompararamdiadeAcomamdiadeCtemse:
1+
6
1 8,00
5
2
Nocasodoexemplo,paracompararamdiadeBcomamdiadeCtemse:
127
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
1 +
4
1
5
8,00
2
DeacordocomotestedeTukey,duasmdiassoestatisticamentediferentessemprequeovalor
absolutodadiferenaentreelasforigualousuperioraovalordadms.
Passemosentoobservaodosvalores:
Valor absoluto da
Pares de mdias
dms
diferena
A-B
|14-19| = 5
4,87
<0,05
A-C
|14-17| = 3
4,57
ns
B-C
|19-17| = 2
5,06
ns
ConcluisequeemmdiaAsignificativamentediferentedeB,aonveldesignificnciade0,05.
128
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
ANEXOS
129
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Anexo I
TABELADOQUIQUADRADO(X2)
130
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Anexo II
TABELADEU
131
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Anexo III
TABELADEWILCOXON
132
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Anexo IV
TABELAH
133
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Anexo V
TABELASDEFRIEDMAN
134
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Anexo VI
TABELAS(TABELADEKENDAL)
135
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Anexo VII
TABELAT
136
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Anexo VIII
TABELAZ
137
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Anexo IX
TABELAF
138
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Anexo X
TABELADOSVALORESDEq
139
Margarida Pocinho e Joo Paulo de Figueiredo