NDICE GERAL
I - INTRODUO .............................................................................................................................................5 1. NOES GERAIS ..........................................................................................................................................6 2. POPULAO E AMOSTRA ............................................................................................................................9 3. MTODOS DE AMOSTRAGEM ....................................................................................................................11
3.3 INDIVDUO OU UNIDADE ESTATSTICA.............................................................................................21 3.4 VARIVEL ESTATSTICA....................................................................................................................22 3.5 ESTATSTICA DESCRITIVA E ESTATSTICA INDUTIVA....................................................................24 3.6 PARMETRO E DADO ESTATSTICO ...................................................................................................24 3.7 REPRESENTAO DE UMA VARIVEL ESTATSTICA ........................................................................25 3.8 REDUO DE UMA VARIVEL ESTATSTICA .....................................................................................29
3.8.1 Mdia...........................................................................................................................................................30 3.8.2 Mediana ......................................................................................................................................................33 3.8.3 Moda............................................................................................................................................................34 3.8.4 Quantis ........................................................................................................................................................38 3.8.5 Medidas de disperso .............................................................................................................................40 3.8.6 Coeficiente de disperso .......................................................................................................................49
5.1 TESTE DO QUI-QUADRADO................................................................................................................63 5.2 PROCEDIMENTOS PARA ORDENAO DE RESULTADOS ....................................................................67 5.3 TESTES PARA DUAS AMOSTRAS INDEPENDENTES ...........................................................................69 5.4 TESTE U
DE
MANN-WHITNEY .........................................................................................................70
ESTATSTICAEBIOESTATSTICA
6.2 CORRECO DE CONTINUIDADE ........................................................................................................78 6.3 TESTE DOS SINAIS DE WILCOXON .....................................................................................................79
7. TESTES PARA K AMOSTRAS INDEPENDENTES.........................................................................................82
KENDALL...........................................................................99
10.1 CORRELAO ..................................................................................................................................106 10.2 TESTE T DE STUDENT (NO RELACIONADO) ..............................................................................111 10.3 TESTE T DE STUDENT (RELACIONADO).......................................................................................115 10.4 ANLISE DE VARINCIA .......................................................................................................119
10.4.1 Anlise da Varincia com Igual Tamanho .....................................................................................119 10.4.1.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS ............................................................123 10.4.2 ANLISE DE VARINCIA COM DIFERENTES TAMANHOS ..................................................125 10.4.2.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS ............................................................127
ANEXOS ........................................................................................................................................................129
Anexo I ...................................................................................................................................................130 Anexo II ..................................................................................................................................................131 Anexo III.................................................................................................................................................132 Anexo IV ................................................................................................................................................133 Anexo V..................................................................................................................................................134 Anexo VI ................................................................................................................................................135 Anexo VII ...............................................................................................................................................136 Anexo VIII ..............................................................................................................................................137 Anexo IX ................................................................................................................................................138 Anexo X ..................................................................................................................................................139
ESTATSTICAEBIOESTATSTICA
NDICE DE ILUSTRAES
FIGURA 1: POPULAO E AMOSTRA......................................................................................................................................... 10 FIGURA 2: AMOSTRA ESTRATIFICADA ....................................................................................................................................... 13 FIGURA 3: CONVERSO DOS NIVEIS DE CONFIANA EM DESVIOS PADRO .................................................................................. 17 QUADRO 1: QUADRO GERAL DE SERIAO .............................................................................................................................. 25 QUADRO 2: QUADRO DE FREQUNCIAS .................................................................................................................................... 26 QUADRO 3: QUADRO DE FREQUNCIAS .................................................................................................................................... 27 QUADRO 4: QUADRO DE FREQUNCIAS .................................................................................................................................... 28 QUADRO 5: QUADRO DO CLCULO DA MDIA .......................................................................................................................... 30 QUADRO 6: QUADRO DO CLCULO DA MDIA .......................................................................................................................... 31 QUADRO 7: CLCULO DA MDIA PONDERADA .......................................................................................................................... 32 FIGURA 4: CURVA SIMTRICA .................................................................................................................................................. 35 FIGURA 5: CURVA ASSIMTRICA DIREITA .............................................................................................................................. 36 FIGURA 6: CURVA ASSIMTRICA ESQUERDA .......................................................................................................................... 36 FIGURA 7: CURVA ASSIMTRICA DIREITA .............................................................................................................................. 39 FIGURA 8: CURVA SIMTRICA ACHATADA (PLATOCURTICA) ..................................................................................................... 42 QUADRO 8: CLCULO DO DESVIO MDIO ................................................................................................................................ 44 QUADRO 9: CLCULO DO DESVIO MDIO PARA CLASSES ......................................................................................................... 45 QUADRO 10: CLCULO DA VARINCIA .................................................................................................................................... 45 QUADRO 11: CLCULO DA VARINCIA .................................................................................................................................... 46 FIGURA 9: DISTRIBUIO NORMAL .......................................................................................................................................... 51 FIGURA 10 - DISTRIBUIO LEPTOCRTICA E PLATICRTICA .................................................................................................... 51 FIGURA 11: % DE RESULTADOS 1 DP ACIMA E ABAIXO DA MDIA ............................................................................................. 54 FIGURA 12: POSIO DE UM RESULTADO .................................................................................................................................. 55 QUADRO 12: TABELA DE CONTINGNCIA (CROSSTAB)............................................................................................................. 65 QUADRO 13: ORDENAO DE UM GRUPO EM FUNO DO N. DE FACTORES DE RISCO ............................................................... 67 QUADRO 14: ORDENAO PARA AMOSTRAS RELACIONADAS OU EMPARELHADAS ................................................................... 69 QUADRO 15: RESULTADOS DO REGISTO DAS QUEIXAS .............................................................................................................. 71 QUADRO 16: TESTE MCNEMAR................................................................................................................................................ 75 QUADRO 17: TABELA DE QUATRO CASAS PARA A PROVA DE SIGNIFICNCIA DE MUDANAS ...................................................... 77 QUADRO 18: RESULTADOS DO TESTE DO VOCABULRIO ........................................................................................................... 79 QUADRO 19: NMERO DE IDEIAS RELEMBRADAS PARA TRS TIPOS DE TESTES .......................................................................... 83 QUADRO 20: Q DE COCHRAN .................................................................................................................................................. 89 QUADRO 21: Q DE COCHRAN .................................................................................................................................................. 90 QUADRO 22: AVALIAO DE TRS TIPOS DE ILUSTRAES ....................................................................................................... 93 QUADRO 23: COEFICIENTE DE CONTINGNCIA DE RHO DE SPEARMAN-RANK ......................................................................... 99 QUADRO 24: POSTOS ATRIBUDOS A 6 CANDIDATOS A EMPREGO POR 3 CHEFES DE PESSOAL.................................................... 100 FIGURA 13: DIAGRAMA DE DISPERSO DE PONTOS OU SCATTERPLOT OU SCATTERGRAM ......................................................... 107 QUADRO 25: CORRELAO DE PEARSON ............................................................................................................................... 110 QUADRO 26: TESTE T NO RELACIONADO .............................................................................................................................. 114 QUADRO 27: TESTE T RELACIONADO ..................................................................................................................................... 117 QUADRO 28: DADOS DE 4 AMOSTRAS E RESPECTIVAS MDIAS ................................................................................................ 118
3 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
QUADRO 29: NOTAO PARA ANLISE DA VARINCIA ........................................................................................................... 119 QUADRO 30: RECIDIVAS POR TRATAMENTO ............................................................................................................................ 121 QUADRO 31: ANOVA .......................................................................................................................................................... 123 QUADRO 32: POST-HOC DAS RECIDIVAS ................................................................................................................................. 124 QUADRO 33: MDIAS POR TRATAMENTO ................................................................................................................................ 125 QUADRO 34: ANOVA .......................................................................................................................................................... 127 QUADRO 35: POST-HOC ......................................................................................................................................................... 128
ESTATSTICAEBIOESTATSTICA
I - INTRODUO
Desde sculos o homem tem, muitas vezes, tomado notas de coisas e de pessoas, no com o nico fim de acumular nmeros, mas com a esperana de utilizar os dados do passado para a resoluodeproblemasdopresenteassimcomoparaaprevisodeacontecimentosfuturos.No entanto,osucessoquantoaesteobjectivosfoipossvelemdatamuitorecente:snofinaldo sculoXIXe,sobretudo,noprincpiodosculoXXque,comaaplicaodeprobabilidadesaos problemassobreainterpretaodosdadosrecolhidos,foipossvelresolveralgunsdeles. AEstatsticaconquistou,hoje,oseulugarentreascincias.Opoderdoseumtodo,sobretudo, afirmado nas ltimas dcadas e aplicase, agora, nos domnios mais variados. At aqui, s um pequenonmerodepessoassepreocupoucomestudosestatsticos,querpelanaturezadassuas investigaes, quer por causa da sua utilidade para as diferentes profisses. O valor e a importnciadomtodoestatsticoresidemnoesforoparamelhorcompreenderonossomundo, tomaravilhosamentecomplexo,tantonopontodevistafsicocomosocial,levamnosasonhar queelesetorneobjectodeumconhecimentocomoasoutrascincias.Avidacorrentelevanosa decisesparapassardoconhecidoaodesconhecido,daexperinciapreviso. Este curso tem por fim fornecer conhecimentos estatsticos (sem ter muitos conhecimentos matemticos) e saber interpretar resultados que podem ser obtidos atravs de programas de computador.
ESTATSTICAEBIOESTATSTICA
1. NOES GERAIS
Paraalgumaspessoas,aEstatsticanosenoumquadrodecolunasmaisoumenoslongasde nmeros que dizem respeito populao, indstria ou ao comrcio, como se v frequentementeemrevistas;paraoutras,eladgrficosmostrandoavariaonotempodeum facto econmico ou social, a produo ou os nmeros relativos aos negcios de uma empresa, assimcomoseencontranosescritriosdeempresasprivadas. To diferenciados se apresentam os mtodos estatsticos que no possvel estabelecer uma definio que os contenha a todos. Apesar disso, apresentamos a seguir uma definio que, emboranecessariamenteincompletacomoqualqueroutra,temavantagemdeintroduziroaluno namatria. AEstatsticatemcomofinalidadeelaborardeumasntesenumricaqueevidencieoquedemais generalizadoesignificativoexistanumconjuntonumerosodeobservaes. O grande nmero de observaes de que se parte reflecte uma diversidade tal que se torna ininteligvel a sua interpretao. Para que, a partir dessa diversidade se possa comear a entender logo, tornase necessrio reduzir sucessivamente as observaes, ganhandose em generalidadeoquesevaiperdendoemindividualidade. A sntese implica, assim, que nos desprendamos do que particular e individual para nos atermos ao que existe de mais geral no conjunto das observaes; medida que a sntese progride,vaiseperdendoocontactocomasparticularidadesimediatas. Destemodo,aEstatsticanoseocupadoqueexcepcional,masapenasdoquegeral:nose interessa pelo indivduo, mas por grupos de indivduos; no se ocupa, em suma, de uma s medio,masdeumconjuntodemedies. Acrescentese,ainda,queasntesenumrica.Queristodizerqueseprescindeinteiramentedas palavras e dos recursos literrios de mais ou menos efeito que elas possibilitam. Alcanase a sntesepelorecursoexclusivodosnmeros.
ESTATSTICAEBIOESTATSTICA
Da o af com que frequentemente se escolhem os nmeros de acordo com os argumentos. A Estatstica intrinsecamente uma disciplina no literria, manipula exclusivamente nmeros e alcanaasnteseordenandoosecooperandocomeles. Estatstica, deriva de status que em latim significa Estado, e que s por si demonstra a ligaoquesempreexistiuentreambos; O primeiro levantamento estatstico remonta a 3050 a.C., no Egipto, tendo como objectivo informaroestadosobrerecursoshumanoseeconmicos. No sc. XVII d.C., a disciplina de Estatstica era j leccionada nas universidades alems, continuandocomafinalidadededescreveraspopulaeseasriquezasdoEstado. Aindanosc.XVII,dseaexpansodosseuscamposdeinvestigaoareascomo: Sadepblica; Indstria; Comrcio; EstudosDemogrficos. Os mtodos de inferncia estatstica surgem com Jonh Graunt (16201674), um modesto comerciante,quetiraconclusesvlidassobreumapopulaodesconhecidaporele. Fermat (16011665) e Pascal (16231662) permitem que o estudo do acaso tome uma expresso matemtica,introduzindooClculodasProbabilidades. O Clculo das Probabilidades e o aparecimento do Mtodo dos mnimos quadrados, vm credibilizaraEstatsticaconferindolheafundamentaomatemticaemqueelaassentahoje. Nosc.XVIIILambertQuetelet(17961874)introduziuaEstatsticaemreascomo: Meteorologia; Antropometria; CinciasSociais; Economia; Biologia.
ESTATSTICAEBIOESTATSTICA
FrancisGalton(18221911),apresentanoesderegressoecorrelao; KarlPearson(18571936)apresentaamaisbelaeacabadateoriadeEstatstica,ficandotambm conhecidopelosseuscoeficientes; FishereosseustrabalhossobreinfernciaEstatsticaderamtambmumgrandecontributoao desenvolvimentodaEstatstica. Em 1943,dseumagrandereviravolta,umavezqueotratamentodedadosdeixadeserfeito manualmenteepassaasercomputadorizado. MtodoEstatstico: Tcnicausadaparaobter,analisareapresentardadosnumricos; Mtodocientficocujafinalidadeoestudodaspropriedadesnumricas dosconjuntosdosfactos. OMtodoEstatstico,segundoateoriadeCramer,pressupeasseguintesfases: Recolhadedadosestatsticos:obtenodaamostraapartirdapopulao, devendo depurar e rectificar os dados estatsticos, que no seu conjunto sodenominadossrieestatstica. Descrio:conjuntodeoperaes,numricasougrficas,efectuadassobre os dados estatsticos determinando a sua distribuio; procedese sua ordenao,codificaoerepresentaopormeiodequadrosetabelas. Anlise: consiste em tirar concluses sobre a distribuio da populao, determinaroseugraudeconfianaeaindaformularhipteses,tentando verificlas,quantoaofenmenoemestudo. Predio: uma previso do comportamento do fenmeno em estudo, tendoemcontaadefiniodadistribuioestatstica.
ESTATSTICAEBIOESTATSTICA
2. POPULAO E AMOSTRA
Populao: somatrio dos indivduos ou elementos, com qualquer caracterstica comum e que estosujeitosaumaanliseestatstica,portereminteresseparaoestudo. Quantosuaorigempodeser: Conjuntodepessoas; Conjuntodeobjectos; Conjuntodeacontecimentos.
Quantosuanaturezapodeser: Podeaindaser: Amostra:umsubconjuntoretiradodapopulao,quesesupeserrepresentativodetodasas caractersticas da mesma, sobre o qual ser feito o estudo, com o objectivo de serem tiradas conclusesvlidassobreapopulao. Amostragem: o procedimento pelo qual um grupo de pessoas ou um subconjunto de uma populao escolhido com vista a obter informaes relacionadas com um fenmeno, e de tal formaqueapopulaointeiranosinteressaestejarepresentada OPlanodeAmostragemserveparadescreveraestratgiaautilizarparaseleccionaraamostra. Este plano fornece os detalhes sobre a forma de proceder relativamente utilizao de um mtododeamostragemparadeterminadoestudo. Conjuntofinito; Conjuntoinfinito. Existenteoureal; Hipotticaounototalmenteexistente;
ESTATSTICAEBIOESTATSTICA
Logo que o investigador delimite a populao potencial para o estudo, ele deve precisar os critriosdeselecodosseuselementos. Certoscritriosdizemrespeitoscaractersticasrequeridasparaqueumelementoousujeitofaa partedaamostra: Aamplitudedaidadedosparticipantes; Condiesdesadeprecisas. Igualmentecertoscritriosdefinemossujeitosquenofaropartedoestudo:
Populao
Populao-alvo Amostra
Um investigador interessado pela readaptao aps cirurgia de revascularizao, pode concentrarsesomentenossujeitosquetiveramumanicaexperinciadestetipoeexcluremos outros. Umaamostraditarepresentativaseassuascaractersticasseassemelhamomaispossvelsda populaoalvo.particularmenteimportantequeaamostrarepresentenosasvariveisem estudo,mastambmoutrosfactoressusceptveisdeexerceralgumainflunciasobreasvariveis estudadas,comoaidade,osexo,aescolaridade,orendimento,etc. ARepresentatividadeavaliasecomparandoasmdiasdaamostracomasdapopulaoalvo.
ESTATSTICAEBIOESTATSTICA
Comoseignorasetodasascaractersticasdapopulaoestopresentesnumaamostradadoque estassomuitasvezesdesconhecidas,admitesequeexistesempreumgraudeerro. ERRODEAMOSTRAGEM:adiferenaqueexisteentreosresultadosobtidosnumaamostrae osqueteriamsidoobtidosnapopulaoalvo. Duassoluesexistemparareduziraomnimooerroamostral: 1. Retirar de forma aleatria e um nmero suficiente de sujeitos que faro parte da amostra. 2. Procurar reproduzir o mais fielmente possvel a populao pela tomada em conta das caractersticasconhecidasdesta.
3. MTODOS DE AMOSTRAGEM
3.1 AMOSTRAGENS PROBABILSTICAS E NOPROBABILSTICAS
3.1.1 As Amostras Probabilsticas
Os mtodos de amostragem probabilstica servem para assegurar uma certa preciso na estimaodosparmetrosdapopulao,reduzindooerroamostral. Aprincipalcaractersticadosmtodosdeamostragemprobabilsticaresidenofactodequecada elementodapopulaotemumaprobabilidadeconhecidaediferentedezero,deserescolhida, aquandodatiragemaoacasoparafazerpartedaamostra. Oobjectivodestaabordagemobteramelhorrepresentatividadepossvel.
ESTATSTICAEBIOESTATSTICA
AAmostragemaleatriaestratificadaumavariantedaamostraaleatriasimples.Estatcnica consisteemdividirapopulaoalvoemsubgruposhomogneoschamadosestratoseaseguir tirar de forma aleatria uma amostra de cada estrato. A Amostragem aleatria estratificada utilizadaquandoapopulaointeirareconhecidaporcertascaractersticasprecisas,taiscomoa idade, o sexo, a incidncia de uma condio de sade, tudo isto para assegurar a melhor representatividadepossvel.
ESTATSTICAEBIOESTATSTICA
P o p u la o - A lv o
2 0 0 0 e s tu d a n te s e m S o c ia is
C i n c ia s
C la s s ific a o
E s tr a t ific a o P r o p o r c io n a l
E s tra to 1 D o u to ra m e n to 400 = 20%
E s tra to 2 M e s tra d o 600 = 30%
E s c o lh a A le a t r ia
4 0 E s tu d a n te s D o u to ra m e n to
6 0 E s tu d a n te s M e s tra d o
1 0 0 E s tu d a n te s L ic e n c ia t u r a
AMOSTRAGEM EM CACHOS
Consiste em retirar de forma aleatria os elementos por cachos em vez de unidades. til quandooselementosdapopulaoestonaturalmenteporcachoseporissodevemsertratados comogruposouquandonopossvelobterumalistagemdetodososelementosdapopulao alvo.
AMOSTRAGEM SISTEMTICA
Consistequandoexisteumalistaordenadadeelementosdapopulao.EstatcnicaconsisteK elementosdessalistasendooprimeiroelementodaamostraretiradoaoacaso. Ointervaloentreoselementoscorresponderazoentreotamanhodapopulaoedaamostra. Exemplo:Sepretenderumaamostrade100indivduoseapopulaoforde1000osistemaser 1000:100=10 (dez em dez o sistema), isto , ser includo um elemento da lista de 10 em 10 indivduosapartirdo1.n.sorteado.
ESTATSTICAEBIOESTATSTICA
Importante Se se utilizar uma amostragem por cachos ou outros tipos de agrupamentos, a amostra s consideradaprobabilsticaseosgruposforamescolhidosaoacasoantesdarepartioaleatria dossujeitosnosgrupos.
formada por sujeitos facilmente acessveis, que esto presentes num determinado local e momentopreciso. Exemplo: pessoas hospitalizadas. Um investigador pode ter acesso a uma unidade hospitalar paraconstituirumaamostradepacienteshospitalizados. Nestetipodeamostratemavantagemdesersimplesemorganizarepoucoonerosa,todaviaeste tipodeamostraprovocaenviesamentos,poisnadaindicaqueasprimeiras30a40pessoassejam
ESTATSTICAEBIOESTATSTICA
Idnticaamostragemaleatriaestratificadadiferindodestaapenaspelofactodossujeitosno seremescolhidosaleatoriamentenointeriordecadaestratooudecadagrupo.
AMOSTRAGEM POR SELECO RACIONAL OU POR TIPICIDADE
Temporbaseojulgamentodoinvestigadorparaconstituirumaamostradesujeitosemfuno doseucarctertpico. Por exemplo: o estudo de casos extremos ou desviantes como uma patologia rara ou uma instituio.
AMOSTRAGEM POR REDES OU BOLA DE NEVE
Consisteemescolhersujeitosqueseriamdifceisdeencontrardeoutraforma.Tomaseporbase, redessociaisamizadeseconhecimentos. Porexemplo:ImigrantesdeLeste. Quando o investigador encontra sujeitos que satisfazem os critrios escolhidos pedelhes que indiquemoutraspessoasdecaractersticassimilares.
ESTATSTICAEBIOESTATSTICA
F rm ula:
ESTATSTICAEBIOESTATSTICA
Sedesejarmosumnveldeconfianabastantealtosuperiora99%aplicaseafrmuladostrs desvios.
Convmlembrarquesemprequenosejapossvelestimarumapercentagemdofenmeno,deve utilizarsesemprep=50
ESTATSTICAEBIOESTATSTICA
Frmula
Onde: n=Tamanhodaamostra =nveldeconfianaescolhido,expressoemnmerosdedesviospadro p=percentagemdofenmeno q=percentagemcomplementar N=tamanhodapopulao e2=erromximopermitido Exemplo:Verificarquantosdos100empregadosdeumacantinacumpremcorrectamenteas normasdehigieneeseguranadotrabalho. Presumesequeessen.nosejasuperiora30%dototal;desejaseumnveldeconfianade95% (2desvios)etoleraseumerroat3%. Ento,n=90,4Logodeveroserpesquisados90empregados. Confirmeaplicandoafrmula Mas,seapopulaofossede10.000empregados,comosmesmoscritriosanteriormente referidos,ento:
n= 4 . (30.70).10000 = 853
(9.9999)+4.(30.70)
ESTATSTICAEBIOESTATSTICA
Otamanhoptimodeumaamostra,nodependetantodotamanhodapopulaomassimde doisparmetrosestatsticos:amargemdeerroeonveldeconfiana MargemdeerroUmaamostrarepresentaaproximadamente(enuncaexactamente)uma populao.Amedidadesteaproximadamenteachamadamargemdeerro,elidoassim: seumapesquisatemumamargemdeerrode2%eaDoenaCardacateve25%deprevalncia naamostrarecolhida,podemosdizerque,naqueleinstante,napopulao,elateruma prevalnciaentre23%e27%(25%menos2%e25%mais2%). NveldeconfianaAspesquisassofeitascomumparmetrochamadonveldeconfiana, geralmentede95%.Estes95%queremdizeroseguinte:serealizarmosumaoutrapesquisa,com umaamostradomesmotamanho,nasmesmasdataselocaisecomomesmoinstrumentode recolhadedados,humaprobabilidadede95%dequeosresultadossejamosmesmos(euma probabilidadede5%,claro,dequetudodifira). Quandojseefectivouumapesquisaesedesejaconheceramargemdeerroutilizadaaplicase:
Frmula
Onde: n=Tamanhodaamostra
p =
(p.q) n
ESTATSTICAEBIOESTATSTICA
p =
Frmula
Emque p=fenmeno] =erro
ESTATSTICAEBIOESTATSTICA
Assimparaumfenmenoquetenhaumaprevalnciade25%,osresultadosseriam:
Emtermosestatsticosconsideramosqueumaamostra:Pequenasen<30
CUIDADOS
A TER NA ESCOLHA DA AMOSTRA:
1. Imparcialidade:todososelementosdevemteramesmaprobabilidadeeoportunidadede seremescolhidos; 2. Representatividade: deve conter em proporo todas as caractersticas que a populao possui,qualitativaequantitativamente,demodoaquenosetornetendenciosa; 3. Tamanho: suficientemente grande de modo a fornecer as principais caractersticas, por outroladopequenaparaeconomizartempo,dinheiroepessoal.
ESTATSTICAEBIOESTATSTICA
ESTATSTICAEBIOESTATSTICA
2. Quantitativa: se a sua intensidade que varia de elemento para elemento, tornandoa mensurveloureferencivel. Asvariveisquantitativasdividemseem: a. Variveisdiscretas:assumevaloresisolados,normalmenteinteiros(n.defilhos, n.defactoresderisco,n.dedependentes,n.derespostas,etc) b. Variveis contnuas: em que possvel qualquer operao aritmtica, podendo assumirqualquervalorreal(altura,peso,IMC,distncia,etc). Tendoemcontaonmerodeatributos(caractersticas)queestoaserestudadas,asvariveis podemser: 1. Unidimensionais:seapenascorrespondeaumatributo 2. Bidimensionais:secorrespondeadoisatributos; 3. Pluridimensionais:secorrespondeavriosatributos.
Modalidade: toda a manifestao possvel de uma varivel, isto , as vrias hipteses de resposta,podendoelasserduasoumais. Asmodalidadestmobrigatoriamentequeser: 1. Incompatveis:cadaunidadeEstatsticanopodepertencersimultaneamentea duasoumaismodalidades; 2. Exaustivas: todas as unidades Estatsticas tm que ser inseridas numa modalidade. Aescolhadasmodalidadesdeveserfeitadeacordocomasinformaespossudas.Noentanto, surgemsituaesemquehnecessidadedeseaumentarumamodalidadesuplementar.
ESTATSTICAEBIOESTATSTICA
Ovalor11oparmetro(resultadodamdiaaritmtica).
Odadoestatsticotodaafunodefinidaapartirdosdadosnumricosdeumaamostra. Exemplo:consideremosaamostra:1010
Mdia =xi/n = 20/2 = 10 O valor 10 o dado estatstico
ESTATSTICAEBIOESTATSTICA
Como j referimos anteriormente, uma seriao implica que a varivel seja discreta (exemplo: nmerodefilhosdeumcasal,nmerodedivisesdeumacasa,etc.). Oquadrogeraldeumaseriaoestexpressonoquadroquesesegue.
Quadro 1: Quadro Geral de Seriao
Varivel X1 X2 X3 Xi Xk
Frequncias absolutas n1 n2 n3 ni nk
Frequncias acumuladas n1 n1+ n2 n1+ n2+ n3 n1+ n2+ +ni n1+ n2+ +nk
Frequncias relativas n1 N n2 N n3 N ni N nk N 1
Na primeira coluna temos os valores que a nossa varivel X toma (x1, x2, ..., xk). Esta coluna podesertambmdenominadaporxi. Nasegundacolunaapresentamosasfrequnciasabsolutassimplesouefectivas,isto,onmero devezesquecadavalorfoiobservadoouonmerodevezesquecadavalorsurgenaamostra.
25 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Estacolunapodetambmserdenominadaporni.Devemoslembraraquiqueonmerototalde indivduos pertencentes populao/ou amostra chamase efectivo total e designase por n, devendosempreverificarsequeni=n. Naterceiracolunapodemosvisualizarasfrequnciasacumuladas,isto,asomadasfrequncias absolutas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambmdenominadaporN(xi).Assim,
N(xi) = ni xi<x
Na quarta coluna apresentamos as frequncias relativas simples. Esta coluna pode ser tambm denominadaporfi,emquefi=ni/ne,detalmodoque,fi=1;afrequnciarelativaexpressa, emgeral,empercentagem. Na quinta coluna temos as frequncias relativas acumuladas, isto , a soma das frequncias relativas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambm denominada por F(xi); a frequncia relativa acumulada expressa, em geral, em percentagem. Exemplo:ConstruaoquadrodefrequnciasparaavarivelXquetomaosseguintesvalores:
xi 14 14 13 12 11 12 10 13 12
xi 10 11 12 13 14 ni = 9
ni 1 1 3 2 2
N(xi) 1 2 5 7 9
fi = 1
em que n = 9
ESTATSTICAEBIOESTATSTICA
Como j referimos anteriormente, uma classificao implica que a varivel seja contnua (exemplo:atemperaturadeumcorpo,aalturadeumapessoa,aduraodecertofenmeno,etc. variveisrelacionadascomoespao,otempoouamassa).
Quadro 3: Quadro de Frequncias
Frequncias Marcas da Classes classe absolutas acumuladas relativas acumuladas n1 c0-c1 c1-c2 c2-c3 ci-1-ci ci-1-ck Total X1 X2 X3 Xi Xk _ n1 n2 n3 ni nk n1 N n2 n1+ n2 N n3 n1+ n2+ n3 N n1+ n2+ +ni N n1+ n2+ +nk N 1 nk 1 N ni N n1+ n2++ ni N n1+ n2+n3 N n1+n2 n1 Frequncias Frequncias Frequncias relativas
Naterceiracolunaapresentamosasfrequnciasabsolutassimplesouefectivas,ouseja,onmero devezesqueosvaloresdedeterminadaclasseforamobservados.Estacolunapodesertambm denominada por ni. Mais uma vez, ni = n (nmero total de indivduos pertencentes populao/ouamostra,aquesechamaefectivototal). Na quarta coluna apresentamos as frequncias acumuladas, isto , a soma das frequncias absolutas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambmdenominadaporN(i).
27 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Na quinta coluna temos as frequncias relativas simples. Esta coluna pode ser tambm denominadaporfi,emquefi=ni/ne,detalmodo,quefi=1. Na sexta coluna apresentamos as frequncias relativas acumuladas, isto , a soma das frequncias relativas correspondentes a valoresinferioresaumdeterminadovalor.Estacoluna podesertambmdenominadaporF(i). NumaclassificaohabitualrepresentarmosporKonmerodeclasses(emgeralKvariaentre 5e20,inclusive)eporAaamplitude(emqueA=xmximoxmnimo). Ento,
- Se K dado = A/K - Se dado K=A/ , sendo a amplitude do intervalo de classe e A a amplitude do intervalo da amostra
Exemplo:Construaoquadrodefrequnciascomosseguintesdados:
Classes [20-23[ [23-26[ [26-29[ [29-32[ [32-35[ [35-38] ni 2 5 7 10 4 2
Quadro 4: Quadro de Frequncias
ni 2 5 7 10 4 2
N(i) 2 7 14 24 28 30
x'i 21 24 27 30 33 36
ni
= 30
fi
= 1em que n = 30 e = 3
ESTATSTICAEBIOESTATSTICA
Anteriormente definimos o conceito de varivel estatstica e construramse quadros e grficos estatsticos com vista a uma descrio numrica e grfica de uma varivel estatstica. Naturalmente, os grficos permitem uma primeira sntese das informaes registadas nos quadros. Por outro lado, por simples aproximao das curvas de frequncias absolutas ou relativas de duasoumaisvariveis,podemosfazerumaprimeiracomparaoentreelas. H, porm, necessidade de sintetizarmos toda a informao respeitante a uma varivel estatstica, resumindose os dados a um pequeno nmero de elementos que bastam para caracterizla. Tal sntese consiste na reduo de dados e os elementos numricos obtidos designamseporparmetrosdavarivelestatstica. Feitaarepresentaodosdadosestatsticospormeiodequadrose/oudegrficos,importafazer sobreosmesmosumestudonosentidodesepoderchegaraconcluses. Paratal,impeseumtrabalhodesimplificaoqueconsisteemprocederasnteses,emreduzir grandesquantidadesdedadosanmerossimplesquepermitamumaanliserpidaeumafcil comparaocomoutrassriesdamesmanaturezaoudenaturezadiferente. Tais nmeros so designados, habitualmente, por caractersticas, parmetros ou medidas e so agrupadosemcategoriasconformeotipodeinformaoquefornecem.
ESTATSTICAEBIOESTATSTICA
Sobestadesignaoagrupamseosparmetrosque,ounosindicamalgodeassocivelaoncleo ou centro da distribuio, ou nos permitem compartimentla. Vamos considerar as seguintes medidasdetendnciacentraloudeposio:mdia,mediana,modaequantis.
3.8.1 Mdia
MDIA ARITMTICA
Numaamostraseriadaosvaloresx1,x2,...,xkocorremn1,n2,...,nkvezes,respectivamente,a mdiaaritmticaser
x = nixi / n = fixi
Exemplo:Calculeamdiaaritmtica,sabendoque xi ni 4 2 6 4 7 5 8 3 10 2
xi 4 6 7 8 10
ni 2 4 5 3 2
nixi 8 24 35 24 20
=16 Ento,
=111
ESTATSTICAEBIOESTATSTICA
Numa amostra classificada a frmula definidora da mdia no se pode aplicar directamente porque no conhecemos os valores exactos da varivel estatstica, mas apenas o nmero de observaesdentrodecadaclasse,isto,quandoosdadosestoagrupadosemclasses,parao clculo da mdia simples, devemos considerar o ponto mdio de cada classe (marca) como representativo de todos os valores nela includos, pelo que aquela pode ser representada pela frmulamatemticaseguinte:
x = nix'i / n = fix'i
Exemplo:Calculeamdiaaritmtica,sabendoque
Classes ni [3-5[ 2 [5-7[ 4 [7-9[ [9-11[ [11-13] 5 3 2
ni 2 4 5 3 2
=16
=119
Temos de salientar que quando usamos a marca da classe estamos a colocar um certo erro de agrupamento,peloquedevemosconsideraraCorrecodeSheppard,detalmodoque:
x semelhante a x
ESTATSTICAEBIOESTATSTICA
Sepreferirmosemquadroaresoluoser
Quadro 7: Clculo da mdia ponderada
xi 65 60 40 80 78 70 28 75
pi 30 30 30 30 70 70 70 70 400
pixi 1950 1800 1200 2400 5460 4900 1960 5250 24920
x p = pixi / pi=24920/400=62,3
ESTATSTICAEBIOESTATSTICA
Para alm da mdia aritmtica e da mdia aritmtica ponderada, temos tambm a mdia geomtrica, a mdia harmnica e a mdia quadrtrica (a estes trs tipos de mdias no iremos fazerqualquerreferncia).
3.8.2 Mediana
Amedianadeumasriedenobservaesx1,x2,...,xndeumavarivelXovalorqueocupaa posiocentralquandoasobservaesestoordenadasporordemcrescenteoudecrescente,isto ,amedianadeumavarivelestatsticaovalordessavariveltalqueafrequnciadosvalores que lhe so inferiores a mesma que a frequncia dos valores que lhe so superiores. Representase,habitualmente,porMd. Amedianausadaquandonaamostrahvaloresexcntricosemrelaoaoutrosvalores. Paraoclculodamediana,temosdeconsiderarduassituaes:ocasoemqueNmpareocaso emqueNpar.
N
MPAR:
Amedianaumvalorobservado,detalmodoqueolugarqueocupadadopelafrmula
Md = (N +1) / 2
Exemplo:Determineamedianaparaaseguintesriededados:
5 9 8 7 6
Seamedianaocupaaterceiraposioouterceirotermo,oseuvalor7
ESTATSTICAEBIOESTATSTICA
PAR:
Exemplo:Determineamedianaparaaseguintesriededados
5 6 12 9 8 7
3.8.3 Moda
A moda (ou valor modal) de uma srie de n valores x1, x2, ..., xn de uma varivel X o valor ondeafrequnciaatingeomximo(relativo).Representase,habitualmente,porMo.
AMOSTRA SERIADA:
Amoda8.
ESTATSTICAEBIOESTATSTICA
AMOSTRA CLASSIFICADA:
Aclassemodal[810[,peloqueamoda=(8+10)/2=18/2=9
Pearson chegou concluso de que para as distribuies unimodais e moderadamente assimtricas,vigoraaseguinterelaoemprica: MdiaModa=3(MdiaMediana)
Vejamos,agora,arelaoexistenteentreestastrsmedidasnocasodasfigurasqueseseguem
ESTATSTICAEBIOESTATSTICA
A UTILIZAO DA MDIA ARITMTICA, DA MEDIANA E DA MODA
MDIA ARITMTICA:
A medida de tendncia central mais usada a mdia aritmtica, que apresenta em relao medianaemodavantagensapreciveis,taiscomo: facilmentecalculvel; aquemelhorseprestaaulterioresanlisesestatsticas; Dependedetodososvaloresdasrie; umamedidadetendnciacentralparticularmenteestvel,variandoomenospossvel deamostraparaamostraextradasdamesmapopulao; Existem,todavia,casosemqueainformaofornecidapelamedianaoupelamoda,pareceser maiscompletadoqueafornecidapelamdiaaritmtica,comopassamosaindicar. Podesertratadaalgebricamente.
ESTATSTICAEBIOESTATSTICA
MEDIANA:
Estamedidadetendnciacentraldeverutilizarsequando: Sedesejaconheceropontomdioexactodadistribuio; Existemresultadosextremosqueafectariamgrandementeamdia.Importasalientarque a mediana no influenciada pelos resultados extremos exemplo: na srie 10,13,15,16,18,19,21,tantoamdiacomoamedianaso16;sesubstituirmos21por50eos restantesresultadospermaneceremosmesmos,amediana16eamdiaserde20,1; A distribuio truncada, isto , incompleta nas extremidades exemplo: desejamos medir os tempos de reaco em Psicologia e as vrias respostas ultrapassam as capacidades de medida do aparelho; vemonos, assim, impossibilitados de calcular a mdia,jquenodispomosdetodososvaloresdavarivel,sendo,noentanto,possvel calcularovalordamediana,jqueconhecemosonmerodemedidasefectuadas.
MODA:
desalientarque,apesardasvantagensapresentadasparaamoda,estatemadesvantagemde serdedeterminaoimprecisa,nocasodasvariveiscontnuas.
ESTATSTICAEBIOESTATSTICA
3.8.4 Quantis
Chamasequantildeordempcom0p1erepresentase,habitualmente,porCpaovalordex talqueF(x)=p. Algunsquantistmdenominaesespeciais:
QUARTIS:
Osquartisdividemasrieordenadaem4partesiguais,contendocadaumadelas1/4ou25%das observaes. Q1=1quartil(correspondeaoquantildeordemp=1/4) Q2=2quartil(correspondeaoquantildeordemp=1/2) Q3=3quartil(correspondeaoquantildeordemp=3/4) Assim, Q1 o valor da varivel estatstica que deixa atrs de si 25% das observaes; Q2 o valordavarivelestatsticaquedeixaatrsdesi50%dasobservaeseQ3ovalordavarivel estatsticaquedeixaatrsdesi75%dasobservaes.A(Q1Q3)chamaseintervalointerquartil eointervaloaoqualpertencem50%dasobservaes,deixando25%paraadireitae25%paraa esquerda. de notar que dizer que os quartis dividem a srie em 4 partes iguais no significa que, por exemplo, os intervalos (Q1, Q2) e (Q2, Q3) tm a mesma amplitude, mas sim que contm o mesmonmerodeobservaes.
DECIS:
Os decis dividem a srie ordenada em 10 partes iguais, contendo cada uma delas 1/10 ou 10% dasobservaes. D1=1decil(correspondeaoquantildeordemp=1/10) D2=2decil(correspondeaoquantildeordemp=2/10)
38 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
CENTIS:
ESTATSTICAEBIOESTATSTICA
A mdia e a mediana 10 e, contudo, estas distribuies so muito diferentes. Com efeito, enquanto no grupo A as notas apresentam desvios muito grandes, na distribuio B todos os valoresseaproximamde10.Adispersoouvariabilidadedaprimeirasriemaisacentuadado quenasegunda. Quer dizer: distribuies com a mesma tendncia central podem apresentar aspectos bastante diferentesnoqueconcernedispersoouvariabilidade,emedidaqueestadispersoaumenta, menossignificativasdadistribuiovosendoasmedidasdetendnciacentral. Assim,paramelhorcaracterizarmosumadistribuio,temosdeconsiderar,almdasmedidasde tendncia central, uma outra medida que exprima o grau de disperso ou variabilidade dos dados. Vamos considerar as seguintes medidas de disperso: amplitude total, amplitude interquartis, desviomdio,varincia,desviopadroecoeficientededispersooudevariao.
AMPLITUDE TOTAL
Aamplitudetotaladiferenaentreomaiorvaloreomenorvalor,isto,aamplitudetotalde uma varivel estatstica a diferena entre o valor mximo e o valor mnimo dos valores
ESTATSTICAEBIOESTATSTICA
observados.aformamaissimplesdeavaliaradispersodosdados,detalmodoquequanto maiorforaamplitudetotalmaioradispersodosdados. A amplitude total pode ser tambm denominada de intervalo total ou campo de variao; representase,habitualmente,porAeapenasusavaloresextremos. Numaamostraseriada: A=xmximoxmnimo Numaamostraclassificada: A=extremosuperiordaltimaclasseextremoinferiordaprimeiraclasse Se alguma destas classes for de amplitude indeterminada no possvel definir o intervalo de variao. Aamplitudetotalapresentaasseguintesdesvantagens: Emborasejafcildecalcular,aamplitudetotaldependesomentedosvaloresextremos,queso, geralmente,osmenosfrequenteseosmenossignificativosdeumadistribuio,desprezandose os valores intermdios que so os mais frequentes. Alm disso, os valores extremos so vulgarmenteanmalosemuitovariveis,consoanteaamostraqueseretiredeumapopulao, detalmodoqueduasdistribuiespodemteramesmaamplitudetotal,masdispersesmuito diferentes. Outro inconveniente da amplitude total consequncia de no tomar em considerao as frequnciasdasobservaes. Exemplo:CalculeaamplitudetotaldogrupoG,sabendoque:
G= 2 3 10 16 19
ESTATSTICAEBIOESTATSTICA
AMPLITUDE INTERQUARTIS
Osquartisfornecemindicaoquantoformacomoasobservaessedistribuememtornoda mediana. Como o 1 e o 3 quartis representam valores abaixo dos quais esto, grosso modo, respectivamente, 25% e 75% das observaes, entre eles existiro, assim, 50% das observaes centrais. Consequentemente, quanto mais aproximados estiverem estes quartis, maior ser a concentraodasobservaesemtornodamediana. AamplitudeinterquartispodeserdefinidacomoadiferenaentreoQuartil3eoQuartil1.Esta medida de disperso pode ser tambm denominada de intervalo interquartis ou intervalo quartlico. Como podemos observar na figura 8, quanto mais achatada a curva, maior a amplitude e quantomaioraamplitudeinterquartlicamaisdispersaadistribuio.
Q1
Md
Q3
Exemplo:Calculeaamplitudeinterquartis,sabendoqueQ3=177,46eQ1=166,88. Q=Q3Q1=177,46166,88=10,58 Podemostambmcalcularaamplitudesemiinterquatisouintervalointerquartlicoouintervalo semiquartil ou desvio quartlico ou amplitude semiinterquartlico, que se representa, habitualmente,porQepodeserdefinidadoseguintemodo:
Q = (Q3-Q1) / 2
ESTATSTICAEBIOESTATSTICA
Estas medidas so mais completas do que a amplitude total, porque usam dois valores menos extremos(Q1eQ3).Noentanto,tmaindaalimitaodenoentrarememlinhadecontacoma disposio das frequncias nos intervalos definidos pelos valores separados exemplo: a amplitudeinterquartisseramesma,queras50%dasobservaesseacumulemnumsponto, querestejamuniformementedistribudasporesseintervalointerquartis. As medidas de disperso que passaremos a descrever no tm esta limitao, porquanto o seu clculodependedetodososvaloresdasrie.
DESVIO
Dadosnvaloresx1,x2,...,xndeumavarivelX,chamasedesviodecadavalorxiemrelao constantec,adiferenadexiparac,isto,
xi - c
NotesequeosdesviosdavarivelXemrelaoac,isto,(x1c),(x2c),...,(xnc)constituemosn valoresdavarivelXc.
DESVIO MDIO
Falamosemdesviomdioquandoconsideramososdesviosdecadavalorxiemrelaomdia aritmtica,isto:
xi-x
O simples total destes desvios no pode ser utilizado como medida de disperso, por ser identicamentenulo.Defacto,paranvaloressingulares,terse:
(xi-x)=0
Noentanto,oquocienteentreasomadosmdulosdestesdesvioseonmerodeles,jpodeser consideradocomomedidadedisperso
D.M.= |xi-x | / n
ESTATSTICAEBIOESTATSTICA
Exemplo20:CalculeodesviomdioparaA=453
Quadro 8: Clculo do Desvio Mdio
xi 4 5 3
|xi-x | 0 1 1
=12
x = xi / n =12/3=4 D.M.= |xi-x| / n = 2/3=0,67
= 2
Se os valores da varivel estiverem tabelados de modo que cada valor xi corresponda a frequnciaabsolutani,odesviomdioigualsomadosprodutosdasfrequnciaspelosvalores absolutosdosrespectivosdesviosemrelaomdia,divididapeloefectivodadistribuio. Numaamostraclassificada,osdesviosemrelaomdiaaritmticasocalculadosapartirdos pontosmdiosdecadaclasse,ouseja:
D.M.= ni |x'i-x'| / n = fi |x'i-x'|
ESTATSTICAEBIOESTATSTICA
classes ni
[4-6[ 1
[6-8] 2
Classes
ni 1 2
xi 4,5 7
[4-6[ [6-8]
=3,3
Ento,odesviomdio
D.M.= ni |x'i-x'| / n = 3,3 /3 = 1,1
Odesviomdioapresentaaseguintedesvantagem: Embora dependa de todos os valores observados, o desvio mdio tem a desvantagem de considerarosvaloresabsolutosdosdesvios,oqueimpedeoseutratamentoalgbrico.
VARINCIA
Outramaneiradeeliminarmosossinaisdosdesvios,consisteemelevlosaoquadrado.Porisso, em vez da mdia dos valores absolutos dos desvios considerase a mdia dos quadrados dos desvios.Obtmse,assim,umaoutramedidadedispersobastanteusadaavarincia. Dados n valores x1, x2, ..., xn de uma varivel X, chamase varincia e representase, habitualmente,pors2ous2xamdiaaritmticadosquadradosdosdesviosemrelaomdia dessasvalores,isto:
S2 = (xi-x)2 / n Exemplo 22: Calcule a varincia para X=17,18,19,20,21 Resoluo 22: x = xi / n = (17+18+19+20+21) / 5 = 19 Ento,avarincia:
Quadro 10: Clculo da Varincia
xi 17 18 19 20 21 N=5
(xi-x)2 4 1 0 1 4 =10
S2 = (xi-x)2/ n = 10/5 = 2
45 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Sex1,x2,...,xnocorremn1,n2,...,nkvezes,respectivamente,temos Paraumaamostraseriada:
S2 = ni (xi-x)2 / n = fi (xi-x)2
Paraumaamostraclassificada:
S'2 = ni (x'i-x ')2 / n = fi (x'i-x ')2
Exemplo23:Calculeavarinciaparaadistribuiocujamdia103
Classes [85-90[ [90-95[ [95-100[ [100-105[ [105-110[ [110-115[ [115-120] ni 12 25 38 85 93 16 9
Quadro 11: Clculo da Varincia
ni 12 25 38 85 93 16 9 278
Ento,avarincia
S'2 = ni (x'i-x)2/ n = 12162,25/ 278 = 43,7491
Podemos,agora,enumeraraspropriedadesdavarincia: Somando ou subtraindo uma constante a todos os valores observados, a varincia resultantepermanecerinalterada;
ESTATSTICAEBIOESTATSTICA
Multiplicandooudividindotodososvaloresobservadosporumaconstantediferentede zero, a varincia resultante vir multiplicada ou dividida, respectivamente, pelo quadradodessaconstante.
CORRECODESHEPPARD: Aocalcularseamdiaeavarinciadaamostraclassificadaatravsdadistribuioempricadas marcas, cometese um certo erro (erro de agrupamento), pois supomos que as observaes agrupadas em cada classe tm todas o valor da respectiva marca. Todavia, existem frmulas correctivas devidas a Sheppard, isto ,na variancia, ao valor calculado deve subtrairse 1/12 ao quadradodaamplitudedasclasses(a)
s2x = s2x' - a2/12 assim,nonossoexemploanterior,avarianciacorrigida
era
s2x =43,7491 - 52 12 s2x =41.666
DESVIOPADRO O desvio padro pode ser definido como a raiz quadrada da varincia, representandose, habitualmente,porsx,isto:
sx = s 2x
Ainda que a varincia nos d uma boa informao sobre a distribuio ou variabilidade dos valores observados em relao sua mdia, apresenta, no entanto, a desvantagem de no se exprimirnamesmaunidadeaqueestoreferidososdadosiniciais.Contudo,estadesvantagem poder ser eliminada se extrairmos a raiz quadrada da varincia. A nova medida chamase desviopadrooudesvioquadrtico. Numaamostraseriada,temos:
sx =
s 2x
ESTATSTICAEBIOESTATSTICA
Exemplo:Calculeodesviopadro,sabendoqueavarinciadeumaamostraseriada2.
sx = s2x = 2 = 1,414
Numaamostraclassificada,temos:
sx = s2x
Exemplo: Calcule o desvio padro, sabendo que a varincia corrigida de uma amostra classificada4327,16.
sx =
s2x
=4327,16 = 65,78
AUTILIZAODASMEDIDASABSOLUTASDEDISPERSO Amplitudetotal Utilizasequando: Osdadosforemmuitorarosoudemasiadodispersosparasejustificaroclculodeuma medidamaisprecisadedisperso; Amplitudeinterquartlica Utilizasequando: Amedianaamedidadetendnciacentralusada; Existirem resultados extremos que poderiam afectar o desvio padro de uma maneira desproporcionada; Adistribuiotruncada; Adistribuioapresentaumaforteassimetria.
48 Margarida Pocinho e Joo Paulo de Figueiredo
Forapenasnecessriooconhecimentodosresultadosextremos; Desejamosumndicemuitorpidodedisperso.
ESTATSTICAEBIOESTATSTICA
Desviomdio Utilizasequando: DesviopadroeVarincia Utilizamsequando: Seprocuraumamedidadedispersoemrelaocomacurvanormal; Tiveremdesercalculadosposteriormentecoeficientesdecorrelaoeoutrasestatsticas; Sedesejarobterumamedidaqueserevistadeummximodeestabilidade; Sesetratasomentededescreverumadistribuioprefereseodesviopadrovarincia. Avarinciaintervmsobretudonaanliseestatstica. Desejamosponderartodososdesviosemrelaomdiadeacordocomasuagrandeza; Osdesviosextremosinfluenciaremindeterminadamenteodesviopadro.
ESTATSTICAEBIOESTATSTICA
Qual a distribuio mais dispersa? Se compararmos os desvios padres a B, porque tem maiordesviopadro.Masavariaode20para600muitomaiordoque10para30.Assim,em vezdecompararmososdesviospadres,aplicamosoutramedidadedispersorelativaqueo coeficientedevariaooudedisperso,quepodeserdefinidopelafrmula
V = sx /x
Exemplo26:Adistribuiodospesosedasalturasdeumgrupodeestudantesdedeterminada Universidadeconduziuaosseguintesresultados: Determineocoeficientededispersoparacadaumadasdistribuiese,depois,indiqueemqual delasadispersorelativamaior. Vx=sx/x=7,5Kg/57,5Kg=0,130=13% Vy=sy/Y=7,1cm/170cm=0,042=4,2% X:Pesos Y:Alturas Mdia=57,5Kg Mdia=170cm DesvioPadro=7,5Kg DesvioPadro=7,1cm
Assim,podemosdizerqueadispersorelativamaisacentuadanadistribuiodospesos(X). Adispersomaiornadistribuioquetivermaiorcoeficientededisperso. Se pretendermos estabelecer comparaes entre disperses absolutas, devemos usar o desvio padro,detalmodoquequantomaiorforodesviopadromaiorseradisperso. Se pretendermos estabelecer comparaes entre disperses relativas, devemos usar um coeficiente de disperso, de tal modo que quanto maior for o coeficiente de disperso V maior seradisperso.
ESTATSTICAEBIOESTATSTICA
Estas no so distribuies normais, apesar de a mdia, a mediana e a moda se encontrarem todas no mesmo ponto ( isto que confere simetria distribuio); a distribuio normal tem sempre a forma de um sino. Como foi descoberta pelo matemtico Gauss, tambm lhe chamamosdistribuiogaussiana. Amaiorpartedosdadosrecolhidoscomorganismosvivostmestepadro.Podemosobservar que, devido forma da curva, h poucos resultados muito baixos e poucos resultados muito eleva. dos (a curva cai nos extremos esquerdo e direito, o que se deve s baixas frequncias encontradas),enquantoamaioriadosresultadosseencontramjuntomdia.Vamosdebruar
51 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
nossobreopadroderesultadosmuitoembreve,masnestafasereferiremosoutracaracterstica muito importante da distribuio normal. Tericamente, a curva nunca toca o eixo horizontal, mas aproximase dele infinitamente. Esta uma propriedade matemtica da distri buio que no se reflecte na recolha de dados real. No nos cruzamos com seres humanos com dimensesgigantescasoumicroscspicas! Entoaspropriedadesdadistribuionormalsoasseguintes: 1)simtrica; 2)Temformadesino; 3) A mdia, a mediana e a moda encontramse no mesmo pontodacurva; 4)Temduaspontasquenuncatocamoeixohorizontal.
Podemos perguntarnos quo rgida a distribuio normal relativamente aos elementos. Por outras palavras, quanto pode uma curva desviarse da forma de sino e continuar a ser consideradanormal?Geralmente,usamosduasabordagensparatomarmosestetipodedeciso; na verdade, este problema mais importante do que o leitor pode pensar, pois existem testes estatsticos,descritosmaisfrente,quespodemrealizarseseoselementosforemnormalmente distribudos. Uma das abordagens baseiase na observao dos dados por averiguao, para lhe darmos um nome mais respeitvel. Se o conjunto de nmeros for extenso, tornarse mais fcil desenhar uma distribuio de frequncias. A outra abordagem reside em seguir um dos procedimentos matemticos para determinar se um conjunto de resultados normalmente distribudo. A verso do teste do quiquadrado que inclumos neste manual um desses procedimentos.Naverdade,improvvelquenestafasedasuacarreiraestatsticanecessitede saber com grande preciso se uma distribuio considerada normal ou no, pelo que o teste grficodevebastar.Noentanto,devesersensvelaoproblema.
ESTATSTICAEBIOESTATSTICA
ESTATSTICAEBIOESTATSTICA
Exemplo: Suponhamos que o professor obtm os resultados de um teste de leitura feito a 200 crianas.Osresultadossonormalmentedistribudoscomumamdiade60eumdesviopadro de 8. A partir das propriedades da distribuio normal, sabemos que cerca de dois teros dos resultados,isto,aquelesqueforamobtidoscomcercade136crianas,encontrarseoentreos 52eos68pontos.Cercade32crianas(16%)teroresultadosabaixode52ecercade32tero resultadosacimade68.Josreferimostodos.Suponhamosentoqueospaisdeumacrianaque obteve 68 gostariam de saber algo acerca do progresso do seu filho. Quando souberam que o resultado da criana estava acima da mdia, ficaram contentes, mas gostariam de saber, posteriormente,quoacimadamdiaseencontra,relativamenteaosoutros50%decrianasque tambmobtiveramresultadosacimadamdia.Poroutraspalavras,ospaispretendemsaber qualaposiorelativadodesempenhodofilho.Seosresultadosestivessemtodosmuitoperto da mdia, sendo a nota mxima 68, os pais continuariam encantados. Ficariam, porm, menos satisfeitos se soubessem que a nota mxima tinha sido 90, com um grande conjunto de notas altas,acimade70.Noentanto,oprofessorsabequeodesviopadrodasnotasfoi8e,porisso, umterodetodososresultadosestavaentre60e68.Sabendoque50%dosresultadosobtidos estavamabaixodamdia,podemosperceberqueaposiodestacrianaestaonvelde84% dosresultados,napartesuperiordetodososresultados.Afinal,ospaistmrazesparaestarem contentes! Se a criana tivesse obtido 76, os pais teriam muito mais razes para estarem orgulhosos, pois saberiam que o seu filho estava acima de 98 % das outras crianas (nota 76 e dois desviospadro acima da mdia);umanota84colocariaomeninonaposioinvejvelde estar acima de 99,87 % das outras crianas por outras palavras, num grupo de 200 crianas,
54 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
estaria, muito provavelmente, no topo. Os desviospadro cortam propores fixas da distribuio normal, a partir da mdia e at ao infinito (pelo menos teoricamente), nas duas direces.Devecertificarsedequepercebeucomoseobtmaposiorelativadanota76(isto, 50%+33%+15%)ecomosecalculaquenestegrupodecrianasexistemoutrasquatrocomnotas acimade76.Vejaseconseguecalcularanotaquecolocariaacriananaposio,menosinvejvel, deestarapenasaquatrolugaresdofim. Aresposta44.Paraobtermosestanotanecessitamosdesaberquenotarepresentadoisdesvios padro abaixo da mdia ou que nota corresponde a 2%. Partindo de 60, a mdia, se lhe subtrairmos o valor de dois desviospadro 16, duas vezes o valor de 8, que um desvio padroobteremos44.Devemostercuidadoenomisturarosvaloresdosdesviospadrocom os resultados reais. Neste exemplo no subtramos o valor 2 da mdia de 60, apesar de querermos oresultadoqueestavadoisdesviospadroabaixodele.Subtramos16pontos,pois esteonmeroquecorrespondeadoisdesviospadroparaesteconjuntoderesultados. Resultados z Nos exemplos considerados os resultados encontravamse sempre na mdia, ou exactamenteum,doisoutrsdesviospadroacimaouabaixodela.Temos,porm,deexaminar resultados que no sejam to facilmente convertveis para desviospadro. Suponhamos, por exemplo,queumacrianacompaisansiososobteveumanota64numtestedeleitura.Aposio dacriananacurvaseriaametadedadistncia,noeixohorizontal,entreoresultadodamdia (60)eumdesviopadroacima(68).
ESTATSTICAEBIOESTATSTICA
A posio da criana exactamente a meio entre os pontos 60 e 68. Significar isto que a sua posionogrupoopontocentralentreamdiade50%e84%danota68?Isto,encontrarse acrianaacimade67%doscolegas?Olhemoscuidadosamenteparaasduasporesdacurva que est dividida pela linha ao nvel da nota 64. Sero simtricas? No e aqui temos um problemaquetornaoclculodeumaposiorelativamuitomaiscomplicadoecansativodoque gostaramos. Quanto mais nos afastamos da mdia, menos resultados correspondem s diferentes propores. Assim, se tivermos duas pores entre 60 e 64 e entre 64 e 68, haver menos resultados neste ltimo intervalo. Haver ainda menos no intervalo sguinte, entre as notas 68 e 72, e assim sucessivamente. Isto tambm verdadeiro para os resultados abaixo da mdia,mas,nestecaso,soosresultadosmaiselevados,enoosmaisbaixos,queseencontram maispertodamdia.Hmuitomenosresultadosentre44e48doqueentre48e52,apesarde, em ambos os casos, a variao de notas ser de 4 pontos, ou seja, meio desviopadro. Quando olhamosparaaformadeumadistribuionormal,otamanhodiferentedasproporesquecada desviopadro compreende parece bvio. No entanto, o problema de decidir a posio relativa de uma nota 64, quando comparada com os resultados, no desapareceu. Como podemos determinla? A resposta dada atravs de resultados z. Os resultados z correspondem a desviospadroe,naverdade,sovirtualmenteamesmacoisa,exceptonofactodeumresultado zsereferirsempreposiodeumpontoemrelaoamdia.Istovaitornarseclaroembreve. Paraj,pensemosqueumresultadozde1amesmacoisaqueumdesviopadrode1,queum resultado z de 2 e um dp 2, e assim por diante. Como no h, virtualmente, nada numa distribuionormaldepoisdoterceirodesviopadroouresultadozemqualquerdasdireces ,r,aroqueosdesviospadroouosresultadoszincluamovalor4.Ecomumreferirmonosaos resultadoszcomomaisoumenos;aosdesviospadrodescrevemoloscomosituandoseacima ouabaixodamdia,emvezdemaisoumenos.Umdesviopadrotemumvalordefinidono varivel, enquanto um resultado z se refere a uma posio relativa na curva e referido em funo da mdia. Como, at agora, um resultado z tem o mesmo significado que um desvio padroacimadamdia,podemosconsiderarqueosresultadoszeosdesviospadrosoiguais. No entanto, um desviopadro pode referirse a um conjunto de resultados que distem um desviopadro de qualquer ponto da curva, enquanto os resultados z tm posies fixas. Um resultado z de + 1 corresponde exactamente a um desviopadro acima da mdia, e no a qualquer conjunto de resultados que constituam um desviopadro. Voltemos ao problema do resultadode64esuaposiorelativa.Sabemosqueasuaposioexactamentemetadedeum desviopadroacimadamdia,peloquelhedamosumresultadozde+0,5.
ESTATSTICAEBIOESTATSTICA
H tabelas que nos permitem ver muito facilmente onde os resultados z se situam na curva normal(AnexoVIII).Vejamoscomoutilizlas.Utilizaremosonossoexemplode64,cujovalorz +0,5. Lemos o valor na primeira coluna da esquerda, encabeada por z, at chegarmos ao valor 0,5. Olhamos para a coluna direita e vemos o nmero 19,15. Temos de somar 50%, de modo a obtermos o valor 69,15. Sabemos ento que h 69,15% dos resultados abaixo de 64 e 30,85% acima. Devemos arredondar os valores para 69% e 31%, respectivamente. Consideremos outro exemplo,destavezcomovalor65.Estevalorest5pontosacimadamdiaeodesviopadro paraoconjuntode8.Umresultadode5pontosacimadamdia5/8dedesviopadroacima damdia.Sefizermosascontas,sabemosquez+0,63.Comoseencontraacimadamdia,oseu valor positivo. Voltemos tabela 51. Como z tem, desta vez, duas casas decimais, os procedimentos vo ser um pouco diferentes. O valor imediatamente direita (22,7) a percentagemcorrectaparaumresultadozde0,6.Noentanto,onossoresultado0,63,peloque temosdeandartrscolunasdatabelaataovalor0,03,notopo.Estevalor,somadoaovalor0,6, dnos o z de 0,63 ou seja, 23,57. Como o nosso z positivo, devemos somarlhe 50% para obtermos o valor final de 73,57. Assim, a nota 65 est frente de 74% da escala. Podemos ver pelatabelaque49%detodasasnotasemcadaumdosladosdacurvaestoincludasnumzde 2,33ouumbocadinhomaisabaixo,parasermosmaisprecisos).Notemosque,matematicamente, ascaudasdacurvanuncatocamoeixohorizontal,nemincluemtodososresultadospossveis. Reparemosagoranaposiorelativadeumapessoaqueobtenhaumresultadoabaixodamdia, digamosumanota41naamostraoriginal.Estanotaest19pontosabaixodamdia,apenasum poucomenosdoquedoisdesviospadro.Parasermosprecisos,est19/8ou2,375abaixo.Oseu zser2,375.NatabelaSIiemanexovemosqueumzde+2,3inclui48,93%dosresultados,mas onossoresultadozovalorumpoucosuperiorde2,375.Anossatabelaspodeserusadacom duascasasdecimais,peloquevamosarredondarestevalorpara2,38.Paramos,destavez,junto dacolunade0,08eobtemosovalor49,13.Assim,umzde+2,38inclui50%+49,13%=99,13%de todososresultados.Atagoratudobem,masoproblemaqueonossovaloreranegativo.Basta virarmosanossacurvaaocontrrioetrabalharmoscomasuaimagemaoespelho.Assim,como nosso valor 2,38 sabemos que 99,13% de todas as notas da distribuio esto acima dele e apenas0,87%abaixo.Seconsiderarmosestapequenaproporode1%,devemosesperarque,na nossaamostrade200indivduos,1%,ouseja,doisindivduostenhamnotasinferioresa41.No
57 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Seodesvioemrelaomdiativerumsinalpositivoounegativo,seestiveracimaouabaixoda mdia,respectivamente,zficarcomosinalcorrecto. Nota: : tenha cuidado quando trabalhar com z e dp, de modo a uslos sempre que os dados atravs dos quais foram obtidos sigam uma distribuio normalOuaproximadamentenormal. Deoutromodo,arranjarconfuses
ESTATSTICAEBIOESTATSTICA
ESTATSTICAEBIOESTATSTICA
PODERDEUMTESTE OpoderdeumtesteaprobabilidadederejeitarmosaH0quandoelarealmentenula Os testes mais poderosos (os que tm maior probabilidade) de rejeio de H0, so testes que possuemprrequisitosmaisdifceisdesatisfazer(testesparamtricoscomoteF). As alternativas no paramtricas exigem muito menos prrequisitos mas produzem testes de significnciacommenospoderqueoscorrespondentesparamtricos. EMCONSEQUNCIA Ao rejeitarse a H0 sem preencher as exigncias mnimas dos testes paramtricos, mais provvelqueessarejeiosejafalsa(serejeitaraH0quandoelaverdadeiracometeumerrode tipoI;seaceitaraH0quandoelafalsacometeumerrodetipoII).Quandoosrequisitosdeum testeparamtricosoviolados,tornaseimpossvelconheceroseupodereasuadimenso() obvioqueosinvestigadoresquerem,atodoocusto,rejeitaraH0quandoelamesmofalsa, evitandoumerrodetipoI. Otesteidealseriaaqueleque=0e=1,oqueimplicariaqueotesteconduziriasempredeciso correcta,contudoestetesteidealraramenteexiste. Aprobabilidadedoerrode1espciedeveserreduzida,fixandotericoem0,1;0,05ou0,01.o valor fixado para depende da importncia que se d ao facto de rejeitar a H0 quando esta verdadeira. Umailustraodestepontodevistapodeserfeitacomoseguinteexemplo: Umapessoainocenteatprovadocontrrio H0:Apessoainocente H1:Apessoaculpada
ErroI:Apessoacondenadamasestinocente ErroII:Apessoaabsolvidamasculpada
ESTATSTICAEBIOESTATSTICA
Naturalmente a justia procura reduzir a possibilidade de ocorrer o erro de 1 espcie, pois entendesequemaisgravecondenarinocentesqueabsolvercriminosos. Para certos sistemas judiciais um = 0,1 demasiado elevado, optando por =0,01; noutros sistemasjudiciaispodeadmitirque=0,05umvalorrazovel.
ASSIM Fixada a probabilidade do erro de tipo I (dimensodoteste),otestemaispotenteaqueleem que a escolha da regio critica minimiza a probabilidade do erro de 2 espcie. Dizse tambm queestaregiocriticaamaispotente. Facilmenteseconcluiqueotestemaispotenteaqueleque,umavezfixadaaprobabilidadede rejeitar a H0, quando ela verdadeira, maximiza a potncia ou a capacidade para rejeitar a mesmahiptesequandoestafalsa. PRESSUPOSTOS Para saber se uma varivel simtrica dividimos o coeficiente assimetria (Skewness) pelo erro padroeseoresultadoestiverentre2e2adistribuiosimtrica. Parasaberseumavarivelmesocurticadividimosocoeficientedeachatamento(Kurtosis)pelo erropadroeseoresultadoestiverentre2e2adistribuiomesocurtica. Mas se os resultados de um teste paramtrico, no cumpriram com os requisitos (no mnimo dados intervalares; distribuio simtrica, mesocurtica e normal), ento no tm interpretao significativa. Quando acontecem estes factos, a maioria dos investigadores opta por testes de significncia noparamtricos.
ESTATSTICAEBIOESTATSTICA
INTERSUJEITOSOUDESIGNNORELACIONADO estetipodedesignutilizadoquandoumindivduoouobjectoavaliadoapenasumavez.A comparao efectuado entre os grupos de sujeitos/ objectos cujos resultados so no relacionados. Desvantagem: conjunto das diferenas individuais na forma como os sujeitos reagem ou respondemtarefa. INTRASUJEITOSOUDESIGNRELACIONADO Acomparaofeitaentreosmesmossujeitos(sujeitosdomesmogrupo). Aimportnciadestesdesignsaeliminaodequaisquerparticularidadesindividuais,umavez queficamigualizadasemtodasassituaes. Desvantagem:Efeitodememriaeaprendizagem. AMOSTRASEMPARELHADAS Igualizamsesujeitosdiferentesmasemparelhados,emtermosdeidade,sexo,profissoeoutras caractersticasgeraisqueparecemimportantesparacadapesquisaemparticular. estes tipos de designs podem ser considerados de designs relacionados, uma vez que controladonassuascaractersticasrelevantes. Desvantagem: Dificuldade em encontrar sujeitos que permitam o emparelhamento de todas as caractersticasrelevantes. Dificuldadesarranjargrandesamostras.
ESTATSTICAEBIOESTATSTICA
QUANDOUTILIZAR
Utilizasequandoosdadossonominais,peloqueemvezdesemediremresultadosdossujeitos apenassepodemdistribuirossujeitosporumaoumaiscategorias. OQuiQuadrado(X2)testaahipteseexperimentalqueprevquantossujeitosdecadagruposo distribudosporumadeterminadacategoria. OX2umtesteestatsticonoparamtrico,sendoumdosmaisutilizadosebastanteaplicadoem diferentes planeamentos experimentais. O X2 muito usado mesmo ao nvel da estatstica multivariada(nosentidodeobterograudeadernciaentreomodeloobtidoeoterico).
OBJECTIVO
Oobjectivocompararfrequnciasobservadascomfrequnciastericasouesperadas,ouseja, verificaroseugraudeaproximao,quepodesergrande(=0)oupequeno(>0).
63 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Assim,oobjectivocompararasfrequnciasobservadasemcadaumadasclulasdeumatabela de contingncia com as diferenas esperadas. O teste compara o nmero de sujeitos que se distribuem por uma determinada categoria com o nmero de sujeitos que se esperaria se distribussemporessamesmacategoria,casonoexistissemdiferenas. OtestedoX2reflecteotamanhodasdiferenasentreasfrequnciasobservadaseesperadas.Para sersignificativo,ovalordeX2deverserigualousuperioraosvalorescrticosdatabela(Anexo I). INSTRUESPASSOAPASSO 1. Calcular as frequncias esperadas (E) para cada clula, multiplicando os dois totais parciais relevantesparacadaumaedividindopelonmerototaldesujeitos. 2.CalcularX2:
(O-E)2
X2 =
______________
3.Calcularosgrausdeliberdade:
g.l. = (r-1) (c-1)
ESTATSTICAEBIOESTATSTICA
A C A+C
B D B+D
A+B C+D N
Quandoumatabelatemmaisdeduasentradas: g.l.=(nmerodecolunas1)(nmerodelinhas1)
X2 = (total de linha) (total de coluna) (total geral)
Exemplo:Suponhaquequerestudarseosestudantesdecinciassociaisutilizamummtodode estudo significativamente diferente daquele que utilizado pelos estudantes de tecnologia. Escolheramsedoisgrupos,umcompostopor50estudantesdecinciassociaiseooutropor50 estudantes de tecnologia. Enviouse um questionrio aos 100 estudantes pedindolhes que indicassememqualdasseguintescategoriasmelhorseenquadraoseumtododeestudo:estudo dirioregular,estudoirregularemperodosconcentradosdetrabalhointensivoouumamistura dosdois.Foramrecebidas44respostasdosestudantesdecinciassociaise42dosestudantesde tecnologia.Colocouseahipoteseexperimental(H1)dequeotipodeestudodependiadocurso frequentado Os resultados so apresentados na forma de uma tabela 2X3, designada por tabela de contingncia(crosstab).Asclulasquerepresentamcadaumadascategoriassonumeradasde 1a6.
Quadro 12: Tabela de Contingncia (Crosstab)
Irregular
3
Misto
23 E=24,05
ESTATSTICAEBIOESTATSTICA
Resoluo49: InstruesPassoaPasso:
2.Aplicarafrmula:
(O-E)2
X2 =
________________
E X2 = (6-8,19)2 + (15-11,77)2 + (23-24,05)2 + (10-7,81)2 + (8-11,23)2 + (24-22,95)2 8,19 11,77 24,05 7,81 11,23 22,95 X2 = 0,59 + 0,89 + 0,05 + 0,61 + 0,93 + 0,05 = 3,12
3.Calcularosgrausdeliberdade(gl)
g.l. = (r - 1) (c - 1) = (2 -1) (3 - 1) = 2 4. Consultar a tabela (Anexo I)
Para
p=0,05 e gl=2 x2 critico=5,99
Concluses:DadoqueovalorobservadodeX2apenasde3,12,ouseja,inferioraovalorcrtico de5,99parap<0,05,oresultadodaexperincianosignificativo.Aceitasehiptesenulade que os padres de estudo dos estudantes de cincias sociais e de tecnologia no diferem, rejeitandosedestaformaanossahipoteseexperimental(H1).
ESTATSTICAEBIOESTATSTICA
Exemplo:ordenarumgrupoemfunodon.defactoresderisco:
Quadro 13: Ordenao de um grupo em funo do n. de factores de Risco
N. de Factores de risco 6 3 12 4 7 5 8
Ordem
4 1 7 2 5 3 6
Noscasosemqueexistemresultadosiguaisutilizaseadoslugaresquedeviaocupar.
ESTATSTICAEBIOESTATSTICA
Exemplo:
N. de FR.
1 2 1 4 1 3 4 6 5
Ordem
2 4 2 6,5 2 5 6,5 9 8
Ordenamento de diferenas entre resultados (designs relacionados para os mesmos sujeitos ou emparelhados): 1. Em geral, a atribuio de ordens s diferenas entre resultados efectuase tal como fizemosparaosresultados,sendoatribudaaordemmaisbaixamenordiferenae poraadiante; 2. Diferenasidnticasentreresultadossoordenadasdamesmaformaqueresultados idnticos,atribuindoseumaordemmdiaresultantedaglobalidadedeordensque essasdiferenasdeveriamocupar; 3. Resultadosnulosde0socontadoscomooresultadomaisbaixopossvelquandose calculamdiferenasentreresultados; 4. Contudo, quando existe igualdade entre resultados que originem uma diferena nula entre as situaes experimentais, estes no so ordenados, sendo retirados da anlise; 5. Diferenaspositivasenegativassoordenadasemconjuntocomosesetratassede umordenamentosimplesderesultados,ignorandoossinaispositivosenegativos.
ESTATSTICAEBIOESTATSTICA
Exemplo: Suponha que quer ordenar as diferenas entre o nmero de frases correctas que um grupo de crianas com suspeita de perda auditiva produziu antes da colocao de um aparelhoauditivoeapsacolocaodaquele.
Quadro 14: Ordenao para Amostras Relacionadas ou Emparelhadas
Sujeitos 1 2 3 4 5 6 7 8 9 10 N de frases correctas antes do aparelho auditivo 5 5 2 1 4 2 1 4 1 1 N de frases correctas depois do aparelho auditivo 6 7 3 5 5 5 5 4 7 6 diferenas 1 2 1 4 1 3 4 0 6 5 ordem 2 4 2 6,5 2 5 6,5 9 8
Ao contrrio do que acontece nos casos das amostras relacionadas quando a diferena entre 2 situaes nula nas amostras relacionas a este tipo de resultado no atribuda nenhuma ordem, sendo que o resultado nem sequer considerado na anlise. No ordenamento de resultados negativos em amostras relacionadas ignoramse os sinais quando se ordenam os resultados.
relacionados/emparelhadosougruposindependentes.Nocasodeduasamostrasindependentes determinamos se as diferenas nas amostras constituem uma evidncia convincente de uma diferenanosprocessosdetratamentoaelasaplicados. Conquanto o uso de duas amostras relacionadas em projectos de pesquisa tenha mritos indiscutveis, a sua aplicao, em geral, no prtica. Frequentemente, a natureza da varivel dependente impede a utilizao dos indivduos como seus prprios controlos, tal como ocorre quandoavariveldependenteosuicidiotentado;umproblemaquepodeacontecerumanica vez. Pode ser tambm impossvel delinear um projecto que utilize pares de dados, talvez por
69 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
desconhecimento,porpartedoinvestigador,devariveisteisquepossamformarpares,oupela impossibilidade de obter mensuraes adequadas de alguma varivel de reconhecida importnciaou,enfim,porquesimplesmentenosedispedeparesadequados. Quandoautilizaodeduasamostrasrelacionadasnoprticaouadequada,podemosutilizar duasamostrasindependentes.Emtaisprojectos,asduasamostraspodemserobtidasporumde doismtodos: a) Podemserextradasaleatoriamentededuaspopulaes; b) Podemdecorrerdaatribuioaleatriadedoistratamentosaosmembrosde umaamostradeorigemarbitrria. Nota:Emnenhumdestescasosseexigequeasamostrastenhamomesmotamanho.
O teste U de MannWhitney deve ser utilizado em designs com duas situaes, no relacionados, quando so utilizados sujeitos diferentes em cada uma das situaes experimentais.
ESTATSTICAEBIOESTATSTICA
Exemplo:Suponhaquequerinvestigaron.dequeixasdolorosasduranteumtratamentoa ummesmoproblemateraputico(controladaagravidadeeaextensodaleso)emquese utilizaram duas tcnicas diferentes. A hipotese experimental supe que durante a utilizaodatcnicaBqueodoenteseapresentamaisqueixoso.
Quadro 15: Resultados do registo das queixas
A 3 4 2 6 2 5 22 3,67
B 9 7 5 10 6 8 45 7,5
RACIONAL OracionalqueestportrsdotesteUdeMannWhitneybastantesemelhanteaodoteste deWilcoxon.Adiferenafundamentalentreasduasresidenofactodosegundoseaplicara designs relacionados e o U se aplicar a designs norelacionados, utilizando, portanto, sujeitos diferentes. O teste de Wilcoxon analisa as diferenas entre a performance dos mesmos sujeitos (ou pares de sujeitos emparelhados) submetidos a duas situaes experimentais. Com um design norelacionado no temos uma base que nos permita comparardiferenasentreparesderesultados.Assim,otesteUdeMannWhitneyordenaos resultadosdetodosossujeitosemambasassituaescomosefossemapenasumconjunto simplesderesultados. Se as diferenas entre as situaes forem aleatrias, como postulado pela hiptese nula, entoosresultadosdevemseraproximadamenteosmesmose,consequentemente,asordens devem ser tambm aproximadamente as mesmas para as duas situaes. Se houver uma preponderncia de ordens altas ou baixas numa situao ou na outra, ento porque a diferenanototaldosresultadosordenadosparacadasituaodevidaaosefeitosprevistos da varivel independente e no ao acaso. Se a soma total das ordens for muito baixa para uma das situaes, ento ter de haver uma preponderncia de ordens elevadas na outra situao. Quanto menor for U mais significativas sero as diferenas entre as ordens das duas situaes.
71 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Seleccioneomaiortotaldasordens.
T2=55
CalculeovalordeUatravsdafrmula
U = n1.n2 + Nx (nx + 1) __________________ 2 - Tx
emque:
ClculodeU
6x7 U=6x6+
_______________
Nx=nmerodesujeitosdogrupocomomaiortotaldeordens
- 55 = 36+21-55=2
Quando existe o mesmo nmero de sujeitos em cada situao rapidamente se torna mais fcil verificar qual o maior total de ordens. Normalmente, prefervel ter um nmero idntico de sujeitosemcadagrupo;noentanto,setiverdeutilizarumnmerodesigualdesujeitosemcada grupo,poderfazlo.Emcasodedvida,calculeUparaambasasordenstotais,seleccionando onapropriadoacadacasoe,depois,considereoUmaispequeno.
ESTATSTICAEBIOESTATSTICA
ESTATSTICAEBIOESTATSTICA
ESTATSTICAEBIOESTATSTICA
Preferencia aps 30 dias de exercicio Escadas Preferncia antes da teraputica Elevador Escadas 4 4 (A) (C) Elevador 14 3 (B) (D)
HIPTESE DE NULA:
H0: Para os obesos que modificaram a sua atitude, a probabilidade de mudar o percurso do elevador para as escadas (PA) igual probabilidade de mudar de mudar das escadas para o elevador(PD)eambassoiguaisa.Isto, H0:PA=PD=1/2 H1:PA>PD
ESTATSTICAEBIOESTATSTICA
PROVA ESTATSTICA:
Utilizase a prova de McNemar para significncia de mudanas, porque o estudo utiliza duas amostras relacionadas, do tipo antesedepois e utiliza a escala de medida nominal (classificativa). Nveldesignificncia: p=0,05 Distribuioamostral: AdistribuioQuiquadradocom1graudeliberdadedumaboaaproximaodadistribuio amostraldeQuiquadrado,talcomocalculadapelafrmula. RegiodeRejeio: ComoH1especificaosentidodadiferenaprevista,aregioderejeiounilateral.Consistede todos os valores de Quiquadrado que so to grandes que acusem uma probabilidade unilateral,associadasuaocorrnciasobH0nosuperiora0,05. Deciso: Estamosinteressadosnosobesoscujocomportamentoacusaalterao:representadosnasclulas AeD. Paraosdados,temos:
(A-D - 1)2 X2 =
_________________________
N=25
(4-3 - 1)2 =
__________________
(1 - 1)2 =
___________________
0 =
__________
=0
A+D
4+3
Sendo0valorobservadodex2=0,devemosconsultaratabela(AnexoI)paraobterovalorcritico, no esquecendo que temos uma amostra unicaudal a um nivel de 0,05. consultando a tabela observamosumx2criticode5,41.
Racional Paracompararasignificnciadequalquermudanaobservada,porestemtodo,constriseuma tabela de frequncias de 4 casas para representar o 1 e o 2 conjunto de reaces dos mesmos
ESTATSTICAEBIOESTATSTICA
indivduos. As caractersticas gerais desta tabela so as que se apresentam a seguir, em que se utilizamossinais+eparaindicardiferentesreaces.
ANTES
DEPOIS + A C + B D
Notesequeoscasosqueacusammodificaesentrea1ea2reacoaparecemnasclulasAe D.UmindivduolocalizadonaclulaAsepassoude+paraenaclulaDsepassoude para+.Naausnciademodificao,oindivduoclassificadonaclulaB(reaco+antes edepois)ounaclulaC(reacoantesedepois). Como A e D representa o nmero total de indivduos que acusam modificao, a perspectiva, sobahiptesedenulidade,seriaque(A+D)acusassemmodificaesnumsentidoe(A+D) acusassemmodificaesnoutrosentido.Ouseja,(A+D)afrequnciaesperada,sobH0,tanto naclulaAcomonaclulaD. NaprovadeMcNemardesignificnciademudana,estamosinteressadosapenasnasclulasA e D. Portanto, A=nmero de casos observados na clula A, D=nmero de casos observados na clulaDe(A+D)=nmeroesperadodecasostantonasclulasAcomoD,ento
(A-D)2 X2 =
_____________
A+D
comgrausdeliberdade=1
ESTATSTICAEBIOESTATSTICA
(A-D - 1)2 X2 =
_______________________
A+D
Mediante referncia Tabela (Anexo I), determinar a probabilidade, sob H0, associado a um valortograndequantoovalorobservadodeX2.Sesetratadeumaprovaunilateral,dividirpor
ESTATSTICAEBIOESTATSTICA
2 o valor da probabilidade exibido na Tabela. Se o valor de p, dado pela Tabela para o valor observadodeX2comgl=1,nosuperap,rejeitaseH0emfavordeH1.
Quadro 18: Resultados do teste do vocabulrio Ordem das Par de sujeitos Situao A (com aparelho) Situao B d (A-B) (sem aparelho) positivas negativas Ordem de d diferenas diferenas Ordem das
1 2 3 4 5 6 7 8 9 10 TOTAL MDIA
3 4 3 1 5 2 3 4 1 3 29 2,9
5 5 2 5 4 5 5 4 5 5 45 4,5
-2 -1 +1 -4 +1 -3 -2 0 -4 -2
5 2 2 8,5 2 7 5 8,5 5 41
ESTATSTICAEBIOESTATSTICA
RACIONAL
OobjectivodotestedossinaisdeWilcoxoncompararasperformancesdecadasujeito(oupares de sujeitos) no sentido de verificar se existem diferenas significativas entre os seus resultados nasduassituaes.OsresultadosdaSituaoBsosubtradosdosdaSituaoAediferena resultante (d) atribudo o sinal mais (+) ou, caso seja negativa, o sinal menos (). Estas diferenassoordenadasemfunodasuagrandeza(independentementedosinalpositivoou negativo).Oordenamentoassimobtidodepoisapresentadoseparadamenteparaosresultados positivos e negativos. O menor dos valores deste segundo, dlhe o valor de uma estatstica designadaporW,quepodeserconsultadanaTabeladesignificnciaapropriada. Aideiaqueseexistiremapenasdiferenasaleatrias,talcomopostuladopelahiptesenula, ento haver aproximadamente o mesmo nmero de ordens elevadas e de ordens inferiores tantoparaasdiferenaspositivascomonegativas.Seseverificarumaprepondernciadebaixos resultados para um dos lados, isso significa a existncia de muitos resultados elevados para o outrolado,indicandoumadiferenaemfavordeumadassituaes,superiorquiloqueseriade esperarseosresultadossedevessemaoacaso.DadoqueaestatsticaWreflecteomenortotalde ordens, quanto menor for o W mais significativas sero as diferenas nas ordenaes entre as duassituaes.
ESTATSTICAEBIOESTATSTICA
4.
5.
ConteonmerodeparesdesujeitosN(noconsidereasigualdades). N=101=9
ESTATSTICAEBIOESTATSTICA
ESTATSTICAEBIOESTATSTICA
Quando n > 5 por grupo de respondentes, a significncia de H pode ser determinada por recorrncia Tabela do Quiquadrado (Anexo I). Para testar diferenas entre amostras de tamanhoinferiora6,deverecorreratabelasespeciais(AnexoIV).
QUANDO UTILIZAR
EstetestepodeserconsideradoumaextensodotesteUdeMannWhitneyquandonecessitamos de utilizar trs ou mais situaes. Deve ser utilizado em designs norelacionados quando sujeitosdiferentessodistribudosportrsoumaissituaes.
Exemplo:Suponhaqueestamosinteressadosemdescobrirseexistemdiferenasnoacessoa uma pgina da internet em funo da caracteristica: muito ilustrada, com algumas ilustraes e, sem ilustraes. Alocmos trs pginas na internet com o mesmo assunto e titulo durante 4 meses. A seguir verificmos o nmero de vezes que formam acedidas durantequatrosbadosseguidos.Osresultadosforam.
Quadro 19: Nmero de ideias relembradas para trs tipos de testes Sujeitos do grupo 1 (pgina muito ilustrada) Sujeitos do grupo 2 (pgina com algumas ilustraes) Sujeitos do grupo 3 (Pgina sem ilustraes)
1 2 3 4
Resul 19 21 17 16 73 18,25
Ordem 10 11 9 8 38
Resul 14 15 9 38 12,67
Ordem 6 7 1 14
Result. 12 12 13 10 47 11,75
RACIONAL
Este teste pretende determinar se os resultados so significativamente diferentes para trs ou mais grupos. Uma vez que todos os resultados foram, em principio, obtidos por sujeitos diferentes a nica forma de verificarmos as diferenas entre as situaes ordenlas em conjunto, como se se tratassem apenas de um conjunto de resultados, tal como havamos efectuado no teste U de MannWhitney. Isto acontece porque, no temos uma base para compararresultadosdosmesmossujeitosoudesujeitosemparelhadosemdiferentessituaes, comocomotesteUdeMannWhitneyparadesignsrelacionados. Este ordenamento global, quando posteriormente adicionamos as ordens de cada coluna em separado,permitenosobterototaldasordensparacadasituao.Seexistiremapenasdiferenas aleatriasentreassituaes,comopostuladonahiptesenula,deesperarqueordensaltase
ESTATSTICAEBIOESTATSTICA
baixassedistribuamdeformaaproximadamenteequivalentepelasdiferentessituaes.Mas,se pelocontrrio,houverumaprepondernciadealtosoubaixosresultadosemqualquerumadas situaes, provvel que tal facto reflicta diferenas significativas devidas varivel independente. OvalordasdiferenasentreostotaisdasordensdadopelaestatsticadesignadaporH.Desde queahipteseexperimentalprevejaaexistnciadediferenassignificativasentreassituaes,o valor que obtivermos de H dever ser igual ou superior ao valor crtico da Tabela, para que possaserconsideradosignificativo.
H
em que: N=nmerototaldesujeitos
N=11 n1=4;n2=3;n3=4
nc=nmerodesujeitosemcadagrupo
Tc2=totaldasordensparacadasituao,cadaumelevadoaoquadrado T12=382;T22=142;T32=142
ESTATSTICAEBIOESTATSTICA
12
- 3 (11 + 1)
- 3 x 12
ESTATSTICAEBIOESTATSTICA
valorqueobtivemosH=7,26superioraovalorcrticode5,99parap<=0,05,peloquepodemos aceitar que o resultado significativo a este nvel. Dar conta que esta probabilidade menos significativa de que quando utilizamos a Tabela anterior. Isso acontece porque essa Tabela especialmenteconcebidaparanosdarasprobabilidadescomumpequenonmerodesujeitose desituaes. Notar tambm que o teste de KruskalWallis apenas lhe pode dizer que existem diferenas globais nos resultados entre as situaes experimentais. Na tabela apresentada parece existir uma tendncia para consultar pginas com mais ilustraes do que sem ilustraes. Mas para podertestarseessatendnciarealmenteexiste,terdeutilizarumtestedetendncia.
ESTATSTICAEBIOESTATSTICA
ESTATSTICAEBIOESTATSTICA
Quandoutilizar: A prova de McNemar para duas amostras pode ser estendida para aplicao a pesquisas que envolvem mais de duas amostras. Essa extenso, que constitui a prova Q de Cochran para K amostras relacionadas, proporciona um mtodo para comparar se trs ou mais conjuntos correspondentes de frequncias ou propores diferem entre si significativamente. A correspondncia pode basearse em caractersticas relevantes dos diferentes indivduos ou no facto de os mesmos indivduos serem observados sob condies diferentes. A prova Q de Cochranadaptaseespecialmenteaocasoemqueosdadosseapresentamnumaescalanominal ousobaformadeinformaoordinaldicotomizada. Exemplo: Suponha que estamos interessados em saber se a atitude de um entrevistador influencia a aceitao de participao num estudo por inqurito. Poderemos treinar o entrevistadorparaefectuarassuasentrevistasdetrsmaneirasdiferentes: 1. 2. 3. Demonstrandointeresse,cordialidade,entusiasmo; Demonstrandoformalismo,reservaecortesia; Demonstrandomodoabrupto,formalismoeaspereza.
ESTATSTICAEBIOESTATSTICA
Exemplo: O entrevistador visitaria3gruposde18casas,aplicandootipo1deentrevistaa umgrupo,otipo2aoutrogrupoeo3aoterceirogrupo.Teramos,assim,18conjuntosde potenciais inquiridos com trs deles correspondendo em cada conjunto. Em cada conjunto atribuirseam aleatoriamente aos trs membros as trs condies (tipos de entrevista). Teramos, ento, 3 amostras relacionadas (correspondentes) com 18 elementos cada uma (N=18).Poderamos,pois,comprovarseasdiferenasfundamentaisnostiposdeentrevista influenciariam o nmero de respostas afirmativas sim dadas para aceitao de participaopelos3gruposdecorrespondentes.
Quadro 20: Q de Cochran
Conjunto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Resposta entrevista 1 1 2 1 1 2 2 2 1 2 1 2 2 2 2 2 2 2 2
Resposta entrevista 2 1 2 2 1 1 2 2 2 1 1 2 2 2 2 2 2 2 2
Resposta entrevista 3 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 2 1 1
RespostasSim(1)eNo(2)dadaspordonasdecasaatrstiposdeentrevistas
HIPTESE NULA:
AprobabilidadedeumSimamesmaparaostrsgruposdeentrevistas. H1:AsprobabilidadesdeumSimdiferemconformeotipodeentrevista.
PROVA ESTATSTICA:
Escolhese a prova Q de Cochran, porque os dados se referem a mais de dois grupos relacionados(K=3)eapresentamsedicotomizadossobaformaSimeNo.
ESTATSTICAEBIOESTATSTICA
DISTRIBUIO AMOSTRAL:
Sobahiptesedenulidade,QtemumadistribuioaproximadamenteQuiquadradocomgl=1. Isto,aprobabilidadeassociadaocorrncia,sobHo,dequalquervalortograndequantoum valorobservadodeQpodeserdeterminadamedianterefernciaTabela.
REGIO DE REJEIO:
Consiste em todos os valores de Q to grandes quanto a probabilidade associada sua ocorrncia,sobHo,nosejasuperiorap=0,01.
DECISO:
RecodificmosSimpor1eNopor0.
Quadro 21: Q de Cochran
Conjunto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Total
Resposta entrevista 1 0 1 0 0 1 1 1 0 1 0 1 1 1 1 1 1 1 1
G1=13
Resposta entrevista 2 0 1 1 0 0 1 1 1 0 0 1 1 1 1 1 1 1 1
G2=13
Resposta entrevista 3 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 1 0 0
G3=3
Li 0 2 1 0 1 2 2 1 1 0 3 3 2 2 2 3 2 2
Li2 0 4 1 0 1 4 4 1 1 0 9 9 4 4 4 9 4 4
Li=29 Li263
ESTATSTICAEBIOESTATSTICA
Substituindoestesvaloresnafrmula,vem:
(K-1) Q=
[K Gj
( Gj)2
]
=
(3-1)
[ 3X (13
]
= 16,7
_____________________________________________
______________________________________________________
K Li - Li2
3X29 - 63
Emque
K=n.degrupos Gj=n.totaldesucessos
RACIONAL
Se os dados de uma pesquisa se dispem numa tabela de dupla entrada com N linhas e K colunas,possveltestarahiptesedenulidadedequeaproporooufrequnciaderespostas dedeterminadotiposejaamesmaemcadacoluna,exceptuandoasdiferenasdevidasaoacaso. Cochran mostrou que se a hiptese de nulidade verdadeira, isto , se no h diferena na probabilidade, digamos de Sucesso sob cada condio (o que equivale a dizer que os Sucessos ou Fracassos se distribuem aleatoriamente pelas linhas e colunas da tabela de duplaentrada),ento,seonmerodelinhasmuitopequeno
K(K-1) Q=
(Gj - G)2
__________________________________________
K Li - Li2
temdistribuioaproximadamenteQuiquadradocomgl=K1,emque: Gj=nmerototaldeSucessosnacolunaj
__
G=mdiadosGj Li=nmerototaldesucessosnalinhai
ESTATSTICAEBIOESTATSTICA
Umaexpressoequivalentefrmulaanterior,efacilmentededutveldela,masquesimplificaos clculos:
(K-1) Q=
[K Gj ( Gj) ]
2 2
__________________________________________________
K Li - Li2
ESTATSTICAEBIOESTATSTICA
Exemplo:Suponhaqueumeditordelivrosdeestatisticaproduziuumasriedelivrosequer escolher de entre trs tipos de ilustraes aquele que mais eficaz para os estudantes. pedido a oito universitrios que classifiquem as obras numa escala de cinco pontos, desde nadaboaatmuitoboa.Obtiveramseosresultadosapresentadosnatabelaseguinte.
Sujeitos Quadro 22: Avaliao de trs tipos de ilustraes Situao 1 Situao 2 Situao 3 (Ilustrao A) (Ilustrao B) (Ilustrao C) Result. Ordem Result. Ordem Result. 2 1 3 3 2 1 5 1 18 2,25 1 1 1 2 1 1 3 1 11 5 5 5 5 3 4 3 4 34 4,25 3 3 2,5 3 2 2,5 2 3 21 4 3 5 2 5 4 2 3 28 3,50
1 2 3 4 5 6 7 8
TOTAL MDIA
RACIONAL
Uma vez que se trata de um design relacionado no qual o mesmo sujeito obtm resultados em todas as situaes, permitido comparar os resultados de cada sujeito atravs de todas as situaes,nosentidodeverificarmosemquesituaoobtmmaioresemenoresresultados. Uma vez que existem mais do que duas situaes, no possvel calcular as diferenas nos resultados de duas situaes, como era o caso do teste de Wilcoxon. Pelo contrrio, o ordenamentodosresultadosdecadasujeitoparaastrscondiesserfeitahorizontalmenteao longo das linhas, tal como mostra a tabela. Por exemplo, aos resultados do sujeito 1, respectivamente2naSituao1,5naSituao2e4naSituao3,soatribudastrsordens,do menorresultadoparaomaior:Ordem1paraaSituao1,Ordem2paraaSituao3eOrdem3 paraaSituao2;esteprocedimentosemelhanteparatodosossujeitos.Claroqueseexistissem quatrosituaesexperimentais,osresultadosdecadasujeitoseriamordenadosde1a4. Oprximopassocalcularostotaisdeordensparacadasituao.Seexistiremapenasdiferenas aleatrias entre os resultados de todas as situaes, como postulado pela hiptese nula, de esperarqueestestotaissejamaproximadamenteiguaispartindodoprincpiodequesurgiriam algumasordensbaixas(baixosresultados)ealgumasordensaltas(altosresultados).Contudo,se assituaesforemsignificativamentediferentes,deesperarqueseobtenhamtotaisdasordens
ESTATSTICAEBIOESTATSTICA
significativamente diferentes, com algumas situaes a terem uma preponderncia de ordens baixas e outras uma preponderncia de ordens altas. O tamanho das diferenas entre os totais das ordens nos dado por uma estatstica designada por Xr2. Se o valor de Xr2 for igual ou superior aos valores crticos das Tabelas C e D (Anexo V), isso implica que as diferenas nos totaisdasordenssosuficientementegrandesparaquesepossamconsiderarsignificativas.
CalculeovalordeXR2apartirdafrmula
12
- 3N (C + 1)
Tc=totaldeordensparacadasituao
Tc2=quadradodototaldeordensparacadasituao
Tc2=somadosquadradosdostotaisdasordensparacadasituao:112+212+162 ClculodeXR2
12 XR2 = _____________________ (112 + 212 + 162) - 3 x 8 (3 + 1) (8 x 3) (3 + 1) 12 XR2 =
_____________________
24 x 4 12 XR2 =
_________________
x 818 - 96
96 XR2 = 6,25
ESTATSTICAEBIOESTATSTICA
Calculeosgrausdeliberdade,ouseja,onmerodesituaesmenosuma. (gl=C1=31=2)
ESTATSTICAEBIOESTATSTICA
Apartirdaanliseestatsticadaexperinciapodeconcluirqueascrianasmostrampreferncias significativamentediferentespelostrstiposdeilustraes.Emfunodasmdiasapresentadas natabela,sabemosquepreferemaIlustraoB,querecolheuasordensmaiselevadas,seguindo seaIlustraoCe,porltimo,aIlustraoA.Contudo,otestedeFriedmanpodeapenasindicar que existem diferenas globais entre as situaes. Para verificar se existe uma tendncia para uma determinada ordem de preferncia das Ilustraes, necessita de utilizar um teste de tendncia.
ESTATSTICAEBIOESTATSTICA
Escalademedidanomnimoordinal.
ESTATSTICAEBIOESTATSTICA
Podeacontecerqueoscaracteresestudadosnosejammensurveis,maspodemserordenados ou classificados. Por exemplo, se se considera um grupo de candidatos a um certo lugar, eles podemserexaminadossegundodoispontosdevista:conhecimentosepersonalidade.Estasduas qualidades no podem ser medidas, mas possvel para cada uma delas efectuar uma classificao dos candidatos. Podemos, assim, examinar se existe correlao entre estes dois caracteres; cada par de dados (xi, yi) formado pelas ordens ocupadas por um candidato nas duasclassificaes. Formulrio:
6(di2) =1________________
N(N2-1)
Emque: di=diferenaentreasposiesnasduasvariveis,isto,di=xiyi Para tal, temos que dar valores s posies: pontuao mais baixa damos o valor 1 e assimsucessivamente. Seasduasclassificaessoiguais,disemprezeroeentor=1eacorrelaoperfeita.Seas ordensmaisaltasdeumaclasseestoassociadassmaisbaixasdaoutrartornasenegativoese asduasclassificaessoinversas=1. Ento,
-1 1
INTERPRETAO
O coeficiente de correlao obtido pode ser interpretado, tal como o coeficiente de correlao momentoprodutodeBrawaisPearson(verestecoeficienteemtestesparamtricos).
ESTATSTICAEBIOESTATSTICA
Exemplo:Calcule,sabendoque:
xi yi 18 24 17 27 14 17 13 22 13 19 12 20 11 14 9 11 7 3 5 6
xi 18 17 14 13 13 12 11 9 7 5
yi 24 27 17 22 19 20 14 11 3 6
posio 2 1 6 3 5 4 7 8 10 9
d -1 1 -3 1,5 -0,5 2 0 0 -1 1
d2 1 1 9 2,25 0,25 4 0 0 1 1
=19,5
ESTATSTICAEBIOESTATSTICA
RACIONAL E EXEMPLO
Como soluo do problema da determinao da concordncia global entre K conjuntos de postos, poderia parecer razovel determinar os rs entre todos os pares possveis de postos e ento calcular a mdia desses coeficientes para determinar a associao global. Adoptando este procedimento, o processotornaseimpraticvel,umavezquetemosdecalcularinmeroscoeficientesdecorrelaode postos.
Assim,oclculodeWmuitomaissimpleseWtemumarelaolinearcomovalormdioders relativo a todos os grupos. Denotando rsav o valor mdio dos coeficientes de correlao por postosdeSpearman,Kendalmostrouque KW1 rsav=__________ K1
Outro processo consiste em imaginar como se apresentariam dados se no houvesse concordncia alguma entre os conjuntos de postos e, em seguida, como se apresentariam se houvesse concordncia perfeita. O coeficiente de concordncia seria, ento, um ndice de divergnciaentreaconcordnciaefectivaacusadapelosdadoseaconcordnciamximapossvel (perfeita).Demodoaproximado,Wumcoeficientedestanatureza. Suponhamos que 3 chefes de pessoal estejam encarregados de entrevistar 6 candidatos a emprego e classificlos em postos, separadamente, segundo a capacidade de cada um para preencheravaga.Atabelaseguintedos3conjuntosindependentesdepostosatribudospelos chefesdepessoalX,YeZaoscandidatosaaf;altimalinhadatabelaRjdassomasdospostos atribudosacadacandidato.
Quadro 24: Postos atribudos a 6 candidatos a emprego por 3 chefes de pessoal
Candidato a 1 1 6 8 b 6 5 3 14 c 3 6 2 11 d 2 4 5 11 e 5 2 4 11 f 4 3 1 8
Chefe
X Y Z Rj
Se os chefes de pessoal apresentassem perfeita concordncia nos seus julgamentos sobre os candidatos, isto , se tivessem atribudo postos aos candidatos da mesma ordem, ento um candidato teria recebido trs postos 1 e assim a sua soma de postos, Rj, seria 1+1+1=3=K. O candidatoqueos3chefestivessemconsideradoemsegundolugarreceberiaRj=2+2+2=6=2Keo menospromissordoscandidatosseriaRj=6+6+6=18=NK.
100 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Defacto,nocasodaconcordnciaperfeitaentreos3chefes,asvriassomasdepostos,Rj,seriam 3,6,9,12,15,18, muito embora no necessariamente nesta ordem. Em geral, quando h concordnciaperfeitaentreKconjuntosdepostos,obtemos,paravaloressignificativosdeRj,a sequnciaK,2K,3K,...,NK. Poroutrolado,senotivessehavidoconcordnciaentreos3chefes,entoosdiversosRjseriam aproximadamenteiguais. Desteexemplo,vemosqueograudeconcordnciaentreosKjulgamentosreflectidopelograu devarinciaentreasNsomasdepostos.W,coeficientedeconcordncia,funodessegraude varincia. Assim: S W=____________________
1/12 K2 (N3 N)
emque: S=soma dos quadrados dos desvios observados a contar da mdia dos Rj, isto , S= (Rj Rj/N)2; K=nmerodeconjuntosdepostos; N=nmerodeentidades(objectosouindivduosaqueseatribuempostos); 1/12K2(N3N)=valormximopossveldasomadosquadradosdosdesvios,isto,ovalordeS queocorrerianocasodeconcordnciaperfeitaentreosKconjuntosdepostos.
ESTATSTICAEBIOESTATSTICA
Ento, =(8+14+11+11+11+8)/6=10,5
W=0,16 exprime o grau de concordncia entre os 3 colegas fictcios ao atriburem postos aos 6 candidatosaemprego.
desalientarquearazoporqueWnopodetomarvaloresnegativosque,quandoesto em jogo mais de dois conjuntos de postos, esses conjuntos no podem ser completamente discordantes.Porexemplo,seXeYdiscordam,eseXtambmdiscordadeZ,entoYeZ certamente concordaro. Isto , quando esto em jogo mais de 3 juzes, concordncia e discordncianosoopostossimtricos.Kjuzespodemtodosconcordar,masimpossvel todoselesdiscordaremcompletamente.Portanto,Wdeveserzeroouumnmeropositivo. NOTA: Quando ocorrem empates, atribuemse s observaes empatadas a mdia dos postosquelhescaberiamsenohouvesseempates. OefeitodosempatesreduzirovalordeW.Seaproporodeempatespequena,oefeito desprezvel, podendo continuar a usarse a frmula anterior. Se a proporo de empates grande, pode introduzirse uma correco que aumentar ligeiramente o valor de W em relaoaovalorqueseapresentariasemcorreco.Oelementocorrectivo: (t3 t) T=
_________________________
12 Emquet=nmerodeobservaesnumgrupoempatadosemrelaoaumdadoposto
ESTATSTICAEBIOESTATSTICA
Emcasocontrrio,usar
S W=
_______________________________
1/12 K2 (N3 N)
Omtodoparadeterminarseovalorobservadosignificativamentediferentedezerodepende dotamanhodeN: SeN7aTabela(AnexoVI)dosvalorescrticosdeSassociadoscomosWs significativosaosnveisde0,05ede0,01; Se N>7 podemos usar X2 = K (N 1)W para calcular um valor de X2 cuja significncia, para g.l.=N1, possa ser comparada recorrendo Tabela do X2 (AnexoI).
ESTATSTICAEBIOESTATSTICA
UtilizandoseaTabelaestadovalordeSparaWssignificativosaosnveisde0,05ede0,01. Esta Tabela aplicvel para K de 3 a 20 e N de 3 a 7. Se um valor observado de S igual ou superior ao valor exibido na Tabela para um dado nvel de significncia, ento H0 pode ser rejeitadaquelenvel. Por exemplo, vimos que quando K=3 chefes depessoalfictciosclassificaramN=6candidatosa emprego,aconcordnciadosjulgamentosfoiW=0,16.ATabelaindicaqueoSassociadoquele valordeW(25,5)nosignificativo,umavezqueScrtico(103,9)maiordoqueSobservado (25,5). QuandoN>7,adistribuioaproximadamenteumadistribuiodeQuiquadradocomg.l.=N 1,vindo: S 2=_______________________ X 1/12 KN (N + 1)
Noteseque: S
_____________________________
= K (N 1) W
1/12 KN (N + 1)
E, portanto, X2 = K (N 1) W, pelo que se pode usar esta frmula que mais fcil para determinaraprobabilidadeassociadaocorrncia,sobH0,dequalquervalortograndequanto oWobservado. SeovalordeX2observadoigualaousuperaovalordaTabela(AnexoI)paraumdadonvelde significnciaeumparticularvalordeg.l.=N1,entoHo(nohrelaoentreosKconjuntosde postos)podeserrejeitadaquelenvel.
104 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
INTERPRETAO DE W
Um valor elevado ou significativo de W pode ser interpretado como indicando que os observadoresoujuizesestoaplicandoessencialmenteosmesmospadresaoatriburempostos aos N indivduos em estudo. Frequentemente a sua ordenao conjunta pode servir como padro,especialmentequandonohcritriosexternosrelevantesparaordenarosindivduos. KendallsugerequeamelhorestimativadaverdadeiraclassificaodeNobjectos,quandoW significativo,sejadadapelaordemdasvriassomasdepostos,Rj.Seseaceitaocritriosegundo o qual diversos juizes concordarem na atribuio de postos a N indivduos, ento a melhor estimativa da verdadeira ordenao desses indivduos segundo aquele critrio dada pela ordemdasomadospostos.Assim,anossamelhorestimativaseriadadaaocandidatoaouf,pois emambososcasosRj=0,omenorvalorobservado.
ESTATSTICAEBIOESTATSTICA
10.1 CORRELAO
Quando estudamos um grupo relativamente a dois caracteres vemos, como j dissemos, que podeexistirumarelaoentreeles. Se medirmos os raios de vrias circunferncias e tambm os seus permetros verificamos que existe uma relao entre eles que constante; neste caso temos dependncia funcional. Isto querdizerqueexisteumafrmulaexprimindoamedidadosegundoemfunodadoprimeiro: P=2r. Suponhamos agora que registamos, durante todos os dias de um certo perodo de tempo, a alturamximadamarnoportodaFigueiradaFozeonmerodepassageirosdalinhaPorto Lisboa.Vsebemqueentreasduasestatsticasassimobtidasnoseencontranenhumarelao. Diremosqueosdoiscaracteressoindependentes. Masentreestesdoiscasosextremos,adependnciafuncionaleaindependncia,avidacorrente ofereceumgrandenmerodeexemplosondeexisteumarelaoentreoscaracteres,masemque existe uma impossibilidade de a formular por uma lei: o caso da dependncia estatstica. Existeumadependnciaestatsticaentreaspessoasquemorremcomfebretifideeaspessoas vacinadascontraestadoena. Desdequeosdoiscaracteressejamtaisqueassuasvariaessejamsemprenomesmosentido, ou em sentidos contrrios, pressentimos que os caracteres estejam ligados entre si: dizemos, ento,queelesestocorrelacionadosouqueexisteumacorrelaoentreeles. EstesmtodosdecorrelaoforamcriadosporSirFrancisGalton,quetrabalhoujuntamentecom Pearson,nosfinsdosculoXIX.
ESTATSTICAEBIOESTATSTICA
A correlao e a regresso so dois aspectos que andam sempre muito ligados, pertencendo EstatsticaDescritiva.Assim,importafazermosadistinoentreeles: A correlao pode ser definida como o grau de semelhana no sentido das variaes entreosvalorescorrespondentesdosdoiscaracteres,isto,acorrelaopreocupasecom adescriodarelaoentrevariveis. A regresso usada quando tentamos predizer uma varivel quando conhecemos a outra.
REPRESENTAO GRFICA
representaogrficadacorrelaochamamosdiagramadedispersodepontosouscatterplot ouscattergrame,genericamente,tomaaseguinteforma:
80
70
60
50
40 40 50 60 70 80
ESTATSTICAEBIOESTATSTICA
Suponhamosquetemosduassriesestatsticasformadaspelosvaloresxieyidedoiscaracteres. Podemos fazer uma representao grfica dos dados representando todos os pontos (xi, yi) e obtendoanuvemdepontos. Segundoosdados,anuvemdepontospodeapresentardiversosaspectos. Porexemploospontospodemdistribuirsenasemelhanadeumalinharectaoudeumacurva: istosugereaexistnciadeumarelaofuncionalentreXeY. Os pontos podem ser dispersos e colocados ao acaso no plano: caso das mars no porto da FigueiradaFozeonmerodepassageirosnalinhaPortoLisboa(independncia).Tambmpode acontecerqueospontoscubramumaporodoplanodaqualsepodedefinirocontorno;esta formasugerequeasduasvariveisestoligadas.Limitemonosaocasomaissimplesemquea nuvemtemumaformaalongadalembrandoumaelipseesuponhamosqueasuaorientaotal que desde que X cresa, a varivel Y tambm cresce. A forma desta nuvem sugere a possibilidadedaexistnciadeumarectatalqueosvaloresestimadosporestarecta,apartirdos valoresdexi,sejamboasaproximaesdosvaloresdeyi.Nspodemosdeterminarpelomtodo dosmnimosquadradosumarectatalqueasomadosquadradosdosdesviossejamnima.Esta rectachamadarectaderegressodeYemXourectadeestimaodeYemX. Mas,poderamos,deummodosemelhante,procurarumarectatalqueosvaloresdexestimados aolongodestarecta,apartirdeyi,constituamigualmenteboasaproximaesdexi.Estarecta chamadarectaderegressodeXemYourectadeestimaodeXemY. Normalmente, estas rectas so distintas uma da outra. Elas sero confundidas quando existe ligao funcional linear e so perpendiculares quando h independncia. Compreendemos, assim, que a correlao entre os caracteres tanto maior quanto maior as rectas de regresso estejammaisprximasumadaoutra.
ESTATSTICAEBIOESTATSTICA
Ento:
-1 r 1
Interpretao: Ocoeficientedecorrelaoobtidopodeseinterpretadocombaseem:
Para Cardoso: r0,2
ESTATSTICAEBIOESTATSTICA
Estudante 1 2 3 4 5 6 7 8 9 10
X 75 70 70 65 60 60 55 50 50 45 600
Y 75 70 70 65 60 60 55 50 50 45 600
Z 45 50 50 55 60 60 65 70 70 75 600
W 45 50 50 55 60 60 65 70 70 75 600
XY 5625 4900 4900 4225 3600 3600 3025 2500 2500 2025 36900
XZ 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100
XW 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100
YZ 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100
YW 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100
ZW 2025 2500 2500 3025 3600 3600 4225 4900 4900 5625 36900
Sabeseque:
X=60
XY=36900 s2x= 90
Y=60
XZ=35100 s2y= 90
Z=60
s2z= 90
W=60
s2w= 90
a)CalculeocoeficientedecorrelaoentreXeYerepresentegraficamente. b)CalculeocoeficientedecorrelaoentreXeZerepresentegraficamente.
ESTATSTICAEBIOESTATSTICA
Resoluo 47: a) (XY) - X Y r=_____N______________ sx sy Ento, 36900 _ 60x60 10 r = _________________________________________ 90 x 90 r= = 1 Existe uma relao positiva muito forte entre X e Y b) r= Ento, 35100 _ 60x60 10 r=
________________________________________
(XZ) - X Z N .. sx sZ
90 x 90 r= = -1
ExisteumarelaonegativamuitoforteentreXeW,isto,quantomaiorXmenorYevice versa.
CARACTERSTICAS DO TESTE T:
1. 2. Testeparaacomparaodemdias; Distribuio com forma leptocrtica, isto , as caudas da distribuio so mais grossasdoquenadistribuionormal; 3. 4. 5. 6. 7. Contnua; Simtrica; Deformacampanular; Variademaisinfinitoamenosinfinito; Mdia=0edesviopadrodavariveldeacordocomn;
ESTATSTICAEBIOESTATSTICA
8.
OusodeTpressupequeavarivelobservacionaltenhanapopulao(deondefoi colhidaaamostra)distribuionormal;
9.
No existe uma distribuio t, mas sim uma famlia. Para cada n tamanho da amostraexisteumadistribuio(umacurva)especfica;
QUANDO UTILIZAR
Utilizaseparadesignsexperimentaiscomduassituaestestandoumavarivelindependente, quandonessassituaesseencontramsujeitosdiferentesdesignsnorelacionados. O teste t no relacionado equivalente ao teste no paramtrico U de MannWhitney; ambos comparamdiferenasentredoisgrupos.
OBJECTIVO
O objectivo comparar a quantidade da variabilidade devida s diferenas previstas nos resultadosentredoisgruposcomavariabilidadetotalnosresultadosdossujeitos.Asdiferenas previstassocalculadascomoumadiferenaentreosresultadosmdiosentreosdoisgrupos. Aestatsticatrepresentaotamanhodadiferenaentreasmdiasparaosdoisgrupos,tomando emconsideraoavarinciatotal.Paraqueovalorobservadodetsejasignificativoterdeser igualousuperioraosvalorescrticosdetapresentadosnatabela.
ESTATSTICAEBIOESTATSTICA
INSTRUES PASSO-A-PASSO
Elevaraoquadradocadaresultadoindividualparaambososgruposemseparado: 1. 2. 3. 4. Adicionarostotaisdosresultadosaoquadradoparacadagrupo; Elevaraoquadradotodososresultadosindividuaisparacadagrupo; Calcularamdiaparacadagrupo; Calculart:
1 - 2 t = _________________________________________________________________ x12 - ( x1)2 + x22 - ( x2)2 ______ ______ n1 n2 1 1 ____________________________________ __ + __ (n1 - 1) + (n2 - 1) n1 n2
x12=somadosquadradosparaogrupo1 x22=somadosquadradosparaogrupo2
(x1)2=resultadostotaisdogrupo1aoquadrado (x2)2=resultadostotaisdogrupo2aoquadrado
Calcularg.l.:
g.l.=(n11)+(n21)
Setobservado>tcrticorejeitaseHo Setobservado<tcrticonoserejeitaHo
ESTATSTICAEBIOESTATSTICA
Exemplo:paraverificarseduasdietasparaemagrecersoigualmenteeficazes,ummdicoseparouao acaso um conjunto de pacientes em dois grupos. Cada paciente seguiu a dieta designada para o seu grupodurante4meses.Omdicoregistouaperdadepesoemkgdecadapacienteporgrupo.Osdados estoapresentadosnoquadroquesesegue:
Quadro 26: Teste t no relacionado
______________________________________________________________________________________ Grupo 1 (dieta 1) Grupo 2 (dieta 2) ______________________________________________________________________________________ Resultados Resultados Resultados Resultados ao quadrado ao quadrado 10 100 2 4 5 25 1 1 6 36 7 49 3 9 4 16 9 81 4 16 8 64 5 25 7 49 2 4 5 25 5 25 6 36 3 9 5 25 4 16 _____________________________________________________________________________________ Total x1 = 64 x12 = 450 x2 = 37 x22 = 165 2 = 3,7 Mdia 1 = 6,4
3.(x1)2=64X64=4096 (x2)2=37X37=1369
4.1=6,4
2=3,7
ESTATSTICAEBIOESTATSTICA
6,4 - 3,7 t = _________________________________________________________ = 450 - 4096 + 165 - 1369 ______ ______ 10 10 _______________________________ 9+9 2,7 = ______________ 3,806. 0,2 6. g.l. = (n1 - 1) + (n2 - 1) = (10 - 1) + (10 - 1) = 18 = 3,547
1 __ 10
1 + __ 10
O valor de t observado (3,547) superior ao valor crtico de 2,878 (Anexo VII), indicando um nvel de significncia de p < 0,05 para uma hiptese unicaudal ou p < 0,01 para uma hiptese bicaudal.
Quandoutilizar: Utilizaseparadesignsexperimentaiscomduassituaestestandoumavarivelindependente, quando os mesmos sujeitos (ou emparelhados) se encontram em ambas as situaes design relacionado.OtestetrelacionadoequivalenteaotestenoparamtricodeWilcoxon.
OBJECTIVO
Oobjectivocompararasdiferenasentreasduassituaesexperimentaiscomavariabilidade total nos resultados. Quando os mesmos sujeitos so usados em ambas as situaes podem compararse pares de resultados obtidos por cada indivduo quando sujeito a ambas as situaes.
ESTATSTICAEBIOESTATSTICA
INSTRUES PASSO-A-PASSO
1.CalcularasdiferenasentreosresultadosdossujeitossubtraindoosresultadosdasituaoB paraasituaoA 2.Elevaressasdiferenasaoquadrado 3.Calcularosomatriodasdiferenasobtidas(d) 4.Calcularosomatriodoquadradodasdiferenas(d2) 5.Elevaraoquadradoasdiferenastotais(d)2 6.Calculart:
d t=
___________________________________
N d2 ( d)2 N-1
d=somadasdiferenasdosresultadosAeB d2=somadosquadradosdasdiferenas
(d)2=somadasdiferenaselevadasaoquadrado N=nmerodesujeitos
ESTATSTICAEBIOESTATSTICA
Exemplo:Paraverificarseaeficciadeumadietaerainfluenciadapeloministrardeumfrmaco,um mdicodecidiuadministrar,aumgrupodeindividuosqueotinhamprocuradoparaperderpeso,um placebo em conjunto com uma dieta que j havia administrado um ms antes aos mesmos sujeitos. Referiu aos seus casos que aquele medicamento servia para perder apetite e ajudava a queimar gorduras. Registouaperdadepesoquetinhaocorridonos30diasantecedentestomadadeplaceboetrintadias apsoplacebo.Osresultadosestonoquadroquesesegue
Situao A Situao B d d2 (com placebo) (s com dieta) (A-B) ____________________________________________________________________________ 1 10 2 8 64 2 5 1 4 16 3 6 7 -1 1 4 3 4 -1 1 5 9 4 5 25 6 8 5 3 9 7 7 2 5 25 8 5 5 0 0 9 6 3 3 9 10 5 4 1 1 ___________________________________________________________________________ Total 64 37 d=27 d2=151 Mdia6,43,7 Resoluo50: InstruesPassoaPasso:
Sujeito
27 =
_______________
= 27 / 9,316 = 2,90
86,78
ESTATSTICAEBIOESTATSTICA
Comoovalorobservadodetde2,90superioraovalorcrticode2,821aonveldesignificncia de p < 0,01 (unicaudal) ou p < 0,02 (bicaudal), e a mdia de perda de peso superior com o placebo,omdicoconcluiuqueoefeitodeplacebopositivonaperdadepeso Oponto10.3explicacomocompararmdiasdeduaspopulaes,combaseemamostrasdessas populaes.Massvezesprecisocompararmdiasdemaisdeduaspopulaes.Porexemplo, paraverificarsepessoascomdiferentesnveissocioeconmicos,isto,alto,mdioebaixotm, emmdia,omesmopesocorporal,precisocompararmdiasdetrspopulaes. ParacompararmdiasdemaisdeduaspopulaesaplicaseotesteF,naformaqueaseguirse descreve, desde que a varivel em estudo tenha distribuio normal ou aproximadamente normal.Masantesdemostrarcomosefazesseteste,convmapresentarumexemplo.
Imaginequequatrogrupos,todascomcincoelementos,conduziramaosdadosapresentadosnoquadro 28. As mdiasdessasamostrasestonaltimalinhadessequadro.Serqueasdiferenasdasmdias dasamostrassosuficientementegrandesparaquesepossaafirmarqueasmdiasdaspopulaesso diferentes?Pararesponderaestapergunta,precisoumtesteestatstico.
A 11 8 5 8 8 40 8
B 8 5 2 5 5 25 5
C 5 7 3 3 7 25 5
D 4 4 2 0 0 10 2
ESTATSTICAEBIOESTATSTICA
O quadro 29 apresenta os dados de k tratamentos, cada um com r repeties (no exemplo, denominamse repeties os elementos da mesma amostra). A soma das repeties (r) de um mesmotratamentoconstituiototaldessetratamento(T).Ototalgeral(T)dadopelasomadosk totaisdetratamentos.
... ... . . .
Total
T=x N=kr
Parafazeraanlisedevarinciaprecisocalcularasseguintesquantidades:
119 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
FORMULA:
C = (x)2 n
b)
calcularaSomadosQuadradosTotal(SQT)
FORMULA:
c)
SQT = x2-C
calcularaSomadoQuadradodoTotaldecadarepetio(SQTr)
FORMULA:
SQTr = T2 - C r
d)
calcularaSomadosQuadradosdosResduos(SQR)
FORMULA:
e)
SQR = SQT-SQTr
calcularoQuadradomdiodoTotaldecadarepetio(QMTr)
FORMULA:
f)
calcularoQuadradomdiodoTotaldoResiduo(QMR)
FORMULA:
ESTATSTICAEBIOESTATSTICA
g)
calcularovalordeF
FORMULA:
F = QMTr QMR
Tratamento A 11 8 5 8 8 40 8
Tratamento B 8 5 2 5 5 25 5
Tratamento C 5 7 3 3 7 25 5
Tratamento D 4 4 2 0 0 10 2
ESTATSTICAEBIOESTATSTICA
b)
calcularaSomadosQuadradosTotal(SQT)
c)
calcularaSomadoQuadradodoTotaldecadarepetio(SQTr)
e)
calcularoQuadradomdiodoTotaldecadarepetio(QMTr)
f)
calcularoQuadradomdiodoResduo(QMR)
g)
calcularovalordeF
ESTATSTICAEBIOESTATSTICA
3.passo:irtabelaFparaumnveldesignificncia(p)de5%(0,05)eobservarqualoFterico para 3 e 16 graus de liberdade (anexo). Como o valor calculado (7,06) maior que o da tabela (3,24),conclumosqueasmdiasdasrecidivasdiferememfunodotratamento,paraumnvel designificnciade0,05. Aacompanharestecomentrio,osvalorescalculadosdevemserapresentadosnumquadro,da seguinteforma:
Quadro 31: ANOVA
Mas,comosepodeobservar,apesardatabelamostrarqueexistemdiferenassignificativas,no nosinforma,quetratamentosqueproduzemdiferenasequaissosemelhantes.Semprequeas diferenas so significativas, e s nesse caso, temos que proceder s comparaes posteriori (PostHoc). Podemonos socorrer de diversos testes (LSD; Bonferroni; Sidak; Scheffe; SNK; Tukey;etc.),agrandediferenaentreelesresidenotipodedistribuioemqueassentameno tipo de ajustamento). Apresentaremos de seguida apenas o teste de Tukey, por ser dos mais utilizadoseomaissimplesdecalcular,quandorecorremosaoclculomanual.
dms =q
QMR r
ESTATSTICAEBIOESTATSTICA
assim,seconsultarmosatabelaverificamosqueoqparacompararquatrotratamentoscom16gl noresiduode4,05.comoQMR=4,25er=5,temos:
dms
p ns ns <0,05 ns ns ns
3,73
fcil de observar que s existem diferenas entre a mdia dos tratamentos A e a mdia dos tratamentos D, em que o tratamento D aquele com que se obtm, significativamente, menos recidivas
ESTATSTICAEBIOESTATSTICA
SQTr = T2 - C r
-C
Paramaisfcildeentenderobserveoseguinteexemplo:
Tratamento A 15 10 13 18 15 84
Tratamento B 23 16 19 18
Tratamento C 19 15 21 14 16
76
85
ESTATSTICAEBIOESTATSTICA
b) calcularaSomadosQuadradosTotal(SQT)
f) calcularoQuadradomdiodoResduo(QMR)
g) calcularovalordeF
F = QMTr = QMR
31,67 8
= 3,96
ESTATSTICAEBIOESTATSTICA
3.passo:irtabelaFparaumnveldesignificncia(p)de5%(0,05)eobservarqualoFterico para 2 e 12 graus de liberdade (anexo). Como o valor calculado (3,96) maior que o da tabela (3,89),conclumosqueasmdiasdossujeitosdiferememfunodotratamento,paraumnvel designificnciade0,05. Osvalorescalculadosdevemserapresentadosdaseguinteforma:
gl 2 12 14
SQ 63,33 96 159,33
QM 31,67 8
F 3,96
p <0,05
Como as diferenas so significativas, temos que proceder s comparaes posteriori (Post Hoc).OresultadodotestedeTukeyoseguinte:
dms =q
1+ 1 ri rj
QMR 2
Nocasodoexemplo,paracompararamdiadeAcomamdiadeBtemse:
1 + 6
1 4
8,00 2
Nocasodoexemplo,paracompararamdiadeAcomamdiadeCtemse:
1+ 6
1 8,00 5 2
Nocasodoexemplo,paracompararamdiadeBcomamdiadeCtemse:
ESTATSTICAEBIOESTATSTICA
1 + 4
1 5
8,00 2
Valor absoluto da Pares de mdias diferena A-B A-C B-C |14-19| = 5 |14-17| = 3 |19-17| = 2 4,87 4,57 5,06 <0,05 ns ns dms p
ConcluisequeemmdiaAsignificativamentediferentedeB,aonveldesignificnciade0,05.
ESTATSTICAEBIOESTATSTICA
ANEXOS
ESTATSTICAEBIOESTATSTICA
Anexo I
TABELADOQUIQUADRADO(X2)
ESTATSTICAEBIOESTATSTICA
Anexo II
TABELADEU
ESTATSTICAEBIOESTATSTICA
Anexo III
TABELADEWILCOXON
ESTATSTICAEBIOESTATSTICA
Anexo IV
TABELAH
ESTATSTICAEBIOESTATSTICA
Anexo V
TABELASDEFRIEDMAN
ESTATSTICAEBIOESTATSTICA
Anexo VI
TABELAS(TABELADEKENDAL)
ESTATSTICAEBIOESTATSTICA
Anexo VII
TABELAT
ESTATSTICAEBIOESTATSTICA
Anexo VIII
TABELAZ
ESTATSTICAEBIOESTATSTICA
Anexo IX
TABELAF
ESTATSTICAEBIOESTATSTICA
Anexo X
TABELADOSVALORESDEq