Escolar Documentos
Profissional Documentos
Cultura Documentos
Bioestatistica - Margarida Pocinho e Joao Paulo de Figueiredo
Bioestatistica - Margarida Pocinho e Joao Paulo de Figueiredo
NDICE GERAL
I - INTRODUO .............................................................................................................................................5 1. NOES GERAIS ..........................................................................................................................................6 2. POPULAO E AMOSTRA ............................................................................................................................9 3. MTODOS DE AMOSTRAGEM ....................................................................................................................11
3.3 INDIVDUO OU UNIDADE ESTATSTICA.............................................................................................21 3.4 VARIVEL ESTATSTICA....................................................................................................................22 3.5 ESTATSTICA DESCRITIVA E ESTATSTICA INDUTIVA....................................................................24 3.6 PARMETRO E DADO ESTATSTICO ...................................................................................................24 3.7 REPRESENTAO DE UMA VARIVEL ESTATSTICA ........................................................................25 3.8 REDUO DE UMA VARIVEL ESTATSTICA .....................................................................................29
3.8.1 Mdia ...........................................................................................................................................................30 3.8.2 Mediana ......................................................................................................................................................33 3.8.3 Moda ............................................................................................................................................................34 3.8.4 Quantis ........................................................................................................................................................38 3.8.5 Medidas de disperso .............................................................................................................................40 3.8.6 Coeficiente de disperso .......................................................................................................................49
5.1 TESTE DO QUI-QUADRADO................................................................................................................63 5.2 PROCEDIMENTOS PARA ORDENAO DE RESULTADOS ....................................................................67 5.3 TESTES PARA DUAS AMOSTRAS INDEPENDENTES ...........................................................................69 5.4 TESTE U
DE
MANN-WHITNEY .........................................................................................................70
ESTATSTICAEBIOESTATSTICA
6.2 CORRECO DE CONTINUIDADE ........................................................................................................78 6.3 TESTE DOS SINAIS DE WILCOXON .....................................................................................................79
7. TESTES PARA K AMOSTRAS INDEPENDENTES.........................................................................................82
KENDALL...........................................................................99
10.1 CORRELAO ..................................................................................................................................106 10.2 TESTE T DE STUDENT (NO RELACIONADO) ..............................................................................111 10.3 TESTE T DE STUDENT (RELACIONADO).......................................................................................115 10.4 ANLISE DE VARINCIA .......................................................................................................119
10.4.1 Anlise da Varincia com Igual Tamanho .....................................................................................119 10.4.1.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS ............................................................123 10.4.2 ANLISE DE VARINCIA COM DIFERENTES TAMANHOS ..................................................125 10.4.2.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS ............................................................127
ANEXOS ........................................................................................................................................................129
Anexo I ...................................................................................................................................................130 Anexo II ..................................................................................................................................................131 Anexo III.................................................................................................................................................132 Anexo IV ................................................................................................................................................133 Anexo V..................................................................................................................................................134 Anexo VI ................................................................................................................................................135 Anexo VII ...............................................................................................................................................136 Anexo VIII ..............................................................................................................................................137 Anexo IX ................................................................................................................................................138 Anexo X ..................................................................................................................................................139
ESTATSTICAEBIOESTATSTICA
NDICE DE ILUSTRAES
FIGURA 1: POPULAO E AMOSTRA......................................................................................................................................... 10 FIGURA 2: AMOSTRA ESTRATIFICADA ....................................................................................................................................... 13 FIGURA 3: CONVERSO DOS NIVEIS DE CONFIANA EM DESVIOS PADRO .................................................................................. 17 QUADRO 1: QUADRO GERAL DE SERIAO .............................................................................................................................. 25 QUADRO 2: QUADRO DE FREQUNCIAS .................................................................................................................................... 26 QUADRO 3: QUADRO DE FREQUNCIAS .................................................................................................................................... 27 QUADRO 4: QUADRO DE FREQUNCIAS .................................................................................................................................... 28 QUADRO 5: QUADRO DO CLCULO DA MDIA .......................................................................................................................... 30 QUADRO 6: QUADRO DO CLCULO DA MDIA .......................................................................................................................... 31 QUADRO 7: CLCULO DA MDIA PONDERADA .......................................................................................................................... 32 FIGURA 4: CURVA SIMTRICA .................................................................................................................................................. 35 FIGURA 5: CURVA ASSIMTRICA DIREITA .............................................................................................................................. 36 FIGURA 6: CURVA ASSIMTRICA ESQUERDA .......................................................................................................................... 36 FIGURA 7: CURVA ASSIMTRICA DIREITA .............................................................................................................................. 39 FIGURA 8: CURVA SIMTRICA ACHATADA (PLATOCURTICA) ..................................................................................................... 42 QUADRO 8: CLCULO DO DESVIO MDIO ................................................................................................................................ 44 QUADRO 9: CLCULO DO DESVIO MDIO PARA CLASSES ......................................................................................................... 45 QUADRO 10: CLCULO DA VARINCIA .................................................................................................................................... 45 QUADRO 11: CLCULO DA VARINCIA .................................................................................................................................... 46 FIGURA 9: DISTRIBUIO NORMAL .......................................................................................................................................... 51 FIGURA 10 - DISTRIBUIO LEPTOCRTICA E PLATICRTICA .................................................................................................... 51 FIGURA 11: % DE RESULTADOS 1 DP ACIMA E ABAIXO DA MDIA ............................................................................................. 54 FIGURA 12: POSIO DE UM RESULTADO .................................................................................................................................. 55 QUADRO 12: TABELA DE CONTINGNCIA (CROSSTAB)............................................................................................................. 65 QUADRO 13: ORDENAO DE UM GRUPO EM FUNO DO N. DE FACTORES DE RISCO ............................................................... 67 QUADRO 14: ORDENAO PARA AMOSTRAS RELACIONADAS OU EMPARELHADAS ................................................................... 69 QUADRO 15: RESULTADOS DO REGISTO DAS QUEIXAS .............................................................................................................. 71 QUADRO 16: TESTE MCNEMAR................................................................................................................................................ 75 QUADRO 17: TABELA DE QUATRO CASAS PARA A PROVA DE SIGNIFICNCIA DE MUDANAS ...................................................... 77 QUADRO 18: RESULTADOS DO TESTE DO VOCABULRIO ........................................................................................................... 79 QUADRO 19: NMERO DE IDEIAS RELEMBRADAS PARA TRS TIPOS DE TESTES .......................................................................... 83 QUADRO 20: Q DE COCHRAN .................................................................................................................................................. 89 QUADRO 21: Q DE COCHRAN .................................................................................................................................................. 90 QUADRO 22: AVALIAO DE TRS TIPOS DE ILUSTRAES ....................................................................................................... 93 QUADRO 23: COEFICIENTE DE CONTINGNCIA DE RHO DE SPEARMAN-RANK ......................................................................... 99 QUADRO 24: POSTOS ATRIBUDOS A 6 CANDIDATOS A EMPREGO POR 3 CHEFES DE PESSOAL.................................................... 100 FIGURA 13: DIAGRAMA DE DISPERSO DE PONTOS OU SCATTERPLOT OU SCATTERGRAM ......................................................... 107 QUADRO 25: CORRELAO DE PEARSON ............................................................................................................................... 110 QUADRO 26: TESTE T NO RELACIONADO .............................................................................................................................. 114 QUADRO 27: TESTE T RELACIONADO ..................................................................................................................................... 117 QUADRO 28: DADOS DE 4 AMOSTRAS E RESPECTIVAS MDIAS ................................................................................................ 118
3 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
QUADRO 29: NOTAO PARA ANLISE DA VARINCIA ........................................................................................................... 119 QUADRO 30: RECIDIVAS POR TRATAMENTO ............................................................................................................................ 121 QUADRO 31: ANOVA .......................................................................................................................................................... 123 QUADRO 32: POST-HOC DAS RECIDIVAS ................................................................................................................................. 124 QUADRO 33: MDIAS POR TRATAMENTO ................................................................................................................................ 125 QUADRO 34: ANOVA .......................................................................................................................................................... 127 QUADRO 35: POST-HOC ......................................................................................................................................................... 128
ESTATSTICAEBIOESTATSTICA
I - INTRODUO
Desde sculos o homem tem, muitas vezes, tomado notas de coisas e de pessoas, no com o nico fim de acumular nmeros, mas com a esperana de utilizar os dados do passado para a resoluo de problemas do presente assim como para a previso de acontecimentos futuros. No entanto, o sucesso quanto a este objectivo s foi possvel em data muito recente: s no final do sculo XIX e, sobretudo, no princpio do sculo XX que, com aaplicaodeprobabilidadesaos problemassobreainterpretaodosdadosrecolhidos,foipossvelresolveralgunsdeles. AEstatsticaconquistou,hoje,oseulugarentreascincias.Opoderdoseumtodo,sobretudo, afirmado nas ltimas dcadas e aplicase, agora, nos domnios mais variados. At aqui, s um pequeno nmero de pessoas se preocupou com estudos estatsticos, quer pela natureza das suas investigaes, quer por causa da sua utilidade para as diferentes profisses. O valor e a importnciadomtodoestatsticoresidemnoesforoparamelhorcompreenderonossomundo, to maravilhosamente complexo, tanto no ponto de vista fsico como social, levamnos a sonhar que ele se torne objecto de um conhecimento como as outrascincias.Avidacorrentelevanosa decisesparapassardoconhecidoaodesconhecido,daexperinciapreviso. Este curso tem por fim fornecer conhecimentos estatsticos (sem ter muitos conhecimentos matemticos) e saber interpretar resultados que podem ser obtidos atravs de programas de computador.
ESTATSTICAEBIOESTATSTICA
1. NOES GERAIS
Para algumas pessoas, a Estatstica no seno um quadro de colunas mais ou menos longas de nmeros que dizem respeito populao, indstria ou ao comrcio, como se v frequentemente em revistas; para outras, ela d grficos mostrando a variao no tempo de um facto econmico ou social, a produo ou os nmeros relativos aos negcios de uma empresa, assimcomoseencontranosescritriosdeempresasprivadas. To diferenciados se apresentam os mtodos estatsticos que no possvel estabelecer uma definio que os contenha a todos. Apesar disso, apresentamos a seguir uma definio que, emboranecessariamenteincompletacomoqualqueroutra,temavantagemdeintroduziroaluno namatria. AEstatsticatemcomofinalidadeelaborardeumasntesenumricaqueevidencieoquedemais generalizadoesignificativoexistanumconjuntonumerosodeobservaes. O grande nmero de observaes de que se parte reflecte uma diversidade tal que se torna ininteligvel a sua interpretao. Para que, a partir dessa diversidade se possa comear a entender logo, tornase necessrio reduzir sucessivamente as observaes, ganhandose em generalidadeoquesevaiperdendoemindividualidade. A sntese implica, assim, que nos desprendamos do que particular e individual para nos atermos ao que existe de mais geral no conjunto das observaes; medida que a sntese progride,vaiseperdendoocontactocomasparticularidadesimediatas. Deste modo, a Estatstica no se ocupa do que excepcional, mas apenas do que geral: no se interessa pelo indivduo, mas por grupos de indivduos; no se ocupa, em suma, de uma s medio,masdeumconjuntodemedies. Acrescentese,ainda,queasntesenumrica.Queristodizerqueseprescindeinteiramentedas palavras e dos recursos literrios de mais ou menos efeito que elas possibilitam. Alcanase a sntesepelorecursoexclusivodosnmeros.
ESTATSTICAEBIOESTATSTICA
Da o af com que frequentemente se escolhem os nmeros de acordo com os argumentos. A Estatstica intrinsecamente uma disciplina no literria, manipula exclusivamente nmeros e alcanaasnteseordenandoosecooperandocomeles. Estatstica, deriva de status que em latim significa Estado, e que s por si demonstra a ligaoquesempreexistiuentreambos; O primeiro levantamento estatstico remonta a 3050 a.C., no Egipto, tendo como objectivo informaroestadosobrerecursoshumanoseeconmicos. No sc. XVII d.C., a disciplina de Estatstica era j leccionada nas universidades alems, continuandocomafinalidadededescreveraspopulaeseasriquezasdoEstado. Aindanosc.XVII,dseaexpansodosseuscamposdeinvestigaoareascomo: Sadepblica; Indstria; Comrcio; EstudosDemogrficos. Os mtodos de inferncia estatstica surgem com Jonh Graunt (16201674), um modesto comerciante,quetiraconclusesvlidassobreumapopulaodesconhecidaporele. Fermat (16011665) e Pascal (16231662) permitem que o estudo do acaso tome uma expresso matemtica,introduzindooClculodasProbabilidades. O Clculo das Probabilidades e o aparecimento do Mtodo dos mnimos quadrados, vm credibilizaraEstatsticaconferindolheafundamentaomatemticaemqueelaassentahoje. Nosc.XVIIILambertQuetelet(17961874)introduziuaEstatsticaemreascomo: Meteorologia; Antropometria; CinciasSociais; Economia; Biologia.
ESTATSTICAEBIOESTATSTICA
FrancisGalton(18221911),apresentanoesderegressoecorrelao; Karl Pearson (18571936) apresenta a mais bela e acabada teoria de Estatstica, ficando tambm conhecidopelosseuscoeficientes; Fisher e os seus trabalhos sobre inferncia Estatstica deram tambm um grande contributo ao desenvolvimentodaEstatstica. Em 1943, dse uma grande reviravolta, uma vez que o tratamento de dados deixa de ser feito manualmenteepassaasercomputadorizado. MtodoEstatstico: Tcnicausadaparaobter,analisareapresentardadosnumricos; Mtodocientficocujafinalidadeoestudodaspropriedadesnumricas dosconjuntosdosfactos. OMtodoEstatstico,segundoateoriadeCramer,pressupeasseguintesfases: Recolha de dados estatsticos: obteno da amostra a partir da populao, devendo depurar e rectificar os dados estatsticos, que no seu conjunto sodenominadossrieestatstica. Descrio:conjuntodeoperaes,numricasougrficas,efectuadassobre os dados estatsticos determinando a sua distribuio; procedese sua ordenao,codificaoerepresentaopormeiodequadrosetabelas. Anlise: consiste em tirar concluses sobre a distribuio da populao, determinar o seu grau de confiana e ainda formular hipteses, tentando verificlas,quantoaofenmenoemestudo. Predio: uma previso do comportamento do fenmeno em estudo, tendoemcontaadefiniodadistribuioestatstica.
ESTATSTICAEBIOESTATSTICA
2. POPULAO E AMOSTRA
Populao: somatrio dos indivduos ou elementos, com qualquer caracterstica comum e que estosujeitosaumaanliseestatstica,portereminteresseparaoestudo. Quantosuaorigempodeser: Conjuntodepessoas; Conjuntodeobjectos; Conjuntodeacontecimentos.
Quantosuanaturezapodeser: Podeaindaser: Amostra: um subconjunto retirado da populao, que se supe ser representativo de todas as caractersticas da mesma, sobre o qual ser feito o estudo, com o objectivo de serem tiradas conclusesvlidassobreapopulao. Amostragem: o procedimento pelo qual um grupo de pessoas ou um subconjunto de uma populao escolhido com vista a obter informaes relacionadas com um fenmeno, e de tal formaqueapopulaointeiranosinteressaestejarepresentada OPlanodeAmostragemserveparadescreveraestratgiaautilizarparaseleccionaraamostra. Este plano fornece os detalhes sobre a forma de proceder relativamente utilizao de um mtododeamostragemparadeterminadoestudo. Conjuntofinito; Conjuntoinfinito. Existenteoureal; Hipotticaounototalmenteexistente;
ESTATSTICAEBIOESTATSTICA
Logo que o investigador delimite a populao potencial para o estudo, ele deve precisar os critriosdeselecodosseuselementos. Certoscritriosdizemrespeitoscaractersticasrequeridasparaqueumelementoousujeitofaa partedaamostra: Aamplitudedaidadedosparticipantes; Condiesdesadeprecisas. Igualmentecertoscritriosdefinemossujeitosquenofaropartedoestudo:
Populao
Populao-alvo Amostra
Um investigador interessado pela readaptao aps cirurgia de revascularizao, pode concentrarse somente nos sujeitos que tiveram uma nica experincia deste tipo e exclurem os outros. Umaamostraditarepresentativaseassuascaractersticasseassemelhamomaispossvelsda populaoalvo. particularmente importante que a amostra represente no s as variveis em estudo, mas tambm outrosfactoressusceptveisdeexerceralgumainflunciasobreasvariveis estudadas,comoaidade,osexo,aescolaridade,orendimento,etc. ARepresentatividadeavaliasecomparandoasmdiasdaamostracomasdapopulaoalvo.
ESTATSTICAEBIOESTATSTICA
Comoseignorasetodasascaractersticasdapopulaoestopresentesnumaamostradadoque estassomuitasvezesdesconhecidas,admitesequeexistesempreumgraudeerro. ERRODEAMOSTRAGEM:adiferenaqueexisteentreosresultadosobtidosnumaamostrae osqueteriamsidoobtidosnapopulaoalvo. Duassoluesexistemparareduziraomnimooerroamostral: 1. Retirar de forma aleatria e um nmero suficiente de sujeitos que faro parte da amostra. 2. Procurar reproduzir o mais fielmente possvel a populao pela tomada em conta das caractersticasconhecidasdesta.
3. MTODOS DE AMOSTRAGEM
3.1 AMOSTRAGENS PROBABILSTICAS E NOPROBABILSTICAS
3.1.1 As Amostras Probabilsticas
Os mtodos de amostragem probabilstica servem para assegurar uma certa preciso na estimaodosparmetrosdapopulao,reduzindooerroamostral. A principal caracterstica dos mtodos de amostragem probabilstica reside no facto de que cada elemento da populao tem uma probabilidade conhecida e diferente de zero, de ser escolhida, aquandodatiragemaoacasoparafazerpartedaamostra. Oobjectivodestaabordagemobteramelhorrepresentatividadepossvel.
ESTATSTICAEBIOESTATSTICA
AAmostragemaleatriasimplesumatcnicasegundoaqualcadaumdoselementos(sujeitos) que compe a populao alvo tem igual probabilidade de ser escolhido para fazer parte de uma amostra. A amostragem aleatria simples consiste em elaborar uma lista numrica de elementos de onde se tira, com a ajuda de uma tabela de nmeros aleatrios, uma srie de nmeros para constituiraamostra.
AMOSTRAGEM ALEATRIA ESTRATIFICADA
A Amostragem aleatria estratificada uma variante da amostra aleatria simples. Esta tcnica consiste em dividir a populao alvo em subgrupos homogneos chamados estratos e a seguir tirar de forma aleatria uma amostra de cada estrato. A Amostragem aleatria estratificada utilizadaquandoapopulaointeirareconhecidaporcertascaractersticasprecisas,taiscomoa idade, o sexo, a incidncia de uma condio de sade, tudo isto para assegurar a melhor representatividadepossvel.
ESTATSTICAEBIOESTATSTICA
P o p u la o - A lv o
2 0 0 0 e s tu d a n te s e m S o c ia is
C i n c ia s
C la s s ific a o
E s tr a t ific a o P r o p o r c io n a l
E s tra to 1 D o u to ra m e n to 400 = 20%
E s tra to 2 M e s tra d o 600 = 30%
E s c o lh a A le a t r ia
4 0 E s tu d a n te s D o u to ra m e n to
6 0 E s tu d a n te s M e s tra d o
1 0 0 E s tu d a n te s L ic e n c ia t u r a
AMOSTRAGEM EM CACHOS
Consiste em retirar de forma aleatria os elementos por cachos em vez de unidades. til quando os elementos da populao esto naturalmente por cachos e por isso devem ser tratados comogruposouquandonopossvelobterumalistagemdetodososelementosdapopulao alvo.
AMOSTRAGEM SISTEMTICA
Consiste quando existe uma lista ordenada de elementos da populao. Esta tcnica consiste K elementosdessalistasendooprimeiroelementodaamostraretiradoaoacaso. Ointervaloentreoselementoscorresponderazoentreotamanhodapopulaoedaamostra. Exemplo: Se pretender uma amostra de 100 indivduos e a populao for de 1000 o sistema ser 1000:100=10 (dez em dez o sistema), isto , ser includo um elemento da lista de 10 em 10 indivduosapartirdo1.n.sorteado.
ESTATSTICAEBIOESTATSTICA
Importante Se se utilizar uma amostragem por cachos ou outros tipos de agrupamentos, a amostra s considerada probabilstica se os grupos foram escolhidos ao acaso antes da repartio aleatria dossujeitosnosgrupos.
formada por sujeitos facilmente acessveis, que esto presentes num determinado local e momentopreciso. Exemplo: pessoas hospitalizadas. Um investigador pode ter acesso a uma unidade hospitalar paraconstituirumaamostradepacienteshospitalizados. Nestetipodeamostratemavantagemdesersimplesemorganizarepoucoonerosa,todaviaeste tipodeamostraprovocaenviesamentos,poisnadaindicaqueasprimeiras30a40pessoassejam
ESTATSTICAEBIOESTATSTICA
Idntica amostragem aleatria estratificada diferindo desta apenas pelo facto dos sujeitos no seremescolhidosaleatoriamentenointeriordecadaestratooudecadagrupo.
AMOSTRAGEM POR SELECO RACIONAL OU POR TIPICIDADE
Tem por base o julgamento do investigador para constituir uma amostra de sujeitos em funo doseucarctertpico. Por exemplo: o estudo de casos extremos ou desviantes como uma patologia rara ou uma instituio.
AMOSTRAGEM POR REDES OU BOLA DE NEVE
Consisteemescolhersujeitosqueseriamdifceisdeencontrardeoutraforma.Tomaseporbase, redessociaisamizadeseconhecimentos. Porexemplo:ImigrantesdeLeste. Quando o investigador encontra sujeitos que satisfazem os critrios escolhidos pedelhes que indiquemoutraspessoasdecaractersticassimilares.
ESTATSTICAEBIOESTATSTICA
F rm ula:
ESTATSTICAEBIOESTATSTICA
Se desejarmos um nvel de confiana bastante alto superior a 99% aplicase a frmula dos trs desvios.
Convmlembrarquesemprequenosejapossvelestimarumapercentagemdofenmeno,deve utilizarsesemprep=50
ESTATSTICAEBIOESTATSTICA
Frmula
Onde: n=Tamanhodaamostra =nveldeconfianaescolhido,expressoemnmerosdedesviospadro p=percentagemdofenmeno q=percentagemcomplementar N=tamanhodapopulao e2=erromximopermitido Exemplo:Verificarquantosdos100empregadosdeumacantinacumpremcorrectamenteas normasdehigieneeseguranadotrabalho. Presumesequeessen.nosejasuperiora30%dototal;desejaseumnveldeconfianade95% (2desvios)etoleraseumerroat3%. Ento,n=90,4Logodeveroserpesquisados90empregados. Confirmeaplicandoafrmula Mas,seapopulaofossede10.000empregados,comosmesmoscritriosanteriormente referidos,ento:
n= 4 . (30.70).10000 = 853
(9.9999)+4.(30.70)
ESTATSTICAEBIOESTATSTICA
Otamanhoptimodeumaamostra,nodependetantodotamanhodapopulaomassimde doisparmetrosestatsticos:amargemdeerroeonveldeconfiana MargemdeerroUmaamostrarepresentaaproximadamente(enuncaexactamente)uma populao.Amedidadesteaproximadamenteachamadamargemdeerro,elidoassim: seumapesquisatemumamargemdeerrode2%eaDoenaCardacateve25%deprevalncia naamostrarecolhida,podemosdizerque,naqueleinstante,napopulao,elateruma prevalnciaentre23%e27%(25%menos2%e25%mais2%). NveldeconfianaAspesquisassofeitascomumparmetrochamadonveldeconfiana, geralmentede95%.Estes95%queremdizeroseguinte:serealizarmosumaoutrapesquisa,com umaamostradomesmotamanho,nasmesmasdataselocaisecomomesmoinstrumentode recolhadedados,humaprobabilidadede95%dequeosresultadossejamosmesmos(euma probabilidadede5%,claro,dequetudodifira). Quandojseefectivouumapesquisaesedesejaconheceramargemdeerroutilizadaaplicase:
Frmula
Onde: n=Tamanhodaamostra
p =
(p.q) n
ESTATSTICAEBIOESTATSTICA
p =
Frmula
Emque p=fenmeno] =erro
ESTATSTICAEBIOESTATSTICA
Assimparaumfenmenoquetenhaumaprevalnciade25%,osresultadosseriam:
Emtermosestatsticosconsideramosqueumaamostra:Pequenasen<30
CUIDADOS
A TER NA ESCOLHA DA AMOSTRA:
1. Imparcialidade:todososelementosdevemteramesmaprobabilidadeeoportunidadede seremescolhidos; 2. Representatividade: deve conter em proporo todas as caractersticas que a populao possui,qualitativaequantitativamente,demodoaquenosetornetendenciosa; 3. Tamanho: suficientemente grande de modo a fornecer as principais caractersticas, por outroladopequenaparaeconomizartempo,dinheiroepessoal.
ESTATSTICAEBIOESTATSTICA
No estudo de cada unidade Estatstica, surgem resultados individuais com os quais so feitas as infernciassobreapopulao.EstesresultadostmonomedeDadoEstatstico. Dado Estatstico: o resultado do estudo efectuado a cada unidade Estatstica tendo em conta a sua individualidade, sendo este depois tratado de modo a permitir inferir sobre a colectividade queaintegra(populao).
ESTATSTICAEBIOESTATSTICA
2. Quantitativa: se a sua intensidade que varia de elemento para elemento, tornandoa mensurveloureferencivel. Asvariveisquantitativasdividemseem: a. Variveis discretas: assume valores isolados, normalmente inteiros (n. de filhos, n.defactoresderisco,n.dedependentes,n.derespostas,etc) b. Variveis contnuas: em que possvel qualquer operao aritmtica, podendo assumirqualquervalorreal(altura,peso,IMC,distncia,etc). Tendo em conta o nmero de atributos (caractersticas) que esto a ser estudadas, as variveis podemser: 1. Unidimensionais:seapenascorrespondeaumatributo 2. Bidimensionais:secorrespondeadoisatributos; 3. Pluridimensionais:secorrespondeavriosatributos.
Modalidade: toda a manifestao possvel de uma varivel, isto , as vrias hipteses de resposta,podendoelasserduasoumais. Asmodalidadestmobrigatoriamentequeser: 1. Incompatveis: cada unidade Estatstica no pode pertencer simultaneamente a duasoumaismodalidades; 2. Exaustivas: todas as unidades Estatsticas tm que ser inseridas numa modalidade. A escolha das modalidades deve ser feita de acordo com as informaes possudas. No entanto, surgemsituaesemquehnecessidadedeseaumentarumamodalidadesuplementar.
ESTATSTICAEBIOESTATSTICA
Ovalor11oparmetro(resultadodamdiaaritmtica).
Odadoestatsticotodaafunodefinidaapartirdosdadosnumricosdeumaamostra. Exemplo:consideremosaamostra:1010
Mdia =xi/n = 20/2 = 10 O valor 10 o dado estatstico
ESTATSTICAEBIOESTATSTICA
Como j referimos anteriormente, uma seriao implica que a varivel seja discreta (exemplo: nmerodefilhosdeumcasal,nmerodedivisesdeumacasa,etc.). Oquadrogeraldeumaseriaoestexpressonoquadroquesesegue.
Quadro 1: Quadro Geral de Seriao
Varivel X1 X2 X3 Xi Xk
Frequncias absolutas n1 n2 n3 ni nk
Frequncias acumuladas n1 n1+ n2 n1+ n2+ n3 n1+ n2+ +ni n1+ n2+ +nk
Frequncias relativas n1 N n2 N n3 N ni N nk N 1
Na primeira coluna temos os valores que a nossa varivel X toma (x1, x2, ..., xk). Esta coluna podesertambmdenominadaporxi. Na segunda coluna apresentamosasfrequnciasabsolutassimplesouefectivas,isto,onmero de vezes que cada valor foi observado ou o nmero de vezes que cada valor surge na amostra.
25 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Esta coluna pode tambm ser denominada por ni. Devemos lembrar aqui que o nmero total de indivduos pertencentes populao/ou amostra chamase efectivo total e designase por n, devendosempreverificarsequeni=n. Naterceiracolunapodemosvisualizarasfrequnciasacumuladas,isto,asomadasfrequncias absolutas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambmdenominadaporN(xi).Assim,
N(xi) = ni xi<x
Na quarta coluna apresentamos as frequncias relativas simples. Esta coluna pode ser tambm denominada por fi, em que fi = ni/n e, de tal modo que, fi = 1; a frequncia relativa expressa, emgeral,empercentagem. Na quinta coluna temos as frequncias relativas acumuladas, isto , a soma das frequncias relativas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambm denominada por F(xi); a frequncia relativa acumulada expressa, em geral, em percentagem. Exemplo:ConstruaoquadrodefrequnciasparaavarivelXquetomaosseguintesvalores:
xi 14 14 13 12 11 12 10 13 12
xi 10 11 12 13 14 ni = 9
ni 1 1 3 2 2
N(xi) 1 2 5 7 9
fi = 1
em que n = 9
ESTATSTICAEBIOESTATSTICA
Como j referimos anteriormente, uma classificao implica que a varivel seja contnua (exemplo:atemperaturadeumcorpo,aalturadeumapessoa,aduraodecertofenmeno,etc. variveisrelacionadascomoespao,otempoouamassa).
Quadro 3: Quadro de Frequncias
Frequncias Marcas da Classes classe absolutas acumuladas relativas acumuladas n1 c0-c1 c1-c2 c2-c3 ci-1-ci ci-1-ck Total X1 X2 X3 Xi Xk _ n1 n2 n3 ni nk n1 N n2 n1+ n2 N n3 n1+ n2+ n3 N n1+ n2+ +ni N n1+ n2+ +nk N 1 nk 1 N ni N n1+ n2++ ni N n1+ n2+n3 N n1+n2 n1 Frequncias Frequncias Frequncias relativas
Na primeira coluna temos as classes. Por conveno, as classes so abertas superiormente, com excepodaltimaclasse,naturalmente. Nasegundacolunatemosasmarcasdaclasse.Estacolunapodesertambmdesignadaporxi.A marca de uma classe o ponto mdio dessa classe, ou seja, o ponto equidistante dos extremos deumaclasse. Exemplo:classec0c1 x1=(c0+c1)/2
Naterceiracolunaapresentamosasfrequnciasabsolutassimplesouefectivas,ouseja,onmero de vezes que os valores de determinada classe foram observados. Esta coluna pode ser tambm denominada por ni. Mais uma vez, ni = n (nmero total de indivduos pertencentes populao/ouamostra,aquesechamaefectivototal). Na quarta coluna apresentamos as frequncias acumuladas, isto , a soma das frequncias absolutas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambmdenominadaporN(i).
27 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Na quinta coluna temos as frequncias relativas simples. Esta coluna pode ser tambm denominadaporfi,emquefi=ni/ne,detalmodo,quefi=1. Na sexta coluna apresentamos as frequncias relativas acumuladas, isto , a soma das frequncias relativas correspondentes a valores inferiores a um determinado valor. Esta coluna podesertambmdenominadaporF(i). Numa classificao habitualrepresentarmosporKonmerodeclasses(emgeralKvariaentre 5e20,inclusive)eporAaamplitude(emqueA=xmximoxmnimo). Ento,
- Se K dado = A/K - Se dado K=A/ , sendo a amplitude do intervalo de classe e A a amplitude do intervalo da amostra
Exemplo:Construaoquadrodefrequnciascomosseguintesdados:
Classes [20-23[ [23-26[ [26-29[ [29-32[ [32-35[ [35-38] ni 2 5 7 10 4 2
Quadro 4: Quadro de Frequncias
ni 2 5 7 10 4 2
N(i) 2 7 14 24 28 30
x'i 21 24 27 30 33 36
ni
= 30
fi
= 1em que n = 30 e = 3
ESTATSTICAEBIOESTATSTICA
Anteriormente definimos o conceito de varivel estatstica e construramse quadros e grficos estatsticos com vista a uma descrio numrica e grfica de uma varivel estatstica. Naturalmente, os grficos permitem uma primeira sntese das informaes registadas nos quadros. Por outro lado, por simples aproximao das curvas de frequncias absolutas ou relativas de duasoumaisvariveis,podemosfazerumaprimeiracomparaoentreelas. H, porm, necessidade de sintetizarmos toda a informao respeitante a uma varivel estatstica, resumindose os dados a um pequeno nmero de elementos que bastam para caracterizla. Tal sntese consiste na reduo de dados e os elementos numricos obtidos designamseporparmetrosdavarivelestatstica. Feita a representao dos dados estatsticos por meio de quadros e/ou de grficos, importa fazer sobreosmesmosumestudonosentidodesepoderchegaraconcluses. Para tal, impese um trabalho de simplificao que consiste em proceder a snteses, em reduzir grandes quantidades de dados a nmeros simples que permitam uma anlise rpida e uma fcil comparaocomoutrassriesdamesmanaturezaoudenaturezadiferente. Tais nmeros so designados, habitualmente, por caractersticas, parmetros ou medidas e so agrupadosemcategoriasconformeotipodeinformaoquefornecem.
ESTATSTICAEBIOESTATSTICA
Sobestadesignaoagrupamseosparmetrosque,ounosindicamalgodeassocivelaoncleo ou centro da distribuio, ou nos permitem compartimentla. Vamos considerar as seguintes medidasdetendnciacentraloudeposio:mdia,mediana,modaequantis.
3.8.1 Mdia
MDIA ARITMTICA
A mdia aritmtica o ponto de equilbrio dos dados, isto , tendo um conjunto de n valores x1, x2,...,xndeumavarivelXoquocienteentreasomadessesvaloreseonmerodeles. Amdiaaritmticapodeserrepresentadapelaseguintefrmulamatemtica:
x = xi / n
Numa amostra seriada os valores x1, x2, ..., xk ocorrem n1, n2, ..., nk vezes, respectivamente, a mdiaaritmticaser
x = nixi / n = fixi
Exemplo:Calculeamdiaaritmtica,sabendoque xi ni 4 2 6 4 7 5 8 3 10 2
xi 4 6 7 8 10
ni 2 4 5 3 2
nixi 8 24 35 24 20
=16 Ento,
=111
ESTATSTICAEBIOESTATSTICA
Numa amostra classificada a frmula definidora da mdia no se pode aplicar directamente porque no conhecemos os valores exactos da varivel estatstica, mas apenas o nmero de observaes dentro de cada classe, isto , quando os dados esto agrupados em classes, para o clculo da mdia simples, devemos considerar o ponto mdio de cada classe (marca) como representativo de todos os valores nela includos, pelo que aquela pode ser representada pela frmulamatemticaseguinte:
x = nix'i / n = fix'i
Exemplo:Calculeamdiaaritmtica,sabendoque
Classes ni [3-5[ 2 [5-7[ 4 [7-9[ [9-11[ [11-13] 5 3 2
ni 2 4 5 3 2
=16
=119
Temos de salientar que quando usamos a marca da classe estamos a colocar um certo erro de agrupamento,peloquedevemosconsideraraCorrecodeSheppard,detalmodoque:
x semelhante a x
ESTATSTICAEBIOESTATSTICA
Por sua vez associase a x1, x2, ..., xk certos factores de ponderao ou pesos p1, p2, ..., pk que dependemdosignificadoouimportnciaatribudasobservaes.Assim,afrmulamatemtica damdiaser:
x p = pixi / pi
Exemplo 9: Um professor de matemtica quer saber a mdia poderada das suas avaliaes nas quatro turmas em que lecciona, sabendo que o teste tinha uma ponderao de 30% e o trabalho umaponderaode70%: TurmaAMdiadanotadoteste=65% TurmaBMdiadanotadoteste=60% TurmaCMdiadanotadoteste=40% TurmaDMdiadanotadoteste=80% Determineamdiaponderadadasquatroturmasemconjunto.
xp=pixi/pi = [((65*30)/100) + ((78*70)/100) + ((60*30)/100) + ((70*70)/100) +
Sepreferirmosemquadroaresoluoser
Quadro 7: Clculo da mdia ponderada
xi 65 60 40 80 78 70 28 75
pi 30 30 30 30 70 70 70 70 400
pixi 1950 1800 1200 2400 5460 4900 1960 5250 24920
x p = pixi / pi=24920/400=62,3
ESTATSTICAEBIOESTATSTICA
Para alm da mdia aritmtica e da mdia aritmtica ponderada, temos tambm a mdia geomtrica, a mdia harmnica e a mdia quadrtrica (a estes trs tipos de mdias no iremos fazerqualquerreferncia).
3.8.2 Mediana
A mediana de uma srie de n observaes x1, x2, ..., xn de uma varivel X o valor que ocupa a posio central quando as observaes estoordenadasporordemcrescenteoudecrescente,isto , a mediana de uma varivel estatstica o valor dessa varivel tal que a frequncia dos valores que lhe so inferiores a mesma que a frequncia dos valores que lhe so superiores. Representase,habitualmente,porMd. Amedianausadaquandonaamostrahvaloresexcntricosemrelaoaoutrosvalores. Paraoclculodamediana,temosdeconsiderarduassituaes:ocasoemqueNmpareocaso emqueNpar.
N
MPAR:
Amedianaumvalorobservado,detalmodoqueolugarqueocupadadopelafrmula
Md = (N +1) / 2
Exemplo:Determineamedianaparaaseguintesriededados:
5 9 8 7 6
Seamedianaocupaaterceiraposioouterceirotermo,oseuvalor7
ESTATSTICAEBIOESTATSTICA
PAR:
A mediana no coincide com nenhum valor observado ficando compreendida entre dois valores centrais classe mediana; convencionouse tomar para mediana a mdia destes dois valores. A posioqueamedianaocupadadapelafrmula
Md = mdia dos valores que se encontram na posio N / 2 e (N / 2) + 1
Exemplo:Determineamedianaparaaseguintesriededados
5 6 12 9 8 7
Ordenandoporordemcrescente,vem5678912 ComoNpar,ento N/2=6/2=3;(N/2+1)=3+1=4 Assim, a classe mediana ocupada pelas posies 3 e 4, ou seja, pelos valores 7 e 8, pelo que a Md=(7+8)/2=15/2=7,5
3.8.3 Moda
A moda (ou valor modal) de uma srie de n valores x1, x2, ..., xn de uma varivel X o valor ondeafrequnciaatingeomximo(relativo).Representase,habitualmente,porMo.
AMOSTRA SERIADA:
A moda o valor da varivel com maior efectivo, isto , se uma varivel discreta, a(s) moda(s) (so)o(s)valor(es)davarivelestatsticaqueseobserva(m)commaiorfrequncia. Exemplo:Determineamodaparaaseguintesriedevalores xi ni 4 1 6 3 8 5 10 4 2 2
Amoda8.
ESTATSTICAEBIOESTATSTICA
AMOSTRA CLASSIFICADA:
Neste caso falamos em classe modal, tomandose para moda a marca da classe. Assim, a moda de uma varivel contnua X todo o valor de X para o qual a funo de frequncia (absoluta ou relativa)atingeummximolocal. Exemplo:Determineamodaparaaseguintesriedevalores
classes [2-4[ ni [4-6[ 1 [6-8[ 7 [8-10[ 4 [10-12] 10 2
Aclassemodal[810[,peloqueamoda=(8+10)/2=18/2=9
Pearson chegou concluso de que para as distribuies unimodais e moderadamente assimtricas,vigoraaseguinterelaoemprica: MdiaModa=3(MdiaMediana)
Vejamos,agora,arelaoexistenteentreestastrsmedidasnocasodasfigurasqueseseguem
ESTATSTICAEBIOESTATSTICA
A UTILIZAO DA MDIA ARITMTICA, DA MEDIANA E DA MODA
MDIA ARITMTICA:
A medida de tendncia central mais usada a mdia aritmtica, que apresenta em relao medianaemodavantagensapreciveis,taiscomo: facilmentecalculvel; aquemelhorseprestaaulterioresanlisesestatsticas; Dependedetodososvaloresdasrie; uma medida de tendncia central particularmente estvel, variando o menos possvel deamostraparaamostraextradasdamesmapopulao; Existem, todavia, casos em que a informao fornecida pela mediana ou pela moda, parece ser maiscompletadoqueafornecidapelamdiaaritmtica,comopassamosaindicar. Podesertratadaalgebricamente.
ESTATSTICAEBIOESTATSTICA
MEDIANA:
Estamedidadetendnciacentraldeverutilizarsequando: Sedesejaconheceropontomdioexactodadistribuio; Existemresultadosextremosqueafectariamgrandementeamdia.Importasalientarque a mediana no influenciada pelos resultados extremos exemplo: na srie 10,13,15,16,18,19,21,tantoamdiacomoamedianaso16;sesubstituirmos21por50eos restantesresultadospermaneceremosmesmos,amediana16eamdiaserde20,1; A distribuio truncada, isto , incompleta nas extremidades exemplo: desejamos medir os tempos de reaco em Psicologia e as vrias respostas ultrapassam as capacidades de medida do aparelho; vemonos, assim, impossibilitados de calcular a mdia, j que no dispomos de todos os valores da varivel, sendo, no entanto, possvel calcularovalordamediana,jqueconhecemosonmerodemedidasefectuadas.
MODA:
Estamedidadetendnciacentraldeverutilizarsequando: Umamedidarpidaeaproximadadatendnciacentralforsuficiente; Se deseja conhecer o valor mais tpico de uma distribuio exemplos: descrever o estilo devestidousadopelamulhermdia,salriopreponderanteemdeterminadaempresa.
de salientar que, apesar das vantagens apresentadas para a moda, esta tem a desvantagem de serdedeterminaoimprecisa,nocasodasvariveiscontnuas.
ESTATSTICAEBIOESTATSTICA
3.8.4 Quantis
Chamasequantildeordempcom0p1erepresentase,habitualmente,porCpaovalordex talqueF(x)=p. Algunsquantistmdenominaesespeciais:
QUARTIS:
Osquartisdividemasrieordenadaem4partesiguais,contendocadaumadelas1/4ou25%das observaes. Q1=1quartil(correspondeaoquantildeordemp=1/4) Q2=2quartil(correspondeaoquantildeordemp=1/2) Q3=3quartil(correspondeaoquantildeordemp=3/4) Assim, Q1 o valor da varivel estatstica que deixa atrs de si 25% das observaes; Q2 o valor da varivel estatstica que deixa atrs de si 50% das observaes e Q3 o valor da varivel estatstica que deixa atrs de si 75% das observaes. A (Q1 Q3) chamase intervalo interquartil eointervaloaoqualpertencem50%dasobservaes,deixando25%paraadireitae25%paraa esquerda. de notar que dizer que os quartis dividem a srie em 4 partes iguais no significa que, por exemplo, os intervalos (Q1, Q2) e (Q2, Q3) tm a mesma amplitude, mas sim que contm o mesmonmerodeobservaes.
DECIS:
Os decis dividem a srie ordenada em 10 partes iguais, contendo cada uma delas 1/10 ou 10% dasobservaes. D1=1decil(correspondeaoquantildeordemp=1/10) D2=2decil(correspondeaoquantildeordemp=2/10)
38 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
CENTIS:
Os centis dividem a srie ordenada em 100 partes iguais, contendo cada uma delas 1/100 ou 1% dasobservaes. C1=1centil(correspondeaoquantildeordemp=1/100) C2=2centil(correspondeaoquantildeordemp=2/100)
RELAES ENTRE QUARTIS, DECIS, CENTIS E MEDIANA:
ESTATSTICAEBIOESTATSTICA
A mdia e a mediana 10 e, contudo, estas distribuies so muito diferentes. Com efeito, enquanto no grupo A as notas apresentam desvios muito grandes, na distribuio B todos os valoresseaproximamde10.Adispersoouvariabilidadedaprimeirasriemaisacentuadado quenasegunda. Quer dizer: distribuies com a mesma tendncia central podem apresentar aspectos bastante diferentesnoqueconcernedispersoouvariabilidade,emedidaqueestadispersoaumenta, menossignificativasdadistribuiovosendoasmedidasdetendnciacentral. Assim,paramelhorcaracterizarmosumadistribuio,temosdeconsiderar,almdasmedidasde tendncia central, uma outra medida que exprima o grau de disperso ou variabilidade dos dados. Vamos considerar as seguintes medidas de disperso: amplitude total, amplitude interquartis, desviomdio,varincia,desviopadroecoeficientededispersooudevariao.
AMPLITUDE TOTAL
A amplitude total a diferena entre o maior valor e o menor valor, isto , a amplitude total de uma varivel estatstica a diferena entre o valor mximo e o valor mnimo dos valores
ESTATSTICAEBIOESTATSTICA
observados. a forma mais simples de avaliar a disperso dos dados, de tal modo que quanto maiorforaamplitudetotalmaioradispersodosdados. A amplitude total pode ser tambm denominada de intervalo total ou campo de variao; representase,habitualmente,porAeapenasusavaloresextremos. Numaamostraseriada: A=xmximoxmnimo Numaamostraclassificada: A=extremosuperiordaltimaclasseextremoinferiordaprimeiraclasse Se alguma destas classes for de amplitude indeterminada no possvel definir o intervalo de variao. Aamplitudetotalapresentaasseguintesdesvantagens: Embora seja fcil de calcular, a amplitude total depende somente dos valores extremos, que so, geralmente, os menos frequentes e os menos significativos de uma distribuio, desprezandose os valores intermdios que so os mais frequentes. Alm disso, os valores extremos so vulgarmente anmalos e muito variveis, consoante a amostra que se retire de uma populao, de tal modo que duas distribuies podem ter a mesma amplitude total, mas disperses muito diferentes. Outro inconveniente da amplitude total consequncia de no tomar em considerao as frequnciasdasobservaes. Exemplo:CalculeaamplitudetotaldogrupoG,sabendoque:
G= 2 3 10 16 19
ESTATSTICAEBIOESTATSTICA
AMPLITUDE INTERQUARTIS
Os quartis fornecem indicao quanto forma como as observaes se distribuem em torno da mediana. Como o 1 e o 3 quartis representam valores abaixo dos quais esto, grosso modo, respectivamente, 25% e 75% das observaes, entre eles existiro, assim, 50% das observaes centrais. Consequentemente, quanto mais aproximados estiverem estes quartis, maior ser a concentraodasobservaesemtornodamediana. A amplitude interquartis pode ser definida como a diferena entre o Quartil 3 e o Quartil 1. Esta medida de disperso pode ser tambm denominada de intervalo interquartis ou intervalo quartlico. Como podemos observar na figura 8, quanto mais achatada a curva, maior a amplitude e quantomaioraamplitudeinterquartlicamaisdispersaadistribuio.
Q1
Md
Q3
Exemplo:Calculeaamplitudeinterquartis,sabendoqueQ3=177,46eQ1=166,88. Q=Q3Q1=177,46166,88=10,58 Podemostambmcalcularaamplitudesemiinterquatisouintervalointerquartlicoouintervalo semiquartil ou desvio quartlico ou amplitude semiinterquartlico, que se representa, habitualmente,porQepodeserdefinidadoseguintemodo:
Q = (Q3-Q1) / 2
ESTATSTICAEBIOESTATSTICA
Estas medidas so mais completas do que a amplitude total, porque usam dois valores menos extremos (Q1 e Q3).Noentanto,tmaindaalimitaodenoentrarememlinhadecontacoma disposio das frequncias nos intervalos definidos pelos valores separados exemplo: a amplitude interquartis ser a mesma, quer as 50% das observaes se acumulem num s ponto, querestejamuniformementedistribudasporesseintervalointerquartis. As medidas de disperso que passaremos a descrever no tm esta limitao, porquanto o seu clculodependedetodososvaloresdasrie.
DESVIO
Dados n valores x1, x2, ..., xn de uma varivel X, chamase desvio de cada valor xi em relao constantec,adiferenadexiparac,isto,
xi - c
NotesequeosdesviosdavarivelXemrelaoac,isto,(x1c),(x2c),...,(xnc)constituemosn valoresdavarivelXc.
DESVIO MDIO
Falamos em desvio mdio quando consideramos os desvios de cada valor xi em relao mdia aritmtica,isto:
xi-x
O simples total destes desvios no pode ser utilizado como medida de disperso, por ser identicamentenulo.Defacto,paranvaloressingulares,terse:
(xi-x)=0
No entanto, o quociente entre a soma dos mdulos destes desvios e o nmero deles, j pode ser consideradocomomedidadedisperso
D.M.= |xi-x | / n
ESTATSTICAEBIOESTATSTICA
Exemplo20:CalculeodesviomdioparaA=453
Quadro 8: Clculo do Desvio Mdio
xi 4 5 3
|xi-x | 0 1 1
=12
x = xi / n =12/3=4 D.M.= |xi-x| / n = 2/3=0,67
= 2
Observao: tambm se utiliza o desvio mdio em relao a qualquer outra medida de posio central. Numaamostraseriadatemos:
D.M.= ni |xi-x| / n = fi |xi-x|
Se os valores da varivel estiverem tabelados de modo que cada valor xi corresponda a frequnciaabsolutani,odesviomdioigualsomadosprodutosdasfrequnciaspelosvalores absolutosdosrespectivosdesviosemrelaomdia,divididapeloefectivodadistribuio. Numa amostra classificada, os desvios em relao mdia aritmtica so calculados a partir dos pontosmdiosdecadaclasse,ouseja:
D.M.= ni |x'i-x'| / n = fi |x'i-x'|
ESTATSTICAEBIOESTATSTICA
classes ni
[4-6[ 1
[6-8] 2
Classes
ni 1 2
xi 4,5 7
[4-6[ [6-8]
=3,3
Ento,odesviomdio
D.M.= ni |x'i-x'| / n = 3,3 /3 = 1,1
Odesviomdioapresentaaseguintedesvantagem: Embora dependa de todos os valores observados, o desvio mdio tem a desvantagem de considerarosvaloresabsolutosdosdesvios,oqueimpedeoseutratamentoalgbrico.
VARINCIA
Outramaneiradeeliminarmosossinaisdosdesvios,consisteemelevlosaoquadrado.Porisso, em vez da mdia dos valores absolutos dos desvios considerase a mdia dos quadrados dos desvios.Obtmse,assim,umaoutramedidadedispersobastanteusadaavarincia. Dados n valores x1, x2, ..., xn de uma varivel X, chamase varincia e representase, habitualmente, por s2 ou s2x a mdia aritmtica dos quadrados dos desvios em relao mdia dessasvalores,isto:
S2 = (xi-x)2 / n Exemplo 22: Calcule a varincia para X=17,18,19,20,21 Resoluo 22: x = xi / n = (17+18+19+20+21) / 5 = 19 Ento,avarincia:
Quadro 10: Clculo da Varincia
xi 17 18 19 20 21 N=5
(xi-x)2 4 1 0 1 4 =10
S2 = (xi-x)2/ n = 10/5 = 2
45 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Sex1,x2,...,xnocorremn1,n2,...,nkvezes,respectivamente,temos Paraumaamostraseriada:
S2 = ni (xi-x)2 / n = fi (xi-x)2
Paraumaamostraclassificada:
S'2 = ni (x'i-x ')2 / n = fi (x'i-x ')2
Exemplo23:Calculeavarinciaparaadistribuiocujamdia103
Classes [85-90[ [90-95[ [95-100[ [100-105[ [105-110[ [110-115[ [115-120] ni 12 25 38 85 93 16 9
Quadro 11: Clculo da Varincia
ni 12 25 38 85 93 16 9 278
Ento,avarincia
S'2 = ni (x'i-x)2/ n = 12162,25/ 278 = 43,7491
Podemos,agora,enumeraraspropriedadesdavarincia: Somando ou subtraindo uma constante a todos os valores observados, a varincia resultantepermanecerinalterada;
ESTATSTICAEBIOESTATSTICA
Multiplicando ou dividindo todos os valores observados por uma constante diferente de zero, a varincia resultante vir multiplicada ou dividida, respectivamente, pelo quadradodessaconstante.
CORRECODESHEPPARD: Ao calcularseamdiaeavarinciadaamostraclassificadaatravsdadistribuioempricadas marcas, cometese um certo erro (erro de agrupamento), pois supomos que as observaes agrupadas em cada classe tm todas o valor da respectiva marca. Todavia, existem frmulas correctivas devidas a Sheppard, isto ,na variancia, ao valor calculado deve subtrairse 1/12 ao quadradodaamplitudedasclasses(a)
s2x = s2x' - a2/12 assim,nonossoexemploanterior,avarianciacorrigida
era
s2x =43,7491 - 52 12 s2x =41.666
DESVIOPADRO O desvio padro pode ser definido como a raiz quadrada da varincia, representandose, habitualmente,porsx,isto:
sx = s 2x
Ainda que a varincia nos d uma boa informao sobre a distribuio ou variabilidade dos valores observados em relao sua mdia, apresenta, no entanto, a desvantagem de no se exprimir na mesma unidade a que esto referidos os dados iniciais. Contudo, esta desvantagem poder ser eliminada se extrairmos a raiz quadrada da varincia. A nova medida chamase desviopadrooudesvioquadrtico. Numaamostraseriada,temos:
sx =
s 2x
ESTATSTICAEBIOESTATSTICA
Exemplo:Calculeodesviopadro,sabendoqueavarinciadeumaamostraseriada2.
sx = s2x = 2 = 1,414
Numaamostraclassificada,temos:
sx = s2x
Exemplo: Calcule o desvio padro, sabendo que a varincia corrigida de uma amostra classificada4327,16.
sx =
s2x
=4327,16 = 65,78
AUTILIZAODASMEDIDASABSOLUTASDEDISPERSO Amplitudetotal Utilizasequando: Os dados forem muito raros ou demasiado dispersos para se justificar o clculo de uma medidamaisprecisadedisperso; Amplitudeinterquartlica Utilizasequando: Amedianaamedidadetendnciacentralusada; Existirem resultados extremos que poderiam afectar o desvio padro de uma maneira desproporcionada; Adistribuiotruncada; Adistribuioapresentaumaforteassimetria.
48 Margarida Pocinho e Joo Paulo de Figueiredo
Forapenasnecessriooconhecimentodosresultadosextremos; Desejamosumndicemuitorpidodedisperso.
ESTATSTICAEBIOESTATSTICA
Desviomdio Utilizasequando: DesviopadroeVarincia Utilizamsequando: Seprocuraumamedidadedispersoemrelaocomacurvanormal; Tiveremdesercalculadosposteriormentecoeficientesdecorrelaoeoutrasestatsticas; Sedesejarobterumamedidaqueserevistadeummximodeestabilidade; Sesetratasomentededescreverumadistribuioprefereseodesviopadrovarincia. Avarinciaintervmsobretudonaanliseestatstica. Desejamosponderartodososdesviosemrelaomdiadeacordocomasuagrandeza; Osdesviosextremosinfluenciaremindeterminadamenteodesviopadro.
ESTATSTICAEBIOESTATSTICA
Qual a distribuio mais dispersa? Se compararmos os desvios padres a B, porque tem maiordesviopadro.Masavariaode20para600muitomaiordoque10para30.Assim,em vez de compararmos os desvios padres, aplicamos outra medida de disperso relativa que o coeficientedevariaooudedisperso,quepodeserdefinidopelafrmula
V = sx /x
Exemplo 26: A distribuio dos pesos e das alturas de um grupo de estudantes de determinada Universidadeconduziuaosseguintesresultados: Determineocoeficientededispersoparacadaumadasdistribuiese,depois,indiqueemqual delasadispersorelativamaior. Vx=sx/x=7,5Kg/57,5Kg=0,130=13% Vy=sy/Y=7,1cm/170cm=0,042=4,2% X:Pesos Y:Alturas Mdia=57,5Kg Mdia=170cm DesvioPadro=7,5Kg DesvioPadro=7,1cm
Assim,podemosdizerqueadispersorelativamaisacentuadanadistribuiodospesos(X). Adispersomaiornadistribuioquetivermaiorcoeficientededisperso. Se pretendermos estabelecer comparaes entre disperses absolutas, devemos usar o desvio padro,detalmodoquequantomaiorforodesviopadromaiorseradisperso. Se pretendermos estabelecer comparaes entre disperses relativas, devemos usar um coeficiente de disperso, de tal modo que quanto maior for o coeficiente de disperso V maior seradisperso.
ESTATSTICAEBIOESTATSTICA
Estas no so distribuies normais, apesar de a mdia, a mediana e a moda se encontrarem todas no mesmo ponto ( isto que confere simetria distribuio); a distribuio normal tem sempre a forma de um sino. Como foi descoberta pelo matemtico Gauss, tambm lhe chamamosdistribuiogaussiana. A maior parte dos dados recolhidos com organismos vivos tm este padro. Podemos observar que, devido forma da curva, h poucos resultados muito baixos e poucos resultados muito eleva. dos (a curva cai nos extremos esquerdo e direito, o que se deve s baixas frequncias encontradas), enquanto a maioria dos resultados se encontram junto mdia. Vamos debruar
51 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
nossobreopadroderesultadosmuitoembreve,masnestafasereferiremosoutracaracterstica muito importante da distribuio normal. Tericamente, a curva nunca toca o eixo horizontal, mas aproximase dele infinitamente. Esta uma propriedade matemtica da distri buio que no se reflecte na recolha de dados real. No nos cruzamos com seres humanos com dimensesgigantescasoumicroscspicas! Entoaspropriedadesdadistribuionormalsoasseguintes: 1)simtrica; 2)Temformadesino; 3) A mdia, a mediana e a moda encontramse no mesmo pontodacurva; 4)Temduaspontasquenuncatocamoeixohorizontal.
Podemos perguntarnos quo rgida a distribuio normal relativamente aos elementos. Por outras palavras, quanto pode uma curva desviarse da forma de sino e continuar a ser considerada normal? Geralmente, usamos duas abordagens para tomarmos este tipo de deciso; na verdade, este problema mais importante do que o leitor pode pensar, pois existem testes estatsticos,descritosmaisfrente,quespodemrealizarseseoselementosforemnormalmente distribudos. Uma das abordagens baseiase na observao dos dados por averiguao, para lhe darmos um nome mais respeitvel. Se o conjunto de nmeros for extenso, tornarse mais fcil desenhar uma distribuio de frequncias. A outra abordagem reside em seguir um dos procedimentos matemticos para determinar se um conjunto de resultados normalmente distribudo. A verso do teste do quiquadrado que inclumos neste manual um desses procedimentos. Na verdade, improvvel que nesta fase da sua carreira estatstica necessite de saber com grande preciso se uma distribuio considerada normal ou no, pelo que o teste grficodevebastar.Noentanto,devesersensvelaoproblema.
ESTATSTICAEBIOESTATSTICA
ESTATSTICAEBIOESTATSTICA
Exemplo: Suponhamos que o professor obtm os resultados de um teste de leitura feito a 200 crianas.Osresultadossonormalmentedistribudoscomumamdiade60eumdesviopadro de 8. A partir das propriedades da distribuio normal, sabemos que cerca de dois teros dos resultados, isto , aqueles que foram obtidos com cerca de 136 crianas, encontrarseo entre os 52 e os 68 pontos. Cerca de 32 crianas (16 %) tero resultados abaixo de 52 e cerca de 32 tero resultadosacimade68.Josreferimostodos.Suponhamosentoqueospaisdeumacrianaque obteve 68 gostariam de saber algo acerca do progresso do seu filho. Quando souberam que o resultado da criana estava acima da mdia, ficaram contentes, mas gostariam de saber, posteriormente,quoacimadamdiaseencontra,relativamenteaosoutros50%decrianasque tambm obtiveram resultados acima da mdia. Por outras palavras, os pais pretendem saber qual a posio relativa do desempenho do filho. Se os resultados estivessem todos muito perto da mdia, sendo a nota mxima 68, os pais continuariam encantados. Ficariam, porm, menos satisfeitos se soubessem que a nota mxima tinha sido 90, com um grande conjunto de notas altas, acima de 70. No entanto, o professor sabe que o desviopadro das notas foi 8 e, por isso, um tero de todos os resultados estava entre 60 e 68. Sabendo que 50 % dos resultados obtidos estavamabaixodamdia,podemosperceberqueaposiodesta crianaestaonvelde84% dos resultados, na parte superior de todos os resultados. Afinal, os pais tm razes para estarem contentes! Se a criana tivesse obtido 76, os pais teriam muito mais razes para estarem orgulhosos, pois saberiam que o seu filho estava acima de 98 % das outras crianas (nota 76 e dois desviospadro acima da mdia); uma nota 84 colocaria o menino na posio invejvel de estar acima de 99,87 % das outras crianas por outras palavras, num grupo de 200 crianas,
54 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
estaria, muito provavelmente, no topo. Os desviospadro cortam propores fixas da distribuio normal, a partir da mdia e at ao infinito (pelo menos teoricamente), nas duas direces.Devecertificarsedequepercebeucomoseobtmaposiorelativadanota76(isto, 50%+33%+15%)ecomosecalculaquenestegrupodecrianasexistemoutrasquatrocomnotas acimade76.Vejaseconseguecalcularanotaquecolocariaacriananaposio,menosinvejvel, deestarapenasaquatrolugaresdofim. Aresposta44.Paraobtermosestanotanecessitamosdesaberquenotarepresentadoisdesvios padro abaixo da mdia ou que nota corresponde a 2%. Partindo de 60, a mdia, se lhe subtrairmos o valor de dois desviospadro 16, duas vezes o valor de 8, que um desvio padro obteremos 44. Devemos ter cuidado e no misturar os valores dos desviospadro com os resultados reais. Neste exemplo no subtramos o valor 2 da mdia de 60, apesar de querermos o resultado que estava dois desviospadro abaixo dele. Subtramos 16 pontos, pois esteonmeroquecorrespondeadoisdesviospadroparaesteconjuntoderesultados. Resultados z Nos exemplos considerados os resultados encontravamse sempre na mdia, ou exactamente um, dois ou trs desviospadro acima ou abaixo dela. Temos, porm, de examinar resultados que no sejam to facilmente convertveis para desviospadro. Suponhamos, por exemplo,queumacrianacompaisansiososobteveumanota64numtestedeleitura.Aposio da criana na curva seria a metade da distncia, no eixo horizontal, entre o resultado da mdia (60)eumdesviopadroacima(68).
ESTATSTICAEBIOESTATSTICA
A posio da criana exactamente a meio entre os pontos 60 e 68. Significar isto que a sua posionogrupoopontocentralentreamdiade50%e84%danota68?Isto,encontrarse a criana acima de 67 % dos colegas? Olhemos cuidadosamente para as duas pores da curva que est dividida pela linha ao nvel da nota 64. Sero simtricas? No e aqui temos um problemaquetornaoclculodeumaposiorelativamuitomaiscomplicadoecansativodoque gostaramos. Quanto mais nos afastamos da mdia, menos resultados correspondem s diferentes propores. Assim, se tivermos duas pores entre 60 e 64 e entre 64 e 68, haver menos resultados neste ltimo intervalo. Haver ainda menos no intervalo sguinte, entre as notas 68 e 72, e assim sucessivamente. Isto tambm verdadeiro para os resultados abaixo da mdia, mas, neste caso, so os resultados mais elevados, e no os mais baixos, que se encontram mais perto da mdia. H muito menos resultados entre 44 e 48 do que entre 48 e 52, apesar de, em ambos os casos, a variao de notas ser de 4 pontos, ou seja, meio desviopadro. Quando olhamosparaaformadeumadistribuionormal,otamanhodiferentedasproporesquecada desviopadro compreende parece bvio. No entanto, o problema de decidir a posio relativa de uma nota 64, quando comparada com os resultados, no desapareceu. Como podemos determinla? A resposta dada atravs de resultados z. Os resultados z correspondem a desviospadroe,naverdade,sovirtualmenteamesmacoisa,exceptonofactodeumresultado z se referir sempre posio de um ponto em relao a mdia. Isto vai tornarse claro em breve. Para j, pensemos que um resultado z de 1amesmacoisaqueumdesviopadrode1,queum resultado z de 2 e um dp 2, e assim por diante. Como no h, virtualmente, nada numa distribuionormaldepoisdoterceirodesviopadroouresultadozemqualquerdasdireces ,r,aroqueosdesviospadroouosresultadoszincluamovalor4.Ecomumreferirmonosaos resultados z como mais ou menos; aos desviospadro descrevemolos como situandose acima ou abaixo da mdia, em vez de mais ou menos. Um desviopadro tem um valor definido no varivel, enquanto um resultado z se refere a uma posio relativa na curva e referido em funo da mdia. Como, at agora, um resultado z tem o mesmo significado que um desvio padro acima da mdia, podemos considerar que os resultados z e osdesviospadrosoiguais. No entanto, um desviopadro pode referirse a um conjunto de resultados que distem um desviopadro de qualquer ponto da curva, enquanto os resultados z tm posies fixas. Um resultado z de + 1 corresponde exactamente a um desviopadro acima da mdia, e no a qualquer conjunto de resultados que constituam um desviopadro. Voltemos ao problema do resultadode64esuaposiorelativa.Sabemosqueasuaposioexactamentemetadedeum desviopadroacimadamdia,peloquelhedamosumresultadozde+0,5.
ESTATSTICAEBIOESTATSTICA
H tabelas que nos permitem ver muito facilmente onde os resultados z se situam na curva normal (Anexo VIII).Vejamoscomoutilizlas.Utilizaremosonossoexemplode64,cujovalorz +0,5. Lemos o valor na primeira coluna da esquerda, encabeada por z, at chegarmos ao valor 0,5. Olhamos para a coluna direita e vemos o nmero 19,15. Temos de somar 50%, de modo a obtermos o valor 69,15. Sabemos ento que h 69,15% dos resultados abaixo de 64 e 30,85% acima. Devemos arredondar os valores para 69% e 31%, respectivamente. Consideremos outro exemplo, desta vez com o valor 65. Este valor est 5 pontos acima da mdia e o desviopadro para o conjunto de 8. Um resultado de 5 pontos acima da mdia 5/8 de desviopadro acima damdia.Sefizermosascontas,sabemosquez+0,63.Comoseencontraacimadamdia,oseu valor positivo. Voltemos tabela 51. Como z tem, desta vez, duas casas decimais, os procedimentos vo ser um pouco diferentes. O valor imediatamente direita (22,7) a percentagem correcta para um resultado z de 0,6. No entanto, o nosso resultado 0,63, pelo que temos de andar trs colunas da tabela ataovalor0,03,notopo.Estevalor,somadoaovalor0,6, dnos o z de 0,63 ou seja, 23,57. Como o nosso z positivo, devemos somarlhe 50% para obtermos o valor final de 73,57. Assim, a nota 65 est frente de 74% da escala. Podemos ver pela tabela que 49% de todas as notas em cada um dos lados da curva esto includas num z de 2,33ouumbocadinhomaisabaixo,parasermosmaisprecisos).Notemosque,matematicamente, ascaudasdacurvanuncatocamoeixohorizontal,nemincluemtodososresultadospossveis. Reparemosagoranaposiorelativadeumapessoaqueobtenhaumresultadoabaixodamdia, digamos uma nota 41 na amostra original. Esta nota est 19 pontos abaixo da mdia, apenas um poucomenosdoquedoisdesviospadro.Parasermosprecisos,est19/8 ou2,375abaixo.Oseu zser 2,375.NatabelaSIiemanexovemosqueumzde+2,3inclui48,93%dosresultados,mas o nosso resultado z o valor um pouco superior de 2,375. A nossa tabela s pode ser usada com duas casas decimais, pelo que vamos arredondar este valor para 2,38. Paramos, desta vez, junto dacolunade0,08eobtemosovalor49,13.Assim,umzde+2,38inclui50%+49,13%=99,13%de todososresultados.Atagoratudobem,masoproblemaqueonossovaloreranegativo.Basta virarmosanossacurvaaocontrrioetrabalharmoscomasuaimagemaoespelho.Assim,como nosso valor 2,38 sabemos que 99,13% de todas as notas da distribuio esto acima dele e apenas0,87%abaixo.Seconsiderarmosestapequenaproporode1%,devemosesperarque,na nossa amostra de 200 indivduos, 1%, ou seja, dois indivduos tenham notas inferiores a 41. No
57 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
outro extremo das notas, devemos esperar que apenas dois alunos tenham notas de 19 ou mais pontosacimadamdia,ouseja,notasqueexcedamos79%. Omododeobterovalorzdadopelaexpressoformal
Z= desvio da nota em relao mdia desvio-padro
Seodesvioemrelaomdiativerumsinalpositivoounegativo,seestiveracimaouabaixoda mdia,respectivamente,zficarcomosinalcorrecto. Nota: : tenha cuidado quando trabalhar com z e dp, de modo a uslos sempre que os dados atravs dos quais foram obtidos sigam uma distribuio normal Ou aproximadamente normal. Deoutromodo,arranjarconfuses
ESTATSTICAEBIOESTATSTICA
ESTATSTICAEBIOESTATSTICA
PODERDEUMTESTE OpoderdeumtesteaprobabilidadederejeitarmosaH0quandoelarealmentenula Os testes mais poderosos (os que tm maior probabilidade) de rejeio de H0, so testes que possuemprrequisitosmaisdifceisdesatisfazer(testesparamtricoscomoteF). As alternativas no paramtricas exigem muito menos prrequisitos mas produzem testes de significnciacommenospoderqueoscorrespondentesparamtricos. EMCONSEQUNCIA Ao rejeitarse a H0 sem preencher as exigncias mnimas dos testes paramtricos, mais provvel que essa rejeio seja falsa (se rejeitar a H0 quando ela verdadeira comete umerrode tipo I; se aceitar a H0 quando ela falsa comete um erro de tipo II). Quando os requisitosdeum testeparamtricosoviolados,tornaseimpossvelconheceroseupodereasuadimenso() obvio que os investigadores querem, a todo o custo, rejeitar a H0 quando ela mesmo falsa, evitandoumerrodetipoI. Otesteidealseriaaqueleque=0e=1,oqueimplicariaqueotesteconduziriasempredeciso correcta,contudoestetesteidealraramenteexiste. Aprobabilidadedoerrode1espciedeveserreduzida,fixandotericoem0,1;0,05ou0,01.o valor fixado para depende da importncia que se d ao facto de rejeitar a H0 quando esta verdadeira. Umailustraodestepontodevistapodeserfeitacomoseguinteexemplo: Umapessoainocenteatprovadocontrrio H0:Apessoainocente H1:Apessoaculpada
ErroI:Apessoacondenadamasestinocente ErroII:Apessoaabsolvidamasculpada
ESTATSTICAEBIOESTATSTICA
Naturalmente a justia procura reduzir a possibilidade de ocorrer o erro de 1 espcie, pois entendesequemaisgravecondenarinocentesqueabsolvercriminosos. Para certos sistemas judiciais um = 0,1 demasiado elevado, optando por =0,01; noutros sistemasjudiciaispodeadmitirque=0,05umvalorrazovel.
ASSIM Fixada a probabilidade do erro de tipo I (dimenso do teste), o teste mais potente aquele em que a escolha da regio critica minimiza a probabilidade do erro de 2 espcie. Dizse tambm queestaregiocriticaamaispotente. Facilmente se conclui que o teste mais potente aquele que, uma vez fixada a probabilidade de rejeitar a H0, quando ela verdadeira, maximiza a potncia ou a capacidade para rejeitar a mesmahiptesequandoestafalsa. PRESSUPOSTOS Para saber se uma varivel simtrica dividimos o coeficiente assimetria (Skewness) pelo erro padroeseoresultadoestiverentre2e2adistribuiosimtrica. Parasaberseumavarivelmesocurticadividimosocoeficientedeachatamento(Kurtosis)pelo erropadroeseoresultadoestiverentre2e2adistribuiomesocurtica. Mas se os resultados de um teste paramtrico, no cumpriram com os requisitos (no mnimo dados intervalares; distribuio simtrica, mesocurtica e normal), ento no tm interpretao significativa. Quando acontecem estes factos, a maioria dos investigadores opta por testes de significncia noparamtricos.
ESTATSTICAEBIOESTATSTICA
PARAESCOLHERQUALQUERTIPODETESTEESTATSTICO Distinguir se a nossa amostra constituda pelos mesmos sujeitos em todas as situaes ou se formadapordiferentessujeitosparacadasituao
INTERSUJEITOSOUDESIGNNORELACIONADO este tipo de design utilizado quando um indivduo ou objecto avaliado apenas uma vez. A comparao efectuado entre os grupos de sujeitos/ objectos cujos resultados so no relacionados. Desvantagem: conjunto das diferenas individuais na forma como os sujeitos reagem ou respondemtarefa. INTRASUJEITOSOUDESIGNRELACIONADO Acomparaofeitaentreosmesmossujeitos(sujeitosdomesmogrupo). A importncia destesdesignsaeliminaodequaisquerparticularidadesindividuais,umavez queficamigualizadasemtodasassituaes. Desvantagem:Efeitodememriaeaprendizagem. AMOSTRASEMPARELHADAS Igualizamse sujeitos diferentes mas emparelhados, em termos de idade, sexo, profisso e outras caractersticasgeraisqueparecemimportantesparacadapesquisaemparticular. estes tipos de designs podem ser considerados de designs relacionados, uma vez que controladonassuascaractersticasrelevantes. Desvantagem: Dificuldade em encontrar sujeitos que permitam o emparelhamento de todas as caractersticasrelevantes. Dificuldadesarranjargrandesamostras.
ESTATSTICAEBIOESTATSTICA
QUANDOUTILIZAR
Utilizasequandoosdadossonominais,peloqueemvezdesemediremresultadosdossujeitos apenassepodemdistribuirossujeitosporumaoumaiscategorias. OQuiQuadrado(X2)testaahipteseexperimentalqueprevquantossujeitosdecadagruposo distribudosporumadeterminadacategoria. OX2umtesteestatsticonoparamtrico,sendoumdosmaisutilizadosebastanteaplicadoem diferentes planeamentos experimentais. O X2 muito usado mesmo ao nvel da estatstica multivariada(nosentidodeobterograudeadernciaentreomodeloobtidoeoterico).
OBJECTIVO
O objectivo comparar frequncias observadas com frequncias tericas ou esperadas, ou seja, verificaroseugraudeaproximao,quepodesergrande(=0)oupequeno(>0).
63 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Assim,oobjectivocompararasfrequnciasobservadasemcadaumadasclulasdeumatabela de contingncia com as diferenas esperadas. O teste compara o nmero de sujeitos que se distribuem por uma determinada categoria com o nmero de sujeitos que se esperaria se distribussemporessamesmacategoria,casonoexistissemdiferenas. OtestedoX2reflecteotamanhodasdiferenasentreasfrequnciasobservadaseesperadas.Para ser significativo, o valor de X2 dever ser igual ou superior aos valores crticos da tabela (Anexo I). INSTRUESPASSOAPASSO 1. Calcular as frequncias esperadas (E) para cada clula, multiplicando os dois totais parciais relevantesparacadaumaedividindopelonmerototaldesujeitos. 2.CalcularX2:
(O-E)2
X2 =
______________
3.Calcularosgrausdeliberdade:
g.l. = (r-1) (c-1)
ESTATSTICAEBIOESTATSTICA
A C A+C
B D B+D
A+B C+D N
Quandoumatabelatemmaisdeduasentradas: g.l.=(nmerodecolunas1)(nmerodelinhas1)
X2 = (total de linha) (total de coluna) (total geral)
Exemplo: Suponha que quer estudar se os estudantes de cincias sociais utilizam um mtodo de estudo significativamente diferente daquele que utilizado pelos estudantes de tecnologia. Escolheramse dois grupos, um composto por 50 estudantes de cincias sociais e o outro por 50 estudantes de tecnologia. Enviouse um questionrio aos 100 estudantes pedindolhes que indicassememqualdasseguintescategoriasmelhorseenquadraoseumtododeestudo:estudo dirio regular, estudo irregular em perodos concentrados de trabalho intensivo ou uma mistura dos dois. Foram recebidas 44 respostas dos estudantes de cincias sociais e 42 dos estudantes de tecnologia. Colocouse a hipotese experimental (H1) de que o tipo de estudo dependia do curso frequentado Os resultados so apresentados na forma de uma tabela 2X3, designada por tabela de contingncia(crosstab).Asclulasquerepresentamcadaumadascategoriassonumeradasde 1a6.
Quadro 12: Tabela de Contingncia (Crosstab)
Irregular
3
Misto
23 E=24,05
ESTATSTICAEBIOESTATSTICA
Resoluo49: InstruesPassoaPasso:
2.Aplicarafrmula:
(O-E)2
X2 =
________________
E X2 = (6-8,19)2 + (15-11,77)2 + (23-24,05)2 + (10-7,81)2 + (8-11,23)2 + (24-22,95)2 8,19 11,77 24,05 7,81 11,23 22,95 X2 = 0,59 + 0,89 + 0,05 + 0,61 + 0,93 + 0,05 = 3,12
3.Calcularosgrausdeliberdade(gl)
g.l. = (r - 1) (c - 1) = (2 -1) (3 - 1) = 2 4. Consultar a tabela (Anexo I)
Para
p=0,05 e gl=2 x2 critico=5,99
Concluses: Dado que o valor observado de X2 apenas de 3,12, ou seja, inferior ao valor crtico de 5,99 para p < 0,05, o resultado da experincia no significativo. Aceitase hiptese nula de que os padres de estudo dos estudantes de cincias sociais e de tecnologia no diferem, rejeitandosedestaformaanossahipoteseexperimental(H1).
ESTATSTICAEBIOESTATSTICA
Exemplo:ordenarumgrupoemfunodon.defactoresderisco:
Quadro 13: Ordenao de um grupo em funo do n. de factores de Risco
N. de Factores de risco 6 3 12 4 7 5 8
Ordem
4 1 7 2 5 3 6
Noscasosemqueexistemresultadosiguaisutilizaseadoslugaresquedeviaocupar.
ESTATSTICAEBIOESTATSTICA
Exemplo:
N. de FR.
1 2 1 4 1 3 4 6 5
Ordem
2 4 2 6,5 2 5 6,5 9 8
Ordenamento de diferenas entre resultados (designs relacionados para os mesmos sujeitos ou emparelhados): 1. Em geral, a atribuio de ordens s diferenas entre resultados efectuase tal como fizemos para os resultados, sendo atribuda a ordem mais baixa menor diferena e poraadiante; 2. Diferenasidnticasentreresultadossoordenadasdamesmaformaqueresultados idnticos, atribuindose uma ordem mdia resultante da globalidade de ordens que essasdiferenasdeveriamocupar; 3. Resultadosnulosde0socontadoscomooresultadomaisbaixopossvelquandose calculamdiferenasentreresultados; 4. Contudo, quando existe igualdade entre resultados que originem uma diferena nula entre as situaes experimentais, estes no so ordenados, sendo retirados da anlise; 5. Diferenas positivas e negativas so ordenadas em conjunto como se se tratasse de umordenamentosimplesderesultados,ignorandoossinaispositivosenegativos.
ESTATSTICAEBIOESTATSTICA
Exemplo: Suponha que quer ordenar as diferenas entre o nmero de frases correctas que um grupo de crianas com suspeita de perda auditiva produziu antes da colocao de um aparelhoauditivoeapsacolocaodaquele.
Quadro 14: Ordenao para Amostras Relacionadas ou Emparelhadas
Sujeitos 1 2 3 4 5 6 7 8 9 10 N de frases correctas antes do aparelho auditivo 5 5 2 1 4 2 1 4 1 1 N de frases correctas depois do aparelho auditivo 6 7 3 5 5 5 5 4 7 6 diferenas 1 2 1 4 1 3 4 0 6 5 ordem 2 4 2 6,5 2 5 6,5 9 8
Ao contrrio do que acontece nos casos das amostras relacionadas quando a diferena entre 2 situaes nula nas amostras relacionas a este tipo de resultado no atribuda nenhuma ordem, sendo que o resultado nem sequer considerado na anlise. No ordenamento de resultados negativos em amostras relacionadas ignoramse os sinais quando se ordenam os resultados.
relacionados/emparelhados ou grupos independentes. No caso de duas amostras independentes determinamos se as diferenas nas amostras constituem uma evidncia convincente de uma diferenanosprocessosdetratamentoaelasaplicados. Conquanto o uso de duas amostras relacionadas em projectos de pesquisa tenha mritos indiscutveis, a sua aplicao, em geral, no prtica. Frequentemente, a natureza da varivel dependente impede a utilizao dos indivduos como seus prprios controlos, tal como ocorre quandoavariveldependenteosuicidiotentado;umproblemaquepodeacontecerumanica vez. Pode ser tambm impossvel delinear um projecto que utilize pares de dados, talvez por
69 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
desconhecimento,porpartedoinvestigador,devariveisteisquepossamformarpares,oupela impossibilidade de obter mensuraes adequadas de alguma varivel de reconhecida importnciaou,enfim,porquesimplesmentenosedispedeparesadequados. Quandoautilizaodeduasamostrasrelacionadasnoprticaouadequada,podemosutilizar duas amostras independentes. Em tais projectos, as duas amostras podem ser obtidas por umde doismtodos: a) Podemserextradasaleatoriamentededuaspopulaes; b) Podem decorrer da atribuio aleatria de dois tratamentos aos membros de umaamostradeorigemarbitrria. Nota:Emnenhumdestescasosseexigequeasamostrastenhamomesmotamanho.
O teste U de MannWhitney deve ser utilizado em designs com duas situaes, no relacionados, quando so utilizados sujeitos diferentes em cada uma das situaes experimentais.
ESTATSTICAEBIOESTATSTICA
Exemplo: Suponha que quer investigar o n. de queixas dolorosas durante um tratamento a um mesmo problema teraputico (controlada a gravidade e a extenso da leso) em que se utilizaram duas tcnicas diferentes. A hipotese experimental supe que durante a utilizaodatcnicaBqueodoenteseapresentamaisqueixoso.
Quadro 15: Resultados do registo das queixas
A 3 4 2 6 2 5 22 3,67
B 9 7 5 10 6 8 45 7,5
RACIONAL O racional que est por trs do teste U de MannWhitney bastante semelhante ao do teste de Wilcoxon. A diferena fundamental entre as duas reside no facto do segundo se aplicar a designs relacionados e o U se aplicar a designs norelacionados, utilizando, portanto, sujeitos diferentes. O teste de Wilcoxon analisa as diferenas entre a performance dos mesmos sujeitos (ou pares de sujeitos emparelhados) submetidos a duas situaes experimentais. Com um design norelacionado no temos uma base que nos permita comparardiferenasentreparesderesultados.Assim,otesteUdeMannWhitneyordenaos resultados de todos os sujeitos em ambas as situaes como se fossem apenas um conjunto simplesderesultados. Se as diferenas entre as situaes forem aleatrias, como postulado pela hiptese nula, entoosresultadosdevemseraproximadamenteosmesmose,consequentemente,asordens devem ser tambm aproximadamente as mesmas para as duas situaes. Se houver uma preponderncia de ordens altas ou baixas numa situao ou na outra, ento porque a diferenanototaldosresultadosordenadosparacadasituaodevidaaosefeitosprevistos da varivel independente e no ao acaso. Se a soma total das ordens for muito baixa para uma das situaes, ento ter de haver uma preponderncia de ordens elevadas na outra situao. Quanto menor for U mais significativas sero as diferenas entre as ordens das duas situaes.
71 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Seleccioneomaiortotaldasordens.
T2=55
CalculeovalordeUatravsdafrmula
U = n1.n2 + Nx (nx + 1) __________________ 2 - Tx
emque:
ClculodeU
6x7 U=6x6+
_______________
Nx=nmerodesujeitosdogrupocomomaiortotaldeordens
- 55 = 36+21-55=2
Quando existe o mesmo nmero de sujeitos em cada situao rapidamente se torna mais fcil verificar qual o maior total de ordens. Normalmente, prefervel ter um nmero idntico de sujeitos em cada grupo; no entanto, se tiver de utilizar um nmero desigual de sujeitos em cada grupo, poder fazlo. Em caso de dvida, calcule U para ambas as ordens totais, seleccionando onapropriadoacadacasoe,depois,considereoUmaispequeno.
ESTATSTICAEBIOESTATSTICA
ESTATSTICAEBIOESTATSTICA
ESTATSTICAEBIOESTATSTICA
Preferencia aps 30 dias de exercicio Escadas Preferncia antes da teraputica Elevador Escadas 4 4 (A) (C) Elevador 14 3 (B) (D)
HIPTESE DE NULA:
H0: Para os obesos que modificaram a sua atitude, a probabilidade de mudar o percurso do elevador para as escadas (PA) igual probabilidade de mudar de mudar das escadas para o elevador(PD)eambassoiguaisa.Isto, H0:PA=PD=1/2 H1:PA>PD
ESTATSTICAEBIOESTATSTICA
PROVA ESTATSTICA:
Utilizase a prova de McNemar para significncia de mudanas, porque o estudo utiliza duas amostras relacionadas, do tipo antesedepois e utiliza a escala de medida nominal (classificativa). Nveldesignificncia: p=0,05 Distribuioamostral: A distribuio Quiquadrado com 1 grau de liberdade d uma boa aproximao da distribuio amostraldeQuiquadrado,talcomocalculadapelafrmula. RegiodeRejeio: Como H1 especifica o sentido da diferena prevista, a regio derejeiounilateral.Consistede todos os valores de Quiquadrado que so to grandes que acusem uma probabilidade unilateral,associadasuaocorrnciasobH0nosuperiora0,05. Deciso: Estamos interessados nos obesos cujo comportamento acusa alterao: representados nas clulas AeD. Paraosdados,temos:
(A-D - 1)2 X2 =
_________________________
N=25
(4-3 - 1)2 =
__________________
(1 - 1)2 =
___________________
0 =
__________
=0
A+D
4+3
Sendo0valorobservadodex2=0,devemosconsultaratabela(AnexoI)paraobterovalorcritico, no esquecendo que temos uma amostra unicaudal a um nivel de 0,05. consultando a tabela observamosumx2criticode5,41.
Racional Paracompararasignificnciadequalquermudanaobservada,porestemtodo,constriseuma tabela de frequncias de 4 casas para representar o 1 e o 2 conjunto de reaces dos mesmos
ESTATSTICAEBIOESTATSTICA
indivduos. As caractersticas gerais desta tabela so as que se apresentam a seguir, em que se utilizamossinais+eparaindicardiferentesreaces.
ANTES
DEPOIS + A C + B D
Notese que os casosqueacusammodificaesentrea1ea2reacoaparecemnasclulasAe D.UmindivduolocalizadonaclulaAsepassoude+paraenaclulaDsepassoude para +. Na ausncia de modificao, o indivduo classificado na clula B (reaco + antes edepois)ounaclulaC(reacoantesedepois). Como A e D representa o nmero total de indivduos que acusam modificao, a perspectiva, sob a hiptese de nulidade, seria que (A+D) acusassem modificaes num sentido e (A+D) acusassemmodificaesnoutrosentido.Ouseja,(A+D)afrequnciaesperada,sobH0,tanto naclulaAcomonaclulaD. Na prova de McNemar de significncia de mudana, estamos interessados apenas nas clulas A e D. Portanto, A=nmero de casos observados na clula A, D=nmero de casos observados na clulaDe(A+D)=nmeroesperadodecasostantonasclulasAcomoD,ento
(A-D)2 X2 =
_____________
A+D
comgrausdeliberdade=1
ESTATSTICAEBIOESTATSTICA
Esta expresso indica que se deve subtrair 1 do valor absoluto da diferena entre A e D antes de elevar ao quadrado. O grau de significncia de qualquer valor observado de Quiquadrado, tal como calculado atravs da frmula, determinado mediante referncia a uma Tabela (Anexo I). SeovalorobservadodeQuiquadradoiguala,oumaiordoque,ovalorexibidonaTabelapara determinado nvel de significncia com gl=1, a implicao que existe efeito significativo nas reacesantesedepois.
(A-D - 1)2 X2 =
_______________________
A+D
Mediante referncia Tabela (Anexo I), determinar a probabilidade, sob H0, associado a um valortograndequantoovalorobservadodeX2.Sesetratadeumaprovaunilateral,dividirpor
ESTATSTICAEBIOESTATSTICA
2 o valor da probabilidade exibido na Tabela. Se o valor de p, dado pela Tabela para o valor observadodeX2comgl=1,nosuperap,rejeitaseH0emfavordeH1.
Quadro 18: Resultados do teste do vocabulrio Ordem das Par de sujeitos Situao A (com aparelho) Situao B d (A-B) (sem aparelho) positivas negativas Ordem de d diferenas diferenas Ordem das
1 2 3 4 5 6 7 8 9 10 TOTAL MDIA
3 4 3 1 5 2 3 4 1 3 29 2,9
5 5 2 5 4 5 5 4 5 5 45 4,5
-2 -1 +1 -4 +1 -3 -2 0 -4 -2
5 2 2 8,5 2 7 5 8,5 5 41
ESTATSTICAEBIOESTATSTICA
RACIONAL
O objectivo do teste dos sinais de Wilcoxon comparar as performances de cada sujeito (ou pares de sujeitos) no sentido de verificar se existem diferenas significativas entre os seus resultados nas duas situaes. Os resultados da Situao B so subtrados dos da Situao A e diferena resultante (d) atribudo o sinal mais (+) ou, caso seja negativa, o sinal menos (). Estas diferenas so ordenadas em funo da sua grandeza (independentemente do sinal positivo ou negativo). O ordenamento assim obtido depois apresentado separadamente para os resultados positivos e negativos. O menor dos valores deste segundo, dlhe o valor de uma estatstica designadaporW,quepodeserconsultadanaTabeladesignificnciaapropriada. A ideia que se existirem apenas diferenas aleatrias, tal como postulado pela hiptese nula, ento haver aproximadamente o mesmo nmero de ordens elevadas e de ordens inferiores tanto para as diferenas positivas como negativas. Se se verificar uma preponderncia de baixos resultados para um dos lados, isso significa a existncia de muitos resultados elevados para o outrolado,indicandoumadiferenaemfavordeumadassituaes,superiorquiloqueseriade esperarseosresultadossedevessemaoacaso.DadoqueaestatsticaWreflecteomenortotalde ordens, quanto menor for o W mais significativas sero as diferenas nas ordenaes entre as duassituaes.
ESTATSTICAEBIOESTATSTICA
4.
5.
ConteonmerodeparesdesujeitosN(noconsidereasigualdades). N=101=9
ESTATSTICAEBIOESTATSTICA
ESTATSTICAEBIOESTATSTICA
Quando n > 5 por grupo de respondentes, a significncia de H pode ser determinada por recorrncia Tabela do Quiquadrado (Anexo I). Para testar diferenas entre amostras de tamanhoinferiora6,deverecorreratabelasespeciais(AnexoIV).
QUANDO UTILIZAR
EstetestepodeserconsideradoumaextensodotesteUdeMannWhitneyquandonecessitamos de utilizar trs ou mais situaes. Deve ser utilizado em designs norelacionados quando sujeitosdiferentessodistribudosportrsoumaissituaes.
Exemplo: Suponha que estamos interessados em descobrir se existem diferenas no acesso a uma pgina da internet em funo da caracteristica: muito ilustrada, com algumas ilustraes e, sem ilustraes. Alocmos trs pginas na internet com o mesmo assunto e titulo durante 4 meses. A seguir verificmos o nmero de vezes que formam acedidas durantequatrosbadosseguidos.Osresultadosforam.
Quadro 19: Nmero de ideias relembradas para trs tipos de testes Sujeitos do grupo 1 (pgina muito ilustrada) Sujeitos do grupo 2 (pgina com algumas ilustraes) Sujeitos do grupo 3 (Pgina sem ilustraes)
1 2 3 4
Resul 19 21 17 16 73 18,25
Ordem 10 11 9 8 38
Resul 14 15 9 38 12,67
Ordem 6 7 1 14
Result. 12 12 13 10 47 11,75
RACIONAL
Este teste pretende determinar se os resultados so significativamente diferentes para trs ou mais grupos. Uma vez que todos os resultados foram, em principio, obtidos por sujeitos diferentes a nica forma de verificarmos as diferenas entre as situaes ordenlas em conjunto, como se se tratassem apenas de um conjunto de resultados, tal como havamos efectuado no teste U de MannWhitney. Isto acontece porque, no temos uma base para comparar resultados dos mesmos sujeitos ou de sujeitos emparelhados em diferentes situaes, comocomotesteUdeMannWhitneyparadesignsrelacionados. Este ordenamento global, quando posteriormente adicionamos as ordens de cada coluna em separado,permitenosobterototaldasordensparacadasituao.Seexistiremapenasdiferenas aleatrias entre as situaes, como postulado na hiptese nula, de esperar que ordens altas e
ESTATSTICAEBIOESTATSTICA
baixas se distribuam de forma aproximadamente equivalente pelas diferentes situaes. Mas, se pelo contrrio, houver uma preponderncia de altos ou baixos resultados em qualquer uma das situaes, provvel que tal facto reflicta diferenas significativas devidas varivel independente. O valor das diferenas entre os totais das ordens dado pela estatstica designada por H. Desde que a hiptese experimental preveja a existncia de diferenas significativas entre as situaes, o valor que obtivermos de H dever ser igual ou superior ao valor crtico da Tabela, para que possaserconsideradosignificativo.
H
em que: N=nmerototaldesujeitos
N=11 n1=4;n2=3;n3=4
nc=nmerodesujeitosemcadagrupo
Tc2=totaldasordensparacadasituao,cadaumelevadoaoquadrado T12=382;T22=142;T32=142
ESTATSTICAEBIOESTATSTICA
12
- 3 (11 + 1)
- 3 x 12
ESTATSTICAEBIOESTATSTICA
valor que obtivemos H=7,26 superior ao valor crtico de 5,99 para p<=0,05, pelo que podemos aceitar que o resultado significativo a este nvel. Dar conta que esta probabilidade menos significativa de que quando utilizamos a Tabela anterior. Isso acontece porque essa Tabela especialmente concebida para nos dar as probabilidades com um pequeno nmero de sujeitos e desituaes. Notar tambm que o teste de KruskalWallis apenas lhe pode dizer que existem diferenas globais nos resultados entre as situaes experimentais. Na tabela apresentada parece existir uma tendncia para consultar pginas com mais ilustraes do que sem ilustraes. Mas para podertestarseessatendnciarealmenteexiste,terdeutilizarumtestedetendncia.
ESTATSTICAEBIOESTATSTICA
ESTATSTICAEBIOESTATSTICA
Quandoutilizar: A prova de McNemar para duas amostras pode ser estendida para aplicao a pesquisas que envolvem mais de duas amostras. Essa extenso, que constitui a prova Q de Cochran para K amostras relacionadas, proporciona um mtodo para comparar se trs ou mais conjuntos correspondentes de frequncias ou propores diferem entre si significativamente. A correspondncia pode basearse em caractersticas relevantes dos diferentes indivduos ou no facto de os mesmos indivduos serem observados sob condies diferentes. A prova Q de Cochran adaptase especialmente ao caso em que os dados se apresentam numa escala nominal ousobaformadeinformaoordinaldicotomizada. Exemplo: Suponha que estamos interessados em saber se a atitude de um entrevistador influencia a aceitao de participao num estudo por inqurito. Poderemos treinar o entrevistadorparaefectuarassuasentrevistasdetrsmaneirasdiferentes: 1. 2. 3. Demonstrandointeresse,cordialidade,entusiasmo; Demonstrandoformalismo,reservaecortesia; Demonstrandomodoabrupto,formalismoeaspereza.
ESTATSTICAEBIOESTATSTICA
Exemplo: O entrevistador visitaria 3 grupos de 18 casas, aplicando o tipo 1 de entrevista a um grupo, o tipo 2 a outro grupo e o 3 ao terceiro grupo. Teramos, assim, 18 conjuntos de potenciais inquiridos com trs deles correspondendo em cada conjunto. Em cada conjunto atribuirseam aleatoriamente aos trs membros as trs condies (tipos de entrevista). Teramos, ento, 3 amostras relacionadas (correspondentes) com 18 elementos cada uma (N=18). Poderamos, pois, comprovar se as diferenas fundamentais nos tipos de entrevista influenciariam o nmero de respostas afirmativas sim dadas para aceitao de participaopelos3gruposdecorrespondentes.
Quadro 20: Q de Cochran
Conjunto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Resposta entrevista 1 1 2 1 1 2 2 2 1 2 1 2 2 2 2 2 2 2 2
Resposta entrevista 2 1 2 2 1 1 2 2 2 1 1 2 2 2 2 2 2 2 2
Resposta entrevista 3 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 2 1 1
RespostasSim(1)eNo(2)dadaspordonasdecasaatrstiposdeentrevistas
HIPTESE NULA:
AprobabilidadedeumSimamesmaparaostrsgruposdeentrevistas. H1:AsprobabilidadesdeumSimdiferemconformeotipodeentrevista.
PROVA ESTATSTICA:
Escolhese a prova Q de Cochran, porque os dados se referem a mais de dois grupos relacionados(K=3)eapresentamsedicotomizadossobaformaSimeNo.
ESTATSTICAEBIOESTATSTICA
DISTRIBUIO AMOSTRAL:
Sob a hiptese de nulidade, Q tem uma distribuio aproximadamente Quiquadrado com gl=1. Isto , a probabilidade associada ocorrncia, sob Ho, de qualquer valor to grande quanto um valorobservadodeQpodeserdeterminadamedianterefernciaTabela.
REGIO DE REJEIO:
Consiste em todos os valores de Q to grandes quanto a probabilidade associada sua ocorrncia,sobHo,nosejasuperiorap=0,01.
DECISO:
RecodificmosSimpor1eNopor0.
Quadro 21: Q de Cochran
Conjunto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Total
Resposta entrevista 1 0 1 0 0 1 1 1 0 1 0 1 1 1 1 1 1 1 1
G1=13
Resposta entrevista 2 0 1 1 0 0 1 1 1 0 0 1 1 1 1 1 1 1 1
G2=13
Resposta entrevista 3 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 1 0 0
G3=3
Li 0 2 1 0 1 2 2 1 1 0 3 3 2 2 2 3 2 2
Li2 0 4 1 0 1 4 4 1 1 0 9 9 4 4 4 9 4 4
Li=29 Li263
ESTATSTICAEBIOESTATSTICA
Substituindoestesvaloresnafrmula,vem:
(K-1) Q=
[K Gj
( Gj)2
]
=
(3-1)
[ 3X (13
]
= 16,7
_____________________________________________
______________________________________________________
K Li - Li2
3X29 - 63
Emque
K=n.degrupos Gj=n.totaldesucessos
A Tabela (Anexo I) indica que Q 16,7 tem uma probabilidade de ocorrncia, sob Ho, p < 0,001, quando gl=K1=31=2. Essa probabilidade inferior ao nvel de significncia de p=0,01. O valor de Q est na regio de rejeio e, consequentemente, a nossa deciso rejeitar Ho em favor de H1, concluindo que o nmero de respostas Sim difere significativamente em relao aos tipos 1,2e3deentrevista.
RACIONAL
Se os dados de uma pesquisa se dispem numa tabela de dupla entrada com N linhas e K colunas, possvel testar a hiptese de nulidade de que a proporo ou frequncia de respostas de determinado tipo seja a mesma em cada coluna, exceptuando as diferenas devidas ao acaso. Cochran mostrou que se a hiptese de nulidade verdadeira, isto , se no h diferena na probabilidade, digamos de Sucesso sob cada condio (o que equivale a dizer que os Sucessos ou Fracassos se distribuem aleatoriamente pelas linhas e colunas da tabela de duplaentrada),ento,seonmerodelinhasmuitopequeno
K(K-1) Q=
(Gj - G)2
__________________________________________
K Li - Li2
temdistribuioaproximadamenteQuiquadradocomgl=K1,emque: Gj=nmerototaldeSucessosnacolunaj
__
G=mdiadosGj Li=nmerototaldesucessosnalinhai
ESTATSTICAEBIOESTATSTICA
Umaexpressoequivalentefrmulaanterior,efacilmentededutveldela,masquesimplificaos clculos:
(K-1) Q=
[K Gj ( Gj) ]
2 2
__________________________________________________
K Li - Li2
ESTATSTICAEBIOESTATSTICA
Exemplo:Suponhaqueumeditordelivrosdeestatisticaproduziuumasriedelivrosequer escolher de entre trs tipos de ilustraes aquele que mais eficaz para os estudantes. pedido a oito universitrios que classifiquem as obras numa escala de cinco pontos, desde nadaboaatmuitoboa.Obtiveramseosresultadosapresentadosnatabelaseguinte.
Sujeitos Quadro 22: Avaliao de trs tipos de ilustraes Situao 1 Situao 2 Situao 3 (Ilustrao A) (Ilustrao B) (Ilustrao C) Result. Ordem Result. Ordem Result. 2 1 3 3 2 1 5 1 18 2,25 1 1 1 2 1 1 3 1 11 5 5 5 5 3 4 3 4 34 4,25 3 3 2,5 3 2 2,5 2 3 21 4 3 5 2 5 4 2 3 28 3,50
1 2 3 4 5 6 7 8
TOTAL MDIA
RACIONAL
Uma vez que se trata de um design relacionado no qual o mesmo sujeito obtm resultados em todas as situaes, permitido comparar os resultados de cada sujeito atravs de todas as situaes,nosentidodeverificarmosemquesituaoobtmmaioresemenoresresultados. Uma vez que existem mais do que duas situaes, no possvel calcular as diferenas nos resultados de duas situaes, como era o caso do teste de Wilcoxon. Pelo contrrio, o ordenamento dos resultados de cada sujeito para as trs condies ser feita horizontalmente ao longo das linhas, tal como mostra a tabela. Por exemplo, aos resultados do sujeito 1, respectivamente 2 na Situao 1, 5 na Situao 2 e 4 na Situao 3, so atribudas trs ordens, do menor resultado para o maior: Ordem 1 para a Situao1,Ordem2paraaSituao3eOrdem3 paraaSituao2;esteprocedimentosemelhanteparatodosossujeitos.Claroqueseexistissem quatrosituaesexperimentais,osresultadosdecadasujeitoseriamordenadosde1a4. Oprximopassocalcularostotaisdeordensparacadasituao.Seexistiremapenasdiferenas aleatrias entre os resultados de todas as situaes, como postulado pela hiptese nula, de esperar que estes totais sejam aproximadamente iguais partindo do princpio de que surgiriam algumasordensbaixas(baixosresultados)ealgumasordensaltas(altosresultados).Contudo,se as situaes forem significativamente diferentes, de esperar que se obtenham totais das ordens
ESTATSTICAEBIOESTATSTICA
significativamente diferentes, com algumas situaes a terem uma preponderncia de ordens baixas e outras uma preponderncia de ordens altas. O tamanho das diferenas entre os totais das ordens nos dado por uma estatstica designada por Xr2. Se o valor de Xr2 for igual ou superior aos valores crticos das Tabelas C e D (Anexo V), isso implica que as diferenas nos totaisdasordenssosuficientementegrandesparaquesepossamconsiderarsignificativas.
CalculeovalordeXR2apartirdafrmula
12
- 3N (C + 1)
Tc=totaldeordensparacadasituao
Tc2=quadradodototaldeordensparacadasituao
Tc2=somadosquadradosdostotaisdasordensparacadasituao:112+212+162 ClculodeXR2
12 XR2 = _____________________ (112 + 212 + 162) - 3 x 8 (3 + 1) (8 x 3) (3 + 1) 12 XR2 =
_____________________
24 x 4 12 XR2 =
_________________
x 818 - 96
96 XR2 = 6,25
ESTATSTICAEBIOESTATSTICA
Calculeosgrausdeliberdade,ouseja,onmerodesituaesmenosuma. (gl=C1=31=2)
ESTATSTICAEBIOESTATSTICA
A partir da anlise estatstica da experincia pode concluir que as crianas mostram preferncias significativamente diferentes pelos trs tipos de ilustraes. Em funo das mdias apresentadas natabela,sabemosquepreferemaIlustraoB,querecolheuasordensmaiselevadas,seguindo seaIlustraoCe,porltimo,aIlustraoA.Contudo,otestedeFriedmanpodeapenasindicar que existem diferenas globais entre as situaes. Para verificar se existe uma tendncia para uma determinada ordem de preferncia das Ilustraes, necessita de utilizar um teste de tendncia.
ESTATSTICAEBIOESTATSTICA
Escalademedidanomnimoordinal.
ESTATSTICAEBIOESTATSTICA
Pode acontecer que os caracteres estudados no sejam mensurveis, mas podem ser ordenados ou classificados. Por exemplo, se se considera um grupo de candidatos a um certo lugar, eles podemserexaminadossegundodoispontosdevista:conhecimentosepersonalidade.Estasduas qualidades no podem ser medidas, mas possvel para cada uma delas efectuar uma classificao dos candidatos. Podemos, assim, examinar se existe correlao entre estes dois caracteres; cada par de dados (xi, yi) formado pelas ordens ocupadas por um candidato nas duasclassificaes. Formulrio:
6(di2) =1________________
N(N2-1)
Emque: di=diferenaentreasposiesnasduasvariveis,isto,di=xiyi Para tal, temos que dar valores s posies: pontuao mais baixa damos o valor 1 e assimsucessivamente. Se as duas classificaes so iguais, di sempre zero e ento r=1 e a correlao perfeita. Se as ordens maisaltasdeumaclasseestoassociadassmaisbaixasdaoutrartornasenegativoese asduasclassificaessoinversas=1. Ento,
-1 1
INTERPRETAO
O coeficiente de correlao obtido pode ser interpretado, tal como o coeficiente de correlao momentoprodutodeBrawaisPearson(verestecoeficienteemtestesparamtricos).
ESTATSTICAEBIOESTATSTICA
Exemplo:Calcule,sabendoque:
xi yi 18 24 17 27 14 17 13 22 13 19 12 20 11 14 9 11 7 3 5 6
xi 18 17 14 13 13 12 11 9 7 5
yi 24 27 17 22 19 20 14 11 3 6
posio 2 1 6 3 5 4 7 8 10 9
d -1 1 -3 1,5 -0,5 2 0 0 -1 1
d2 1 1 9 2,25 0,25 4 0 0 1 1
=19,5
ESTATSTICAEBIOESTATSTICA
RACIONAL E EXEMPLO
Como soluo do problema da determinao da concordncia global entre K conjuntos de postos, poderia parecer razovel determinar os rs entre todos os pares possveis de postos e ento calcular a mdia desses coeficientes para determinar a associao global. Adoptando este procedimento, o processo tornase impraticvel, uma vez que temos de calcular inmeros coeficientes de correlao de postos.
Assim,oclculodeWmuitomaissimpleseWtemumarelaolinearcomovalormdioders relativo a todos os grupos. Denotando rsav o valor mdio dos coeficientes de correlao por postosdeSpearman,Kendalmostrouque KW1 rsav=__________ K1
Outro processo consiste em imaginar como se apresentariam dados se no houvesse concordncia alguma entre os conjuntos de postos e, em seguida, como se apresentariam se houvesse concordncia perfeita. O coeficiente de concordncia seria, ento, um ndice de divergnciaentreaconcordnciaefectivaacusadapelosdadoseaconcordnciamximapossvel (perfeita).Demodoaproximado,Wumcoeficientedestanatureza. Suponhamos que 3 chefes de pessoal estejam encarregados de entrevistar 6 candidatos a emprego e classificlos em postos, separadamente, segundo a capacidade de cada um para preencher a vaga. A tabela seguinte d os 3 conjuntos independentes de postos atribudos pelos chefesdepessoalX,YeZaoscandidatosaaf;altimalinhadatabelaRjdassomasdospostos atribudosacadacandidato.
Quadro 24: Postos atribudos a 6 candidatos a emprego por 3 chefes de pessoal
Candidato a 1 1 6 8 b 6 5 3 14 c 3 6 2 11 d 2 4 5 11 e 5 2 4 11 f 4 3 1 8
Chefe
X Y Z Rj
Se os chefes de pessoal apresentassem perfeita concordncia nos seus julgamentos sobre os candidatos, isto , se tivessem atribudo postos aos candidatos da mesma ordem, ento um candidato teria recebido trs postos 1 e assim a sua soma de postos, Rj, seria 1+1+1=3=K. O candidato que os 3 chefes tivessem considerado em segundo lugar receberia Rj=2+2+2=6=2K e o menospromissordoscandidatosseriaRj=6+6+6=18=NK.
100 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
Defacto,nocasodaconcordnciaperfeitaentreos3chefes,asvriassomasdepostos,Rj,seriam 3,6,9,12,15,18, muito embora no necessariamente nesta ordem. Em geral, quando h concordncia perfeita entre K conjuntos de postos, obtemos, para valores significativos de Rj, a sequnciaK,2K,3K,...,NK. Por outro lado, se no tivesse havido concordncia entre os 3 chefes, ento os diversos Rj seriam aproximadamenteiguais. Deste exemplo, vemos que o grau de concordncia entre os K julgamentos reflectido pelo grau de varincia entre as N somas de postos. W, coeficiente de concordncia, funo desse grau de varincia. Assim: S W=____________________
1/12 K2 (N3 N)
emque: S=soma dos quadrados dos desvios observados a contar da mdia dos Rj, isto , S= (Rj Rj/N)2; K=nmerodeconjuntosdepostos; N=nmerodeentidades(objectosouindivduosaqueseatribuempostos); 1/12K2(N3N)=valormximopossveldasomadosquadradosdosdesvios,isto,ovalordeS queocorrerianocasodeconcordnciaperfeitaentreosKconjuntosdepostos.
ESTATSTICAEBIOESTATSTICA
Ento, =(8+14+11+11+11+8)/6=10,5
W=0,16 exprime o grau de concordncia entre os 3 colegas fictcios ao atriburem postos aos 6 candidatosaemprego.
de salientar que a razo porque W no pode tomar valores negativos que, quando esto em jogo mais de dois conjuntos de postos, esses conjuntos no podem ser completamente discordantes. Por exemplo, se X e Y discordam, e se X tambm discorda de Z, ento Y e Z certamente concordaro. Isto , quando esto em jogo mais de 3 juzes, concordncia e discordncia no so opostos simtricos. K juzes podem todos concordar, mas impossvel todoselesdiscordaremcompletamente.Portanto,Wdeveserzeroouumnmeropositivo. NOTA: Quando ocorrem empates, atribuemse s observaes empatadas a mdia dos postosquelhescaberiamsenohouvesseempates. OefeitodosempatesreduzirovalordeW.Seaproporodeempatespequena,oefeito desprezvel, podendo continuar a usarse a frmula anterior. Se a proporo de empates grande, pode introduzirse uma correco que aumentar ligeiramente o valor de W em relaoaovalorqueseapresentariasemcorreco.Oelementocorrectivo: (t3 t) T=
_________________________
12 Emquet=nmerodeobservaesnumgrupoempatadosemrelaoaumdadoposto
ESTATSTICAEBIOESTATSTICA
Emcasocontrrio,usar
S W=
_______________________________
1/12 K2 (N3 N)
O mtodo para determinar se o valor observado significativamente diferente de zero depende dotamanhodeN: Se N7 a Tabela (Anexo VI) d os valores crticos de S associados com os Ws significativosaosnveisde0,05ede0,01; Se N>7 podemos usar X2 = K (N 1)W para calcular um valor de X2 cuja significncia, para g.l.=N1, possa ser comparada recorrendo Tabela do X2 (AnexoI).
ESTATSTICAEBIOESTATSTICA
Utilizandose a Tabela esta d o valor de S para Ws significativos aos nveis de 0,05 e de 0,01. Esta Tabela aplicvel para K de 3 a 20 e N de 3 a 7. Se um valor observado de S igual ou superior ao valor exibido na Tabela para um dado nvel de significncia, ento H0 pode ser rejeitadaquelenvel. Por exemplo, vimos que quando K=3 chefes de pessoal fictcios classificaram N=6 candidatos a emprego, a concordncia dos julgamentos foi W=0,16. A Tabela indica que o S associado quele valor de W (25,5) no significativo, uma vez que S crtico (103,9) maior do que S observado (25,5). Quando N>7, a distribuio aproximadamente uma distribuio de Quiquadrado com g.l.=N 1,vindo: S 2 _______________________ X = 1/12 KN (N + 1)
Noteseque: S
_____________________________
= K (N 1) W
1/12 KN (N + 1)
E, portanto, X2 = K (N 1) W, pelo que se pode usar esta frmula que mais fcil para determinaraprobabilidadeassociadaocorrncia,sobH0,dequalquervalortograndequanto oWobservado. Se o valor de X2 observado iguala ou supera o valor da Tabela (Anexo I) para um dado nvel de significncia e um particular valor de g.l.=N1, ento Ho (no h relao entre os K conjuntos de postos)podeserrejeitadaquelenvel.
104 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
INTERPRETAO DE W
Um valor elevado ou significativo de W pode ser interpretado como indicando que os observadores ou juizes esto aplicando essencialmente os mesmos padres ao atriburem postos aos N indivduos em estudo. Frequentemente a sua ordenao conjunta pode servir como padro,especialmentequandonohcritriosexternosrelevantesparaordenarosindivduos. KendallsugerequeamelhorestimativadaverdadeiraclassificaodeNobjectos,quandoW significativo,sejadadapelaordemdasvriassomasdepostos,Rj.Seseaceitaocritriosegundo o qual diversos juizes concordarem na atribuio de postos a N indivduos, ento a melhor estimativa da verdadeira ordenao desses indivduos segundo aquele critrio dada pela ordemdasomadospostos.Assim,anossamelhorestimativaseriadadaaocandidatoaouf,pois emambososcasosRj=0,omenorvalorobservado.
ESTATSTICAEBIOESTATSTICA
10.1 CORRELAO
Quando estudamos um grupo relativamente a dois caracteres vemos, como j dissemos, que podeexistirumarelaoentreeles. Se medirmos os raios de vrias circunferncias e tambm os seus permetros verificamos que existe uma relao entre eles que constante; neste caso temos dependncia funcional. Isto quer dizer que existe umafrmulaexprimindoamedidadosegundoemfunodadoprimeiro: P=2r. Suponhamos agora que registamos, durante todos os dias de um certo perodo de tempo, a altura mxima da mar no porto da Figueira da Foz e o nmero de passageiros da linha Porto Lisboa. Vse bem que entre as duas estatsticas assim obtidas no se encontranenhumarelao. Diremosqueosdoiscaracteressoindependentes. Mas entre estes dois casos extremos, a dependncia funcional e a independncia, a vida corrente ofereceumgrandenmerodeexemplosondeexisteumarelaoentreoscaracteres,masemque existe uma impossibilidade de a formular por uma lei: o caso da dependncia estatstica. Existe uma dependncia estatstica entre as pessoas que morrem com febre tifide e as pessoas vacinadascontraestadoena. Desde que os dois caracteres sejam tais que as suas variaes sejam sempre no mesmo sentido, ou em sentidos contrrios, pressentimos que os caracteres estejam ligados entre si: dizemos, ento,queelesestocorrelacionadosouqueexisteumacorrelaoentreeles. EstesmtodosdecorrelaoforamcriadosporSirFrancisGalton,quetrabalhoujuntamentecom Pearson,nosfinsdosculoXIX.
ESTATSTICAEBIOESTATSTICA
A correlao e a regresso so dois aspectos que andam sempre muito ligados, pertencendo EstatsticaDescritiva.Assim,importafazermosadistinoentreeles: A correlao pode ser definida como o grau de semelhana no sentido das variaes entreosvalorescorrespondentesdosdoiscaracteres,isto,acorrelaopreocupasecom adescriodarelaoentrevariveis. A regresso usada quando tentamos predizer uma varivel quando conhecemos a outra.
REPRESENTAO GRFICA
representaogrficadacorrelaochamamosdiagramadedispersodepontosouscatterplot ouscattergrame,genericamente,tomaaseguinteforma:
80
70
60
50
40 40 50 60 70 80
ESTATSTICAEBIOESTATSTICA
Suponhamos que temos duas sries estatsticas formadas pelos valores xi e yi de dois caracteres. Podemos fazer uma representao grfica dos dados representando todos os pontos (xi, yi) e obtendoanuvemdepontos. Segundoosdados,anuvemdepontospodeapresentardiversosaspectos. Por exemplo os pontos podem distribuirse na semelhana de uma linha recta ou de uma curva: istosugereaexistnciadeumarelaofuncionalentreXeY. Os pontos podem ser dispersos e colocados ao acaso no plano: caso das mars no porto da FigueiradaFozeonmerodepassageirosnalinhaPortoLisboa(independncia).Tambmpode acontecer que os pontos cubram uma poro do plano da qual se pode definir o contorno; esta forma sugere que as duas variveis esto ligadas. Limitemonos ao caso mais simples em que a nuvemtemumaformaalongadalembrandoumaelipseesuponhamosqueasuaorientaotal que desde que X cresa, a varivel Y tambm cresce. A forma desta nuvem sugere a possibilidade da existncia de uma recta tal que os valores estimados por esta recta, a partir dos valoresdexi,sejamboasaproximaesdosvaloresdeyi.Nspodemosdeterminarpelomtodo dos mnimos quadrados uma recta tal que a soma dos quadrados dos desvios seja mnima. Esta rectachamadarectaderegressodeYemXourectadeestimaodeYemX. Mas,poderamos,deummodosemelhante,procurarumarectatalqueosvaloresdexestimados ao longo desta recta, a partir de yi, constituam igualmente boas aproximaes de xi. Esta recta chamadarectaderegressodeXemYourectadeestimaodeXemY. Normalmente, estas rectas so distintas uma da outra. Elas sero confundidas quando existe ligao funcional linear e so perpendiculares quando h independncia. Compreendemos, assim, que a correlao entre os caracteres tanto maior quanto maior as rectas de regresso estejammaisprximasumadaoutra.
ESTATSTICAEBIOESTATSTICA
Ento:
-1 r 1
Interpretao: Ocoeficientedecorrelaoobtidopodeseinterpretadocombaseem:
Para Cardoso: r0,2
ESTATSTICAEBIOESTATSTICA
Coeficientedecorrelaodnos: Adirecoqueindicadapelosinal+ou A intensidade ou fora que dada pelo valor que varia entre1 e 1. Se a correlao for zeronoexistecorrelaoentreasvariveis(exemplo:cordosolhoseinteligncia).
Exemplo: Considere as classificaes obtidas por 10 alunos nas disciplinas X, Y, Z e W:
Estudante 1 2 3 4 5 6 7 8 9 10
X 75 70 70 65 60 60 55 50 50 45 600
Y 75 70 70 65 60 60 55 50 50 45 600
Z 45 50 50 55 60 60 65 70 70 75 600
W 45 50 50 55 60 60 65 70 70 75 600
XY 5625 4900 4900 4225 3600 3600 3025 2500 2500 2025 36900
XZ 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100
XW 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100
YZ 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100
YW 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100
ZW 2025 2500 2500 3025 3600 3600 4225 4900 4900 5625 36900
Sabeseque:
X=60
XY=36900 s2x= 90
Y=60
XZ=35100 s2y= 90
Z=60
s2z= 90
W=60
s2w= 90
a)CalculeocoeficientedecorrelaoentreXeYerepresentegraficamente. b)CalculeocoeficientedecorrelaoentreXeZerepresentegraficamente.
ESTATSTICAEBIOESTATSTICA
Resoluo 47: a) (XY) - X Y r=_____N______________ sx sy Ento, 36900 _ 60x60 10 r = _________________________________________ 90 x 90 r= = 1 Existe uma relao positiva muito forte entre X e Y b) r= Ento, 35100 _ 60x60 10 r=
________________________________________
(XZ) - X Z N .. sx sZ
90 x 90 r= = -1
Existe uma relao negativa muito forte entre X e W, isto , quanto maior X menor Y e vice versa.
CARACTERSTICAS DO TESTE T:
1. 2. Testeparaacomparaodemdias; Distribuio com forma leptocrtica, isto , as caudas da distribuio so mais grossasdoquenadistribuionormal; 3. 4. 5. 6. 7. Contnua; Simtrica; Deformacampanular; Variademaisinfinitoamenosinfinito; Mdia=0edesviopadrodavariveldeacordocomn;
ESTATSTICAEBIOESTATSTICA
8.
O uso de T pressupe que a varivel observacional tenha na populao (de onde foi colhidaaamostra)distribuionormal;
9.
No existe uma distribuio t, mas sim uma famlia. Para cada n tamanho da amostraexisteumadistribuio(umacurva)especfica;
10. medida que n cresce, t tende a z (a aproximao entre t e z comea a ficarboa a partirden>=30). Requisitosparautilizarotestet: 1.Quandoasduasamostrastmamesmahomogeneidadedevarincia; 2.Osdoisgrupostenhamamesmadistribuioaproximadanormalleptocrtica; 3.Escalademedidaintervalar.
QUANDO UTILIZAR
Utilizase para designs experimentais com duas situaes testando uma varivel independente, quandonessassituaesseencontramsujeitosdiferentesdesignsnorelacionados. O teste t no relacionado equivalente ao teste no paramtrico U de MannWhitney; ambos comparamdiferenasentredoisgrupos.
OBJECTIVO
O objectivo comparar a quantidade da variabilidade devida s diferenas previstas nos resultados entre dois grupos com a variabilidade total nos resultados dos sujeitos. As diferenas previstassocalculadascomoumadiferenaentreosresultadosmdiosentreosdoisgrupos. A estatstica t representa o tamanho da diferena entre as mdias para os dois grupos, tomando em considerao a varincia total. Para que o valor observado de t seja significativo ter de ser igualousuperioraosvalorescrticosdetapresentadosnatabela.
ESTATSTICAEBIOESTATSTICA
INSTRUES PASSO-A-PASSO
Elevaraoquadradocadaresultadoindividualparaambososgruposemseparado: 1. 2. 3. 4. Adicionarostotaisdosresultadosaoquadradoparacadagrupo; Elevaraoquadradotodososresultadosindividuaisparacadagrupo; Calcularamdiaparacadagrupo; Calculart:
1 - 2 t = _________________________________________________________________ x12 - ( x1)2 + x22 - ( x2)2 ______ ______ n1 n2 1 1 ____________________________________ __ + __ (n1 - 1) + (n2 - 1) n1 n2
x12=somadosquadradosparaogrupo1 x22=somadosquadradosparaogrupo2
(x1)2=resultadostotaisdogrupo1aoquadrado (x2)2=resultadostotaisdogrupo2aoquadrado
Calcularg.l.:
g.l.=(n11)+(n21)
Setobservado>tcrticorejeitaseHo Setobservado<tcrticonoserejeitaHo
ESTATSTICAEBIOESTATSTICA
Exemplo: para verificar se duas dietas para emagrecer so igualmente eficazes, um mdico separou ao acaso um conjunto de pacientes em dois grupos. Cada paciente seguiu a dieta designada para o seu grupodurante4meses.Omdicoregistouaperdadepesoemkgdecadapacienteporgrupo.Osdados estoapresentadosnoquadroquesesegue:
Quadro 26: Teste t no relacionado
______________________________________________________________________________________ Grupo 1 (dieta 1) Grupo 2 (dieta 2) ______________________________________________________________________________________ Resultados Resultados Resultados Resultados ao quadrado ao quadrado 10 100 2 4 5 25 1 1 6 36 7 49 3 9 4 16 9 81 4 16 8 64 5 25 7 49 2 4 5 25 5 25 6 36 3 9 5 25 4 16 _____________________________________________________________________________________ Total x1 = 64 x12 = 450 x2 = 37 x22 = 165 2 Mdia 1 = 6,4 = 3,7
3.(x1)2=64X64=4096 (x2)2=37X37=1369
4.1=6,4
2=3,7
ESTATSTICAEBIOESTATSTICA
6,4 - 3,7 t = _________________________________________________________ = 450 - 4096 + 165 - 1369 ______ ______ 10 10 _______________________________ 9+9 2,7 = ______________ 3,806. 0,2 6. g.l. = (n1 - 1) + (n2 - 1) = (10 - 1) + (10 - 1) = 18 = 3,547
1 __ 10
1 + __ 10
O valor de t observado (3,547) superior ao valor crtico de 2,878 (Anexo VII), indicando um nvel de significncia de p < 0,05 para uma hiptese unicaudal ou p < 0,01 para uma hiptese bicaudal.
Quandoutilizar: Utilizase para designs experimentais com duas situaes testando uma varivel independente, quando os mesmos sujeitos (ou emparelhados) se encontram em ambas as situaes design relacionado.OtestetrelacionadoequivalenteaotestenoparamtricodeWilcoxon.
OBJECTIVO
O objectivo comparar as diferenas entre as duas situaes experimentais com a variabilidade total nos resultados. Quando os mesmos sujeitos so usados em ambas as situaes podem compararse pares de resultados obtidos por cada indivduo quando sujeito a ambas as situaes.
ESTATSTICAEBIOESTATSTICA
A estatstica t apresenta o tamanho das diferenas entre os resultados dos sujeitos para as duas situaes.Paraquesejasignificativoovalordetterdeserigualousuperioraosvalorescrticos databela(AnexoVII).
INSTRUES PASSO-A-PASSO
1. Calcular as diferenas entre os resultados dos sujeitos subtraindo os resultados da situao B paraasituaoA 2.Elevaressasdiferenasaoquadrado 3.Calcularosomatriodasdiferenasobtidas(d) 4.Calcularosomatriodoquadradodasdiferenas(d2) 5.Elevaraoquadradoasdiferenastotais(d)2 6.Calculart:
d t=
___________________________________
N d2 ( d)2 N-1
d=somadasdiferenasdosresultadosAeB d2=somadosquadradosdasdiferenas
(d)2=somadasdiferenaselevadasaoquadrado N=nmerodesujeitos
ESTATSTICAEBIOESTATSTICA
Exemplo: Para verificar se a eficcia de uma dieta era influenciada pelo ministrar de um frmaco, um mdico decidiu administrar, a um grupo de individuos que o tinham procurado para perder peso, um placebo em conjunto com uma dieta que j havia administrado um ms antes aos mesmos sujeitos. Referiu aos seus casos que aquele medicamento servia para perder apetite e ajudava a queimar gorduras. Registou a perda de peso que tinha ocorrido nos 30 dias antecedentes tomada de placebo e trinta dias apsoplacebo.Osresultadosestonoquadroquesesegue
Situao A Situao B d d2 (com placebo) (s com dieta) (A-B) ____________________________________________________________________________ 1 10 2 8 64 2 5 1 4 16 3 6 7 -1 1 4 3 4 -1 1 5 9 4 5 25 6 8 5 3 9 7 7 2 5 25 8 5 5 0 0 9 6 3 3 9 10 5 4 1 1 ___________________________________________________________________________ Total 64 37 d=27 d2=151 Mdia6,43,7 Resoluo50: InstruesPassoaPasso:
Sujeito
27 =
_______________
= 27 / 9,316 = 2,90
86,78
ESTATSTICAEBIOESTATSTICA
Como o valor observado de t de2,90superioraovalorcrticode2,821aonveldesignificncia de p < 0,01 (unicaudal) ou p < 0,02 (bicaudal), e a mdia de perda de peso superior com o placebo,omdicoconcluiuqueoefeitodeplacebopositivonaperdadepeso O ponto 10.3 explica como comparar mdias de duas populaes, com base em amostras dessas populaes. Mas s vezes preciso comparar mdias de mais de duas populaes. Por exemplo, para verificar se pessoas com diferentes nveis socioeconmicos, isto , alto, mdio e baixo tm, emmdia,omesmopesocorporal,precisocompararmdiasdetrspopulaes. Para comparar mdias de mais de duas populaes aplicase o teste F, na forma que a seguir se descreve, desde que a varivel em estudo tenha distribuio normal ou aproximadamente normal.Masantesdemostrarcomosefazesseteste,convmapresentarumexemplo.
Imaginequequatrogrupos,todascomcincoelementos,conduziramaosdadosapresentadosnoquadro 28. As mdias dessas amostras esto na ltima linha desse quadro. Ser que as diferenas das mdias das amostras so suficientemente grandes para que se possa afirmar que as mdias das populaes so diferentes?Pararesponderaestapergunta,precisoumtesteestatstico.
A 11 8 5 8 8 40 8
B 8 5 2 5 5 25 5
C 5 7 3 3 7 25 5
D 4 4 2 0 0 10 2
ESTATSTICAEBIOESTATSTICA
O quadro 29 apresenta os dados de k tratamentos, cada um com r repeties (no exemplo, denominamse repeties os elementos da mesma amostra). A soma das repeties (r) de um mesmotratamentoconstituiototaldessetratamento(T).Ototalgeral(T)dadopelasomadosk totaisdetratamentos.
... ... . . .
Total
T=x N=kr
Parafazeraanlisedevarinciaprecisocalcularasseguintesquantidades:
119 Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA
FORMULA:
C = (x)2 n
b)
calcularaSomadosQuadradosTotal(SQT)
FORMULA:
c)
SQT = x2-C
calcularaSomadoQuadradodoTotaldecadarepetio(SQTr)
FORMULA:
SQTr = T2 - C r
d)
calcularaSomadosQuadradosdosResduos(SQR)
FORMULA:
e)
SQR = SQT-SQTr
calcularoQuadradomdiodoTotaldecadarepetio(QMTr)
FORMULA:
f)
calcularoQuadradomdiodoTotaldoResiduo(QMR)
FORMULA:
ESTATSTICAEBIOESTATSTICA
g)
calcularovalordeF
FORMULA:
F = QMTr QMR
Tratamento A 11 8 5 8 8 40 8
Tratamento B 8 5 2 5 5 25 5
Tratamento C 5 7 3 3 7 25 5
Tratamento D 4 4 2 0 0 10 2
ESTATSTICAEBIOESTATSTICA
b)
calcularaSomadosQuadradosTotal(SQT)
c)
calcularaSomadoQuadradodoTotaldecadarepetio(SQTr)
e)
calcularoQuadradomdiodoTotaldecadarepetio(QMTr)
f)
calcularoQuadradomdiodoResduo(QMR)
g)
calcularovalordeF
ESTATSTICAEBIOESTATSTICA
3. passo: ir tabela F para um nvel de significncia (p) de5%(0,05)eobservarqualoFterico para 3 e 16 graus de liberdade (anexo). Como o valor calculado (7,06) maior que o da tabela (3,24), conclumos que as mdias das recidivas diferem em funo do tratamento, para um nvel designificnciade0,05. A acompanhar este comentrio, os valores calculados devem ser apresentados num quadro, da seguinteforma:
Quadro 31: ANOVA
Mas, como se pode observar, apesar da tabela mostrar que existem diferenas significativas, no nosinforma,quetratamentosqueproduzemdiferenasequaissosemelhantes.Semprequeas diferenas so significativas, e s nesse caso, temos que proceder s comparaes posteriori (PostHoc). Podemonos socorrer de diversos testes (LSD; Bonferroni; Sidak; Scheffe; SNK; Tukey; etc.), a grande diferena entre eles reside no tipo de distribuio em que assentam e no tipo de ajustamento). Apresentaremos de seguida apenas o teste de Tukey, por ser dos mais utilizadoseomaissimplesdecalcular,quandorecorremosaoclculomanual.
dms =q
QMR r
ESTATSTICAEBIOESTATSTICA
assim,seconsultarmosatabelaverificamosqueoqparacompararquatrotratamentoscom16gl noresiduode4,05.comoQMR=4,25er=5,temos:
dms
p ns ns <0,05 ns ns ns
3,73
fcil de observar que s existem diferenas entre a mdia dos tratamentos A e a mdia dos tratamentos D, em que o tratamento D aquele com que se obtm, significativamente, menos recidivas
ESTATSTICAEBIOESTATSTICA
SQTr = T2 - C r
-C
Paramaisfcildeentenderobserveoseguinteexemplo:
Tratamento A 15 10 13 18 15 84
Tratamento B 23 16 19 18
Tratamento C 19 15 21 14 16
76
85
ESTATSTICAEBIOESTATSTICA
b) calcularaSomadosQuadradosTotal(SQT)
f) calcularoQuadradomdiodoResduo(QMR)
g) calcularovalordeF
F = QMTr = QMR
31,67 8
= 3,96
ESTATSTICAEBIOESTATSTICA
3. passo: ir tabela F para um nvel de significncia (p) de5%(0,05)eobservarqualoFterico para 2 e 12 graus de liberdade (anexo). Como o valor calculado (3,96) maior que o da tabela (3,89), conclumos que as mdias dos sujeitos diferem em funo do tratamento, para um nvel designificnciade0,05. Osvalorescalculadosdevemserapresentadosdaseguinteforma:
gl 2 12 14
SQ 63,33 96 159,33
QM 31,67 8
F 3,96
p <0,05
Como as diferenas so significativas, temos que proceder s comparaes posteriori (Post Hoc).OresultadodotestedeTukeyoseguinte:
dms =q
1+ 1 ri rj
QMR 2
Nocasodoexemplo,paracompararamdiadeAcomamdiadeBtemse:
1 + 6
1 4
8,00 2
Nocasodoexemplo,paracompararamdiadeAcomamdiadeCtemse:
1+ 6
1 8,00 5 2
Nocasodoexemplo,paracompararamdiadeBcomamdiadeCtemse:
ESTATSTICAEBIOESTATSTICA
1 + 4
1 5
8,00 2
Valor absoluto da Pares de mdias diferena A-B A-C B-C |14-19| = 5 |14-17| = 3 |19-17| = 2 4,87 4,57 5,06 <0,05 ns ns dms p
ConcluisequeemmdiaAsignificativamentediferentedeB,aonveldesignificnciade0,05.
ESTATSTICAEBIOESTATSTICA
ANEXOS
ESTATSTICAEBIOESTATSTICA
Anexo I
TABELADOQUIQUADRADO(X2)
ESTATSTICAEBIOESTATSTICA
Anexo II
TABELADEU
ESTATSTICAEBIOESTATSTICA
Anexo III
TABELADEWILCOXON
ESTATSTICAEBIOESTATSTICA
Anexo IV
TABELAH
ESTATSTICAEBIOESTATSTICA
Anexo V
TABELASDEFRIEDMAN
ESTATSTICAEBIOESTATSTICA
Anexo VI
TABELAS(TABELADEKENDAL)
ESTATSTICAEBIOESTATSTICA
Anexo VII
TABELAT
ESTATSTICAEBIOESTATSTICA
Anexo VIII
TABELAZ
ESTATSTICAEBIOESTATSTICA
Anexo IX
TABELAF
ESTATSTICAEBIOESTATSTICA
Anexo X
TABELADOSVALORESDEq