Você está na página 1de 139

ESTATSTICAEBIOESTATSTICA

NDICE GERAL



I - INTRODUO.............................................................................................................................................5
1. NOES GERAIS ..........................................................................................................................................6
2. POPULAO E AMOSTRA............................................................................................................................9
3. MTODOS DE AMOSTRAGEM....................................................................................................................11
3.1 AMOSTRAGENS PROBABILSTICAS E NO-PROBABILSTICAS .......................................................11
3.1.1 As Amostras Probabilsticas.................................................................................................................11
3.1.1.1 TIPOS DE AMOSTRAGENS PROBABILSTICAS......................................................................................12
3.1.1.2 TIPOS DE AMOSTRAGENS NO PROBABILSTICAS:............................................................................14
3.2 DETERMINAO DO TAMANHO DA AMOSTRA..................................................................................16
3.2.1 Clculo do Tamanho da Amostra para Populaes Infinitas (>100.000 elementos)..............16
3.2.2 Clculo do Tamanho da Amostra para Populaes Finitas (<100.000 elementos) ................18
3.2.3 Determinao da Margem de Erro da Amostra................................................................................20
3.2.4 Determinao da Amostra sem conhecer os limites da populao.............................................20
3.3 INDIVDUO OU UNIDADE ESTATSTICA.............................................................................................21
3.4 VARIVEL ESTATSTICA....................................................................................................................22
3.5 ESTATSTICA DESCRITIVA E ESTATSTICA INDUTIVA....................................................................24
3.6 PARMETRO E DADO ESTATSTICO...................................................................................................24
3.7 REPRESENTAO DE UMA VARIVEL ESTATSTICA ........................................................................25
3.8 REDUO DE UMA VARIVEL ESTATSTICA.....................................................................................29
3.8.1 Mdia...........................................................................................................................................................30
3.8.2 Mediana ......................................................................................................................................................33
3.8.3 Moda............................................................................................................................................................34
3.8.4 Quantis........................................................................................................................................................38
3.8.5 Medidas de disperso .............................................................................................................................40
3.8.6 Coeficiente de disperso .......................................................................................................................49
3.9 AS CARACTERSTICAS DA DISTRIBUIO NORMAL...........................................................................51
3.9.1 A curva normal e os desvios-padro.................................................................................................53
4. ESTATSTICA PARAMTRICA E NO PARAMTRICA..............................................................................59
5. TESTES NO PARAMTRICOS PASSO- -PASSO A .....................................................................................63
5.1 TESTE DO QUI-QUADRADO................................................................................................................63
5.2 PROCEDIMENTOS PARA ORDENAO DE RESULTADOS....................................................................67
5.3 TESTES PARA DUAS AMOSTRAS INDEPENDENTES...........................................................................69
5.4 TESTE U DE MANN-WHITNEY.........................................................................................................70
6. TESTES PARA DUAS AMOSTRAS RELACIONADAS ....................................................................................74
6.1 PROVA DE McNEMAR PARA A SIGNIFICNCIA DE MUDANAS .........................................................75
1
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

6.2 CORRECO DE CONTINUIDADE ........................................................................................................78
6.3 TESTE DOS SINAIS DE WILCOXON.....................................................................................................79
7. TESTES PARA K AMOSTRAS INDEPENDENTES.........................................................................................82
7.1 TESTE DE KRUSKAL-WALLIS...........................................................................................................82
8. TESTES PARA K AMOSTRAS RELACIONADAS...........................................................................................87
8.1 PROVA DE COCHRAN..........................................................................................................................88
8.2 TESTE DE FRIEDMAN.........................................................................................................................92
9. MEDIDAS DE CORRELAO E SUAS PROVAS DE SIGNIFICNCIA.............................................................97
9.1 COEFICIENTE DE CORRELAO RHO DE SPEARMAN-RANK.............................................................97
9.2 O COEFICIENTE DE CONCORDNCIA DE KENDALL...........................................................................99
10. TESTES PARAMTRICOS PASSO- -PASSO A .........................................................................................106
10.1 CORRELAO..................................................................................................................................106
10.2 TESTE T DE STUDENT (NO RELACIONADO) ..............................................................................111
10.3 TESTE T DE STUDENT (RELACIONADO).......................................................................................115
10.4 ANLISE DE VARINCIA.......................................................................................................119
10.4.1 Anlise da Varincia com Igual Tamanho.....................................................................................119
10.4.1.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS ............................................................123
10.4.2 ANLISE DE VARINCIA COM DIFERENTES TAMANHOS..................................................125
10.4.2.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS ............................................................127
ANEXOS ........................................................................................................................................................129
Anexo I ...................................................................................................................................................130
Anexo II ..................................................................................................................................................131
Anexo III.................................................................................................................................................132
Anexo IV................................................................................................................................................133
Anexo V..................................................................................................................................................134
Anexo VI ................................................................................................................................................135
Anexo VII ...............................................................................................................................................136
Anexo VIII..............................................................................................................................................137
Anexo IX ................................................................................................................................................138
Anexo X..................................................................................................................................................139


2
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


NDICE DE ILUSTRAES



FIGURA 1: POPULAO E AMOSTRA.........................................................................................................................................10
FIGURA 2: AMOSTRA ESTRATIFICADA.......................................................................................................................................13
FIGURA 3: CONVERSO DOS NIVEIS DE CONFIANA EM DESVIOS PADRO..................................................................................17
QUADRO 1: QUADRO GERAL DE SERIAO..............................................................................................................................25
QUADRO 2: QUADRO DE FREQUNCIAS....................................................................................................................................26
QUADRO 3: QUADRO DE FREQUNCIAS....................................................................................................................................27
QUADRO 4: QUADRO DE FREQUNCIAS....................................................................................................................................28
QUADRO 5: QUADRO DO CLCULO DA MDIA ..........................................................................................................................30
QUADRO 6: QUADRO DO CLCULO DA MDIA ..........................................................................................................................31
QUADRO 7: CLCULO DA MDIA PONDERADA..........................................................................................................................32
FIGURA 4: CURVA SIMTRICA..................................................................................................................................................35
FIGURA 5: CURVA ASSIMTRICA DIREITA..............................................................................................................................36
FIGURA 6: CURVA ASSIMTRICA ESQUERDA..........................................................................................................................36
FIGURA 7: CURVA ASSIMTRICA DIREITA..............................................................................................................................39
FIGURA 8: CURVA SIMTRICA ACHATADA (PLATOCURTICA).....................................................................................................42
QUADRO 8: CLCULO DO DESVIO MDIO................................................................................................................................44
QUADRO 9: CLCULO DO DESVIO MDIO PARA CLASSES.........................................................................................................45
QUADRO 10: CLCULO DA VARINCIA....................................................................................................................................45
QUADRO 11: CLCULO DA VARINCIA....................................................................................................................................46
FIGURA 9: DISTRIBUIO NORMAL ..........................................................................................................................................51
FIGURA 10 - DISTRIBUIO LEPTOCRTICA E PLATICRTICA....................................................................................................51
FIGURA 11: % DE RESULTADOS 1 DP ACIMA E ABAIXO DA MDIA .............................................................................................54
FIGURA 12: POSIO DE UM RESULTADO..................................................................................................................................55
QUADRO 12: TABELA DE CONTINGNCIA (CROSSTAB).............................................................................................................65
QUADRO 13: ORDENAO DE UM GRUPO EM FUNO DO N. DE FACTORES DE RISCO...............................................................67
QUADRO 14: ORDENAO PARA AMOSTRAS RELACIONADAS OU EMPARELHADAS...................................................................69
QUADRO 15: RESULTADOS DO REGISTO DAS QUEIXAS..............................................................................................................71
QUADRO 16: TESTE MCNEMAR................................................................................................................................................75
QUADRO 17: TABELA DE QUATRO CASAS PARA A PROVA DE SIGNIFICNCIA DE MUDANAS ......................................................77
QUADRO 18: RESULTADOS DO TESTE DO VOCABULRIO...........................................................................................................79
QUADRO 19: NMERO DE IDEIAS RELEMBRADAS PARA TRS TIPOS DE TESTES ..........................................................................83
QUADRO 20: Q DE COCHRAN ..................................................................................................................................................89
QUADRO 21: Q DE COCHRAN ..................................................................................................................................................90
QUADRO 22: AVALIAO DE TRS TIPOS DE ILUSTRAES.......................................................................................................93
QUADRO 23: COEFICIENTE DE CONTINGNCIA DE RHO DE SPEARMAN-RANK .........................................................................99
QUADRO 24: POSTOS ATRIBUDOS A 6 CANDIDATOS A EMPREGO POR 3 CHEFES DE PESSOAL....................................................100
FIGURA 13: DIAGRAMA DE DISPERSO DE PONTOS OU SCATTERPLOT OU SCATTERGRAM.........................................................107
QUADRO 25: CORRELAO DE PEARSON...............................................................................................................................110
QUADRO 26: TESTE T NO RELACIONADO..............................................................................................................................114
QUADRO 27: TESTE T RELACIONADO.....................................................................................................................................117
QUADRO 28: DADOS DE 4 AMOSTRAS E RESPECTIVAS MDIAS................................................................................................118
3
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

QUADRO 29: NOTAO PARA ANLISE DA VARINCIA ...........................................................................................................119
QUADRO 30: RECIDIVAS POR TRATAMENTO............................................................................................................................121
QUADRO 31: ANOVA ..........................................................................................................................................................123
QUADRO 32: POST-HOC DAS RECIDIVAS.................................................................................................................................124
QUADRO 33: MDIAS POR TRATAMENTO................................................................................................................................125
QUADRO 34: ANOVA ..........................................................................................................................................................127
QUADRO 35: POST-HOC .........................................................................................................................................................128


4
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA



I - INTRODUO

Desde sculos o homem tem, muitas vezes, tomado notas de coisas e de pessoas, no com o
nico fim de acumular nmeros, mas com a esperana de utilizar os dados do passado para a
resoluodeproblemasdopresenteassimcomoparaaprevisodeacontecimentosfuturos.No
entanto, o sucesso quanto a este objectivo s foi possvel em data muito recente: s no final do
sculoXIXe,sobretudo,noprincpiodosculoXXque,comaaplicaodeprobabilidadesaos
problemassobreainterpretaodosdadosrecolhidos,foipossvelresolveralgunsdeles.
AEstatsticaconquistou,hoje,oseulugarentreascincias.Opoderdoseumtodo,sobretudo,
afirmado nas ltimas dcadas e aplicase, agora, nos domnios mais variados. At aqui, s um
pequenonmerodepessoassepreocupoucomestudosestatsticos,querpelanaturezadassuas
investigaes, quer por causa da sua utilidade para as diferentes profisses. O valor e a
importnciadomtodoestatsticoresidemnoesforoparamelhorcompreenderonossomundo,
tomaravilhosamentecomplexo,tantonopontodevistafsicocomosocial,levamnosasonhar
queelesetorneobjectodeumconhecimentocomoasoutrascincias.Avidacorrentelevanosa
decisesparapassardoconhecidoaodesconhecido,daexperinciapreviso.
Este curso tem por fim fornecer conhecimentos estatsticos (sem ter muitos conhecimentos
matemticos) e saber interpretar resultados que podem ser obtidos atravs de programas de
computador.
5
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

1. NOES GERAIS

Paraalgumaspessoas,aEstatsticanosenoumquadrodecolunasmaisoumenoslongasde
nmeros que dizem respeito populao, indstria ou ao comrcio, como se v
frequentemente em revistas; para outras, ela dgrficosmostrandoavariaonotempodeum
facto econmico ou social, a produo ou os nmeros relativos aos negcios de uma empresa,
assimcomoseencontranosescritriosdeempresasprivadas.
To diferenciados se apresentam os mtodos estatsticos que no possvel estabelecer uma
definio que os contenha a todos. Apesar disso, apresentamos a seguir uma definio que,
emboranecessariamenteincompletacomoqualqueroutra,temavantagemdeintroduziroaluno
namatria.
AEstatsticatemcomofinalidadeelaborardeumasntesenumricaqueevidencieoquedemais
generalizadoesignificativoexistanumconjuntonumerosodeobservaes.
O grande nmero de observaes de que se parte reflecte uma diversidade tal que se torna
ininteligvel a sua interpretao. Para que, a partir dessa diversidade se possa comear a
entender logo, tornase necessrio reduzir sucessivamente as observaes, ganhandose em
generalidadeoquesevaiperdendoemindividualidade.
A sntese implica, assim, que nos desprendamos do que particular e individual para nos
atermos ao que existe de mais geral no conjunto das observaes; medida que a sntese
progride,vaiseperdendoocontactocomasparticularidadesimediatas.
Destemodo,aEstatsticanoseocupadoqueexcepcional,masapenasdoquegeral:nose
interessa pelo indivduo, mas por grupos de indivduos; no se ocupa, em suma, de uma s
medio,masdeumconjuntodemedies.
Acrescentese,ainda,queasntesenumrica.Queristodizerqueseprescindeinteiramentedas
palavras e dos recursos literrios de mais ou menos efeito que elas possibilitam. Alcanase a
sntesepelorecursoexclusivodosnmeros.
6
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Da o af com que frequentemente se escolhem os nmeros de acordo com os argumentos. A
Estatstica intrinsecamente uma disciplina no literria, manipula exclusivamente nmeros e
alcanaasnteseordenandoosecooperandocomeles.
Estatstica, deriva de status que em latim significa Estado, e que s por si demonstra a
ligaoquesempreexistiuentreambos;
O primeiro levantamento estatstico remonta a 3050 a.C., no Egipto, tendo como objectivo
informaroestadosobrerecursoshumanoseeconmicos.
No sc. XVII d.C., a disciplina de Estatstica era j leccionada nas universidades alems,
continuandocomafinalidadededescreveraspopulaeseasriquezasdoEstado.
Aindanosc.XVII,dseaexpansodosseuscamposdeinvestigaoareascomo:
Sadepblica;
Indstria;
Comrcio;
EstudosDemogrficos.

Os mtodos de inferncia estatstica surgem com Jonh Graunt (16201674), um modesto


comerciante,quetiraconclusesvlidassobreumapopulaodesconhecidaporele.
Fermat (16011665) e Pascal (16231662) permitem que o estudo do acaso tome uma expresso
matemtica,introduzindooClculodasProbabilidades.
O Clculo das Probabilidades e o aparecimento do Mtodo dos mnimos quadrados, vm
credibilizaraEstatsticaconferindolheafundamentaomatemticaemqueelaassentahoje.
Nosc.XVIIILambertQuetelet(17961874)introduziuaEstatsticaemreascomo:
Meteorologia;
Antropometria;
CinciasSociais;
Economia;
Biologia.
7
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

FrancisGalton(18221911),apresentanoesderegressoecorrelao;
Karl Pearson (18571936) apresenta a mais bela e acabada teoria de Estatstica, ficando tambm
conhecidopelosseuscoeficientes;
Fisher e os seus trabalhos sobre inferncia Estatstica deram tambm um grande contributo ao
desenvolvimentodaEstatstica.
Em 1943, dse uma grande reviravolta, uma vez que o tratamento de dados deixa de ser feito
manualmenteepassaasercomputadorizado.
MtodoEstatstico:
Tcnicausadaparaobter,analisareapresentardadosnumricos;
Mtodocientficocujafinalidadeoestudodaspropriedadesnumricas
dosconjuntosdosfactos.

OMtodoEstatstico,segundoateoriadeCramer,pressupeasseguintesfases:
Recolhadedadosestatsticos:obtenodaamostraapartirdapopulao,
devendo depurar e rectificar os dados estatsticos, que no seu conjunto
sodenominadossrieestatstica.
Descrio:conjuntodeoperaes,numricasougrficas,efectuadassobre
os dados estatsticos determinando a sua distribuio; procedese sua
ordenao,codificaoerepresentaopormeiodequadrosetabelas.
Anlise: consiste em tirar concluses sobre a distribuio da populao,
determinar o seu grau de confiana e ainda formular hipteses, tentando
verificlas,quantoaofenmenoemestudo.
Predio: uma previso do comportamento do fenmeno em estudo,
tendoemcontaadefiniodadistribuioestatstica.
8
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

2. POPULAO E AMOSTRA

Populao: somatrio dos indivduos ou elementos, com qualquer caracterstica comum e que
estosujeitosaumaanliseestatstica,portereminteresseparaoestudo.
Quantosuaorigempodeser:
Conjuntodepessoas;
Conjuntodeobjectos;
Conjuntodeacontecimentos.
Quantosuanaturezapodeser:
Existenteoureal;
Hipotticaounototalmenteexistente;
Podeaindaser:
Conjuntofinito;
Conjuntoinfinito.

Amostra: um subconjunto retirado da populao, que se supe ser representativo de todas as


caractersticas da mesma, sobre o qual ser feito o estudo, com o objectivo de serem tiradas
conclusesvlidassobreapopulao.
Amostragem: o procedimento pelo qual um grupo de pessoas ou um subconjunto de uma
populao escolhido com vista a obter informaes relacionadas com um fenmeno, e de tal
formaqueapopulaointeiranosinteressaestejarepresentada
OPlanodeAmostragemserveparadescreveraestratgiaautilizarparaseleccionaraamostra.
Este plano fornece os detalhes sobre a forma de proceder relativamente utilizao de um
mtododeamostragemparadeterminadoestudo.
9
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Logo que o investigador delimite a populao potencial para o estudo, ele deve precisar os
critriosdeselecodosseuselementos.
Certoscritriosdizemrespeitoscaractersticasrequeridasparaqueumelementoousujeitofaa
partedaamostra:
Aamplitudedaidadedosparticipantes;
Condiesdesadeprecisas.

Igualmentecertoscritriosdefinemossujeitosquenofaropartedoestudo:

Populao
Populao-alvo
Amostra

Figura 1: Populao e Amostra

Um investigador interessado pela readaptao aps cirurgia de revascularizao, pode
concentrarsesomentenossujeitosquetiveramumanicaexperinciadestetipoeexcluremos
outros.
Umaamostraditarepresentativaseassuascaractersticasseassemelhamomaispossvelsda
populaoalvo. particularmente importante que a amostra represente no s as variveis em
estudo,mastambmoutrosfactoressusceptveisdeexerceralgumainflunciasobreasvariveis
estudadas,comoaidade,osexo,aescolaridade,orendimento,etc.
ARepresentatividadeavaliasecomparandoasmdiasdaamostracomasdapopulaoalvo.

10
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Comoseignorasetodasascaractersticasdapopulaoestopresentesnumaamostradadoque
estassomuitasvezesdesconhecidas,admitesequeexistesempreumgraudeerro.
ERRODEAMOSTRAGEM:adiferenaqueexisteentreosresultadosobtidosnumaamostrae
osqueteriamsidoobtidosnapopulaoalvo.

Duassoluesexistemparareduziraomnimooerroamostral:
1. Retirar de forma aleatria e um nmero suficiente de sujeitos que faro parte da
amostra.
2. Procurar reproduzir o mais fielmente possvel a populao pela tomada em conta das
caractersticasconhecidasdesta.

3. MTODOS DE AMOSTRAGEM



3.1 AMOSTRAGENS PROBABILSTICAS E NO-
PROBABILSTICAS


3.1.1 As Amostras Probabilsticas

Os mtodos de amostragem probabilstica servem para assegurar uma certa preciso na


estimaodosparmetrosdapopulao,reduzindooerroamostral.
Aprincipalcaractersticadosmtodosdeamostragemprobabilsticaresidenofactodequecada
elemento da populao tem uma probabilidade conhecida e diferente de zero, de ser escolhida,
aquandodatiragemaoacasoparafazerpartedaamostra.
Oobjectivodestaabordagemobteramelhorrepresentatividadepossvel.
11
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

3.1.1.1 TIPOS DE AMOSTRAGENS PROBABILSTICAS

TiposdeAmostragem:
a) AAmostragemAleatriaSimples;
b) AAmostragemAleatriaEstratificada;
c) AAmostragememCachos;
d) AAmostragemSistemtica.


AMOSTRAGEM ALEATRIA SIMPLES
AAmostragemaleatriasimplesumatcnicasegundoaqualcadaumdoselementos(sujeitos)
quecompeapopulaoalvotemigualprobabilidadedeserescolhidoparafazerpartedeuma
amostra.Aamostragemaleatriasimplesconsisteemelaborarumalistanumricadeelementos
de onde se tira, com a ajuda de uma tabela de nmeros aleatrios, uma srie de nmeros para
constituiraamostra.

AMOSTRAGEM ALEATRIA ESTRATIFICADA


A Amostragem aleatria estratificada uma variante da amostra aleatria simples. Esta tcnica
consisteemdividirapopulaoalvoemsubgruposhomogneoschamadosestratoseaseguir
tirar de forma aleatria uma amostra de cada estrato. A Amostragem aleatria estratificada
utilizadaquandoapopulaointeirareconhecidaporcertascaractersticasprecisas,taiscomoa
idade, o sexo, a incidncia de uma condio de sade, tudo isto para assegurar a melhor
representatividadepossvel.
12
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Po p u la o - A lv o
20 00 e stu d a n te s e m C i n c ia s
So c ia is
C la ssific a o
Estra tific a o Pro p o rc io n a l
4 0 Estu d a n te s
D o u to ra m e n to
Estra to 2
M e stra d o
6 0 0 = 3 0 %
Estra to 3
Lic e n c ia tu ra
10 0 0 = 5 0 %
Esc o lh a A le a t ria
Estra tific a o N o - Pro p o rc io n a l
A m o stra = 200
Esc o lh a A le a t ria d e 1 0% e m c a d a Estra to
Estra to 1
D o u to ra m e n to
4 0 0 = 2 0 %
6 0 Estu d a n te s
M e stra d o
1 0 0 Estu d a n te s
Lic e n c ia tu ra
Po p u la o - A lv o
20 00 e stu d a n te s e m C i n c ia s
So c ia is
C la ssific a o
Estra tific a o Pro p o rc io n a l
4 0 Estu d a n te s
D o u to ra m e n to
Estra to 2
M e stra d o
6 0 0 = 3 0 %
Estra to 3
Lic e n c ia tu ra
10 0 0 = 5 0 %
Esc o lh a A le a t ria
Estra tific a o N o - Pro p o rc io n a l
A m o stra = 200
Esc o lh a A le a t ria d e 1 0% e m c a d a Estra to
Estra to 1
D o u to ra m e n to
4 0 0 = 2 0 %
6 0 Estu d a n te s
M e stra d o
1 0 0 Estu d a n te s
Lic e n c ia tu ra

Figura 2: amostra estratificada



AMOSTRAGEM EM CACHOS
Consiste em retirar de forma aleatria os elementos por cachos em vez de unidades. til
quandooselementosdapopulaoestonaturalmenteporcachoseporissodevemsertratados
comogruposouquandonopossvelobterumalistagemdetodososelementosdapopulao
alvo.

AMOSTRAGEM SISTEMTICA
Consiste quando existe uma lista ordenada de elementos da populao. Esta tcnica consiste K
elementosdessalistasendooprimeiroelementodaamostraretiradoaoacaso.
Ointervaloentreoselementoscorresponderazoentreotamanhodapopulaoedaamostra.
Exemplo:Sepretenderumaamostrade100indivduoseapopulaoforde1000osistemaser
1000:100=10 (dez em dez o sistema), isto , ser includo um elemento da lista de 10 em 10
indivduosapartirdo1.n.sorteado.
13
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Importante
Se se utilizar uma amostragem por cachos ou outros tipos de agrupamentos, a amostra s
considerada probabilstica se os grupos foram escolhidos ao acaso antes da repartio aleatria
dossujeitosnosgrupos.

3.1.1.2 TIPOS DE AMOSTRAGENS NO PROBABILSTICAS:

um procedimento de seleco segundo o qual cada elemento da populao no tem amesma


probabilidadedeserescolhidoparaformaraamostra.
Estetipodeamostragemtemoriscodesermenosrepresentativaqueaprobabilsticanoentanto
muitas vezes o nico meio de construir amostras em certas disciplinas profissionais
nomeadamentenareadasade.
TiposdeAmostragensNoProbabilsticas:
a) AAmostragemAcidentaloudeConvenincia;
b) AAmostragemporCotas;
c) AAmostragemdeSelecoRacionalouTipicidade;
d) AAmostragemporRedesouBoladeNeve.

AMOSTRAGEM ACIDENTAL OU DE CONVENINCIA
formada por sujeitos facilmente acessveis, que esto presentes num determinado local e
momentopreciso.
Exemplo: pessoas hospitalizadas. Um investigador pode ter acesso a uma unidade hospitalar
paraconstituirumaamostradepacienteshospitalizados.
Nestetipodeamostratemavantagemdesersimplesemorganizarepoucoonerosa,todaviaeste
tipodeamostraprovocaenviesamentos,poisnadaindicaqueasprimeiras30a40pessoassejam
14
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

representativas da populaoalvo. So utilizadas em estudos que no tm como finalidade a
generalizaodosresultados.

AMOSTRAGEM POR COTAS


Idntica amostragem aleatria estratificada diferindo desta apenas pelo facto dos sujeitos no
seremescolhidosaleatoriamentenointeriordecadaestratooudecadagrupo.

AMOSTRAGEM POR SELECO RACIONAL OU POR TIPICIDADE


Tem por base o julgamento do investigador para constituir uma amostra de sujeitos em funo
doseucarctertpico.
Por exemplo: o estudo de casos extremos ou desviantes como uma patologia rara ou uma
instituio.

AMOSTRAGEM POR REDES OU BOLA DE NEVE


Consisteemescolhersujeitosqueseriamdifceisdeencontrardeoutraforma.Tomaseporbase,
redessociaisamizadeseconhecimentos.
Porexemplo:ImigrantesdeLeste.
Quando o investigador encontra sujeitos que satisfazem os critrios escolhidos pedelhes que
indiquemoutraspessoasdecaractersticassimilares.
15
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


3.2 DETERMINAO DO TAMANHO DA AMOSTRA

Os tamanhos das amostras so relativos, isto , depende do tamanho da populao. Para
determinar as amostras existem vrias frmulas, consoante o parmetro em critrio. As mais
utilizadasnasadesoasquesebaseiamnapercentagemdofenmeno:

3.2.1 Clculo do Tamanho da Amostra para Populaes


Infinitas (>100.000 elementos)

Aamostradependeda:
1. Extensodouniverso;
2. DoNveldeConfiana;
3. DoErroMximopermitido;
4. Dapercentagemcomqueofenmenoseverifica.

n=
2
. (p.q)
e
2
Frmula:
n=
2
. (p.q)
e
2
Frmula:


n=Tamanhodaamostra
=Nveldeconfianaescolhidoexpressoemndesviospadro(s)
p=%comoqualofenmenoseverifica
q=%complementar(100p)
e=Erromximopermitido
16
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Sedesejarmosumnveldeconfianabastantealtosuperiora99%aplicaseafrmuladostrs
desvios.


Figura 3: converso dos niveis de confiana em desvios padro


Logo,odesvio(s)
2
seriaiguala3
2
=9
Seoerromximoforde2%oe
2
seriguala2
2
=4

Exemplo:Seforpossveladmitirqueonmerodecaptaesdeguaemprofundidadesesituam
porvoltados50%,noultrapassandoesta%,entop=50e,consequentemente,q=10050ouseja
50.Assim,temseaequao
n= 9 . (50.50) = 5625
4
Isto,paraatendersexignciasestabelecidas,on.decaptaesaanalisarseria5625.
Setodavia,foraceiteonveldeconfianade95%(2desvios)eumerromximode5%on.de
elementosserbemmenor.
osclculos.
n=
2
. (p.q)
e
2
n= 4 . (50.50) = 400
25

Convmlembrarquesemprequenosejapossvelestimarumapercentagemdofenmeno,deve
utilizarsesemprep=50
17
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

3.2.2 Clculo do Tamanho da Amostra para Populaes


Finitas (<100.000 elementos)

Aamostradependeda:
1. Extensodouniverso;
2. DoNveldeConfiana;
3. DoErroMximopermitido;
4. Dapercentagemcomqueofenmenoseverifica.

Fr mul a
Onde:
n=Tamanhodaamostra
=nveldeconfianaescolhido,expressoemnmerosdedesviospadro
p=percentagemdofenmeno
q=percentagemcomplementar
N=tamanhodapopulao
e
2
=erromximopermitido

Exemplo:Verificarquantosdos100empregadosdeumacantinacumpremcorrectamenteas
normasdehigieneeseguranadotrabalho.
Presumesequeessen.nosejasuperiora30%dototal;desejaseumnveldeconfianade95%
(2desvios)etoleraseumerroat3%.

Ento,n=90,4Logodeveroserpesquisados90empregados.
Confirmeaplicandoafrmula
Mas,seapopulaofossede10.000empregados,comosmesmoscritriosanteriormente
referidos,ento:

n=
4 . (30.70).10000
=
853
(9.9999)+4.(30.70)

18
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA



DETERMINAO DO TAMANHO DA AMOSTRA

Otamanhoptimodeumaamostra,nodependetantodotamanhodapopulaomassimde
doisparmetrosestatsticos:amargemdeerroeonveldeconfiana
MargemdeerroUmaamostrarepresentaaproximadamente(enuncaexactamente)uma
populao.Amedidadesteaproximadamenteachamadamargemdeerro,elidoassim:
seumapesquisatemumamargemdeerrode2%eaDoenaCardacateve25%deprevalncia
naamostrarecolhida,podemosdizerque,naqueleinstante,napopulao,elateruma
prevalnciaentre23%e27%(25%menos2%e25%mais2%).
NveldeconfianaAspesquisassofeitascomumparmetrochamadonveldeconfiana,
geralmentede95%.Estes95%queremdizeroseguinte:serealizarmosumaoutrapesquisa,com
umaamostradomesmotamanho,nasmesmasdataselocaisecomomesmoinstrumentode
recolhadedados,humaprobabilidadede95%dequeosresultadossejamosmesmos(euma
probabilidadede5%,claro,dequetudodifira).
Quandojseefectivouumapesquisaesedesejaconheceramargemdeerroutilizadaaplicase:

p
= (p.q)
n

p
= (p.q)
n

Fr mul a

Onde:
n=Tamanhodaamostra
p=Erropadrooudesviodapercentagemcomqueseverificadeterminadofenmeno
p=percentagemdofenmeno
q=percentagemcomplementar

19
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


3.2.3 Determinao da Margem de Erro da Amostra

Exemplo:Numapesquisaefectuadacom1000adultos,verificouseque30%bebemcafpelo
menosumavezpordia.Qualaprobabilidadedequetalresultadosejaverdadeiroparatodoo
universo.

p
= (30.70)
1000

p
= 1,45

p
= (30.70)
1000

p
= 1,45

Comoovalorencontrado(margemdeerro)correspondeaumdesvio,entoparadoisdesvios
(95,5%),temos1,45*2=2,90.
Para3desviosotriplo(4,35).
Istosignificaque,porexemplo,paraumnveldeconfianade95%(2desvios)oresultadoda
pesquisaapresentarcomomargemdeerro2,90paramaisoumenos.
provvel,portanto,queon.deconsumidoresdecafestejaentre27,10%(30%2,90)e32,90%
(30%+2,90).


3.2.4 Determinao da Amostra sem conhecer os
limites da populao


Z
2
(

/2)

p(1-p)
d
2
Z
2
(

/2)

p(1-p)
d
2

Fr mul a
Emque
p=fenmeno]
=erro
{SeIC(intervalodeconfiana)=95%,=5%(0,05)}Ento
/2=0,05/2=0,025
Z(/2)=Z(0,025)=1,96
d=nmerodedesvios
20
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


Assimparaumfenmenoquetenhaumaprevalnciade25%,osresultadosseriam:

Emtermosestatsticosconsideramosqueumaamostra:Pequenasen<30

CUIDADOS A TER NA ESCOLHA DA AMOSTRA:


1. Imparcialidade:todososelementosdevemteramesmaprobabilidadeeoportunidadede
seremescolhidos;
2. Representatividade: deve conter em proporo todas as caractersticas que a populao
possui,qualitativaequantitativamente,demodoaquenosetornetendenciosa;
3. Tamanho: suficientemente grande de modo a fornecer as principais caractersticas, por
outroladopequenaparaeconomizartempo,dinheiroepessoal.

3.3 INDIVDUO OU UNIDADE ESTATSTICA

OestudoEstatsticorecaisobreaamostra,noentantoestefeitodemodopormenorizadoacada
umdoselementosdaamostra,quesodesignadosporIndivduoouUnidadeEstatstica.
Unidade Estatstica: o factor elementar, o objecto de anlise, que independentemente da sua
naturezatemquepossuirumadefinioprecisa.
AsprincipaiscaractersticasdeumaboaunidadeEstatsticaso:
1. Propriedadeouadequaoaoobjectivodainvestigao;
2. Clareza;
3. Mensurabilidade;
4. Comparabilidade.
21
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

NoestudodecadaunidadeEstatstica,surgemresultadosindividuaiscomosquaissofeitasas
infernciassobreapopulao.EstesresultadostmonomedeDadoEstatstico.
DadoEstatstico:oresultadodoestudoefectuadoacadaunidadeEstatsticatendoemcontaa
sua individualidade, sendo este depois tratado de modo a permitir inferir sobreacolectividade
queaintegra(populao).

3.4 VARIVEL ESTATSTICA

Ao ser efectuada uma anlise Estatstica a uma populao, os aspectos (caractersticas) que se
tmemconta,umouvrios,sodenominadosporVarivelEstatstica.
UmavarivelEstatsticapodeser:

1. Qualitativa:seasuanaturezaquevariadeelementoparaelemento.
Asvariveisqualitativasdividem:seem:
a. Variveisnominais:quandooseusignificadosseentendeemfunodonomee
o nmero ou cdigo que se lhe atribua no nos d nenhuma informao (sexo,
cordeolhos,graudeparentesco,tipodepatologia,presena/ausnciadefactores
derisco,etc.).
b. Variveis ordinais: quando existe uma ordenao possivel (gravidade de uma
leso,classesocial,graudeescolaridade,etc.).
22
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


2. Quantitativa: se a sua intensidade que varia de elemento para elemento, tornandoa
mensurveloureferencivel.
Asvariveisquantitativasdividemseem:
a. Variveis discretas:assumevaloresisolados,normalmenteinteiros(n.defilhos,
n.defactoresderisco,n.dedependentes,n.derespostas,etc)
b. Variveis contnuas: em que possvel qualquer operao aritmtica, podendo
assumirqualquervalorreal(altura,peso,IMC,distncia,etc).

Tendo em conta o nmero de atributos (caractersticas) que esto a ser estudadas, as variveis
podemser:
1. Unidimensionais:seapenascorrespondeaumatributo
2. Bidimensionais:secorrespondeadoisatributos;
3. Pluridimensionais:secorrespondeavriosatributos.

Modalidade: toda a manifestao possvel de uma varivel, isto , as vrias hipteses de
resposta,podendoelasserduasoumais.
Asmodalidadestmobrigatoriamentequeser:
1. Incompatveis: cada unidade Estatstica no pode pertencer simultaneamente a
duasoumaismodalidades;
2. Exaustivas: todas as unidades Estatsticas tm que ser inseridas numa
modalidade.

Aescolhadasmodalidadesdeveserfeitadeacordocomasinformaespossudas.Noentanto,
surgemsituaesemquehnecessidadedeseaumentarumamodalidadesuplementar.
23
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

3.5 ESTATSTICA DESCRITIVA E ESTATSTICA INDUTIVA



AEstatsticaDescritivarecolhe,organizaeanalisaosdadosdeumaamostra,semtirarqualquer
conclusosobreumgrupomaior.
A Estatstica Indutiva recolhe, organiza, analisa e estabelece relaes entre os dados para fazer
infernciassobreapopulao.Combasenosresultadosobtidossobreaamostrapodemosinferir
concluses vlidas sobre a populao (este ramo da Estatstica j exige a utilizao de recursos
matemticosespeciais,nomeadamenteaTeoriadasProbabilidades).
Assim, a Estatstica Indutiva permitenos fazer inferncias sobre a populao e chegar a leis e a
teorias.

3.6 PARMETRO E DADO ESTATSTICO

Oparmetrotodaafunodefinidaapartirdosdadosnumricosdeumapopulao.
Exemplo:consideremosasseguintesnotasemEstatstica101110159
Mdia =xi/n = 55/5 = 11
Ovalor11oparmetro(resultadodamdiaaritmtica).

Odadoestatsticotodaafunodefinidaapartirdosdadosnumricosdeumaamostra.
Exemplo:consideremosaamostra:1010
Mdia =xi/n = 20/2 = 10 O valor 10 o dado estatstico

24
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


3.7 REPRESENTAO DE UMA VARIVEL ESTATSTICA

Depoisdetermosdefinidoalgumasnoesbsicasdeestatstica,tratarse,aseguir,dasegunda
fasedeumestudoestatstico.Comojreferimos,osdadosnumricosrecolhidosregistamseem
sries estatsticas e, para serem analisados, devem ser ordenados e representados em quadros e
emgrficos.
Quando trabalhamos com uma varivel discreta ou descontnua falamos em seriao e quando
trabalhamoscomumavarivelcontnuafalamosemclassificao.

SERIAO DE UMA AMOSTRA



Como j referimos anteriormente, uma seriao implica que a varivel seja discreta (exemplo:
nmerodefilhosdeumcasal,nmerodedivisesdeumacasa,etc.).
Oquadrogeraldeumaseriaoestexpressonoquadroquesesegue.
Quadro 1: Quadro Geral de Seriao
Var i vel
Fr equnci as
absol ut as
Fr equnci as
acumul adas
Fr equnci as
r el at i vas
Fr equnci as
r el at i vas
acumul adas
X1 n1 n1
n1
N
n1
N
X2 n2 n1+ n2
n2
N
n1+n2
N
X3 n3 n1+ n2+ n3
n3
N
n1+ n2+n3
N

Xi ni n1+ n2+ +ni
ni
N
n1+ n2++ ni
N

Xk nk n1+ n2+ +nk
nk
N
1
Tot al N 1
Legenda: Distribuio de frequncias de uma varivel discreta

Na primeira coluna temos os valores que a nossa varivel X toma (x1, x2, ..., xk). Esta coluna
podesertambmdenominadaporxi.
Nasegundacolunaapresentamosasfrequnciasabsolutassimplesouefectivas,isto,onmero
de vezes que cada valor foi observado ou o nmero de vezes que cada valor surge na amostra.
25
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Estacolunapodetambmserdenominadaporni.Devemoslembraraquiqueonmerototalde
indivduos pertencentes populao/ou amostra chamase efectivo total e designase por n,
devendosempreverificarsequeni=n.
Naterceiracolunapodemosvisualizarasfrequnciasacumuladas,isto,asomadasfrequncias
absolutas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser
tambmdenominadaporN(xi).Assim,
N(xi) = ni
xi<x

Na quarta coluna apresentamos as frequncias relativas simples. Esta coluna pode ser tambm
denominadaporfi,emquefi=ni/ne,detalmodoque,fi=1;afrequnciarelativaexpressa,
emgeral,empercentagem.
Na quinta coluna temos as frequncias relativas acumuladas, isto , a soma das frequncias
relativas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser
tambm denominada por F(xi); a frequncia relativa acumulada expressa, em geral, em
percentagem.
Exemplo:ConstruaoquadrodefrequnciasparaavarivelXquetomaosseguintesvalores:
xi 14 14 13 12 11 12 10 13 12

Quadro 2: Quadro de Frequncias
xi ni f i =ni / n N( xi ) F( xi )
10 1 1/ 9 1 1/ 9
11 1 1/ 9 2 2/ 9
12 3 3/ 9 5 5/ 9
13 2 2/ 9 7 7/ 9
14 2 2/ 9 9 9/ 9
ni = 9 fi = 1 em que n = 9
26
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


CLASSIFICAO DE UMA AMOSTRA

Como j referimos anteriormente, uma classificao implica que a varivel seja contnua
(exemplo:atemperaturadeumcorpo,aalturadeumapessoa,aduraodecertofenmeno,etc.
variveisrelacionadascomoespao,otempoouamassa).
Quadro 3: Quadro de Frequncias
Cl asses
Mar cas da
cl asse
Fr equnci as
absol ut as
Fr equnci as
acumul adas
Fr equnci as
r el at i vas
Fr equnci as
r el at i vas
acumul adas
c0- c1 X 1 n1 n1
n1
N
n1
N
c1- c2 X 2 n2 n1+ n2
n2
N
n1+n2
N
c2- c3 X 3 n3 n1+ n2+ n3
n3
N
n1+ n2+n3
N

ci - 1- ci X i ni n1+ n2+ +ni
ni
N
n1+ n2++ ni
N

ci - 1- ck X k nk n1+ n2+ +nk
nk
N
1
Tot al _ 1
Legenda: Di st r i bui o de f r equnci as de uma var i vel cont nua

Na primeira coluna temos as classes. Por conveno, as classes so abertas superiormente, com
excepodaltimaclasse,naturalmente.
Nasegundacolunatemosasmarcasdaclasse.Estacolunapodesertambmdesignadaporxi.A
marcadeumaclasseopontomdiodessaclasse,ouseja,opontoequidistantedosextremos
deumaclasse.
Exemplo:classec0c1 x1=(c0+c1)/2
Naterceiracolunaapresentamosasfrequnciasabsolutassimplesouefectivas,ouseja,onmero
devezesqueosvaloresdedeterminadaclasseforamobservados.Estacolunapodesertambm
denominada por ni. Mais uma vez, ni = n (nmero total de indivduos pertencentes
populao/ouamostra,aquesechamaefectivototal).
Na quarta coluna apresentamos as frequncias acumuladas, isto , a soma das frequncias
absolutas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser
tambmdenominadaporN(i).
27
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Na quinta coluna temos as frequncias relativas simples. Esta coluna pode ser tambm
denominadaporfi,emquefi=ni/ne,detalmodo,quefi=1.
Na sexta coluna apresentamos as frequncias relativas acumuladas, isto , a soma das
frequncias relativas correspondentes a valores inferiores a um determinado valor. Esta coluna
podesertambmdenominadaporF(i).

NumaclassificaohabitualrepresentarmosporKonmerodeclasses(emgeralKvariaentre
5e20,inclusive)eporAaamplitude(emqueA=xmximoxmnimo).
Ento,
- Se K dado = A/K

- Se dado K=A/ , sendo a amplitude do intervalo de
classe e A a amplitude do intervalo
da amostra

Exemplo:Construaoquadrodefrequnciascomosseguintesdados:
Classes [20-23[ [23-26[ [26-29[ [29-32[ [32-35[ [35-38]
ni 2 5 7 10 4 2

Quadro 4: Quadro de Frequncias
Cl asses ni f i N( i ) F( i ) x' i
[ 20- 22] 2 2/ 30 2 2/ 30 21
[ 23- 25] 5 5/ 30 7 7/ 30 24
[ 26- 28] 7 7/ 30 14 14/ 30 27
[ 29- 31] 10 10/ 30 24 24/ 30 30
[ 32- 34] 4 4/ 30 28 28/ 30 33
[ 35- 38] 2 2/ 30 30 30/ 30 36
ni = 30 f i = 1 emque n = 30 e = 3
28
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA



3.8 REDUO DE UMA VARIVEL ESTATSTICA

CONCEITO DE REDUO E SUA CONVENINCIA


Anteriormente definimos o conceito de varivel estatstica e construramse quadros e grficos
estatsticos com vista a uma descrio numrica e grfica de uma varivel estatstica.
Naturalmente, os grficos permitem uma primeira sntese das informaes registadas nos
quadros.
Por outro lado, por simples aproximao das curvas de frequncias absolutas ou relativas de
duasoumaisvariveis,podemosfazerumaprimeiracomparaoentreelas.
H, porm, necessidade de sintetizarmos toda a informao respeitante a uma varivel
estatstica, resumindose os dados a um pequeno nmero de elementos que bastam para
caracterizla. Tal sntese consiste na reduo de dados e os elementos numricos obtidos
designamseporparmetrosdavarivelestatstica.
Feitaarepresentaodosdadosestatsticospormeiodequadrose/oudegrficos,importafazer
sobreosmesmosumestudonosentidodesepoderchegaraconcluses.
Paratal,impeseumtrabalhodesimplificaoqueconsisteemprocederasnteses,emreduzir
grandesquantidadesdedadosanmerossimplesquepermitamumaanliserpidaeumafcil
comparaocomoutrassriesdamesmanaturezaoudenaturezadiferente.
Tais nmeros so designados, habitualmente, por caractersticas, parmetros ou medidas e so
agrupadosemcategoriasconformeotipodeinformaoquefornecem.
29
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

MEDIDAS DE TENDNCIA CENTRAL OU DE POSIO

Sobestadesignaoagrupamseosparmetrosque,ounosindicamalgodeassocivelaoncleo
ou centro da distribuio, ou nos permitem compartimentla. Vamos considerar as seguintes
medidasdetendnciacentraloudeposio:mdia,mediana,modaequantis.

3.8.1 Mdia


MDIA ARITMTICA
Amdiaaritmticaopontodeequilbriodosdados,isto,tendoumconjuntodenvaloresx1,
x2,...,xndeumavarivelXoquocienteentreasomadessesvaloreseonmerodeles.
Amdiaaritmticapodeserrepresentadapelaseguintefrmulamatemtica:
x = xi / n
Numa amostra seriada os valores x1, x2, ..., xk ocorrem n1, n2, ..., nk vezes, respectivamente, a
mdiaaritmticaser
x = nixi / n = fixi

Exemplo:Calculeamdiaaritmtica,sabendoque
xi 4 6 7 8 10
ni 2 4 5 3 2

Quadro 5: Quadro do clculo da mdia


xi ni ni xi
4 2 8
6 4 24
7 5 35
8 3 24
10 2 20
=16 =111
Ento,
x = nixi / n = 111/16= 6,94

30
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Numa amostra classificada a frmula definidora da mdia no se pode aplicar directamente
porque no conhecemos os valores exactos da varivel estatstica, mas apenas o nmero de
observaes dentro de cada classe, isto , quando os dados esto agrupados em classes, para o
clculo da mdia simples, devemos considerar o ponto mdio de cada classe (marca) como
representativo de todos os valores nela includos, pelo que aquela pode ser representada pela
frmulamatemticaseguinte:
x = nix'i / n = fix'i

Exemplo:Calculeamdiaaritmtica,sabendoque
Classes [3-5[ [5-7[ [7-9[ [9-11[ [11-13]
ni 2 4 5 3 2

Quadro 6: Quadro do clculo da mdia
Cl asses ni x' i ni x' i
[ 3- 5[ 2 3, 5 7
[ 5- 7[ 4 5, 5 22
[ 7- 9[ 5 7, 5 37, 5
[ 9- 11[ 3 9, 5 28, 5
[ 11- 13] 2 12 24
=16 =119

Ento:
x = nix'i / n = 119/16 = 7,43

Temos de salientar que quando usamos a marca da classe estamos a colocar um certo erro de
agrupamento,peloquedevemosconsideraraCorrecodeSheppard,detalmodoque:
x semelhante a x

Relativamentespropriedadesdamdiaaritmticapodemosenunciarduas:
Somandoousubtraindoumaconstanteatodososvaloresobservados,amdiaresultante
ficaraumentadaoudiminuda,respectivamente,dessaconstante;
Multiplicandooudividindoosvaloresobservadosporumaconstantediferentedezero,a
mdiaresultanteficarmultiplicadaoudividida,respectivamente,poressaconstante.
31
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

MDIA ARITMTICA PESADA OU PONDERADA:


Por sua vez associase a x1, x2, ..., xk certos factores de ponderao ou pesos p1, p2, ..., pk que
dependemdosignificadoouimportnciaatribudasobservaes.Assim,afrmulamatemtica
damdiaser:
x p = pixi / pi

Exemplo 9: Um professor de matemtica quer saber a mdia poderada das suas avaliaes nas
quatroturmasemquelecciona,sabendoqueotestetinhaumaponderaode30%eotrabalho
umaponderaode70%:
TurmaAMdiadanotadoteste=65% Mdiadanotadotrabalho=78%
TurmaBMdiadanotadoteste=60% Mdiadanotadotrabalho=70%
TurmaCMdiadanotadoteste=40% Mdiadanotadotrabalho=28%
TurmaDMdiadanotadoteste=80% Mdiadanotadotrabalho=75%

Determineamdiaponderadadasquatroturmasemconjunto.
xp=pixi/pi = [((65*30)/100) + ((78*70)/100) + ((60*30)/100) + ((70*70)/100) +
((40*30)/100) + ((28*70)/100) + ((80*30)/100) + ((75*70)/100)]/4 = 62,3

Sepreferirmosemquadroaresoluoser
Quadro 7: Clculo da mdia ponderada
xi pi pi xi
65 30 1950
60 30 1800
40 30 1200
80 30 2400
78 70 5460
70 70 4900
28 70 1960
75 70 5250

400 24920

x p = pixi / pi=24920/400=62,3

32
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Para alm da mdia aritmtica e da mdia aritmtica ponderada, temos tambm a mdia
geomtrica, a mdia harmnica e a mdia quadrtrica (a estes trs tipos de mdias no iremos
fazerqualquerreferncia).

3.8.2 Mediana

Amedianadeumasriedenobservaesx1,x2,...,xndeumavarivelXovalorqueocupaa
posiocentralquandoasobservaesestoordenadasporordemcrescenteoudecrescente,isto
,amedianadeumavarivelestatsticaovalordessavariveltalqueafrequnciadosvalores
que lhe so inferiores a mesma que a frequncia dos valores que lhe so superiores.
Representase,habitualmente,porMd.
Amedianausadaquandonaamostrahvaloresexcntricosemrelaoaoutrosvalores.
Paraoclculodamediana,temosdeconsiderarduassituaes:ocasoemqueNmpareocaso
emqueNpar.

N MPAR:
Amedianaumvalorobservado,detalmodoqueolugarqueocupadadopelafrmula
Md = (N +1) / 2

Exemplo:Determineamedianaparaaseguintesriededados:
5 9 8 7 6

Ordenandoporordemcrescente,vem56789
ComoNmpar,ento Md=(N+1)/2=(5+1)/2=6/2=3
Seamedianaocupaaterceiraposioouterceirotermo,oseuvalor7
33
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA



N PAR:
Amediananocoincidecomnenhumvalorobservadoficandocompreendidaentredoisvalores
centrais classe mediana; convencionouse tomar para mediana a mdia destes dois valores. A
posioqueamedianaocupadadapelafrmula
Md = mdia dos valores que se encontram na posio N / 2 e (N / 2) + 1

Exemplo:Determineamedianaparaaseguintesriededados
5 6 12 9 8 7

Ordenandoporordemcrescente,vem5678912
ComoNpar,ento N/2=6/2=3;(N/2+1)=3+1=4
Assim, a classe mediana ocupada pelas posies 3 e 4, ou seja, pelos valores 7 e 8, pelo que a
Md=(7+8)/2=15/2=7,5

3.8.3 Moda

A moda (ou valor modal) de uma srie de n valores x1, x2, ..., xn de uma varivel X o valor
ondeafrequnciaatingeomximo(relativo).Representase,habitualmente,porMo.

AMOSTRA SERIADA:
Amodaovalordavarivelcommaiorefectivo,isto,seumavariveldiscreta,a(s)moda(s)
(so)o(s)valor(es)davarivelestatsticaqueseobserva(m)commaiorfrequncia.
Exemplo:Determineamodaparaaseguintesriedevalores
xi 4 6 8 10 2
ni 1 3 5 4 2
Amoda8.
34
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


AMOSTRA CLASSIFICADA:
Neste caso falamos em classe modal, tomandose para moda a marca da classe. Assim, a moda
deumavarivelcontnuaXtodoovalordeXparaoqualafunodefrequncia(absolutaou
relativa)atingeummximolocal.
Exemplo:Determineamodaparaaseguintesriedevalores
classes [2-4[ [4-6[ [6-8[ [8-10[ [10-12]
ni 1 7 4 10 2

Aclassemodal[810[,peloqueamoda=(8+10)/2=18/2=9



RELAO EMPRICA ENTRE A MDIA, A MEDIANA E A MODA
Pearson chegou concluso de que para as distribuies unimodais e moderadamente
assimtricas,vigoraaseguinterelaoemprica:
MdiaModa=3(MdiaMediana)
Vejamos,agora,arelaoexistenteentreestastrsmedidasnocasodasfigurasqueseseguem


Figura 4: Curva simtrica

35
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA




Figura 5: Curva assimtrica direita
Mdia > Moda
Mdia > Mediana
Mediana > Moda



Figura 6: Curva assimtrica esquerda
Moda > Mediana
Moda > Mdia
Mediana > Mdia

A UTILIZAO DA MDIA ARITMTICA, DA MEDIANA E DA MODA



MDIA ARITMTICA:
A medida de tendncia central mais usada a mdia aritmtica, que apresenta em relao
medianaemodavantagensapreciveis,taiscomo:
facilmentecalculvel;
aquemelhorseprestaaulterioresanlisesestatsticas;
Dependedetodososvaloresdasrie;
uma medida de tendncia central particularmente estvel, variando o menos possvel
deamostraparaamostraextradasdamesmapopulao;
Podesertratadaalgebricamente.

Existem, todavia, casos em que a informao fornecida pela mediana ou pela moda, parece ser
maiscompletadoqueafornecidapelamdiaaritmtica,comopassamosaindicar.
36
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

MEDIANA:
Estamedidadetendnciacentraldeverutilizarsequando:
Sedesejaconheceropontomdioexactodadistribuio;
Existemresultadosextremosqueafectariamgrandementeamdia.Importasalientarque
a mediana no influenciada pelos resultados extremos exemplo: na srie
10,13,15,16,18,19,21,tantoamdiacomoamedianaso16;sesubstituirmos21por50eos
restantesresultadospermaneceremosmesmos,amediana16eamdiaserde20,1;
A distribuio truncada, isto , incompleta nas extremidades exemplo: desejamos
medir os tempos de reaco em Psicologia e as vrias respostas ultrapassam as
capacidades de medida do aparelho; vemonos, assim, impossibilitados de calcular a
mdia,jquenodispomosdetodososvaloresdavarivel,sendo,noentanto,possvel
calcularovalordamediana,jqueconhecemosonmerodemedidasefectuadas.

MODA:
Estamedidadetendnciacentraldeverutilizarsequando:
Umamedidarpidaeaproximadadatendnciacentralforsuficiente;
Sedesejaconhecerovalormaistpicodeumadistribuioexemplos:descreveroestilo
devestidousadopelamulhermdia,salriopreponderanteemdeterminadaempresa.

desalientarque,apesardasvantagensapresentadasparaamoda,estatemadesvantagemde
serdedeterminaoimprecisa,nocasodasvariveiscontnuas.
37
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

3.8.4 Quantis

Chamasequantildeordempcom0p1erepresentase,habitualmente,porCpaovalordex
talqueF(x)=p.
Algunsquantistmdenominaesespeciais:

QUARTIS:
Osquartisdividemasrieordenadaem4partesiguais,contendocadaumadelas1/4ou25%das
observaes.
Q1=1quartil(correspondeaoquantildeordemp=1/4)
Q2=2quartil(correspondeaoquantildeordemp=1/2)
Q3=3quartil(correspondeaoquantildeordemp=3/4)

Assim, Q1 o valor da varivel estatstica que deixa atrs de si 25% das observaes; Q2 o
valordavarivelestatsticaquedeixaatrsdesi50%dasobservaeseQ3ovalordavarivel
estatsticaquedeixaatrsdesi75%dasobservaes.A(Q1Q3)chamaseintervalointerquartil
eointervaloaoqualpertencem50%dasobservaes,deixando25%paraadireitae25%paraa
esquerda.
de notar que dizer que os quartis dividem a srie em 4 partes iguais no significa que, por
exemplo, os intervalos (Q1, Q2) e (Q2, Q3) tm a mesma amplitude, mas sim que contm o
mesmonmerodeobservaes.

DECIS:
Os decis dividem a srie ordenada em 10 partes iguais, contendo cada uma delas 1/10 ou 10%
dasobservaes.
D1=1decil(correspondeaoquantildeordemp=1/10)
D2=2decil(correspondeaoquantildeordemp=2/10)
38
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA



CENTIS:
Oscentisdividemasrieordenadaem100partesiguais,contendocadaumadelas1/100ou1%
dasobservaes.
C1=1centil(correspondeaoquantildeordemp=1/100)
C2=2centil(correspondeaoquantildeordemp=2/100)


RELAES ENTRE QUARTIS, DECIS, CENTIS E MEDIANA:
Comopodemosobservarnafigura18
Q1=C25
Q2=Md=D5=C50
Q3=C75
D1=C10
D2=C20

Figura 7: Curva assimtrica direita
39
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

3.8.5 Medidas de disperso

Uma medida de tendncia central no nos d, s por si, uma informao exaustiva da
distribuio considerada; pelo contrrio, a capacidade que se lhe atribui de representar os
elementos de uma distribuio depende do modo como estes se concentram ou dispersam em
torno dela. Assim, podemos dizer que os parmetros de tendncia central no so suficientes
para caracterizar uma srie estatstica, apesar de a mediana e os quantis darem j uma ideia
sumriadomodocomoestodistribudasasobservaes.
Consideremososeguinteexemplo:Doisgruposdealunoscomasseguintesclassificaes
A 2 3 10 16 19
B 8 9 10 11 12
A mdia e a mediana 10 e, contudo, estas distribuies so muito diferentes. Com efeito,
enquanto no grupo A as notas apresentam desvios muito grandes, na distribuio B todos os
valoresseaproximamde10.Adispersoouvariabilidadedaprimeirasriemaisacentuadado
quenasegunda.
Quer dizer: distribuies com a mesma tendncia central podem apresentar aspectos bastante
diferentesnoqueconcernedispersoouvariabilidade,emedidaqueestadispersoaumenta,
menossignificativasdadistribuiovosendoasmedidasdetendnciacentral.
Assim,paramelhorcaracterizarmosumadistribuio,temosdeconsiderar,almdasmedidasde
tendncia central, uma outra medida que exprima o grau de disperso ou variabilidade dos
dados.
Vamos considerar as seguintes medidas de disperso: amplitude total, amplitude interquartis,
desviomdio,varincia,desviopadroecoeficientededispersooudevariao.

AMPLITUDE TOTAL
Aamplitudetotaladiferenaentreomaiorvaloreomenorvalor,isto,aamplitudetotalde
uma varivel estatstica a diferena entre o valor mximo e o valor mnimo dos valores
40
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

observados. a forma mais simples de avaliar a disperso dos dados, de tal modo que quanto
maiorforaamplitudetotalmaioradispersodosdados.
A amplitude total pode ser tambm denominada de intervalo total ou campo de variao;
representase,habitualmente,porAeapenasusavaloresextremos.
Numaamostraseriada:
A=xmximoxmnimo

Numaamostraclassificada:
A=extremosuperiordaltimaclasseextremoinferiordaprimeiraclasse

Se alguma destas classes for de amplitude indeterminada no possvel definir o intervalo de
variao.

Aamplitudetotalapresentaasseguintesdesvantagens:
Emborasejafcildecalcular,aamplitudetotaldependesomentedosvaloresextremos,queso,
geralmente,osmenosfrequenteseosmenossignificativosdeumadistribuio,desprezandose
os valores intermdios que so os mais frequentes. Alm disso, os valores extremos so
vulgarmente anmalos e muito variveis, consoante a amostra que se retire de uma populao,
de tal modo que duas distribuies podem ter a mesma amplitude total, mas disperses muito
diferentes.
Outro inconveniente da amplitude total consequncia de no tomar em considerao as
frequnciasdasobservaes.
Exemplo:CalculeaamplitudetotaldogrupoG,sabendoque:

G= 2 3 10 16 19

A = xmximo - xmnimo = 19-2 = 17

41
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

42
Margarida Pocinho e Joo Paulo de Figueiredo

AMPLITUDE INTERQUARTIS
Os quartis fornecem indicao quanto forma como as observaes se distribuem em torno da
mediana.
Como o 1 e o 3 quartis representam valores abaixo dos quais esto, grosso modo,
respectivamente, 25% e 75% das observaes, entre eles existiro, assim, 50% das observaes
centrais. Consequentemente, quanto mais aproximados estiverem estes quartis, maior ser a
concentraodasobservaesemtornodamediana.
AamplitudeinterquartispodeserdefinidacomoadiferenaentreoQuartil3eoQuartil1.Esta
medida de disperso pode ser tambm denominada de intervalo interquartis ou intervalo
quartlico.
Como podemos observar na figura 8, quanto mais achatada a curva, maior a amplitude e
quantomaioraamplitudeinterquartlicamaisdispersaadistribuio.




Q1 Md Q3
Figura 8: Curva simtrica achatada (platocurtica)

Exemplo:Calculeaamplitudeinterquartis,sabendoqueQ3=177,46eQ1=166,88.
Q=Q3Q1=177,46166,88=10,58

Podemostambmcalcularaamplitudesemiinterquatisouintervalointerquartlicoouintervalo
semiquartil ou desvio quartlico ou amplitude semiinterquartlico, que se representa,
habitualmente,porQepodeserdefinidadoseguintemodo:
Q = (Q3-Q1) / 2
Adistribuiotantomaisdispersaquantomaiorforaamplitudeinterquartis.
Podemos enumerar as vantagens e as desvantagens do uso da amplitude interquartis e da
amplitudesemiinterquartis:
ESTATSTICAEBIOESTATSTICA

Estas medidas so mais completas do que a amplitude total, porque usam dois valores menos
extremos(Q1eQ3).Noentanto,tmaindaalimitaodenoentrarememlinhadecontacoma
disposio das frequncias nos intervalos definidos pelos valores separados exemplo: a
amplitudeinterquartisseramesma,queras50%dasobservaesseacumulemnumsponto,
querestejamuniformementedistribudasporesseintervalointerquartis.
As medidas de disperso que passaremos a descrever no tm esta limitao, porquanto o seu
clculodependedetodososvaloresdasrie.

DESVIO
Dadosnvaloresx1,x2,...,xndeumavarivelX,chamasedesviodecadavalorxiemrelao
constantec,adiferenadexiparac,isto,
xi - c
NotesequeosdesviosdavarivelXemrelaoac,isto,(x1c),(x2c),...,(xnc)constituemosn
valoresdavarivelXc.

DESVIO MDIO
Falamosemdesviomdioquandoconsideramososdesviosdecadavalorxiemrelaomdia
aritmtica,isto:
xi-x
O simples total destes desvios no pode ser utilizado como medida de disperso, por ser
identicamentenulo.Defacto,paranvaloressingulares,terse:

(xi-x)=0

Noentanto,oquocienteentreasomadosmdulosdestesdesvioseonmerodeles,jpodeser
consideradocomomedidadedisperso

D.M.= |xi-x | / n
43
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


Exemplo20:CalculeodesviomdioparaA=453

Quadro 8: Clculo do Desvio Mdio


xi xi - x | xi - x |
4 4- 4=0 0
5 5- 4=1 1
3 3- 4=- 1 1
=12
3- 4=- 1
= 2

x = xi / n =12/3=4
D.M.= |xi-x| / n = 2/3=0,67

Observao: tambm se utiliza o desvio mdio em relao a qualquer outra medida de posio
central.

Numaamostraseriadatemos:
D.M.= ni |xi-x| / n = fi |xi-x|
Se os valores da varivel estiverem tabelados de modo que cada valor xi corresponda a
frequnciaabsolutani,odesviomdioigualsomadosprodutosdasfrequnciaspelosvalores
absolutosdosrespectivosdesviosemrelaomdia,divididapeloefectivodadistribuio.

Numaamostraclassificada,osdesviosemrelaomdiaaritmticasocalculadosapartirdos
pontosmdiosdecadaclasse,ouseja:
D.M.= ni |x'i-x'| / n = fi |x'i-x'|
44
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


Exemplo: Calcule o desvio mdio para classes [4-6[ [6-8]
ni 1 2


Quadro 9: Clculo do Desvio Mdio para classes
Cl asses ni x i x i - x | x i - x | ni | x i - x |
[4- 6[ 1 4, 5 4, 5- 6, 2 1, 7 1, 7
[6- 8] 2 7 7- 6, 2 0, 8 1, 6
=2,4 =3,3
x' = nix'i / n = [(1x4,5) + (2x7)] / 3 = 6,2

Ento,odesviomdio
D.M.= ni |x'i-x'| / n = 3,3 /3 = 1,1

Odesviomdioapresentaaseguintedesvantagem:
Embora dependa de todos os valores observados, o desvio mdio tem a desvantagem de
considerarosvaloresabsolutosdosdesvios,oqueimpedeoseutratamentoalgbrico.

VARINCIA
Outramaneiradeeliminarmosossinaisdosdesvios,consisteemelevlosaoquadrado.Porisso,
em vez da mdia dos valores absolutos dos desvios considerase a mdia dos quadrados dos
desvios.Obtmse,assim,umaoutramedidadedispersobastanteusadaavarincia.
Dados n valores x1, x2, ..., xn de uma varivel X, chamase varincia e representase,
habitualmente,pors2ous2xamdiaaritmticadosquadradosdosdesviosemrelaomdia
dessasvalores,isto:
S
2
= (xi-x)
2
/ n

Exemplo 22: Calcule a varincia para X=17,18,19,20,21

Resoluo 22:
x = xi / n = (17+18+19+20+21) / 5 = 19

Ento,avarincia:

Quadro 10: Clculo da Varincia
xi ( xi - x) ( xi - x)
2
17 17- 19=- 2 4
18 18- 19=- 1 1
19 19- 19=0 0
20 20- 19=1 1
21 21- 19=2 4
N=5
=10
S
2
= (xi-x)
2
/ n = 10/5 = 2
45
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Sex1,x2,...,xnocorremn1,n2,...,nkvezes,respectivamente,temos
Paraumaamostraseriada:

S
2
= ni (xi-x)
2
/ n = fi (xi-x)
2



Paraumaamostraclassificada:
S'
2
= ni (x'i-x ')
2
/ n = fi (x'i-x ')
2

Exemplo23:Calculeavarinciaparaadistribuiocujamdia103
Classes [85-90[ [90-95[ [95-100[ [100-105[ [105-110[ [110-115[ [115-120]
ni 12 25 38 85 93 16 9

Quadro 11: Clculo da Varincia
Cl asses ni x i ( ni x i ) ( x i - x ) ( x i - x ) 2 ni ( x i - x ) 2
85- 90 12 87 1044 - 15, 5 240, 25 2883
90- 95 25 92 2300 - 10, 5 110, 25 2756, 25
95- 100 38 97 3686 - 5, 5 30, 25 1149, 5
100- 105 85 102 8670 - 0, 5 0, 25 21, 25
105- 110 93 107 9951 4, 5 20, 25 1883, 25
110- 115 16 112 1792 9, 5 90, 25 1444
115- 120 9 117, 5 1057, 5 15 225 2025
278 28500, 5 12162, 25

x = (nixi) / n
=28500,5/278
=102,5


Ento,avarincia
S'
2
= ni (x'i-x)
2
/ n = 12162,25/ 278 = 43,7491

Podemos,agora,enumeraraspropriedadesdavarincia:
Somando ou subtraindo uma constante a todos os valores observados, a varincia
resultantepermanecerinalterada;
46
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Multiplicandooudividindotodososvaloresobservadosporumaconstantediferentede
zero, a varincia resultante vir multiplicada ou dividida, respectivamente, pelo
quadradodessaconstante.

CORRECODESHEPPARD:
Aocalcularseamdiaeavarinciadaamostraclassificadaatravsdadistribuioempricadas
marcas, cometese um certo erro (erro de agrupamento), pois supomos que as observaes
agrupadas em cada classe tm todas o valor da respectiva marca. Todavia, existem frmulas
correctivas devidas a Sheppard, isto ,na variancia, ao valor calculado deve subtrairse 1/12 ao
quadradodaamplitudedasclasses(a)
s
2
x = s
2
x' - a
2
/12 assim,nonossoexemploanterior,avarianciacorrigida
era
s
2
x =43,7491 - 5
2
12
s
2
x =41.666


DESVIOPADRO
O desvio padro pode ser definido como a raiz quadrada da varincia, representandose,
habitualmente,porsx,isto:
sx = s
2
x


Ainda que a varincia nos d uma boa informao sobre a distribuio ou variabilidade dos
valores observados em relao sua mdia, apresenta, no entanto, a desvantagem de no se
exprimirnamesmaunidadeaqueestoreferidososdadosiniciais.Contudo,estadesvantagem
poder ser eliminada se extrairmos a raiz quadrada da varincia. A nova medida chamase
desviopadrooudesvioquadrtico.

Numaamostraseriada,temos:
sx = s
2
x

47
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Exemplo:Calculeodesviopadro,sabendoqueavarinciadeumaamostraseriada2.
sx = s
2
x = 2 = 1,414

Numaamostraclassificada,temos:

sx = s
2
x


Exemplo: Calcule o desvio padro, sabendo que a varincia corrigida de uma amostra
classificada4327,16.


sx = s
2
x
=4327,16 = 65,78





AUTILIZAODASMEDIDASABSOLUTASDEDISPERSO
Amplitudetotal
Utilizasequando:
Osdadosforemmuitorarosoudemasiadodispersosparasejustificaroclculodeuma
medidamaisprecisadedisperso;
Forapenasnecessriooconhecimentodosresultadosextremos;
Desejamosumndicemuitorpidodedisperso.

Amplitudeinterquartlica
Utilizasequando:
Amedianaamedidadetendnciacentralusada;
Existirem resultados extremos que poderiam afectar o desvio padro de uma maneira
desproporcionada;
Adistribuiotruncada;
Adistribuioapresentaumaforteassimetria.
48
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Desviomdio
Utilizasequando:
Desejamosponderartodososdesviosemrelaomdiadeacordocomasuagrandeza;
Osdesviosextremosinfluenciaremindeterminadamenteodesviopadro.

DesviopadroeVarincia
Utilizamsequando:
Seprocuraumamedidadedispersoemrelaocomacurvanormal;
Tiveremdesercalculadosposteriormentecoeficientesdecorrelaoeoutrasestatsticas;
Sedesejarobterumamedidaqueserevistadeummximodeestabilidade;
Sesetratasomentededescreverumadistribuioprefereseodesviopadrovarincia.
Avarinciaintervmsobretudonaanliseestatstica.

3.8.6 Coeficiente de disperso

As medidas de disperso a que anteriormente nos referimos so medidas que se exprimem na


mesma unidade dos dados e, sendo assim, tornase impossvel comparar entre si as disperses
deduasdistribuiescujosvaloresnoserefirammesmaunidade.
Exemplo: DistribuioA:xA=30 sA=10
DistribuioB:xB=600 sB=20
49
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Qual a distribuio mais dispersa? Se compararmos os desvios padres a B, porque tem


maiordesviopadro.Masavariaode20para600muitomaiordoque10para30.Assim,em
vez de compararmos os desvios padres, aplicamos outra medida de disperso relativa queo
coeficientedevariaooudedisperso,quepodeserdefinidopelafrmula
V = sx /x

Exemplo 26: A distribuiodospesosedasalturasdeumgrupodeestudantesdedeterminada


Universidadeconduziuaosseguintesresultados:
X:Pesos Mdia=57,5Kg DesvioPadro=7,5Kg
Y:Alturas Mdia=170cm DesvioPadro=7,1cm

Determineocoeficientededispersoparacadaumadasdistribuiese,depois,indiqueemqual
delasadispersorelativamaior.
Vx=sx/x=7,5Kg/57,5Kg=0,130=13%
Vy=sy/Y=7,1cm/170cm=0,042=4,2%

Assim,podemosdizerqueadispersorelativamaisacentuadanadistribuiodospesos(X).
Adispersomaiornadistribuioquetivermaiorcoeficientededisperso.
Se pretendermos estabelecer comparaes entre disperses absolutas, devemos usar o desvio
padro,detalmodoquequantomaiorforodesviopadromaiorseradisperso.
Se pretendermos estabelecer comparaes entre disperses relativas, devemos usar um
coeficiente de disperso, de tal modo que quanto maior for o coeficiente de disperso V maior
seradisperso.
50
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


3.9 AS CARACTERSTICAS DA DISTRIBUIO NORMAL

A distribuio normal apresenta uma curva em forma de sino, como mostra a figura 9. A sua
principalcaractersticaadeastrsmedidasdetendnciacentralmdia,medianaemodaSe
encontrarem todas no mesmo ponto da curva, ou seja, todas terem o mesmo valor ou, pelo
menos, valores muito prximos. Se Os elementos que constituem uma distribuio esto muito
prximosoumuitodispersos,encontraremosformassemelhantesdafigura10.


Figura 9: Distribuio normal


Figura 10 - Distribuio leptocrtica e platicrtica

Estas no so distribuies normais, apesar de a mdia, a mediana e a moda se encontrarem
todas no mesmo ponto ( isto que confere simetria distribuio); a distribuio normal tem
sempre a forma de um sino. Como foi descoberta pelo matemtico Gauss, tambm lhe
chamamosdistribuiogaussiana.
A maior parte dos dados recolhidos com organismos vivos tm este padro. Podemos observar
que, devido forma da curva, h poucos resultados muito baixos e poucos resultados muito
eleva. dos (a curva cai nos extremos esquerdo e direito, o que se deve s baixas frequncias
encontradas), enquanto a maioria dos resultados se encontram junto mdia. Vamos debruar
51
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

nossobreopadroderesultadosmuitoembreve,masnestafasereferiremosoutracaracterstica
muito importante da distribuio normal. Tericamente, a curva nunca toca o eixo horizontal,
mas aproximase dele infinitamente. Esta uma propriedade matemtica da distri buio que
no se reflecte na recolha de dados real. No nos cruzamos com seres humanos com
dimensesgigantescasoumicroscspicas!
Entoaspropriedadesdadistribuionormalsoasseguintes:
1)simtrica;
2)Temformadesino;
3) A mdia, a mediana e a moda encontramse no mesmo
pontodacurva;
4)Temduaspontasquenuncatocamoeixohorizontal.

Podemos perguntarnos quo rgida a distribuio normal relativamente aos elementos. Por
outras palavras, quanto pode uma curva desviarse da forma de sino e continuar a ser
consideradanormal?Geralmente,usamosduasabordagensparatomarmosestetipodedeciso;
na verdade, este problema mais importante do que o leitor pode pensar, pois existem testes
estatsticos,descritosmaisfrente,quespodemrealizarseseoselementosforemnormalmente
distribudos. Uma das abordagens baseiase na observao dos dados por averiguao, para
lhe darmos um nome mais respeitvel. Se o conjunto de nmeros for extenso, tornarse mais
fcil desenhar uma distribuio de frequncias. A outra abordagem reside em seguir um dos
procedimentos matemticos para determinar se um conjunto de resultados normalmente
distribudo. A verso do teste do quiquadrado que inclumos neste manual um desses
procedimentos. Na verdade, improvvel que nesta fase da sua carreira estatstica necessite de
saber com grande preciso se uma distribuio considerada normal ou no, pelo que o teste
grficodevebastar.Noentanto,devesersensvelaoproblema.
52
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

3.9.1 A curva normal e os desvios-padro

Suponhamos que temos um conjunto de nmeros cuja mdia 50 e cujo desvio padro 5.
Chamamos a este valor (centmetros, segundos, pontos numa escala, ou outra coisa qualquer)
um desvio padro. Dez centmetros, segundos, etc., seriam dois desvios padro e quinze
centmetros,segundos,etc.,trsdesviospadro...semprecomrefernciaaoconjuntoatravsdo
qual obtivemos o valor 5. como se pudssemos tirar o desvio padro e transformlo numa
unidadedemedidadeumaescala;comosedissssemosqueumapolegadaso2,54cm.Nunca
misturaramos polegadas e centmetros nos mesmos clculos, mas poderamos converter uma
unidade na outra. Do mesmo modo, no misturamos resultados de desvios padro com
resultadosreais,masconvertemosumaescalanaoutra.
Voltemos s propores de nmeros em diferentes partes da distribuio. Se retirarmos uma
partedacurvaentreamdia,queestamarcadanoeixohorizontaldafiguraqueseseguecomo
50,eumdesviopadro,marcadonoeixohorizontalcomo55,sabemosquedevemostercercade
um tero de todos os resultados neste conjunto, porque o que acontece sempre com a
distribuio normal. De uma forma mais precisa, a proporo exacta do nmero total de
resultados que se encontram entre a mdia e um desviopadro acima da mdia (50 e 55 neste
caso)34,13%.Comoadistribuionormalsimtrica,deveverificarseamesmacoisaabaixo
damdia,isto,devemosteroutros34,13%dosresultadosentreosvalores50e45sendo45o
valordamdiamenosumdesviopadrode5pontos.Observemosasduaspartesasombreado.
Aaritmticaelementardiznosque68,26%dototaldosresultadosseencontramentreosvalores
45e55,pertencendo31,74%aosvaloresextremosqueseencontramnosoutrosdoislados.Mais
umavez,asimetriadacurvasignificaque,paraestaproporo,metadede31,74%,ouseja,15,87
%,encontrasedecadaumdosladosdadistribuio.Poroutraspalavras,cercade16%detodos
os nmeros neste conjunto sero menores do que 45, sendo a mesma quantidade maior do que
55.

53
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


Figura 11: % de resultados 1 dp acima e abaixo da mdia

Exemplo: Suponhamos que o professor obtm os resultados de um teste de leitura feito a 200
crianas.Osresultadossonormalmentedistribudoscomumamdiade60eumdesviopadro
de 8. A partir das propriedades da distribuio normal, sabemos que cerca de dois teros dos
resultados,isto,aquelesqueforamobtidoscomcercade136crianas,encontrarseoentreos
52 e os 68 pontos. Cerca de 32 crianas (16 %) tero resultados abaixo de 52 e cerca de 32 tero
resultadosacimade68.Josreferimostodos.Suponhamosentoqueospaisdeumacrianaque
obteve 68 gostariam de saber algo acerca do progresso do seu filho. Quando souberam que o
resultado da criana estava acima da mdia, ficaram contentes, mas gostariam de saber,
posteriormente,quoacimadamdiaseencontra,relativamenteaosoutros50%decrianasque
tambm obtiveram resultados acima da mdia. Por outras palavras, os pais pretendem saber
qual a posio relativa do desempenho do filho. Se os resultados estivessem todos muito perto
da mdia, sendo a nota mxima 68, os pais continuariam encantados. Ficariam, porm, menos
satisfeitos se soubessem que a nota mxima tinha sido 90, com um grande conjunto de notas
altas,acimade70.Noentanto,oprofessorsabequeodesviopadrodasnotasfoi8e,porisso,
um tero de todos os resultados estava entre 60 e 68. Sabendo que 50 % dos resultados obtidos
estavamabaixodamdia,podemosperceberqueaposiodestacrianaestaonvelde84%
dosresultados,napartesuperiordetodososresultados.Afinal,ospaistmrazesparaestarem
contentes! Se a criana tivesse obtido 76, os pais teriam muito mais razes para estarem
orgulhosos, pois saberiam que o seu filho estava acima de 98 % das outras crianas (nota 76 e
dois desviospadro acima da mdia); uma nota 84 colocaria o menino na posio invejvel de
estar acima de 99,87 % das outras crianas por outras palavras, num grupo de 200 crianas,
54
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

estaria, muito provavelmente, no topo. Os desviospadro cortam propores fixas da
distribuio normal, a partir da mdia e at ao infinito (pelo menos teoricamente), nas duas
direces.Devecertificarsedequepercebeucomoseobtmaposiorelativadanota76(isto,
50%+33%+15%)ecomosecalculaquenestegrupodecrianasexistemoutrasquatrocomnotas
acimade76.Vejaseconseguecalcularanotaquecolocariaacriananaposio,menosinvejvel,
deestarapenasaquatrolugaresdofim.
Aresposta44.Paraobtermosestanotanecessitamosdesaberquenotarepresentadoisdesvios
padro abaixo da mdia ou que nota corresponde a 2%. Partindo de 60, a mdia, se lhe
subtrairmos o valor de dois desviospadro 16, duas vezes o valor de 8, que um desvio
padroobteremos44.Devemostercuidadoenomisturarosvaloresdosdesviospadrocom
os resultados reais. Neste exemplo no subtramos o valor 2 da mdia de 60, apesar de
querermos o resultado que estava dois desviospadro abaixo dele. Subtramos 16 pontos, pois
esteonmeroquecorrespondeadoisdesviospadroparaesteconjuntoderesultados.

Resultados z Nos exemplos considerados os resultados encontravamse sempre na mdia, ou


exactamenteum,doisoutrsdesviospadroacimaouabaixodela.Temos,porm,deexaminar
resultados que no sejam to facilmente convertveis para desviospadro. Suponhamos, por
exemplo,queumacrianacompaisansiososobteveumanota64numtestedeleitura.Aposio
da criana na curva seria a metade da distncia, no eixo horizontal, entre o resultado da mdia
(60)eumdesviopadroacima(68).


Figura 12: posio de um resultado



55
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

A posio da criana exactamente a meio entre os pontos 60 e 68. Significar isto que a sua
posionogrupoopontocentralentreamdiade50%e84%danota68?Isto,encontrarse
acrianaacimade67%doscolegas?Olhemoscuidadosamenteparaasduasporesdacurva
que est dividida pela linha ao nvel da nota 64. Sero simtricas? No e aqui temos um
problemaquetornaoclculodeumaposiorelativamuitomaiscomplicadoecansativodoque
gostaramos. Quanto mais nos afastamos da mdia, menos resultados correspondem s
diferentes propores. Assim, se tivermos duas pores entre 60 e 64 e entre 64 e 68, haver
menos resultados neste ltimo intervalo. Haver ainda menos no intervalo sguinte, entre as
notas 68 e 72, e assim sucessivamente. Isto tambm verdadeiro para os resultados abaixo da
mdia,mas,nestecaso,soosresultadosmaiselevados,enoosmaisbaixos,queseencontram
mais perto da mdia. H muito menos resultados entre 44 e 48 do que entre 48 e52,apesarde,
em ambos os casos, a variao de notas ser de 4 pontos, ou seja, meio desviopadro. Quando
olhamosparaaformadeumadistribuionormal,otamanhodiferentedasproporesquecada
desviopadro compreende parece bvio. No entanto, o problema de decidir a posio relativa
de uma nota 64, quando comparada com os resultados, no desapareceu. Como podemos
determinla? A resposta dada atravs de resultados z. Os resultados z correspondem a
desviospadroe,naverdade,sovirtualmenteamesmacoisa,exceptonofactodeumresultado
zsereferirsempreposiodeumpontoemrelaoamdia.Istovaitornarseclaroembreve.
Paraj,pensemosqueumresultadozde1amesmacoisaqueumdesviopadrode1,queum
resultado z de 2 e um dp 2, e assim por diante. Como no h, virtualmente, nada numa
distribuionormaldepoisdoterceirodesviopadroouresultadozemqualquerdasdireces
,r,aroqueosdesviospadroouosresultadoszincluamovalor4.Ecomumreferirmonosaos
resultados z como mais ou menos; aos desviospadro descrevemolos como situandose acima
ou abaixo da mdia, em vez de mais ou menos. Um desviopadro tem um valor definido no
varivel, enquanto um resultado z se refere a uma posio relativa na curva e referido em
funo da mdia. Como, at agora, um resultado z tem o mesmo significado que um desvio
padroacimadamdia,podemosconsiderarqueosresultadoszeosdesviospadrosoiguais.
No entanto, um desviopadro pode referirse a um conjunto de resultados que distem um
desviopadro de qualquer ponto da curva, enquanto os resultados z tm posies fixas. Um
resultado z de + 1 corresponde exactamente a um desviopadro acima da mdia, e no a
qualquer conjunto de resultados que constituam um desviopadro. Voltemos ao problema do
resultadode64esuaposiorelativa.Sabemosqueasuaposioexactamentemetadedeum
desviopadroacimadamdia,peloquelhedamosumresultadozde+0,5.
56
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

H tabelas que nos permitem ver muito facilmente onde os resultados z se situam na curva
normal(AnexoVIII).Vejamoscomoutilizlas.Utilizaremosonossoexemplode64,cujovalorz
+0,5.
Lemos o valor na primeira coluna da esquerda, encabeada por z, at chegarmos ao valor 0,5.
Olhamos para a coluna direita e vemos o nmero 19,15. Temos de somar 50%, de modo a
obtermos o valor 69,15. Sabemos ento que h 69,15% dos resultados abaixo de 64 e 30,85%
acima. Devemos arredondar os valores para 69% e 31%, respectivamente. Consideremos outro
exemplo, desta vez com o valor 65. Este valor est 5 pontos acima da mdia e o desviopadro
paraoconjuntode8.Umresultadode5pontosacimadamdia5/8dedesviopadroacima
damdia.Sefizermosascontas,sabemosquez+0,63.Comoseencontraacimadamdia,oseu
valor positivo. Voltemos tabela 51. Como z tem, desta vez, duas casas decimais, os
procedimentos vo ser um pouco diferentes. O valor imediatamente direita (22,7) a
percentagemcorrectaparaumresultadozde0,6.Noentanto,onossoresultado0,63,peloque
temosdeandartrscolunasdatabelaataovalor0,03,notopo.Estevalor,somadoaovalor0,6,
dnos o z de 0,63 ou seja, 23,57. Como o nosso z positivo, devemos somarlhe 50% para
obtermos o valor final de 73,57. Assim, a nota 65 est frente de 74% da escala. Podemos ver
pelatabelaque49%detodasasnotasemcadaumdosladosdacurvaestoincludasnumzde
2,33ouumbocadinhomaisabaixo,parasermosmaisprecisos).Notemosque,matematicamente,
ascaudasdacurvanuncatocamoeixohorizontal,nemincluemtodososresultadospossveis.
Reparemosagoranaposiorelativadeumapessoaqueobtenhaumresultadoabaixodamdia,
digamosumanota41naamostraoriginal.Estanotaest19pontosabaixodamdia,apenasum
poucomenosdoquedoisdesviospadro.Parasermosprecisos,est19/8ou2,375abaixo.Oseu
zser2,375.NatabelaSIiemanexovemosqueumzde+2,3inclui48,93%dosresultados,mas
onossoresultadozovalorumpoucosuperiorde2,375.Anossatabelaspodeserusadacom
duascasasdecimais,peloquevamosarredondarestevalorpara2,38.Paramos,destavez,junto
dacolunade0,08eobtemosovalor49,13.Assim,umzde+2,38inclui50%+49,13%=99,13%de
todososresultados.Atagoratudobem,masoproblemaqueonossovaloreranegativo.Basta
virarmosanossacurvaaocontrrioetrabalharmoscomasuaimagemaoespelho.Assim,como
nosso valor 2,38 sabemos que 99,13% de todas as notas da distribuio esto acima dele e
apenas0,87%abaixo.Seconsiderarmosestapequenaproporode1%,devemosesperarque,na
nossa amostra de 200 indivduos, 1%, ou seja, dois indivduos tenham notas inferiores a 41. No
57
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

outro extremo das notas, devemos esperar que apenas dois alunos tenham notas de 19 ou mais
pontosacimadamdia,ouseja,notasqueexcedamos79%.
Omododeobterovalorzdadopelaexpressoformal
Z = desvio da nota em relao mdia
desvio-padro
Seodesvioemrelaomdiativerumsinalpositivoounegativo,seestiveracimaouabaixoda
mdia,respectivamente,zficarcomosinalcorrecto.

Nota: : tenha cuidado quando trabalhar com z e dp, de modo a uslos sempre que os dados
atravs dos quais foram obtidos sigam uma distribuio normal Ou aproximadamente normal.
Deoutromodo,arranjarconfuses


58
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


4. ESTATSTICA PARAMTRICA E NO PARAMTRICA

Paramtricos:calculaasdiferenasnumricasexactasentreosresultados.
Noparamtricos:apenasconsideramsecertosresultadossosuperioresouinferioresaoutros
resultados.

REQUISITOSPARAUTILIZAODETESTESPARAMTRICOS
Quando se pretende empregar um teste t de Student ou uma anlise da varincia para fazer
comparaesentreamostras(testesparamtricos),existeumalistaderequisitosqueinclui,entre
outros:
1. queavariveltenhasidomensuradanumnvelmnimointervalar;
2. queadistribuiosejasimtricaemesocurtica;
3. queacaractersticaestudada(varivel)tenhadistribuionormalnumadadapopulao.

Sempre que no se pode, honestamente, admitir a simetria e a normalidade de distribuio, ou


os dados foram recolhidos num nvel de mensurao inferior ao intervalar, devemos recorrer a
testes que no incluem a normalidade da distribuio ou nvel intervalar de mensurao. Esses
testeschamamsenoparamtricos

VANTAGENSDOSTESTESNOPARAMTRICOS
Podem ser utilizados, mesmo quando os seus dados s podem ser medidos num nvel ordinal,
isto , quando for apenas possvel ordenlos por ordem de grandeza) podem ser utilizados
mesmoquandoosseusdadossoapenasnominais,isto,quandoossujeitospodemapenasser
classificadosemcategorias.
59
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

PODERDEUMTESTE
OpoderdeumtesteaprobabilidadederejeitarmosaH0quandoelarealmentenula
Os testes mais poderosos (os que tm maior probabilidade) de rejeio de H0, so testes que
possuemprrequisitosmaisdifceisdesatisfazer(testesparamtricoscomoteF).
As alternativas no paramtricas exigem muito menos prrequisitos mas produzem testes de
significnciacommenospoderqueoscorrespondentesparamtricos.

EMCONSEQUNCIA
Ao rejeitarse a H0 sem preencher as exigncias mnimas dos testes paramtricos, mais
provvelqueessarejeiosejafalsa(serejeitaraH0quandoelaverdadeiracometeumerrode
tipoI;seaceitaraH0quandoelafalsacometeumerrodetipoII).Quandoosrequisitosdeum
testeparamtricosoviolados,tornaseimpossvelconheceroseupodereasuadimenso()
obvio que os investigadores querem, a todo o custo, rejeitar a H0 quando ela mesmo falsa,
evitandoumerrodetipoI.
Otesteidealseriaaqueleque=0e=1,oqueimplicariaqueotesteconduziriasempredeciso
correcta,contudoestetesteidealraramenteexiste.
Aprobabilidadedoerrode1espciedeveserreduzida,fixandotericoem0,1;0,05ou0,01.o
valor fixado para depende da importncia que se d ao facto de rejeitar a H0 quando esta
verdadeira.
Umailustraodestepontodevistapodeserfeitacomoseguinteexemplo:
Umapessoainocenteatprovadocontrrio
H0:Apessoainocente
H1:Apessoaculpada
ErroI:Apessoacondenadamasestinocente
ErroII:Apessoaabsolvidamasculpada
60
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Naturalmente a justia procura reduzir a possibilidade de ocorrer o erro de 1 espcie, pois


entendesequemaisgravecondenarinocentesqueabsolvercriminosos.
Para certos sistemas judiciais um = 0,1 demasiado elevado, optando por =0,01; noutros
sistemasjudiciaispodeadmitirque=0,05umvalorrazovel.

ASSIM
Fixada a probabilidade do erro de tipo I (dimenso do teste), o teste mais potente aquele em
que a escolha da regio critica minimiza a probabilidade do erro de 2 espcie. Dizse tambm
queestaregiocriticaamaispotente.
Facilmenteseconcluiqueotestemaispotenteaqueleque,umavezfixadaaprobabilidadede
rejeitar a H0, quando ela verdadeira, maximiza a potncia ou a capacidade para rejeitar a
mesmahiptesequandoestafalsa.

PRESSUPOSTOS
Para saber se uma varivel simtrica dividimos o coeficiente assimetria (Skewness) pelo erro
padroeseoresultadoestiverentre2e2adistribuiosimtrica.
Parasaberseumavarivelmesocurticadividimosocoeficientedeachatamento(Kurtosis)pelo
erropadroeseoresultadoestiverentre2e2adistribuiomesocurtica.
Mas se os resultados de um teste paramtrico, no cumpriram com os requisitos (no mnimo
dados intervalares; distribuio simtrica, mesocurtica e normal), ento no tm interpretao
significativa.
Quando acontecem estes factos, a maioria dos investigadores opta por testes de significncia
noparamtricos.

61
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

PARAESCOLHERQUALQUERTIPODETESTEESTATSTICO
Distinguirseanossaamostraconstitudapelosmesmossujeitosemtodasassituaesouse
formadapordiferentessujeitosparacadasituao

INTERSUJEITOSOUDESIGNNORELACIONADO
este tipo de design utilizado quando um indivduo ou objecto avaliado apenas uma vez. A
comparao efectuado entre os grupos de sujeitos/ objectos cujos resultados so no
relacionados.
Desvantagem: conjunto das diferenas individuais na forma como os sujeitos reagem ou
respondemtarefa.

INTRASUJEITOSOUDESIGNRELACIONADO
Acomparaofeitaentreosmesmossujeitos(sujeitosdomesmogrupo).
Aimportnciadestesdesignsaeliminaodequaisquerparticularidadesindividuais,umavez
queficamigualizadasemtodasassituaes.
Desvantagem:Efeitodememriaeaprendizagem.

AMOSTRASEMPARELHADAS
Igualizamsesujeitosdiferentesmasemparelhados,emtermosdeidade,sexo,profissoeoutras
caractersticasgeraisqueparecemimportantesparacadapesquisaemparticular.
estes tipos de designs podem ser considerados de designs relacionados, uma vez que
controladonassuascaractersticasrelevantes.
Desvantagem: Dificuldade em encontrar sujeitos que permitam o emparelhamento de todas as
caractersticasrelevantes.
Dificuldadesarranjargrandesamostras.
62
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA



5. TESTES NO PARAMTRICOS PASSO-A-PASSO



5.1 TESTE DO QUI-QUADRADO

O QuiQuadrado (X
2
) de aderncia consiste em comparar os dados obtidos experimentalmente
comosdadosesperadosdeacordocomalei.Dascomparaessurgemdiferenasquepodemser
grandes ou pequenas: se forem grandes, a hiptese nula (H0) que pressupe um bom
ajustamento dever ser rejeitada em favor da hiptese alternativa (H1); se forem pequenas, a
hiptesenulanoserrejeitadaeasdiferenassoatribuveisaoacaso.
OX
2
deindependnciaserveparaajudaradecidirseasduasvariveisestoounoamarradas
umaoutraporumarelaodedependncia.


QUANDOUTILIZAR

Utilizasequandoosdadossonominais,peloqueemvezdesemediremresultadosdossujeitos
apenassepodemdistribuirossujeitosporumaoumaiscategorias.
OQuiQuadrado(X
2
)testaahipteseexperimentalqueprevquantossujeitosdecadagruposo
distribudosporumadeterminadacategoria.
OX
2
umtesteestatsticonoparamtrico,sendoumdosmaisutilizadosebastanteaplicadoem
diferentes planeamentos experimentais. O X
2
muito usado mesmo ao nvel da estatstica
multivariada(nosentidodeobterograudeadernciaentreomodeloobtidoeoterico).



OBJECTIVO

O objectivo comparar frequncias observadas com frequncias tericas ou esperadas, ou seja,
verificaroseugraudeaproximao,quepodesergrande(=0)oupequeno(>0).
63
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Assim,oobjectivocompararasfrequnciasobservadasemcadaumadasclulasdeumatabela
de contingncia com as diferenas esperadas. O teste compara o nmero de sujeitos que se
distribuem por uma determinada categoria com o nmero de sujeitos que se esperaria se
distribussemporessamesmacategoria,casonoexistissemdiferenas.
OtestedoX
2
reflecteotamanhodasdiferenasentreasfrequnciasobservadaseesperadas.Para
sersignificativo,ovalordeX
2
deverserigualousuperioraosvalorescrticosdatabela(Anexo
I).

INSTRUESPASSOAPASSO
1. Calcular as frequncias esperadas (E) para cada clula, multiplicando os dois totais parciais
relevantesparacadaumaedividindopelonmerototaldesujeitos.
2.CalcularX
2
:
(O-E)
2
X
2
=
______________
E
emque:
O=frequnciasobservadasparacadaclula;
E=frequnciasesperadasparacadaclula.

3.Calcularosgrausdeliberdade:
g.l. = (r-1) (c-1)
emque
r=nmerodelinhasdatabeladecontingncia
c=nmerodecolunasdatabeladecontingncia

SeX
2
observado>X
2
crticorejeitaseH0
SeX
2
observado<X
2
crticonoserejeitaH0
Especificandoparaumatabeladeduplaentrada2X2:
g.l.=(nmerodecolunas1)(nmerodelinhas1)=1X1=1
64
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


A B A+B
C D C+D
A+C B+D N

N (AD - CB)
2
X
2
=
_________________________________________
(A+C) (C+D) (A+C) (B+D)

Quandoumatabelatemmaisdeduasentradas:
g.l.=(nmerodecolunas1)(nmerodelinhas1)

X
2
= (total de linha) (total de coluna)
(total geral)


Exemplo:Suponhaquequerestudarseosestudantesdecinciassociaisutilizamummtodode
estudo significativamente diferente daquele que utilizado pelos estudantes de tecnologia.
Escolheramse dois grupos, um composto por50estudantesdecinciassociaiseooutropor50
estudantes de tecnologia. Enviouse um questionrio aos 100 estudantes pedindolhes que
indicassememqualdasseguintescategoriasmelhorseenquadraoseumtododeestudo:estudo
dirioregular,estudoirregularemperodosconcentradosdetrabalhointensivoouumamistura
dosdois.Foramrecebidas44respostasdosestudantesdecinciassociaise42dosestudantesde
tecnologia.Colocouseahipoteseexperimental(H1)dequeotipodeestudodependiadocurso
frequentado
Os resultados so apresentados na forma de uma tabela 2X3, designada por tabela de
contingncia(crosstab).Asclulasquerepresentamcadaumadascategoriassonumeradasde
1a6.
Quadro 12: Tabela de Contingncia (Crosstab)
Tipo de estudo

Regular Irregular Misto
Total parcial do
nmero de
estudantes
Gr upo 1
Est udant es de
Ci nci as
Soci ai s
1
6
E=8, 19
2
15
E=11, 77
3
23
E=24, 05

44
Gr upo 2
Est udant es de
Tecnol ogi a
4
10
E=7, 81
5
8
E=11, 23
6
24
E=22, 95

42
Tot ai s dos
padr es de
est udo

16

23

47

N=86





65
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Resoluo49:
InstruesPassoaPasso:
1.calcularasfrequenciaesperadas(E)
Clula1:E=16X44/86=8,19
Clula2:E=23X44/86=11,77
Clula3:E=47X44/86=24,05
Clula4:E=16X42/86=7,81
Clula5:E=23X42/86=11,23
Clula6:E=47X42/86=22,95

2.Aplicarafrmula:

(O-E)
2
X
2
=
________________
E

X
2
= (6-8,19)
2
+ (15-11,77)
2
+ (23-24,05)
2
+ (10-7,81)
2
+ (8-11,23)
2
+ (24-22,95)
2
8,19 11,77 24,05 7,81 11,23 22,95

X
2
= 0,59 + 0,89 + 0,05 + 0,61 + 0,93 + 0,05 = 3,12

3.Calcularosgrausdeliberdade(gl)
g.l. = (r - 1) (c - 1) = (2 -1) (3 - 1) = 2

4. Consultar a tabela (Anexo I)
Para
p=0,05 e gl=2
x
2
critico=5,99

Concluses:DadoqueovalorobservadodeX
2
apenasde3,12,ouseja,inferioraovalorcrtico
de 5,99 para p < 0,05, o resultado da experincia no significativo. Aceitase hiptese nula de
que os padres de estudo dos estudantes de cincias sociais e de tecnologia no diferem,
rejeitandosedestaformaanossahipoteseexperimental(H1).
66
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

5.2 PROCEDIMENTOS PARA ORDENAO DE RESULTADOS

OstestesUdeMannWhitney;Wilcoxon;HdeKruskalWallis;rhodeSpearman;taudeKendall
e Friedman, exigem o recurso a ordenaes de resultados para efectuar os seus clculos. Neste
sentidocomearemosporexplicarosprocedimentosdeordenaoderesultados
Ordenamentoglobalderesultados(designsnorelacionadosparasujeitosdiferentes):
1. Atribua a ordem mais baixa 1 ao resultado mais baixo, a ordem seguinte 2 ao
resultadoseguintemaisbaixo,eporafora.
2. Osresultadosnulosde0socontadoscomooresultadomaisbaixopossvel,sendo
lheatribudaaordemmaisbaixa.
3. Quando existem resultados idnticos solhe atribudas ordens mdias, calculadas
com base na globalidade das ordens que deviam ter sido atribudas a estes
resultados.


Exemplo:ordenarumgrupoemfunodon.defactoresderisco:

Quadro 13: Ordenao de um grupo em funo do n. de factores de Risco


N. de Factores
de risco
6
3
12
4
7
5
8
4
1
7
2
5
3
6
Ordem
Se existir um Se existir um
zero este deve zero este deve
ser considerado ser considerado
o valor mais o valor mais
baixo. baixo.


Noscasosemqueexistemresultadosiguaisutilizaseadoslugaresquedeviaocupar.
67
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


Exemplo:

N. de FR.
1
2
1
4
1
3
4
6
5
2
4
2
6,5
2
5
6,5
9
8
Ordem N. de FR.
1
2
1
4
1
3
4
6
5
2
4
2
6,5
2
5
6,5
9
8
Ordem


AssimossujeitoscomumFactorderiscoso3(1+1+1)queocupariamo1.2.3.lugar
Ento3+2+1=6:(1+1+1)=2
Com4factoresderiscotemos2sujeitosqueocupariamo6.e7.lugar
Ento6+7=13:(1+1)=6,5

Ordenamento de diferenas entre resultados (designs relacionados para os mesmos sujeitos ou
emparelhados):
1. Em geral, a atribuio de ordens s diferenas entre resultados efectuase tal como
fizemosparaosresultados,sendoatribudaaordemmaisbaixamenordiferenae
poraadiante;
2. Diferenasidnticasentreresultadossoordenadasdamesmaformaqueresultados
idnticos, atribuindose uma ordemmdiaresultantedaglobalidadedeordensque
essasdiferenasdeveriamocupar;
3. Resultadosnulosde0socontadoscomooresultadomaisbaixopossvelquandose
calculamdiferenasentreresultados;
4. Contudo, quando existe igualdade entre resultados que originem uma diferena
nula entre as situaes experimentais, estes no so ordenados, sendo retirados da
anlise;
5. Diferenas positivas e negativas so ordenadas em conjunto como se se tratasse de
umordenamentosimplesderesultados,ignorandoossinaispositivosenegativos.
68
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Exemplo: Suponha que quer ordenar as diferenas entre o nmero de frases correctas que
um grupo de crianas com suspeita de perda auditiva produziu antes da colocao de um
aparelhoauditivoeapsacolocaodaquele.

Quadro 14: Ordenao para Amostras Relacionadas ou Emparelhadas


8 5 6 1 10
9 6 7 1 9
- 0 4 4 8
6,5 4 5 1 7
5 3 5 2 6
2 1 5 4 5
6,5 4 5 1 4
2 1 3 2 3
4 2 7 5 2
2 1 6 5 1
ordem diferenas
N de frases correctas
depois do aparelho
auditivo
N de frases correctas
antes do aparelho
auditivo
Sujeitos
8 5 6 1 10
9 6 7 1 9
- 0 4 4 8
6,5 4 5 1 7
5 3 5 2 6
2 1 5 4 5
6,5 4 5 1 4
2 1 3 2 3
4 2 7 5 2
2 1 6 5 1
ordem diferenas
N de frases correctas
depois do aparelho
auditivo
N de frases correctas
antes do aparelho
auditivo
Sujeitos


Ao contrrio do que acontece nos casos das amostras relacionadas quando a diferena entre 2
situaes nula nas amostras relacionas a este tipo de resultado no atribuda nenhuma
ordem, sendo que o resultado nem sequer considerado na anlise. No ordenamento de
resultados negativos em amostras relacionadas ignoramse os sinais quando se ordenam os
resultados.


5.3 TESTES PARA DUAS AMOSTRAS INDEPENDENTES

Ao estudarmos as diferenas entre dois grupos podemos utilizar grupos
relacionados/emparelhadosougruposindependentes.Nocasodeduasamostrasindependentes
determinamos se as diferenas nas amostras constituem uma evidncia convincente de uma
diferenanosprocessosdetratamentoaelasaplicados.
Conquanto o uso de duas amostras relacionadas em projectos de pesquisa tenha mritos
indiscutveis, a sua aplicao, em geral, no prtica. Frequentemente, a natureza da varivel
dependente impede a utilizao dos indivduos como seus prprios controlos, tal como ocorre
quandoavariveldependenteosuicidiotentado;umproblemaquepodeacontecerumanica
vez. Pode ser tambm impossvel delinear um projecto que utilize pares de dados, talvez por
69
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

desconhecimento,porpartedoinvestigador,devariveisteisquepossamformarpares,oupela
impossibilidade de obter mensuraes adequadas de alguma varivel de reconhecida
importnciaou,enfim,porquesimplesmentenosedispedeparesadequados.
Quandoautilizaodeduasamostrasrelacionadasnoprticaouadequada,podemosutilizar
duasamostrasindependentes.Emtaisprojectos,asduasamostraspodemserobtidasporumde
doismtodos:
a) Podemserextradasaleatoriamentededuaspopulaes;
b) Podem decorrer da atribuio aleatria de dois tratamentos aos membros de
umaamostradeorigemarbitrria.

Nota:Emnenhumdestescasosseexigequeasamostrastenhamomesmotamanho.

5.4 TESTE U DE MANN-WHITNEY

QuandoUtilizar:
Dadas duas amostras, de tamanhos n1 e n2, possvel, mediante a prova U de MannWhitney,
saberseambasasamostraspodemserconsideradasprovenientesdamesmapopulao.
Como j se sabe, a estatstica paramtrica s pode ser usada desde que os dados tenham sido
mensurados, no mnimo, no nvel intervalar. Alm disso, as amostras devem ser aleatrias,
independenteseavarivelobservacionalprecisadeterdistribuionormalnapopulao.
O teste U de MannWhitney deve ser utilizado em designs com duas situaes, no
relacionados, quando so utilizados sujeitos diferentes em cada uma das situaes
experimentais.
70
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Exemplo:Suponhaquequerinvestigaron.dequeixasdolorosasduranteumtratamentoa
um mesmo problema teraputico (controlada a gravidade e a extenso da leso) em que se
utilizaram duas tcnicas diferentes. A hipotese experimental supe que durante a
utilizaodatcnicaBqueodoenteseapresentamaisqueixoso.

Quadro 15: Resultados do registo das queixas
Paci ent e A Or dem( 1) B Or dem( 2)
1 3 3 9 11
2 4 4 7 9
3 2 1, 5 5 5, 5
4 6 7, 5 10 12
5 2 1, 5 6 7, 5
6 5 5, 5 8 10
TOTAL 22 T1=23 45 T2=55
MDI A 3, 67 7, 5



RACIONAL
OracionalqueestportrsdotesteUdeMannWhitneybastantesemelhanteaodoteste
deWilcoxon.Adiferenafundamentalentreasduasresidenofactodosegundoseaplicara
designs relacionados e o U se aplicar a designs norelacionados, utilizando, portanto,
sujeitos diferentes. O teste de Wilcoxon analisa as diferenas entre a performance dos
mesmos sujeitos (ou pares de sujeitos emparelhados) submetidos a duas situaes
experimentais. Com um design norelacionado no temos uma base que nos permita
comparardiferenasentreparesderesultados.Assim,otesteUdeMannWhitneyordenaos
resultados de todos os sujeitos em ambas as situaes como se fossem apenas um conjunto
simplesderesultados.
Se as diferenas entre as situaes forem aleatrias, como postulado pela hiptese nula,
entoosresultadosdevemseraproximadamenteosmesmose,consequentemente,asordens
devem ser tambm aproximadamente as mesmas para as duas situaes. Se houver uma
preponderncia de ordens altas ou baixas numa situao ou na outra, ento porque a
diferenanototaldosresultadosordenadosparacadasituaodevidaaosefeitosprevistos
da varivel independente e no ao acaso. Se a soma total das ordens for muito baixa para
uma das situaes, ento ter de haver uma preponderncia de ordens elevadas na outra
situao. Quanto menor for U mais significativas sero as diferenas entre as ordens das duas
situaes.
71
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


INSTRUES PASSO-A-PASSO PARA CALCULAR W
Ordenetodososresultadosparaambososgruposcomosesetratassedeumconjuntonicode
resultados,atribuindoaordem1aoresultadoinferioreassimsucessivamente.
OordenamentoglobaldetodososresultadosapresentadoemOrdens(1)eOrdens(2).
Adicioneasordenstotaisparaogrupo1egrupo2emseparado.
T1=23 e T2=55

Seleccioneomaiortotaldasordens.
T2=55


CalculeovalordeUatravsdafrmula
N
x
(n
x
+ 1)
U = n
1.
n
2
+
__________________
- T
x
2

emque:
n1=nmerodesujeitosnogrupo1 n1=6
n2=nmerodesujeitosnogrupo2 n1=6
Tx=maiortotaldeordens Tx=T2=55
Nx=nmerodesujeitosdogrupocomomaiortotaldeordens Nx=6

ClculodeU
6 x 7
U = 6 x 6 +
_______________
- 55 = 36+21-55=2
2

Quando existe o mesmo nmero de sujeitos em cada situao rapidamente se torna mais fcil
verificar qual o maior total de ordens. Normalmente, prefervel ter um nmero idntico de
sujeitosemcadagrupo;noentanto,setiverdeutilizarumnmerodesigualdesujeitosemcada
grupo,poderfazlo.Emcasodedvida,calculeUparaambasasordenstotais,seleccionando
onapropriadoacadacasoe,depois,considereoUmaispequeno.
72
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

CONSULTA DA SIGNIFICNCIA NA TABELA


As Tabelas (Anexo II) apresentamlhe os valores crticos de U nos diferentes nveis de
significnciadetestesunicaudaisebicaudais,paraasdiferentescombinaesden1en2dosdois
grupos.
O procedimento mais usual comear por verificar se o valor de U significativo ao nvel de
significncia de p<0,05 para testes unicaudais) ou para testes bicaudais. Uma vez que previmos
que a tcnica B produzia mais queixas, poderemos consultar a Tabela para testes unicaudais.
Localizando n1=6 na linha superior e n2=6 na coluna do lado esquerdo, encontraremos o valor
crticodeUnaintercepodosdois.
Concluso: Uma vez que se convencionou utilizar o nvel inferior de U, o nosso valor de U=2
deve ser igual ou inferior ao valor crtico 7, o que acontece, podemos, desta forma, rejeitar a
hiptesenulaeaceitarqueexistemdiferenassignificativasaonveldador(p<0,05).
73
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


6. TESTES PARA DUAS AMOSTRAS RELACIONADAS

Empregamse as provas estatsticas de duas amostras quando o investigador deseja determinar


sedoistratamentossodiferentesouseumtratamentomelhordoqueooutro.Emcadacaso,
comparase o grupo em que se aplicou o tratamento com outro que no sofreu nenhum
tratamentoouquesofreutratamentodiferente.
Em tais comparaes de dois grupos observamse, por vezes, diferenas significativas que no
soresultantesdotratamentoaplicado.
Umadasmaneirasdesuperaradificuldadedecorrentedaintroduodediferenasextrnsecas
entredoisgruposconsisteemutilizarnapesquisaduasamostrasrelacionadas,isto,relacionar
de alguma forma as duas amostras estudadas. Tal relacionamento pode ser conseguido
utilizandosecadaindivduocomoseuprpriocontroloouentoformandoparesdeindivduos
e, em seguida, associando os dois membros de cada par s duas condies. Quando um
indivduo serve como o seu prprio controlo, ele submetido a ambos os tratamentos em
ocasies diferentes. Quando se utiliza o mtodo do emparelhamento devem procurar
seleccionarse,paracadapar,indivduosquesejamtosemelhantesquantopossvelemrelaoa
quaisquervariveisextrnsecasquepossaminfluenciarosresultadosdapesquisa.
Sempre que possvel, o mtodo de utilizao do indivduo como o seu prprio controlo
(contrabalanando a ordem em que se aplicam os tratamentos ou mtodos) prefervel ao
mtododeemparelhamento.Earazodissoquelimitadaanossacapacidadeparaformaros
paresadequadamente,emconsequnciadonossodesconhecimentodasvariveisrelevantesque
determinam o comportamento. A validade por emparelhamento est na razo directa do
investigador para determinar como formar os pares, e essa capacidade quase sempre muito
limitada. Essa dificuldade contornada quando se utiliza cada indivduo como seu prprio
controlo;nosepodepretenderrelacionamentosmaisprecisosdoqueaprpriaidentidade.


74
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


6.1 PROVA DE McNEMAR PARA A SIGNIFICNCIA DE
MUDANAS

Quandoutilizar:
A prova de McNemar para a significncia de mudanas particularmente aplicvel aos
planeamentosdotipoantesedepois,emquecadaindivduoutilizadocomooseuprprio
controlo e a mensurao se faz ao nvel de uma escala nominal ou ordinal. Pode, assim, ser
usada para testar a eficincia de determinada tcnica (reunies, folhetos, visita, etc.) sobre as
prefernciaseleitoraisarespeitodevrioscandidatos.
Nestes casos, cada pessoa pode servir como o seu prprio controlo, utilizandose a mensurao
emescalanominalparaavaliarasalteraesdasituaoapsemrelaosituaoantes.
Exemplo: Suponha que um profissional de sade est interessado em estudar os
comportamentos resultantes da iniciao de obesos prtica do exercicio fisico. Este
profissional observou ao longo dos anos que os obesos utilizam preferencialmente o
elevadorparasedirigiremsuaconsultacujoconsultrioerano1.andar.Colocaahipotese
de que os obesos que tiveram como terapeutica exerccio fsico comeariam a usar
preferencialmenteasescadas.Afimdetestarahipoteseotcnicoobserva25doentesemque
ministrou como exerccio fsico caminhar uma hora por dia cinco vezes por semana.
Decorrido um ms de exercicio ele observa os mesmos 25 doentes e faz a classificao
comportamentos.Osdadossoosseguintes:

Quadro 16: Teste Mcnemar


Pr ef er enci a aps 30 di as de exer ci ci o
Escadas El evador
El evador 4 ( A) 14 ( B) Pr ef er nci a ant es da
t er aput i ca
Escadas 4 ( C) 3 ( D)

HIPTESE DE NULA:
H0: Para os obesos que modificaram a sua atitude, a probabilidade de mudar o percurso do
elevador para as escadas (PA) igual probabilidade de mudar de mudar das escadas para o
elevador(PD)eambassoiguaisa.Isto,
H0:PA=PD=1/2 H1:PA>PD
75
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA



PROVA ESTATSTICA:
Utilizase a prova de McNemar para significncia de mudanas, porque o estudo utiliza duas
amostras relacionadas, do tipo antesedepois e utiliza a escala de medida nominal
(classificativa).

Nveldesignificncia:
p=0,05 N=25

Distribuioamostral:
AdistribuioQuiquadradocom1graudeliberdadedumaboaaproximaodadistribuio
amostraldeQuiquadrado,talcomocalculadapelafrmula.

RegiodeRejeio:
ComoH1especificaosentidodadiferenaprevista,aregioderejeiounilateral.Consistede
todos os valores de Quiquadrado que so to grandes que acusem uma probabilidade
unilateral,associadasuaocorrnciasobH0nosuperiora0,05.

Deciso:
Estamosinteressadosnosobesoscujocomportamentoacusaalterao:representadosnasclulas
AeD.
Paraosdados,temos:
(A-D - 1)
2
(4-3 - 1)
2
(1 - 1)
2
0
X
2
=
_________________________
=
__________________
=
___________________
=
__________
= 0
A+D 4+3 7 7

Sendo0valorobservadodex
2
=0,devemosconsultaratabela(AnexoI)paraobterovalorcritico,
no esquecendo que temos uma amostra unicaudal a um nivel de 0,05. consultando a tabela
observamosumx
2
criticode5,41.

Racional
Paracompararasignificnciadequalquermudanaobservada,porestemtodo,constriseuma
tabela de frequncias de 4 casas para representar o 1 e o 2 conjunto de reaces dos mesmos
76
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

indivduos. As caractersticas gerais desta tabela so as que se apresentam a seguir, em que se
utilizamossinais+eparaindicardiferentesreaces.


Quadro 17: Tabela de quatro casas para a prova de significncia de mudanas
ANTES
- +
DEPOI S + A B
- C D

Notesequeoscasosqueacusammodificaesentrea1ea2reacoaparecemnasclulasAe
D.UmindivduolocalizadonaclulaAsepassoude+paraenaclulaDsepassoude
para+.Naausnciademodificao,oindivduoclassificadonaclulaB(reaco+antes
edepois)ounaclulaC(reacoantesedepois).
Como A e D representa o nmero total de indivduos que acusam modificao, a perspectiva,
sob a hiptese de nulidade, seria que (A+D) acusassem modificaes num sentido e (A+D)
acusassemmodificaesnoutrosentido.Ouseja,(A+D)afrequnciaesperada,sobH0,tanto
naclulaAcomonaclulaD.
NaprovadeMcNemardesignificnciademudana,estamosinteressadosapenasnasclulasA
e D. Portanto, A=nmero de casos observados na clula A, D=nmero de casos observados na
clulaDe(A+D)=nmeroesperadodecasostantonasclulasAcomoD,ento
(A-D)
2
X
2
=
_____________
A+D comgrausdeliberdade=1

77
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

6.2 CORRECO DE CONTINUIDADE

Aaproximao,peladistribuiodoQuiquadrado,dadistribuioamostraldafrmulatornase
excelente se se introduzir uma correco de continuidade. Tal correco necessria, porque se
utilizou um distribuio contnua (Quiquadrado) para aproximar uma distribuio discreta.
Quando todas as frequncias esperadas so pequenas, tal aproximao pode ser fraca. A
correcodecontinuidade(Yates,1934)constituiumatentativaderemoodessafontedeerro.
Comacorrecodecontinuidade,temse:
(A-D - 1)
2

X
2
=
________________________________
A+D com graus de liberdade=1

Estaexpressoindicaquesedevesubtrair1dovalorabsolutodadiferenaentreAeDantesde
elevar ao quadrado. O grau de significncia de qualquer valor observado de Quiquadrado, tal
comocalculadoatravsdafrmula,determinadomedianterefernciaaumaTabela(AnexoI).
SeovalorobservadodeQuiquadradoiguala,oumaiordoque,ovalorexibidonaTabelapara
determinado nvel de significncia comgl=1,aimplicaoqueexisteefeitosignificativonas
reacesantesedepois.

INSTRUES PASSO-A-PASSO PARA CALCULAR X
2
Enquadrarasfrequnciasobservadasnumatabelade4casas.
DeterminarasfrequnciasesperadasnasclulasAeD
E=1/2 (A+D)
Se as frequncias esperadas so inferiores a 5, empregar a prova binomial em substituio
provadeMcNemar.
Seasfrequnciasesperadasnosoinferioresa5,calcularovalordeX
2
atravsdafrmula
(A-D - 1)
2

X
2
=
_______________________
A+D

Mediante referncia Tabela (Anexo I), determinar a probabilidade, sob H0, associado a um
valortograndequantoovalorobservadodeX
2
.Sesetratadeumaprovaunilateral,dividirpor
78
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

2 o valor da probabilidade exibido na Tabela. Se o valor de p, dado pela Tabela para o valor
observadodeX
2
comgl=1,nosuperap,rejeitaseH0emfavordeH1.

6.3 TESTE DOS SINAIS DE WILCOXON



Quandoutilizar
O teste de Wilcoxon deve ser utilizado num design experimental relacionado, com duas
situaesexperimentaisquandosoutilizadososmesmossujeitosousujeitosemparelhadosem
ambasassituaes.
Exemplo: Suponha que quer investigar se existe alguma diferena na quantidade de
vocabulrioutilizadoporcrianasqueusamumaparelhoauditivoouporcrianasqueno
usam. Este um bom exemplo dum caso em que essencial a utilizao de sujeitos
emparelhados. Como bvio, no possvel utilizar os mesmos sujeitos, uma vez que
nenhuma criana que no precisa de usar aparelho auditivo usa um mesmo tempo. Por
outrolado,nopodemosescolheraleatoriamenteossujeitosparacadagrupo.Podedarseo
caso, porexemplo,deossujeitosqueusamaparelhoauditivoseremmaisvelhos.Qualquer
efeito encontrado neste grupo pode ficar a deverse unicamente a esta diferena. Os dois
grupos com aparelho e sem aparelho necessitam de ser emparelhados em termos de
idade, sexo, inteligncia e todas as outras variveis que achemos necessrio serem
controladas. Apresentamos depois s crianas um teste que mea o seu vocabulrio,
traduzindooemresultados,talcomomostradonatabelaseguinte.

Quadro 18: Resultados do teste do vocabulrio


Par de
suj ei t os
Si t uao A
( comapar el ho)
Si t uao B
( semapar el ho)
d ( A- B) Or demde d
Or demdas
di f er enas
posi t i vas
Or demdas
di f er enas
negat i vas
1 3 5 - 2 5( - ) 5
2 4 5 - 1 2( - ) 2
3 3 2 +1 2( +) 2
4 1 5 - 4 8, 5( - ) 8, 5
5 5 4 +1 2( +) 2
6 2 5 - 3 7( - ) 7
7 3 5 - 2 5( - ) 5
8 4 4 0 -
9 1 5 - 4 8, 5( - ) 8, 5
10 3 5 - 2 5( - ) 5
TOTAL 29 45 4 41
MDI A 2, 9 4, 5



79
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

RACIONAL
OobjectivodotestedossinaisdeWilcoxoncompararasperformancesdecadasujeito(oupares
de sujeitos) no sentido de verificar se existem diferenas significativas entre os seus resultados
nas duas situaes. Os resultados da Situao B so subtrados dos da Situao A e diferena
resultante (d) atribudo o sinal mais (+) ou, caso seja negativa, o sinal menos (). Estas
diferenas so ordenadas em funo da sua grandeza (independentemente do sinal positivo ou
negativo).Oordenamentoassimobtidodepoisapresentadoseparadamenteparaosresultados
positivos e negativos. O menor dos valores deste segundo, dlhe o valor de uma estatstica
designadaporW,quepodeserconsultadanaTabeladesignificnciaapropriada.
Aideiaqueseexistiremapenasdiferenasaleatrias,talcomopostuladopelahiptesenula,
ento haver aproximadamente o mesmo nmero de ordens elevadas e de ordens inferiores
tantoparaasdiferenaspositivascomonegativas.Seseverificarumaprepondernciadebaixos
resultados para um dos lados, isso significa a existncia de muitos resultados elevados para o
outrolado,indicandoumadiferenaemfavordeumadassituaes,superiorquiloqueseriade
esperarseosresultadossedevessemaoacaso.DadoqueaestatsticaWreflecteomenortotalde
ordens, quanto menor for o W mais significativas sero as diferenas nas ordenaes entre as
duassituaes.

INSTRUES PASSO-A-PASSO PARA CALCULAR W


1. Calculeadiferenadentrecadaparderesultados,atribuindoosinalmaisoumenos.
Vejaacolunad(AB)
2. Ordene as diferenas por ordem de grandeza desde a ordem inferior at superior,
ignorandoossinaispositivosenegativos.
Vejaacolunaordenamentoded
3. Emseparado,juntetambmaordenaocorrespondenteaossinaisdiferentes(+ou).
Vejaostotaisparaordenamentosdediferenaspositivasedediferenasnegativasnas
respectivascolunas
80
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

4. ConsidereomenordostotaisdasordenscomoW.
ValorobservadodeW=4,umavezqueototaldasordensparaasdiferenaspositivas
omenor
5. ConteonmerodeparesdesujeitosN(noconsidereasigualdades).
N=101=9

CONSULTA DA SIGNIFICNCIA NA TABELA


A tabela anexada (Anexo III) apresentalhe o nvel de significncia de w tanto para os testes
unicaudaiscomobicaudais.NacolunadaesquerdaencontraosvaloresdeN.Umavezqueno
efectumos uma previso da direco (como por exemplo, que obteramos melhores resultados
no vocabulrio de criana em jardim de infncia) teremos de utilizar os nveis de significncia
paraumahiptesebicaudal.SeleccioneovaloradequadoN=9everifiqueaolongodessalinhase
o valor de W significativo. Uma vez que se convencionou utilizar o menor valor das ordens,
entoovalorobtidodeWterdeserigualouinferioraovalorcrticodaTabela.Comoovalor
obtidoW=4inferioraovalorcrticode6parap<0,05(bicaudal),poderejeitarahiptesenulae
concluir que existe uma diferena significativa entre os resultados no vocabulrio dos dois
gruposdesujeitosemparelhados.
Suponha que tinha efectuado uma previso numa dada direco, por exemplo, que as crianas
que usam aparelho auditivo (Situao B) obtm resultados mais elevados no teste de
vocabulrio. O valor obtido de W=4, inferior a 6, que o valor crtico de W para p<0,025
(hipteseunicaudal),umaprobabilidadeinferiore,consequentemente,maissignificativadoque
onveldesignificnciaparaumahiptesebicaudalp<0,05.

81
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

7. TESTES PARA K AMOSTRAS INDEPENDENTES

O investigador pode precisar de decidir se diversas variveis independentes devem ser


consideradas como procedentes da mesma populao. Os valores amostrais quase sempre so
um tanto diferentes e o problema determinar se as diferentes amostras observadas sugerem
realmente diferenas entre as populaes ou se so apenas variaes casuais que podem ser
esperadasentreamostrasaleatriasdamesmapopulao.
Apresentamos tcnicas para comparar a significncia de diferenas entre trs ou mais grupos
deamostrasindependentes,ouseja,paracomprovarahiptesedenulidadedequeKamostras
independentestenhamsidoextradasdamesmapopulaooudepopulaesidnticas.
As provas noparamtricas tm a vantagem de permitir estudar, quanto significncia, dados
que so inerentemente classificados (escala nominal) ou se apresentam em postos (escala
ordinal).

7.1 TESTE DE KRUSKAL-WALLIS



REQUISITOS PARA O USO DO TESTE DE KRUSKAL-WALLIS
OtestedeKruskalWallispressupeasseguintescondiesparaoseuadequadouso:
a) Comparaodetrsoumaisamostrasindependentes;
b) OtestedeKruskalWallisnopodeserusadoparatestardiferenasnumanicaamostra
derespondentesmensuradosmaisdeumavez;
c) Dadoscujonveldemensuraosejanomnimoordinal;
d) Esta prova exige dados que possam ser ordenados e aos quais, por isso mesmo, seja
possvelatribuirpostosouordens;
e) Otamanhomnimodecadaamostradeveserde6parasepoderrecorreraox
2
.
82
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Quando n > 5 por grupo de respondentes, a significncia de H pode ser determinada por
recorrncia Tabela do Quiquadrado (Anexo I). Para testar diferenas entre amostras de
tamanhoinferiora6,deverecorreratabelasespeciais(AnexoIV).

QUANDO UTILIZAR
EstetestepodeserconsideradoumaextensodotesteUdeMannWhitneyquandonecessitamos
de utilizar trs ou mais situaes. Deve ser utilizado em designs norelacionados quando
sujeitosdiferentessodistribudosportrsoumaissituaes.

Exemplo:Suponhaqueestamosinteressadosemdescobrirseexistemdiferenasnoacessoa
uma pgina da internet em funo da caracteristica: muito ilustrada, com algumas
ilustraes e, sem ilustraes. Alocmos trs pginas na internet com o mesmo assunto e
titulo durante 4 meses. A seguir verificmos o nmero de vezes que formam acedidas
durantequatrosbadosseguidos.Osresultadosforam.
Quadro 19: Nmero de ideias relembradas para trs tipos de testes

Suj ei t os do
gr upo 1
( pgi na mui t o
i l ust r ada)
Suj ei t os do
gr upo 2
( pgi na com
al gumas
i l ust r aes)
Suj ei t os do
gr upo 3
( Pgi na sem
i l ust r aes)
Resul Or dem Resul Or dem Resul t . Or dem
Sabado 1 19 10 14 6 12 3, 5
Sabado 2 21 11 15 7 12 3, 5
Sabado 3 17 9 9 1 13 5
Sabado 4 16 8 10 2
TOTAL 73 38 38 14 47 14
MDI A 18, 25 12, 67 11, 75

RACIONAL
Este teste pretende determinar se os resultados so significativamente diferentes para trs ou
mais grupos. Uma vez que todos os resultados foram, em principio, obtidos por sujeitos
diferentes a nica forma de verificarmos as diferenas entre as situaes ordenlas em
conjunto, como se se tratassem apenas de um conjunto de resultados, tal como havamos
efectuado no teste U de MannWhitney. Isto acontece porque, no temos uma base para
comparar resultados dos mesmos sujeitos ou de sujeitos emparelhados em diferentes situaes,
comocomotesteUdeMannWhitneyparadesignsrelacionados.
Este ordenamento global, quando posteriormente adicionamos as ordens de cada coluna em
separado,permitenosobterototaldasordensparacadasituao.Seexistiremapenasdiferenas
aleatriasentreassituaes,comopostuladonahiptesenula,deesperarqueordensaltase
83
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

baixassedistribuamdeformaaproximadamenteequivalentepelasdiferentessituaes.Mas,se
pelocontrrio,houverumaprepondernciadealtosoubaixosresultadosemqualquerumadas
situaes, provvel que tal facto reflicta diferenas significativas devidas varivel
independente.
OvalordasdiferenasentreostotaisdasordensdadopelaestatsticadesignadaporH.Desde
queahipteseexperimentalprevejaaexistnciadediferenassignificativasentreassituaes,o
valor que obtivermos de H dever ser igual ou superior ao valor crtico da Tabela, para que
possaserconsideradosignificativo.

INSTRUES PASSO-A-PASSO PARA CALCULAR H


Ordene todos os grupos do design como se se tratasse apenas de um conjunto de resultados,
atribuindoaOrdem1aomenorresultadoeassimsucessivamente.
Para um ordenamento global dos resultados, veja as colunasordemparaosgrupos1,2e3,em
quetodososresultadossoconsideradosemconjunto
Adicioneostotaisdasordensparacadasituao.
CalculeovalordeHapartirdafrmula
12
T
c
2
H
= ________________

__________ - 3 (N + 1)
N (N + 1) n
c


em que:


N=nmerototaldesujeitos N=11
nc=nmerodesujeitosemcadagrupo n1=4;n2=3;n3=4
Tc=totaldeordensparacadasituao,ouseja,
ostotaisdasordensparacadacoluna
T1=38;T2=14;T3=14
Tc
2
=totaldasordensparacadasituao,cadaumelevadoaoquadrado
T1
2
=38
2
;T2
2
=14
2
;

T3
2
=14
2
84
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Tc
2
= somadosquadradosdostotaisdasordensparacadasituaodividido
nc pelonmerodesujeitosdessasituao:

38
2
/4 + 14
2
/3 + 14
2
/4


Clculo de H

12 T
c
2
H
= ____________

______ - 3 (N + 1)
N (N + 1) n
c


12
H
= _____________________
(38
2
/4 +

14
2
/3 + 14
2
/4 )
- 3 (11 + 1)
11 (11 + 1)

12
H
= ___________________
(1444/4 +

196/3 + 196/4 )
- 3 x 12
132

H
=
0,091 (361 + 65,33 + 49) 36

H
=
43,255 36 = 7,26

Calculeosgrausdeliberdade,ouseja,onmerodesituaes(C)menosuma.
gl=C1=31=2


CONSULTA DA SIGNIFICNCIA NA TABELA
A Tabela (Anexo IV) utilizase em experincias com trs grupos de sujeitos, e com um mximo
decincosujeitosemcadagrupo.Paraummaiornmerodesujeitos,deveserutilizadaaTabela
doQuiquadrado(AnexoI).Quandonosoutilizadosmaisdetrsgrupos,poderlocalizarna
colunadaesquerdadaTabelaonmerodesujeitosdecadagrupo.Localizeentoacombinao
queprocura(nonossocaso:4,4,3).Notequeaordemdonmerodesujeitosnoimportante,
mas a combinao apropriada na Tabela 4, 4 e 3. Para essa combinao encontrar os valores
crticos de H para vrias probabilidades. Se o valor de H que obteve for igual ou superior ao
valor crtico de um determinado nvel de significncia pode rejeitar a hiptese nula. No nosso
exemplo, o valor obtido de H=7,26 superior ao valor crtico de 7,1439 para p<0,01, pelo que
podemosaceitarahipteseexperimentalaestenveldesignificncia.
Sepossuirmaisdetrssituaes,e/ousujeitosemcadasituao,deverprocurarovalorcrtico
na Tabela do Quiquadrado. Repare que para isso ter que calcular os graus de liberdade.
Localizeosvaloresdosgrausdeliberdade(nonossoexemplo,gl=2)aolongodacolunadolado
esquerdo e verifique ao longo da linha os valores crticos para as diferentes probabilidades. O
85
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

valor que obtivemos H=7,26 superior ao valor crtico de 5,99 para p<=0,05, pelo que podemos
aceitar que o resultado significativo a este nvel. Dar conta que esta probabilidade menos
significativa de que quando utilizamos a Tabela anterior. Isso acontece porque essa Tabela
especialmenteconcebidaparanosdarasprobabilidadescomumpequenonmerodesujeitose
desituaes.
Notar tambm que o teste de KruskalWallis apenas lhe pode dizer que existem diferenas
globais nos resultados entre as situaes experimentais. Na tabela apresentada parece existir
uma tendncia para consultar pginas com mais ilustraes do que sem ilustraes. Mas para
podertestarseessatendnciarealmenteexiste,terdeutilizarumtestedetendncia.

86
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

8. TESTES PARA K AMOSTRAS RELACIONADAS

Soestatsticasparacomprovarasignificnciadediferenasentretrsoumaisgrupos,ouseja,
para comparar a hiptese de nulidade de que K (3 ou mais) amostras tenham sido extradas da
mesmapopulaooudepopulaesidnticas.
As circunstncias exigem, por vezes, o recurso a um experimento que nos permita estudar
simultaneamente mais de duas amostras ou condies. Quando se trata de comparar trs ou
mais amostras ou condies de um experimento, necessrio aplicar uma prova estatstica que
indique se h alguma diferena global entre as K amostras ou condies, antes que possamos
cogitardecomprovarasignificnciadadiferenaentreduasamostrasquaisquer.
Squandoumaprovaglobal(provadeKamostras)nosautorizaarejeitarahiptesenulaque
podemos empregarumprocessoparadeterminardiferenassignificativasentreduasquaisquer
dasKamostras.
Estas provas noparamtricas tm a vantagem de permitir o estudo da significncia de dados
que,inerentemente,seapresentamapenassobaformaclassificativaouempostos.
HdoisplanosbsicosparacompararKgrupos:
1. No primeiro deles, as K amostras de igual tamanho so postas em correspondncia
de acordo com determinado(s) critrio(s) que podem afectar os valores das
observaes.Nalgunscasos,essacorrespondnciaobtmsecomparandoosmesmos
indivduosoucasossobtodasasKcondiesouentocadaumdosNgrupospode
ser mensurado sob todas as K condies. Em tais planos, devem usarse provas
estatsticasparaKamostrasrelacionadas;
2. O segundo plano envolve K amostras aleatrias independentes (no
necessariamente do mesmo tamanho), uma de cada populao. Em tais casos,
devemosusarasprovasestatsticasparaKamostrasindependentes.
87
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

8.1 PROVA DE COCHRAN




Quandoutilizar:
A prova de McNemar para duas amostras pode ser estendida para aplicao a pesquisas que
envolvem mais de duas amostras. Essa extenso, que constitui a prova Q de Cochran para K
amostras relacionadas, proporciona um mtodo para comparar se trs ou mais conjuntos
correspondentes de frequncias ou propores diferem entre si significativamente. A
correspondncia pode basearse em caractersticas relevantes dos diferentes indivduos ou no
facto de os mesmos indivduos serem observados sob condies diferentes. A prova Q de
Cochranadaptaseespecialmenteaocasoemqueosdadosseapresentamnumaescalanominal
ousobaformadeinformaoordinaldicotomizada.
Exemplo: Suponha que estamos interessados em saber se a atitude de um entrevistador
influencia a aceitao de participao num estudo por inqurito. Poderemos treinar o
entrevistadorparaefectuarassuasentrevistasdetrsmaneirasdiferentes:
1. Demonstrandointeresse,cordialidade,entusiasmo;
2. Demonstrandoformalismo,reservaecortesia;
3. Demonstrandomodoabrupto,formalismoeaspereza.

88
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


Exemplo: O entrevistador visitaria 3 grupos de 18 casas, aplicando o tipo 1 de entrevista a
um grupo, o tipo 2 a outro grupo e o3aoterceirogrupo.Teramos,assim,18conjuntosde
potenciais inquiridos com trs deles correspondendo em cada conjunto. Em cada conjunto
atribuirseam aleatoriamente aos trs membros as trs condies (tipos de entrevista).
Teramos, ento, 3 amostras relacionadas (correspondentes) com 18 elementos cada uma
(N=18). Poderamos, pois, comprovar se as diferenas fundamentais nos tipos de entrevista
influenciariam o nmero de respostas afirmativas sim dadas para aceitao de
participaopelos3gruposdecorrespondentes.

Quadro 20: Q de Cochran
Conj unt o
Respost a
ent r evi st a 1
Respost a
ent r evi st a 2
Respost a
ent r evi st a 3
1 1 1 1
2 2 2 1
3 1 2 1
4 1 1 1
5 2 1 1
6 2 2 1
7 2 2 1
8 1 2 1
9 2 1 1
10 1 1 1
11 2 2 2
12 2 2 2
13 2 2 1
14 2 2 1
15 2 2 1
16 2 2 2
17 2 2 1
18 2 2 1
RespostasSim(1)eNo(2)dadaspordonasdecasaatrstiposdeentrevistas


HIPTESE NULA:
AprobabilidadedeumSimamesmaparaostrsgruposdeentrevistas.
H1:AsprobabilidadesdeumSimdiferemconformeotipodeentrevista.

PROVA ESTATSTICA:
Escolhese a prova Q de Cochran, porque os dados se referem a mais de dois grupos
relacionados(K=3)eapresentamsedicotomizadossobaformaSimeNo.

NVEL DE SIGNIFICNCIA:
p=0,01 N=18
89
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


DISTRIBUIO AMOSTRAL:
Sobahiptesedenulidade,QtemumadistribuioaproximadamenteQuiquadradocomgl=1.
Isto,aprobabilidadeassociadaocorrncia,sobHo,dequalquervalortograndequantoum
valorobservadodeQpodeserdeterminadamedianterefernciaTabela.

REGIO DE REJEIO:
Consiste em todos os valores de Q to grandes quanto a probabilidade associada sua
ocorrncia,sobHo,nosejasuperiorap=0,01.

DECISO:
RecodificmosSimpor1eNopor0.
Quadro 21: Q de Cochran
Conj unt o
Respost a
ent r evi st a
1
Respost a
ent r evi st a
2
Respost a
ent r evi st a
3
Li Li
2
1 0 0 0 0 0
2 1 1 0 2 4
3 0 1 0 1 1
4 0 0 0 0 0
5 1 0 0 1 1
6 1 1 0 2 4
7 1 1 0 2 4
8 0 1 0 1 1
9 1 0 0 1 1
10 0 0 0 0 0
11 1 1 1 3 9
12 1 1 1 3 9
13 1 1 0 2 4
14 1 1 0 2 4
15 1 1 0 2 4
16 1 1 1 3 9
17 1 1 0 2 4
18 1 1 0 2 4
Total G1=13 G2=13 G3=3 Li=29 Li
2
63

Li=nmerototalderespostasSimparacadalinha
K=nmerodecolunas
N=nmerodelinhas
90
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Substituindoestesvaloresnafrmula,vem:
(K-1) [K Gj
2
( Gj)
2
] (3-1) [ 3X (13
2
+ 13
2
+ 3
2
) 29
2
]
Q =
_____________________________________________
=
______________________________________________________
= 16,7
K Li - Li
2
3X29 - 63


Emque K=n.degrupos
Gj=n.totaldesucessos

ATabela(AnexoI)indicaqueQ16,7temumaprobabilidadedeocorrncia,sobHo,p<0,001,
quando gl=K1=31=2. Essa probabilidade inferior ao nvel de significncia de p=0,01. O valor
de Q est na regio de rejeio e, consequentemente, a nossa deciso rejeitar Ho em favor de
H1,concluindoqueonmeroderespostasSimdiferesignificativamenteemrelaoaostipos
1,2e3deentrevista.

RACIONAL
Se os dados de uma pesquisa se dispem numa tabela de dupla entrada com N linhas e K
colunas,possveltestarahiptesedenulidadedequeaproporooufrequnciaderespostas
dedeterminadotiposejaamesmaemcadacoluna,exceptuandoasdiferenasdevidasaoacaso.
Cochran mostrou que se a hiptese de nulidade verdadeira, isto , se no h diferena na
probabilidade, digamos de Sucesso sob cada condio (o que equivale a dizer que os
Sucessos ou Fracassos se distribuem aleatoriamente pelas linhas e colunas da tabela de
duplaentrada),ento,seonmerodelinhasmuitopequeno
K(K-1) (Gj - G)
2
Q =
__________________________________________
K Li - Li
2

temdistribuioaproximadamenteQuiquadradocomgl=K1,emque:
Gj=nmerototaldeSucessosnacolunaj
__
G=mdiadosGj

Li=nmerototaldesucessosnalinhai
91
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Umaexpressoequivalentefrmulaanterior,efacilmentededutveldela,masquesimplificaos
clculos:

(K-1) [K Gj
2
( Gj)
2
]
Q =
__________________________________________________
K Li - Li
2



INSTRUES PASSO-A-PASSO PARA CALCULAR Q
Paradadosdicotomizados,atribuiroscore1acadaSucessoeoscore0acadaFalha.

DisporosdadosnumatabelaK.N,comKcolunaseNlinhas(N=nmerodecondiesemcada
umdosgrupos).

DeterminarovalordeQ,aplicandoafrmula.
AsignificnciadovalorobservadodeQpodeserdeterminadomedianteaobservaodoAnexo
I, pois Q recorre distribuio do Quiquadrado com gl=K1. Se a probabilidade associada
ocorrncia, sob H0, de um valor to grande quanto um valor observado de Q no supere p,
rejeitaseH0.

8.2 TESTE DE FRIEDMAN

Quandoutilizar:
EstetestepodeserconsideradoumaextensodotestedeWilcoxon,quandonecessrioutilizar
trsoumaissituaesexperimentais.Deveserutilizadoparaumdesignrelacionadoquandoos
mesmos sujeitos (ou sujeitos emparelhados) so distribudos por trs ou mais situaes
experimentais.
92
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Exemplo:Suponhaqueumeditordelivrosdeestatisticaproduziuumasriedelivrosequer
escolher de entre trs tipos de ilustraes aquele que mais eficaz para os estudantes.
pedido a oito universitrios que classifiquem as obras numa escala de cinco pontos, desde
nadaboaatmuitoboa.Obtiveramseosresultadosapresentadosnatabelaseguinte.

Quadro 22: Avaliao de trs tipos de ilustraes


Sujeitos Situao 1
(Ilustrao A)
Situao 2
(Ilustrao B)
Situao 3
(Ilustrao C)

Result. Ordem Result. Ordem Result. Ordem
1 2 1 5 3 4 2
2 1 1 5 3 3 2
3 3 1 5 2,5 5 2,5
4 3 2 5 3 2 1
5 2 1 3 2 5 3
6 1 1 4 2,5 4 2,5
7 5 3 3 2 2 1
8 1 1 4 3 3 2
TOTAL 18 11 34 21 28 16
MDIA 2,25 4,25 3,50



RACIONAL
Uma vez que se trata de um design relacionado no qual o mesmo sujeito obtm resultados em
todas as situaes, permitido comparar os resultados de cada sujeito atravs de todas as
situaes,nosentidodeverificarmosemquesituaoobtmmaioresemenoresresultados.
Uma vez que existem mais do que duas situaes, no possvel calcular as diferenas nos
resultados de duas situaes, como era o caso do teste de Wilcoxon. Pelo contrrio, o
ordenamentodosresultadosdecadasujeitoparaastrscondiesserfeitahorizontalmenteao
longo das linhas, tal como mostra a tabela. Por exemplo, aos resultados do sujeito 1,
respectivamente2naSituao1,5naSituao2e4naSituao3,soatribudastrsordens,do
menorresultadoparaomaior:Ordem1paraaSituao1,Ordem2paraaSituao3eOrdem3
paraaSituao2;esteprocedimentosemelhanteparatodosossujeitos.Claroqueseexistissem
quatrosituaesexperimentais,osresultadosdecadasujeitoseriamordenadosde1a4.
Oprximopassocalcularostotaisdeordensparacadasituao.Seexistiremapenasdiferenas
aleatrias entre os resultados de todas as situaes, como postulado pela hiptese nula, de
esperar que estes totais sejam aproximadamente iguais partindo do princpio de que surgiriam
algumasordensbaixas(baixosresultados)ealgumasordensaltas(altosresultados).Contudo,se
assituaesforemsignificativamentediferentes,deesperarqueseobtenhamtotaisdasordens
93
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

significativamente diferentes, com algumas situaes a terem uma preponderncia de ordens
baixas e outras uma preponderncia de ordens altas. O tamanho das diferenas entre os totais
das ordens nos dado por uma estatstica designada por Xr
2
. Se o valor de Xr
2
for igual ou
superior aos valores crticos das Tabelas C e D (Anexo V), isso implica que as diferenas nos
totaisdasordenssosuficientementegrandesparaquesepossamconsiderarsignificativas.


INSTRUES PASSO-A-PASSO PARA CALCULAR W
Ordeneosresultadosdecadasujeitoemseparado,aolongodecadalinha,atribuindoaOrdem1
aomenorresultadoeporaadiante.
(Veja as colunas das Ordens na tabela. Note que a ordem para cada linha de resultados
correspondesordens1,2e3,dadoexistiremtrssituaes).
Calculeototaldasordensparacadasituao.

CalculeovalordeXR
2
apartirdafrmula
12
X
R
2 = ________________________


Tc
2 - 3N (C + 1)
NC (C + 1)
emque

C=nmerodesituaes C=3
N=nmerodesujeitos N=8
Tc=totaldeordensparacadasituao T1=11;T2=21;T3=16
Tc
2
=quadradodototaldeordensparacadasituao T1
2
=11
2
;T2
2
=21
2
;

T3
2
=16
2

Tc
2
=somadosquadradosdostotaisdasordensparacadasituao:11
2
+21
2
+16
2
ClculodeXR
2
12


XR
2
=
_____________________
(11
2
+ 21
2
+ 16
2
) - 3 x 8 (3 + 1)
(8 x 3) (3 + 1)



12


XR
2
=
_____________________
(121 + 441 + 256) - (24 x 4)
24 x 4



12


XR
2
=
_________________
x 818 - 96
96




XR
2
= 6,25
94
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


Calculeosgrausdeliberdade,ouseja,onmerodesituaesmenosuma.
(gl=C1=31=2)


CONSULTA DA SIGNIFICNCIA NA TABELA
ExistemduastabelasparaconsultarosvalorescrticosdeXr
2
.Umadelas,aTabelaC(AnexoV),
utilizada quando o nmero de situaes e de sujeitos pequeno. A Tabela C (1) apresenta os
valoresdeXr
2
paratrssituaesquandoN(nmerodesujeitos)sesituaentre2e9.ATabelaC
(2)apresentaosvaloresdeXr
2
paraquatrosituaesquandoN(nmerodesujeitos)de2,3ou
4. A Tabela D (Anexo V) a tabela de distribuio do Quiquadrado; pode utilizla quando a
amostra de sujeitos for superior s das Tabelas C (1) e C (2), uma vez que o Xr
2
tem uma
distribuiosemelhantedoQuiquadrado.
ATabelaquedeveutilizarparaconsultarovalordeXr
2
,nocasodestaexperincia,aTabelaC
(1),umavezquesetratade8sujeitosexpostosa3situaesexperimentais.Aquiloquetemosde
fazer encontrar a coluna apropriada para N (nmero de sujeitos ou pares de sujeitos
emparelhados)edescobrirnacolunapaprobabilidademaisprximaquesejainferioraosnveis
de significncia convencionais. Consultando as probabilidades para N=8, o valor obtido de
Xr
2
=6,25equivalenteaumaprobabilidadedep<0,047,queinferioraosnveisdesignificncia
convencionais(p<0,05=).Paraconsiderarmosonveldesignificnciadep<0,01onossovalorde
Xr
2
teriadeser9,00,dadoquep<0,009inferiorap<0,01.SeovalordeXr
2
noforapresentado
naTabela,deverconsiderarovalorseguintemaisprximoquandoconsultaasprobabilidades.
Porexemplo,seovalordeXr
2
for5,95terdeconsideraraprobabilidadeapresentadapara5,25,
ouseja,p<0,079,quesuperiorap<0,05e,consequentemente,nosignificativa.Paraconsultaros
valoresdaTabelaC(2)deverprocedertalcomoparaaTabelaC(1).
Se tiver mais situaes e/ou sujeitos e tiver de consultar a Tabela D, aquilo que tem a fazer
localizar os valores dos graus de liberdade ao longo da coluna da esquerda (nonossoexemplo,
gl=2, ou seja, nmero de situaes1). Depois siga ao longo da linha de probabilidades at que
encontre um dos nveis de significncia convencionais. O valor que obtivemos de Xr
2
=6,25
superior ao valor crtico de 5,99 apresentado na Tabela do Quiquadrado, pelo que podemos
aceitar que os nossos resultados so significativos ao nvel de significncia de p<0,05. Apesar
disso, e dado que o nosso valor de Xr
2
inferior ao valor crtico de 9,21 para p<0,01, no
podemosrejeitarahiptesenulaaestenveldesignificncia.
95
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Apartirdaanliseestatsticadaexperinciapodeconcluirqueascrianasmostrampreferncias
significativamentediferentespelostrstiposdeilustraes.Emfunodasmdiasapresentadas
natabela,sabemosquepreferemaIlustraoB,querecolheuasordensmaiselevadas,seguindo
seaIlustraoCe,porltimo,aIlustraoA.Contudo,otestedeFriedmanpodeapenasindicar
que existem diferenas globais entre as situaes. Para verificar se existe uma tendncia para
uma determinada ordem de preferncia das Ilustraes, necessita de utilizar um teste de
tendncia.
96
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

9. MEDIDAS DE CORRELAO E SUAS PROVAS DE


SIGNIFICNCIA

Frequentemente,oinvestigadorquersabersedoisconjuntosdescoresestorelacionadosequal
ograudesserelacionamento.
Apresentamsemedidasnoparamtricasdecorrelaoedeprovasestatsticasparadeterminar
a probabilidade associada ocorrncia de uma correlao to grande quanto a observada na
amostra,sobahiptesedenulidadedequeasvariveissejamnorelacionadasnapopulao.
Mas de muito maior interesse podermos afirmar se determinada associao observada numa
amostradescoresindica,ouno,aprobabilidadedeassociaoentreasvariveisnapopulao
da qual se extraiu a amostra. O coeficiente de correlao, por si s, representa o grau de
associao.Asprovasdesignificnciasobreaquelecoeficientedeterminam,aumcertonvelde
probabilidade, se existe a associao na populao da qual se extraiu a amostra que serviu de
baseparaoclculodocoeficiente.

9.1 COEFICIENTE DE CORRELAO RHO DE SPEARMAN-


RANK

CONDIES DE UTILIZAO
Estetipodecoeficientedecorrelaoutilizasequandotemos:
Testenoparamtrico(semelhanteaumadistribuiolivre),isto,nocolocarestries
quantoformadadistribuio;
Escalademedidanomnimoordinal.

97
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Pode acontecer que os caracteres estudados no sejam mensurveis, mas podem ser ordenados
ou classificados. Por exemplo, se se considera um grupo de candidatos a um certo lugar, eles
podemserexaminadossegundodoispontosdevista:conhecimentosepersonalidade.Estasduas
qualidades no podem ser medidas, mas possvel para cada uma delas efectuar uma
classificao dos candidatos. Podemos, assim, examinar se existe correlao entre estes dois
caracteres; cada par de dados (xi, yi) formado pelas ordens ocupadas por um candidato nas
duasclassificaes.
Formulrio:
6(di
2
)
=1-
________________
N(N
2
-1)
Emque:
di=diferenaentreasposiesnasduasvariveis,isto,di=xiyi
Para tal, temos que dar valores s posies: pontuao mais baixa damos o valor 1 e
assimsucessivamente.
Se as duas classificaes so iguais, di sempre zero e ento r=1 e a correlao perfeita. Se as
ordensmaisaltasdeumaclasseestoassociadassmaisbaixasdaoutrartornasenegativoese
asduasclassificaessoinversas=1.
Ento,
-1 1

INTERPRETAO
O coeficiente de correlao obtido pode ser interpretado, tal como o coeficiente de correlao
momentoprodutodeBrawaisPearson(verestecoeficienteemtestesparamtricos).
98
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Exemplo:Calcule,sabendoque:
xi 18 17 14 13 13 12 11 9 7 5
yi 24 27 17 22 19 20 14 11 3 6

Quadro 23: Coeficiente de Contingncia de RHO de Spearman-Rank
xi posi o yi posi o d d
2
18 1 24 2 - 1 1
17 2 27 1 1 1
14 3 17 6 - 3 9
13 4, 5 22 3 1, 5 2, 25
13 4, 5 19 5 - 0, 5 0, 25
12 6 20 4 2 4
11 7 14 7 0 0
9 8 11 8 0 0
7 9 3 10 - 1 1
5 10 6 9 1 1
=19,5
6x19,5
=1
__________________
=0,88
10(10
2
1)

9.2 O COEFICIENTE DE CONCORDNCIA DE KENDALL

Quandoutilizar:
O coeficiente de concordncia de Kendall uma medida da relao entre vrios conjuntos de
postosdeNobjectosouindivduos.
Quando temos K conjuntos de postos, podemos determinar a associao entre eles
utilizandoocoeficientedeconcordnciadeKendall(W).
99
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

RACIONAL E EXEMPLO
Como soluo do problema da determinao da concordncia global entre K conjuntos de postos,
poderia parecer razovel determinar os rs entre todos os pares possveis de postos e ento calcular a
mdia desses coeficientes para determinar a associao global. Adoptando este procedimento, o
processo tornase impraticvel, uma vez que temos de calcular inmeros coeficientes de correlao de
postos.

Assim,oclculodeWmuitomaissimpleseWtemumarelaolinearcomovalormdioders
relativo a todos os grupos. Denotando rsav o valor mdio dos coeficientes de correlao por
postosdeSpearman,Kendalmostrouque
KW1
rsav=
__________
K1

Outro processo consiste em imaginar como se apresentariam dados se no houvesse
concordncia alguma entre os conjuntos de postos e, em seguida, como se apresentariam se
houvesse concordncia perfeita. O coeficiente de concordncia seria, ento, um ndice de
divergnciaentreaconcordnciaefectivaacusadapelosdadoseaconcordnciamximapossvel
(perfeita).Demodoaproximado,Wumcoeficientedestanatureza.
Suponhamos que 3 chefes de pessoal estejam encarregados de entrevistar 6 candidatos a
emprego e classificlos em postos, separadamente, segundo a capacidade de cada um para
preencheravaga.Atabelaseguintedos3conjuntosindependentesdepostosatribudospelos
chefesdepessoalX,YeZaoscandidatosaaf;altimalinhadatabelaRjdassomasdospostos
atribudosacadacandidato.
Quadro 24: Postos atribudos a 6 candidatos a emprego por 3 chefes de pessoal
Candi dat o
a b c d e f
X 1 6 3 2 5 4
Chef e Y 1 5 6 4 2 3
Z 6 3 2 5 4 1
R
j
8 14 11 11 11 8

Se os chefes de pessoal apresentassem perfeita concordncia nos seus julgamentos sobre os
candidatos, isto , se tivessem atribudo postos aos candidatos da mesma ordem, ento um
candidato teria recebido trs postos 1 e assim a sua soma de postos, Rj, seria 1+1+1=3=K. O
candidato que os 3 chefes tivessem considerado em segundo lugar receberia Rj=2+2+2=6=2K e o
menospromissordoscandidatosseriaRj=6+6+6=18=NK.
100
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Defacto,nocasodaconcordnciaperfeitaentreos3chefes,asvriassomasdepostos,Rj,seriam
3,6,9,12,15,18, muito embora no necessariamente nesta ordem. Em geral, quando h
concordncia perfeita entre K conjuntos de postos, obtemos, para valores significativos de Rj, a
sequnciaK,2K,3K,...,NK.
Poroutrolado,senotivessehavidoconcordnciaentreos3chefes,entoosdiversosRjseriam
aproximadamenteiguais.
Desteexemplo,vemosqueograudeconcordnciaentreosKjulgamentosreflectidopelograu
devarinciaentreasNsomasdepostos.W,coeficientedeconcordncia,funodessegraude
varincia.
Assim:
S
W=
____________________
1/12 K
2
(N
3
N)
emque:
S=soma dos quadrados dos desvios observados a contar da mdia dos Rj, isto , S= (Rj
Rj/N)
2
;
K=nmerodeconjuntosdepostos;
N=nmerodeentidades(objectosouindivduosaqueseatribuempostos);
1/12K2(N3N)=valormximopossveldasomadosquadradosdosdesvios,isto,ovalordeS
queocorrerianocasodeconcordnciaperfeitaentreosKconjuntosdepostos.
101
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Ento,
=(8+14+11+11+11+8)/6=10,5

S=(810,5)
2
+(1410,5)
2
+(1110,5)
2
+(1110,5)
2
+(1110,5)
2
+(810,5)
2
=
6,25+12,25+0,25+0,25+0,25+6,25=25,5

Peloque
S 25,5 25,5
W=__________________________=_____________________________=_____________________=
1/12 K
2
(N
3
N) 1/12 x 3
2
(6
3
6) 1/12 x 9 x 210


25,5
=_______=0,16
157,5

W=0,16 exprime o grau de concordncia entre os 3 colegas fictcios ao atriburem postos aos 6
candidatosaemprego.
desalientarquearazoporqueWnopodetomarvaloresnegativosque,quandoesto
em jogo mais de dois conjuntos de postos, esses conjuntos no podem ser completamente
discordantes. Por exemplo, se X e Y discordam, e se X tambm discorda de Z, ento Y e Z
certamente concordaro. Isto , quando esto em jogo mais de 3 juzes, concordncia e
discordncianosoopostossimtricos.Kjuzespodemtodosconcordar,masimpossvel
todoselesdiscordaremcompletamente.Portanto,Wdeveserzeroouumnmeropositivo.

NOTA: Quando ocorrem empates, atribuemse s observaes empatadas a mdia dos


postosquelhescaberiamsenohouvesseempates.
OefeitodosempatesreduzirovalordeW.Seaproporodeempatespequena,oefeito
desprezvel, podendo continuar a usarse a frmula anterior. Se a proporo de empates
grande, pode introduzirse uma correco que aumentar ligeiramente o valor de W em
relaoaovalorqueseapresentariasemcorreco.Oelementocorrectivo:
(t
3
t)
T=
_________________________
12
Emquet=nmerodeobservaesnumgrupoempatadosemrelaoaumdadoposto

102
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Ento,afrmulaser:
S
W=
______________________________________
1/12 K
2
(N
3
N) - T



INSTRUES PASSO-A-PASSO PARA CALCULAR W
SejaN=nmerodeobjectosouindivduosaseremclassificadosempostoseK=nmerodejuzes
classificadores.DisporospostosobservadosnumatabeladotipoKXN.
ParacadaindivduoouobjectodeterminarRj,somadospostosatribudosqueleindivduopelos
Kjuzes.
Determinar a mdia dos Rj. Exprimir cada Rj como desvio a contar dessa mdia. Elevar ao
quadradoessesdesviosesomlos,obtendoS.
SeaproporodeempatesnosKconjuntosgrande,paracalcularWutilizarafrmula

S
W=
_________________________________
1/12 K
2
(N
3
N) - T

Emcasocontrrio,usar
S
W =
_______________________________
1/12 K
2
(N
3
N)


Omtodoparadeterminarseovalorobservadosignificativamentediferentedezerodepende
dotamanhodeN:
SeN7aTabela(AnexoVI)dosvalorescrticosdeSassociadoscomosWs
significativosaosnveisde0,05ede0,01;
Se N>7 podemos usar X
2
= K (N 1)W para calcular um valor de X
2
cuja
significncia, para g.l.=N1, possa ser comparada recorrendo Tabela do X
2

(AnexoI).

103
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA



CONSULTA DA SIGNIFICNCIA NA TABELA

PROVA DE SIGNIFICNCIA


PEQUENAS AMOSTRAS:

Utilizandose a Tabela esta d o valor de S para Ws significativos aos nveis de 0,05 e de 0,01.
Esta Tabela aplicvel para K de 3 a 20 e N de 3 a 7. Se um valor observado de S igual ou
superior ao valor exibido na Tabela para um dado nvel de significncia, ento H0 pode ser
rejeitadaquelenvel.
Por exemplo, vimos que quando K=3 chefes de pessoal fictcios classificaram N=6 candidatos a
emprego,aconcordnciadosjulgamentosfoiW=0,16.ATabelaindicaqueoSassociadoquele
valor de W (25,5) no significativo, uma vez que S crtico (103,9) maior do que S observado
(25,5).

QuandoN>7,adistribuioaproximadamenteumadistribuiodeQuiquadradocomg.l.=N
1,vindo:
S
X
2
=
_______________________
1/12 KN (N + 1)



Noteseque:
S

_____________________________
= K (N 1) W
1/12 KN (N + 1)

E, portanto, X
2
= K (N 1) W, pelo que se pode usar esta frmula que mais fcil para
determinaraprobabilidadeassociadaocorrncia,sobH0,dequalquervalortograndequanto
oWobservado.
SeovalordeX
2
observadoigualaousuperaovalordaTabela(AnexoI)paraumdadonvelde
significnciaeumparticularvalordeg.l.=N1,entoHo(nohrelaoentreosKconjuntosde
postos)podeserrejeitadaquelenvel.
104
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

INTERPRETAO DE W
Um valor elevado ou significativo de W pode ser interpretado como indicando que os
observadoresoujuizesestoaplicandoessencialmenteosmesmospadresaoatriburempostos
aos N indivduos em estudo. Frequentemente a sua ordenao conjunta pode servir como
padro,especialmentequandonohcritriosexternosrelevantesparaordenarosindivduos.
KendallsugerequeamelhorestimativadaverdadeiraclassificaodeNobjectos,quandoW
significativo,sejadadapelaordemdasvriassomasdepostos,Rj.Seseaceitaocritriosegundo
o qual diversos juizes concordarem na atribuio de postos a N indivduos, ento a melhor
estimativa da verdadeira ordenao desses indivduos segundo aquele critrio dada pela
ordemdasomadospostos.Assim,anossamelhorestimativaseriadadaaocandidatoaouf,pois
emambososcasosRj=0,omenorvalorobservado.
105
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


10. TESTES PARAMTRICOS PASSO-A-PASSO

10.1 CORRELAO

Quando estudamos um grupo relativamente a dois caracteres vemos, como j dissemos, que
podeexistirumarelaoentreeles.
Se medirmos os raios de vrias circunferncias e tambm os seus permetros verificamos que
existe uma relao entre eles que constante; neste caso temos dependncia funcional. Isto
querdizerqueexisteumafrmulaexprimindoamedidadosegundoemfunodadoprimeiro:
P=2r.
Suponhamos agora que registamos, durante todos os dias de um certo perodo de tempo, a
altura mxima da mar no porto da Figueira da Foz e o nmero de passageiros da linha Porto
Lisboa.Vsebemqueentreasduasestatsticasassimobtidasnoseencontranenhumarelao.
Diremosqueosdoiscaracteressoindependentes.
Masentreestesdoiscasosextremos,adependnciafuncionaleaindependncia,avidacorrente
ofereceumgrandenmerodeexemplosondeexisteumarelaoentreoscaracteres,masemque
existe uma impossibilidade de a formular por uma lei: o caso da dependncia estatstica.
Existe uma dependncia estatstica entre as pessoas que morrem com febre tifide e as pessoas
vacinadascontraestadoena.
Desde que os dois caracteres sejam tais que as suas variaes sejam sempre no mesmo sentido,
ou em sentidos contrrios, pressentimos que os caracteres estejam ligados entre si: dizemos,
ento,queelesestocorrelacionadosouqueexisteumacorrelaoentreeles.
EstesmtodosdecorrelaoforamcriadosporSirFrancisGalton,quetrabalhoujuntamentecom
Pearson,nosfinsdosculoXIX.
106
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

A correlao e a regresso so dois aspectos que andam sempre muito ligados, pertencendo
EstatsticaDescritiva.Assim,importafazermosadistinoentreeles:
A correlao pode ser definida como o grau de semelhana no sentido das variaes
entreosvalorescorrespondentesdosdoiscaracteres,isto,acorrelaopreocupasecom
adescriodarelaoentrevariveis.
A regresso usada quando tentamos predizer uma varivel quando conhecemos a
outra.

TIPOS DE COEFICIENTE DE CORRELAO


Basicamente,podemosconsiderardoistiposdecoeficientesdecorrelao:
Coeficiente de correlao momentoproduto de BrawaisPearson, cujo smbolo r, e
queumatcnicadeestatsticaparamtrica;
Coeficiente de correlao Rho de SpearmanRank, cujo smbolo , e que uma
tcnicadeestatsticanoparamtrica.
Devemossalientarque,paraoclculodascorrelaes,necessriotermossempreduasmedidas
paracadasujeito.

REPRESENTAO GRFICA
representaogrficadacorrelaochamamosdiagramadedispersodepontosouscatterplot
ouscattergrame,genericamente,tomaaseguinteforma:
W
80 70 60 50 40
Z
80
70
60
50
40

Figura 13: Diagrama de disperso de pontos ou scatterplot ou scattergram

107
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Suponhamosquetemosduassriesestatsticasformadaspelosvaloresxieyidedoiscaracteres.
Podemos fazer uma representao grfica dos dados representando todos os pontos (xi, yi) e
obtendoanuvemdepontos.
Segundoosdados,anuvemdepontospodeapresentardiversosaspectos.
Porexemploospontospodemdistribuirsenasemelhanadeumalinharectaoudeumacurva:
istosugereaexistnciadeumarelaofuncionalentreXeY.
Os pontos podem ser dispersos e colocados ao acaso no plano: caso das mars no porto da
FigueiradaFozeonmerodepassageirosnalinhaPortoLisboa(independncia).Tambmpode
acontecer que os pontos cubram uma poro do plano da qual se pode definir o contorno; esta
forma sugere que as duas variveis esto ligadas. Limitemonos ao caso mais simples emquea
nuvemtemumaformaalongadalembrandoumaelipseesuponhamosqueasuaorientaotal
que desde que X cresa, a varivel Y tambm cresce. A forma desta nuvem sugere a
possibilidadedaexistnciadeumarectatalqueosvaloresestimadosporestarecta,apartirdos
valoresdexi,sejamboasaproximaesdosvaloresdeyi.Nspodemosdeterminarpelomtodo
dosmnimosquadradosumarectatalqueasomadosquadradosdosdesviossejamnima.Esta
rectachamadarectaderegressodeYemXourectadeestimaodeYemX.
Mas,poderamos,deummodosemelhante,procurarumarectatalqueosvaloresdexestimados
aolongodestarecta,apartirdeyi,constituamigualmenteboasaproximaesdexi.Estarecta
chamadarectaderegressodeXemYourectadeestimaodeXemY.
Normalmente, estas rectas so distintas uma da outra. Elas sero confundidas quando existe
ligao funcional linear e so perpendiculares quando h independncia. Compreendemos,
assim, que a correlao entre os caracteres tanto maior quanto maior as rectas de regresso
estejammaisprximasumadaoutra.
108
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA



COEFICIENTE DE CORRELAO MOMENTO-PRODUTO DE BRAWAIS-PEARSON
Condiesdeutilizao:
Estetipodecoeficientedecorrelaoutilizasequando:
1. Asduasvariveissocontnuas;
2. Adistribuioseaproximadadistribuionormal;
3. prefervelparadistribuiesunimodais;
4. Escalaintervalardemedida.

Formulrio
(XY) - X Y
r= N.
sx sy

Ento:
-1 r 1


Interpretao:
Ocoeficientedecorrelaoobtidopodeseinterpretadocombaseem:
Para Cardoso:
r0,2 Correlaomuitobaixa(valoresdesprezveis)
0,2<r0,5 Correlaobaixa
0,5<r0,7 Valoressignificativos
0,7<r0,9 Altacorrelao
0,9<r1 Muitoaltacorrelao

Para Borg:
0,20<r0,35 Ligeira relao entre as variveis, embora j possam ser
estatisticamentesignificativas
0,35<r0,65 Correlaoestatisticamentesignificativaparaalmdonvelde1%
0,65<r0,85 Correlaesquetornampossveisprediesdogrupodequesodignas
r>0,85 ntimarelaoentreasvariveiscorrelacionadas
109
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


Para Byrman e Cramer,
seEta,r,Rho,phi:
0,2 Correlaomuitofracaesemsignificncia
0,2<r0,39 Correlaofraca
0,4<r0,69 Correlaomoderada
0,7<r0,89 Correlaoforte
0,9<r1 Correlaomuitoelevada

Coeficientedecorrelaodnos:
Adirecoqueindicadapelosinal+ou
A intensidade ou fora que dada pelo valor que varia entre 1 e 1. Se a correlao for
zeronoexistecorrelaoentreasvariveis(exemplo:cordosolhoseinteligncia).

Exemplo: Considere as classificaes obtidas por 10 alunos nas disciplinas
X, Y, Z e W:

Quadro 25: Correlao de Pearson


Est udant e X Y Z W XY XZ XW YZ YW ZW
1 75 75 45 45 5625 3375 3375 3375 3375 2025
2 70 70 50 50 4900 3500 3500 3500 3500 2500
3 70 70 50 50 4900 3500 3500 3500 3500 2500
4 65 65 55 55 4225 3575 3575 3575 3575 3025
5 60 60 60 60 3600 3600 3600 3600 3600 3600
6 60 60 60 60 3600 3600 3600 3600 3600 3600
7 55 55 65 65 3025 3575 3575 3575 3575 4225
8 50 50 70 70 2500 3500 3500 3500 3500 4900
9 50 50 70 70 2500 3500 3500 3500 3500 4900
10 45 45 75 75 2025 3375 3375 3375 3375 5625
600 600 600 600 36900 35100 35100 35100 35100 36900

Sabeseque: X=60 Y=60 Z=60 W=60

XY=36900 XZ=35100
s
2
x= 90 s
2
y= 90 s
2
z= 90 s
2
w= 90


a)CalculeocoeficientedecorrelaoentreXeYerepresentegraficamente.
b)CalculeocoeficientedecorrelaoentreXeZerepresentegraficamente.
110
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


Resoluo 47:
a)
(XY) - X Y
r=_____N______________
sx sy
Ento,
36900 _ 60x60
10
r =
_________________________________________
90 x 90
r= = 1
Existe uma relao positiva muito forte entre X e Y


b)
(XZ) - X Z
r= N . .
sx sZ
Ento,

35100 _ 60x60
10
r =
________________________________________
90 x 90
r= = -1
Existe uma relao negativa muito forte entre X e W, isto , quanto maior X menor Y e vice
versa.

10.2 TESTE T DE STUDENT (NO RELACIONADO)

CARACTERSTICAS DO TESTE T:
1. Testeparaacomparaodemdias;
2. Distribuio com forma leptocrtica, isto , as caudas da distribuio so mais
grossasdoquenadistribuionormal;
3. Contnua;
4. Simtrica;
5. Deformacampanular;
6. Variademaisinfinitoamenosinfinito;
7. Mdia=0edesviopadrodavariveldeacordocomn;
111
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

8. OusodeTpressupequeavarivelobservacionaltenhanapopulao(deondefoi
colhidaaamostra)distribuionormal;
9. No existe uma distribuio t, mas sim uma famlia. Para cada n tamanho da
amostraexisteumadistribuio(umacurva)especfica;
10. medidaquencresce,ttendeaz(aaproximaoentretezcomeaaficarboaa
partirden>=30).

Requisitosparautilizarotestet:
1.Quandoasduasamostrastmamesmahomogeneidadedevarincia;
2.Osdoisgrupostenhamamesmadistribuioaproximadanormalleptocrtica;
3.Escalademedidaintervalar.


QUANDO UTILIZAR
Utilizase para designs experimentais com duas situaes testando uma varivel independente,
quandonessassituaesseencontramsujeitosdiferentesdesignsnorelacionados.
O teste t no relacionado equivalente ao teste no paramtrico U de MannWhitney; ambos
comparamdiferenasentredoisgrupos.

OBJECTIVO
O objectivo comparar a quantidade da variabilidade devida s diferenas previstas nos
resultadosentredoisgruposcomavariabilidadetotalnosresultadosdossujeitos.Asdiferenas
previstassocalculadascomoumadiferenaentreosresultadosmdiosentreosdoisgrupos.
Aestatsticatrepresentaotamanhodadiferenaentreasmdiasparaosdoisgrupos,tomando
em considerao a varincia total. Para que o valor observado de t seja significativo ter de ser
igualousuperioraosvalorescrticosdetapresentadosnatabela.
112
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

INSTRUES PASSO-A-PASSO
Elevaraoquadradocadaresultadoindividualparaambososgruposemseparado:
1. Adicionarostotaisdosresultadosaoquadradoparacadagrupo;
2. Elevaraoquadradotodososresultadosindividuaisparacadagrupo;
3. Calcularamdiaparacadagrupo;
4. Calculart:


1 - 2
t = _________________________________________________________________
x1
2
- ( x1)
2
+ x2
2
- ( x2)
2

______ ______
n1 n2 1 1
____________________________________ __ + __
(n1 - 1) + (n2 - 1) n1 n2

emque:
1=mdiadogrupo1
2=mdiadogrupo2
x1
2
=somadosquadradosparaogrupo1
x2
2
=somadosquadradosparaogrupo2
(x1)
2
=resultadostotaisdogrupo1aoquadrado
(x2)
2
=resultadostotaisdogrupo2aoquadrado

n1=nmerodesujeitosdogrupo1
n2=nmerodesujeitosdogrupo2

Calcularg.l.:
g.l.=(n11)+(n21)
Setobservado>tcrticorejeitaseHo
Setobservado<tcrticonoserejeitaHo

113
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


Exemplo: para verificar se duas dietas para emagrecersoigualmenteeficazes,ummdicoseparouao
acaso um conjunto de pacientes em dois grupos. Cada paciente seguiu a dieta designada para o seu
grupodurante4meses.Omdicoregistouaperdadepesoemkgdecadapacienteporgrupo.Osdados
estoapresentadosnoquadroquesesegue:

Quadro 26: Teste t no relacionado


______________________________________________________________________________________
Grupo 1 (dieta 1) Grupo 2 (dieta 2)
______________________________________________________________________________________
Resultados Resultados Resultados Resultados
ao quadrado ao quadrado
10 100 2 4
5 25 1 1
6 36 7 49
3 9 4 16
9 81 4 16
8 64 5 25
7 49 2 4
5 25 5 25
6 36 3 9
5 25 4 16
_____________________________________________________________________________________
Total x
1
= 64 x
1
2
= 450 x
2
= 37 x
2
2
= 165
Mdia
1
= 6,4
2
= 3,7

InstruesPassoaPasso:
1.construiratabela

2.x1=64
x2=37
x1
2
=450
x2
2
=165

3.(x1)
2
=64X64=4096
(x2)
2
=37X37=1369

4.1=6,4
2=3,7
114
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA




6,4 - 3,7
t = _________________________________________________________ =

450 - 4096 + 165 - 1369
______ ______
10 10 1 1
_______________________________ __ + __
9 + 9 10 10

2,7
= ______________ = 3,547

3,806. 0,2

6. g.l. = (n1 - 1) + (n2 - 1) = (10 - 1) + (10 - 1) = 18

O valor de t observado (3,547) superior ao valor crtico de 2,878 (Anexo VII), indicando um
nvel de significncia de p < 0,05 para uma hiptese unicaudal ou p < 0,01 para uma hiptese
bicaudal.


10.3 TESTE T DE STUDENT (RELACIONADO)


Quandoutilizar:
Utilizase para designs experimentais com duas situaes testando uma varivel independente,
quando os mesmos sujeitos (ou emparelhados) se encontram em ambas as situaes design
relacionado.OtestetrelacionadoequivalenteaotestenoparamtricodeWilcoxon.

OBJECTIVO
O objectivo compararasdiferenasentreasduassituaesexperimentaiscomavariabilidade
total nos resultados. Quando os mesmos sujeitos so usados em ambas as situaes podem
compararse pares de resultados obtidos por cada indivduo quando sujeito a ambas as
situaes.
115
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

A estatstica t apresenta o tamanho das diferenas entre os resultados dos sujeitos para as duas
situaes.Paraquesejasignificativoovalordetterdeserigualousuperioraosvalorescrticos
databela(AnexoVII).

INSTRUES PASSO-A-PASSO
1. Calcular as diferenas entre os resultados dos sujeitos subtraindo os resultados da situao B
paraasituaoA
2.Elevaressasdiferenasaoquadrado
3.Calcularosomatriodasdiferenasobtidas(d)
4.Calcularosomatriodoquadradodasdiferenas(d
2
)
5.Elevaraoquadradoasdiferenastotais(d)
2
6.Calculart:
d
t =
___________________________________
N d
2
( d)
2
N - 1

emque
d=somadasdiferenasdosresultadosAeB
d
2
=somadosquadradosdasdiferenas
(d)
2
=somadasdiferenaselevadasaoquadrado
N=nmerodesujeitos

7.Calcularg.l.:
g.l.=N1

Setobservado>tcrticorejeitaseH0
Setobservado<tcrticonoserejeitaH0
116
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA



Exemplo: Para verificar se a eficcia de uma dieta era influenciada pelo ministrardeumfrmaco,um
mdico decidiu administrar, aumgrupodeindividuosqueotinhamprocuradoparaperderpeso,um
placebo em conjunto com uma dieta que j havia administrado um ms antes aos mesmos sujeitos.
Referiu aos seus casos que aquele medicamento servia para perder apetite e ajudava a queimar
gorduras.
Registouaperdadepesoquetinhaocorridonos30diasantecedentestomadadeplaceboetrintadias
apsoplacebo.Osresultadosestonoquadroquesesegue



Quadro 27: Teste t relacionado

Sujeito Situao A Situao B d d
2
(com placebo) (s com dieta) (A-B)
____________________________________________________________________________
1 10 2 8 64
2 5 1 4 16
3 6 7 -1 1
4 3 4 -1 1
5 9 4 5 25
6 8 5 3 9
7 7 2 5 25
8 5 5 0 0
9 6 3 3 9
10 5 4 1 1
___________________________________________________________________________
Total 64 37 d=27 d
2
=151
Mdia6,43,7
Resoluo50:
InstruesPassoaPasso:
1.construirtabela
2.calcularasmdias
3.d=27
4d
2
=151
5.(d)
2
=27x27=729


6. proceder aos calculos
27 27
t =
____________________________
- =
_______________
= 27 / 9,316 = 2,90
10 x 151 (27)
2
86,78
10 - 1


7. g.l. = N - 1 = 10 - 1 = 9

117
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Comoovalorobservadodetde2,90superioraovalorcrticode2,821aonveldesignificncia
de p < 0,01 (unicaudal) ou p < 0,02 (bicaudal), e a mdia de perda de peso superior com o
placebo,omdicoconcluiuqueoefeitodeplacebopositivonaperdadepeso

Oponto10.3explicacomocompararmdiasdeduaspopulaes,combaseemamostrasdessas
populaes.Massvezesprecisocompararmdiasdemaisdeduaspopulaes.Porexemplo,
para verificar se pessoas com diferentes nveis socioeconmicos, isto , alto, mdio e baixo tm,
emmdia,omesmopesocorporal,precisocompararmdiasdetrspopulaes.
ParacompararmdiasdemaisdeduaspopulaesaplicaseotesteF,naformaqueaseguirse
descreve, desde que a varivel em estudo tenha distribuio normal ou aproximadamente
normal.Masantesdemostrarcomosefazesseteste,convmapresentarumexemplo.
Imaginequequatrogrupos,todascomcincoelementos,conduziramaosdadosapresentadosnoquadro
28. As mdias dessas amostras esto na ltima linha desse quadro. Ser que as diferenas das mdias
dasamostrassosuficientementegrandesparaquesepossaafirmarqueasmdiasdaspopulaesso
diferentes?Pararesponderaestapergunta,precisoumtesteestatstico.


Quadro 28: Dados de 4 amostras e respectivas mdias

A B C D
11 8 5 4
8 5 7 4
5 2 3 2
8 5 3 0
8 5 7 0
40 25 25 10
8 5 5 2

118
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA



10.4 ANLISE DE VARINCIA

10.4.1 Anlise da Varincia com Igual Tamanho

Se a varivel em estudo tem distribuio normal ou aproximadamente normal, para comparar


maisdeduasmdiasaplicaseotesteF.
Primeiro,precisoestudarascausasdevariao.Porqueosdadosvariam?Umaexplicaoo
facto de as amostras provirem de populaesdiferentes.Outraexplicaooacaso,porqueat
mesmoosdadosprovenientesdeumamesmapopulaovariam.
O teste F feito atravs de uma anlise de varincia, que separa a variabilidade devido aos
tratamentos (no exemplo, devido s amostras terem provindo de populaes diferentes) da
variabilidaderesidual,isto,devidoaoacaso.ParaaplicarotesteFprecisofazerumasriede
clculos,queexigemconhecimentodanotao. .
O quadro 29 apresenta os dados de k tratamentos, cada um com r repeties (no exemplo,
denominamse repeties os elementos da mesma amostra). A soma das repeties (r) de um
mesmotratamentoconstituiototaldessetratamento(T).Ototalgeral(T)dadopelasomadosk
totaisdetratamentos.

Quadro 29: Notao para anlise da varincia

1 2 3 . . . K Tot al
x
11
X
21
X
31
x
k1

x
12
X
22
X
32
. . . x
k2

. . . . .
. . . . .
. . . . .
x
1r
X
2r
X
3r
X
kr

Tot al T
1
T
1
T
1
T
1
T=x
N. de r epet i es r r r r N=kr
Mdi a
1

3

k




Parafazeraanlisedevarinciaprecisocalcularasseguintesquantidades:
119
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

1.passo:
a) osgrausdeliberdade(gl)dosgrupos:k1
b) gldototal:n1
c) gldosresiduos:(n1)(k1)=nk

2.passo:
a) calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedividido
pelonmerodedados.

C = (x)
2
n
FORMULA:


b) calcularaSomadosQuadradosTotal(SQT)


SQT = x
2
-C
FORMULA:

c) calcularaSomadoQuadradodoTotaldecadarepetio(SQTr)


SQTr = T
2
- C
r
FORMULA:


d) calcularaSomadosQuadradosdosResduos(SQR)


SQR = SQT-SQTr
FORMULA:

e) calcularoQuadradomdiodoTotaldecadarepetio(QMTr)


QMTr = SQTr
k-1
FORMULA:


f) calcularoQuadradomdiodoTotaldoResiduo(QMR)


QMR = SQR
n-k
FORMULA:
120
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


g) calcularovalordeF


F = QMTr
QMR
FORMULA:


3.Passo:compararoFcalculadocomovalordadonatabeladeF,aoniveldesignificncia
estabelecido,observandoosk1grausdeliberdadenonumeradoreosnkgrausdeliberdadeno
denominador(colunadaesquerda).

Exemplo:Umprofissionaldesaderecmcontratadoparaacompanharumconjuntodeatletasdealta
competio, verificou, pelos registos clnicos deixados pelo seu antecessor, que alguns atletas com o
mesmo tipo de leso (em grau e extenso) tinham mais recidivas que outros, apesar das condies de
treino e o tempo de recuperao ser o mesmo. Colocou a hiptese de que tal acontecimento se podia
deversdiferentesteraputicasqueeramutilizadasparatratarasmesmasleses.Osresultadospodem
serobservadosnoquadroquesesegue:


Quadro 30: recidivas por tratamento
Tratamento
A
Tratamento
B
Tratamento
C
Tratamento
D
11 8 5 4
8 5 7 4
5 2 3 2
8 5 3 0
8 5 7 0
40 25 25 10
8 5 5 2


1.passo:
a) osgrausdeliberdade(gl)dosgrupos:k1=41=3
b) gldototal:n1=201=19
c) gldosresiduos:nk=204=16
121
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

2.passo:
a) calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedivididopelo
nmerodedados.




C = (x)
2
= (11+8+5+4+8+5+7+4+5+2+3+2+8+5+3+8+5+7)
2
= 100
2
= 500
N 20 20
b) calcularaSomadosQuadradosTotal(SQT)







SQT = x
2
-C =
11
2
+8
2
+5
2
+4
2
+8
2
+5
2
+7
2
+4
2
+5
2
+2
2
+3
2
+2
2
+8
2
+5
2
+3
2
+8
2
+5
2
+7
2
- 500
= 658-500
=158
c) calcularaSomadoQuadradodoTotaldecadarepetio(SQTr)







SQTr = T
2
C = 40
2
+25
2
+25
2
+10
2
- 500
R 5
= 590-500
= 90
d) calcularaSomadosQuadradosdosResduos(SQR)





SQR = SQT-SQTr = 158-90
= 68
e) calcularoQuadradomdiodoTotaldecadarepetio(QMTr)





QMTr = SQTr = 90 = 30
k-1 3
f) calcularoQuadradomdiodoResduo(QMR)






QMR = SQR = 68 = 4,25
n-k 16
g) calcularovalordeF




F = QMTr = 30 = 7,06
QMR 4,25
122
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

3.passo:irtabelaFparaumnveldesignificncia(p)de5%(0,05)eobservarqualoFterico
para 3 e 16 graus de liberdade (anexo). Como o valor calculado (7,06) maior que o da tabela
(3,24),conclumosqueasmdiasdasrecidivasdiferememfunodotratamento,paraumnvel
designificnciade0,05.
A acompanhar este comentrio, os valores calculados devem ser apresentados num quadro, da
seguinteforma:

Quadro 31: ANOVA


Causas de
var i ao
gl SQ QM F p
Tr at ament os 3 90 30 <0, 05
Res duo 16 68 4, 25
7, 06

Tot al 19 158

Mas,comosepodeobservar,apesardatabelamostrarqueexistemdiferenassignificativas,no
nosinforma,quetratamentosqueproduzemdiferenasequaissosemelhantes.Semprequeas
diferenas so significativas, e s nesse caso, temos que proceder s comparaes posteriori
(PostHoc). Podemonos socorrer de diversos testes (LSD; Bonferroni; Sidak; Scheffe; SNK;
Tukey; etc.), a grande diferena entre eles reside no tipo de distribuio em que assentam e no
tipo de ajustamento). Apresentaremos de seguida apenas o teste de Tukey, por ser dos mais
utilizadoseomaissimplesdecalcular,quandorecorremosaoclculomanual.


10.4.1.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS

O teste Tukey permite estabelecer a diferena mnima significante, ou seja, a menor diferena
entre as mdias que deve ser tomada como significativa em determinado nvel de significncia.
Essadiferena(dms)dadapor:

dms =q QMR
r

Ondequmvalordadoemtabela(Anexo____)
QMRoquadradomdiodoresiduodaANOVA
ronmeroderepeties
123
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

assim,seconsultarmosatabelaverificamosqueoqparacompararquatrotratamentoscom16gl
noresiduode4,05.comoQMR=4,25er=5,temos:

dms =4,05 4,25 = 3,73


5



DeacordocomotestedeTukey,duasmdiassoestatisticamentediferentessemprequeovalor
absolutodadiferenaentreelasforigualousuperioraovalordadms.
Passemosentoobservaodosvalores:

Quadro 32: post-hoc das recidivas
Par es de mdi as
Val or absol ut o da
di f er ena
dms p
A- B ( 8- 5) 3 ns
A- C ( 8- 5) 3 ns
A-D (8-2) 6 <0,05
B- C ( 5- 5) 0 ns
B- D ( 5- 2) 3 ns
C- D ( 5- 2) 3
3, 73
ns

fcil de observar que s existem diferenas entre a mdia dos tratamentos A e a mdia dos
tratamentos D, em que o tratamento D aquele com que se obtm, significativamente, menos
recidivas
124
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA


10.4.2 ANLISE DE VARINCIA COM DIFERENTES
TAMANHOS

Opesquisador,nemsempretemamostrasdomesmotamanho,mesmoassimpossivelconduzir
uma anlise da varincia (ANOVA). Alis todos os clculos, com excepo SQTr, so feitos da
mesmaformaemambasassituaes.
Assimemvezdefazerasomadosquadradospelafrmula
SQTr = T
2
- C
r



Utiliza:

SQTr = T
1
2
+ T
2
2
++ T
k
2
- C
r
1
r
2
r
k

Onde C a correco definida anteriormente
FORMULA:




Paramaisfcildeentenderobserveoseguinteexemplo:


Quadro 33: mdias por tratamento
Tratamento A Tratamento B Tratamento C
15 23 19
10 16 15
13 19 21
18 18 14
15 16
84 76 85


1.passo:
a) osgrausdeliberdade(gl)dosgrupos:k1=31=2
b) gldototal:n1=151=14
c) gldosresiduos:nk=142=12
125
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

2.passo:
a) calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedividido
pelonmerodedados.





C = (x)
2
= 245
2
= 4001,67
n 15
b) calcularaSomadosQuadradosTotal(SQT)




SQT = x
2
-C = 15
2
+10
2
+13
2
++16
2
4001,67
=159,33
c) calcularaSomadoQuadradodoTotaldecadarepetio(SQTrat)









SQTrat = T
1
2
+ T
2
2
++ T
k
2
- C
r
1
r
2
r
k
SQTr = 84
2
+76
2
+85
2
4001,67
6 4 5
= 63,33
d) calcularaSomadosQuadradosdosResduos(SQR)




SQR = SQT-SQTr = 159,33-63,33
= 96
e) calcularoQuadradomdiodoTotaldecadarepetio(QMTr)





QMTr = SQTr = 63,33 = 31,67
k-1 2
f) calcularoQuadradomdiodoResduo(QMR)






QMR = SQR = 96 = 8
n-k 12
g) calcularovalordeF




F = QMTr = 31,67 = 3,96
QMR 8
126
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

3.passo:irtabelaFparaumnveldesignificncia(p)de5%(0,05)eobservarqualoFterico
para 2 e 12 graus de liberdade (anexo). Como o valor calculado (3,96) maior que o da tabela
(3,89), conclumos que as mdias dos sujeitos diferem em funo do tratamento, para um nvel
designificnciade0,05.
Osvalorescalculadosdevemserapresentadosdaseguinteforma:


Quadro 34: ANOVA
Causas de var i ao gl SQ QM F p
Tr at ament os 2 63, 33 31, 67
Res duo 12 96 8
3, 96 <0, 05
Tot al 14 159, 33

Como as diferenas so significativas, temos que proceder s comparaes posteriori (Post


Hoc).OresultadodotestedeTukeyoseguinte:

10.4.2.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS



OtesteTukeyparaamostrascomtamanhosdiferentesdadapelaseguintefrmula:

dms =q 1 + 1 QMR
r
i
r
j
2

Nocasodoexemplo,paracompararamdiadeAcomamdiadeBtemse:

dms (A;B) =3,77 1 + 1 8,00
6 4

2
dms (A;B) =4,87




Nocasodoexemplo,paracompararamdiadeAcomamdiadeCtemse:

dms (A;C) =3,77 1+ 1 8,00
6 5

2
dms (A;C) =4,57




Nocasodoexemplo,paracompararamdiadeBcomamdiadeCtemse:
127
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

dms (B;C) =3,77 1 + 1 8,00
4 5

2
dms (B;C) =5,06


DeacordocomotestedeTukey,duasmdiassoestatisticamentediferentessemprequeovalor
absolutodadiferenaentreelasforigualousuperioraovalordadms.
Passemosentoobservaodosvalores:

Quadro 35: post-hoc
Par es de mdi as
Val or absol ut o da
di f er ena
dms p
A-B |14-19| = 5 4,87 <0,05
A- C | 14- 17| = 3 4, 57 ns
B- C | 19- 17| = 2 5, 06 ns

ConcluisequeemmdiaAsignificativamentediferentedeB,aonveldesignificnciade0,05.

128
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

ANEXOS

129
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Anexo I
TABELADOQUIQUADRADO(X
2
)

130
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Anexo II
TABELADEU

131
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Anexo III
TABELADEWILCOXON

132
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Anexo IV
TABELAH

133
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Anexo V
TABELASDEFRIEDMAN

134
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Anexo VI
TABELAS(TABELADEKENDAL)

135
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Anexo VII
TABELAT
136
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Anexo VIII
TABELAZ

137
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Anexo IX
TABELAF

138
Margarida Pocinho e Joo Paulo de Figueiredo
ESTATSTICAEBIOESTATSTICA

Anexo X
TABELADOSVALORESDEq

139
Margarida Pocinho e Joo Paulo de Figueiredo

Você também pode gostar