Você está na página 1de 130

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/315762853

(Bio) Estatística: Teoria e exercicios passo-a-passo

Book · April 2017

CITATIONS READS
2 1,472

1 author:

Margarida Pocinho
Escola Superior de Tecnologia da Saúde de Coimbra / Instituto Politécnico de Coimbra
81 PUBLICATIONS   132 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Psicologia View project

Riscos psicossociais em docentes do ensino superior. Comparativo entre instituição pública e privada de ensino. View project

All content following this page was uploaded by Margarida Pocinho on 04 February 2020.

The user has requested enhancement of the downloaded file.


(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Margarida Pocinho

(Bio) Estatística: Teoria e


exercícios passo-a-passo

2018
1

Capa: Paulo Santos


(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Estatística:
Teoria e exercicios passo-a-passo

Este manual apresenta as estatisticas paramétricas e


não-paramétricas passo-a-passo; critérios de decisão
para verificação de hipoteses. Pretende-se com esta
compilação de testes e teorias, capacitar os alunos e as
alunas para a aplicação estatística à investigação em
ciências humanas (sociais, médicas, psicológicas, etc) e
biológicas

Margarida Pocinho
28-06-2018

2
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Índice Geral

I - INTRODUÇÃO............................................................................................................. 6
1. NOÇÕES GERAIS ........................................................................................................ 9
2. POPULAÇÃO E AMOSTRA ..................................................................................... 10
3. MÉTODOS DE AMOSTRAGEM ............................................................................. 12
3.1 Amostragens Probabilísticas e Não-Probabilísticas............................................ 12
3.2 Determinação do Tamanho da Amostra............................................................... 15
3.3 Indivíduo ou Unidade Estatística ......................................................................... 19
3.4 Variáveis ............................................................................................................... 20
4. ESTATÍSTICA DESCRITIVA .................................................................................. 24
4.1 Parâmetro e dado estatístico................................................................................ 24
4.2 Representação de uma variável estatística .......................................................... 25
4.3 Redução de uma variável estatística .................................................................... 28
Medidas de dispersão ................................................................................................. 35
5. CARACTERÍSTICAS DA DISTRIBUIÇÃO NORMAL ........................................ 44
5.1 A CURVA NORMAL E OS DESVIOS- PADRÃO ................................................................ 46
6. ESTATÍSTICA PARAMÉTRICA E NÃO PARAMÉTRICA ................................ 49
6.1. TESTES PARAMÉTRICOS PASSO-A - PASSO .................................................................. 56
6.1.1 Teste t de Student (não relacionado) ................................................................. 56
6.1.2 Teste t de Student (relacionado) ........................................................................ 59
6.1.3 Correlação momento-produto de brawais-pearson .......................................... 62
6.1.4 Análise da variancia de um critério (ANOVA).................................................. 66
5. TESTES NÃO PARAMÉTRICOS PASSO- A- PASSO.............................................................. 74
5.1 Teste do qui-quadrado.......................................................................................... 75
5.2 Procedimentos para ordenação de resultados ..................................................... 80
5.3 Testes para duas amostras independentes ........................................................... 80
5.4 Teste U de Mann-Whitney .................................................................................... 82
6. TESTES PARA DUAS AMOSTRAS RELACIONADAS .......................................................... 93
6.1 Prova de mcnemar para a significância de mudanças ........................................ 94
6.2 Correcção de continuidade .................................................................................. 98
6.3 Teste dos sinais de Wilcoxon ................................................................................ 99
7. TESTES PARA K AMOSTRAS INDEPENDENTES ............................................................... 89
7.1 Teste de Kruskal-Wallis........................................................................................ 89
8. TESTES PARA K AMOSTRAS RELACIONADAS .............................................................. 102
3
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
8.1 Prova de Cochran............................................................................................... 102
8.2 Teste de Friedman .............................................................................................. 106
9. MEDIDAS DE CORRELAÇÃO E SUAS PROVAS DE SIGNIFICÂNCIA ................................. 109
9.1 Coeficiente de correlação rho de spearman-rank .............................................. 109
9.2 O coeficiente de concordância de Kendall......................................................... 111
ANEXOS ........................................................................................................................ 116

4
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
INDICE DE TABELAS E FIGURAS

TABELA 1: DISTRIBUIÇÃO DE FREQUENCIAS ........................................................................................ 26


TABELA 2: EXERCÍCIO DE DISTRIBUIÇÃO DE FREQUÊNCIAS .................................................................... 26
TABELA 3: QUADRO DE FREQUÊNCIAS DE CLASSES .............................................................................. 28
TABELA 4: CÁLCULO DO D ESVIO M ÉDIO ............................................................................................ 39
TABELA 5: CÁLCULO DO D ESVIO M ÉDIO PARA CLASSES ....................................................................... 39
TABELA 6: CÁLCULO DA VARIÂNCIA .................................................................................................. 40
TABELA 7: CÁLCULO DA VARIÂNCIA .................................................................................................. 41
TABELA 8: GRELHA DE DECISÃO DOS TESTES ...................................................................................... 55
TABELA 9 ..................................................................................................................................... 58
TABELA 10: VALORES CRITICOS DE T STUDENT ................................................................................... 60
TABELA 11: EXPERIMENT FARMACO VS PLACEBO ................................................................................. 61
TABELA 12 ................................................................................................................................... 65
TABELA 13: RECIDIVAS POR TRATAMENTO .......................................................................................... 68
TABELA 14: ANOVA ...................................................................................................................... 70
TABELA 15: POST-HOC DAS RECIDIVAS .............................................................................................. 71
TABELA 16: MÉDIAS POR TRATAMENTO .............................................................................................. 72
TABELA 17: TESTE TUKEY ............................................................................................................... 73
TABELA 18: TABELA DE CONTINGÊNCIA (C ROSSTAB)........................................................................... 77
TABELA 19: R ESULTADOS DO REGISTO DAS QUEIXAS ........................................................................... 87
TABELA 20: NÚMERO DE IDEIAS RELEMBRADAS PARA TRÊS TIPOS DE TESTES .......................................... 90
TABELA 21: ORDENAÇÃO PARA AMOSTRAS R ELACIONADAS OU E MPARELHADAS ...................................... 94
TABELA 22 ................................................................................................................................... 95
TABELA 23: TABELA DE QUATRO CASAS PARA A PROVA DE SIGNIFICÂNCIA DE MUDANÇAS........................... 97
TABELA 24: R ESULTADOS DO TESTE DO VOCABULÁRIO ........................................................................ 99
TABELA 25 ................................................................................................................................. 103
TABELA 26: D ECISÃO: .................................................................................................................. 104
TABELA 27: AVALIAÇÃO DE TRÊS TIPOS DE ILUSTRAÇÕES ................................................................... 106
TABELA 28 ................................................................................................................................. 111
TABELA 29: POSTOS ATRIBUÍDOS A 6 CANDIDATOS A EMPREGO POR 3 CHEFES DE PESSOAL .................... 112

FIGURA 1: POPULAÇÃO E A MOSTRA .................................................................................................. 11


FIGURA 2: AMOSTRA ESTRATIFICADA ................................................................................................ 13
FIGURA 3: CONVERSÃO DOS NÍVEIS DE CONFIANÇA EM DESVIOS PADRÃO ................................................ 15
FIGURA 4: CURVA SIMÉTRICA ........................................................................................................... 33
FIGURA 5: CURVA ASSIMÉTRICA À DIREITA ......................................................................................... 33
FIGURA 6: CURVA ASSIMÉTRICA À ESQUERDA ..................................................................................... 33
FIGURA 7: D ISTRIBUIÇÃO NORMAL .................................................................................................... 45
FIGURA 8: IDENTIFICAR OS TESTES ESTATISTICOS ............................................................................... 53
FIGURA 9: D IAGRAMA DE DISPERSÃO DE PONTOS OU SCATTERPLOT OU SCATTERGRAM ............................. 63
FIGURA 10: D IAGRAMA DE DISPERSÃO DE PONTOS OU SCATTERPLOT OU SCATTERGRAM NÃO LINEAR .......... 63

5
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

I - Introdução

Desde séculos o homem tem, muitas vezes, tomado notas de coisas e de pessoas, não com o único
fim de acumular números, mas com a esperança de utilizar os dados do passado para a resolução de
problemas do presente assim como para a previsão de acontecimentos futuros. No entanto, o sucesso
quanto a este objectivo só foi possível em data muito recente: só no final do século XIX e, sobretudo,
no princípio do século XX é que, com a aplicação de probabilidades aos problemas sobre a interpretação
dos dados recolhidos, foi possível resolver alguns deles.
O jogo foi o motor de arranque e o primeiro beneficiado com as probabilidades. De facto, por volta
de 1200 a.C. existiam dados com forma cúbica feitos a partir de ossos. No entanto, o jogo atingiu uma
grande popularidade com os gregos e os romanos. Na Idade Média, a igreja católica era contra o jogo
dos dados, não pelo jogo em si, mas pelo vício de beber e dizer palavrões que acompanhavam os jogos.
Os jogadores inveterados do século XVI procuravam cientistas de renome para que estes lhes dessem
fórmulas mágicas para garantir ganhos substanciais nas mesas de jogo.
O contributo decisivo para o início da teoria das probabilidades foi dada pela correspondência
trocada entre os matemáticos franceses Blaise Pascal e seu amigo Pierre de Fermat, em que ambos, por
diferentes caminhos, chegaram à solução correcta do célebre problema da divisão das apostas em 1654.
Quis o acaso que o austero Pascal conhecesse Méré, jogador mais ou menos profissional, que lhe
contava as suas disputas com os adversários em problemas de resolução controversa sobre dados e
apostas. Um desses problemas veio a interessar Pascal 1 . Depois de reflectir sobre ele, trocou uma
interessante correspondência sobre o assunto com o matemático Fermat, seu amigo. Essas cartas
históricas, que contêm as reflexões conjugadas de ambos, são os documentos fundadores da Teoria das
Probabilidades.
Mais tarde, a Teoria das Probabilidades desenvolveu-se e através dos trabalhos de Jacques Bernoulli
(1654-1705), Moivre (1667-1759) e Thomas Bayes(1702-1761). A Bernoulli deveu-se a publicação do
livro “Ars Conjectandi” que foi publicado em 1713 e foi o primeiro a ser tratado inteiramente às teorias
das probabilidades. Nesta obra inclui diversas combinações e das permutações, os teoremas binomial e

1
Em meados do século XVII, o jogador francês, o “Chevalier de Méré”, que vinha calmamente ganhando a vida apostando o seu
bom dinheiro em jogos de dados, decidiu oferecer a mesma quantia para uma aposta diferente. Vinha garantindo, de início, um seis em
quatro jogadas de um só dado; passou, então, a apostar que conseguiria pelo menos um duplo seis em vinte e quatro jogadas de dois
dados. Mas, percebeu que os seus lucros começaram a diminuir e sobre isso procurou aconselhar-se com o seu amigo Pascal. Este
explicou a Méré que ele não estava a ser vítima de uma crise de má sorte mas, apenas, da acção imutável das probabilidades: enquanto
a possibilidade de conseguir um 6 é uma em 3*8 jogadas de um só dado, a possibilidade para um duplo 6 é de uma em 24*61 jogadas
de dois dados

6
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
polinomial e a lei dos grandes números (hoje chamado Teorema de Bernoulli). A lei dos grandes
números pode enunciar-se do seguinte modo:
“ A frequência relativa de um acontecimento tende a estabilizar-se nas vizinhanças de um valor
quando o número de provas cresce indefinidamente”
Moivre introduziu e demostrou a lei normal. A Bayes deve-se o cálculo das chamadas
probabilidades e das causas. Ou seja, este cálculo consistiu em determinar a probabilidade de
acontecimentos perante certas condições iniciais.
Na segunda metade do século XVIII e na primeira metade do século XIX(1749-1827) elaborou uma
posição concisa e sistemática dos acontecimentos probabilísticos e demonstrou uma das formas do
“Teorema das Probabilidades”.
Laplace escreveu: “A teoria das probabilidades, no fundo, não é mais do que o bom senso traduzido
em cálculo, permite calcular com exactidão aquilo que as pessoas sentem por uma espécie de instinto.É
natural como tal ciência, que começou com estudos sobre jogos de azar, tenha alcançado os mais altos
níveis do conhecimento humano.”
Em 1812, Laplace publicou uma importante obra de Teoria Analítica das Probabilidades, onde
sistematizou os conhecimentos da época e onde se encontra definida a Lei de Laplace..
Destaca-se a participação de Gauss (1777-1855) no aprofundamento da “Lei Normal” e de Poisson
na sua “Teoria da lei dos grandes números e da lei de repartição”.
No século XIX e princípio do século XX a teoria das probabilidades tornou-se um instrumento
eficaz, exacto e fiável do conhecimento.
Surge a célebre escola de S. Petersburgo. Desta escola resultaram grandes nomes, tais como:
Tchébychev 81821-1894), Markov (1856-1922) e Liapounav (1857-1918).
À escola de S. Petersburgo sucedeu a escola soviética na qual destaca-se a participação de
Kolmogorov (1903-1987) que axiomatizou correctamente a teoria das probabilidades.
A História regista censos, para fins de alistamento militar e de colheita de impostos, realizados há
mais de 4000 mil anos, como é o caso do censo do imperador Yao na China, em 2200 A.C.. Nesta altura
a estatística era simplesmente um trabalho de exibição e síntese dos dados referentes colhidos pelos
censos. Esta estatística não envolvia nenhum trabalho probabilístico, pois todos os objectos do universo
envolvido (a população) eram observados ou medidos.
Adolph Quéletet em 1850 foi o primeiro a utilizar uma amostra no seu estudo, e, a partir da análise
probabilística, estender os resultados da amostra a toda a população.
A partir dele, rapidamente surgiu a ideia de dar um embasamento mais rigoroso para o método
científico, a partir de uma fundamentação probabilista para as etapas da colecta e a da análise indutiva
de dados científicos. Hoje esta concepção é essencial no trabalho científico, contudo só atingiu um nível
prático no início do sec XX desenvolvendo-se em 3 grandes frentes:
A Estatistica estuda técnicas quem permitem quantificar probabilisticamente as incertezas
envolvidas ao induzirmos para um universo observações feitas numa amostra do mesmo – Inferência
Estatística. Os pais desta técnica são J. Neyman e Karl Pearson. Embora os estudos de Neyman e
7
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Pearson estivessem associados a questões de hereditariedade, os métodos e expressões que criaram, tais
como “hipótese nula” e a “nível de significancia” fazem hoje parte da rotina diária de todo o estatístico
e cientista.
Trata das precauções que o cientista deve tomar, antes de iniciar as suas observações ou medidas,
de modo a que se possa dar uma boa probabilidade de que os objectivos pretendidos sejam atingidos –
o delineamento das experimentações científicas. O pai desta técnica é R.A. Fisher que ao trabalhar na
selecção genética de plantas agrícolas, desenvolveu uma imensa quantidade de resultados básicos sobre
o delineamento de experimentações, divulgando-os em dois livros históricos: Statistical Methods for
Research Wakers, 1925, e The Design of Experiments, publicado em 1935.
Suponhamos que um cientista faz simultaneamente a medida de duas ou mais variáveis: uma
poderia ser a altura e a outra o peso de pessoas de uma população. Se ambas as variáveis (peso e altura)
tendem a crescer ou decrescer simultaneamente, dizemos que são positivamente correlacionados.
Dizemos que são negativamente correlacionados se uma variável tende a crescer e a outra a decrescer.
O cientista ao afirmar que duas ou mais variáveis são correlacionadas, pode utilizar uma série de
técnicas (chamadas análise de regressão) para achar fórmulas expressando os valores de uma dessas
variáveis em termos da outra, ou outras. Tudo isto dentro de uma margem de erro que o cientista poderá
estimar probabilisticamente.
O pai da ideia da correlação entre variáveis foi Francis Galton, o qual no final do século passado a
usou numa série de estudos de hereditariedade motivados pela teoria da evolução de Darwin e com
objectivos decididamente eugénicos , contudo, a base matemática de Galton era precária, cabendo a
Karl Pearson dar uma fundamentação mais matemática para a correlação.
A teoria das probabilidades, que começou com um jogo, transformou-se, hoje em dia, num dos
ramos da matemática com mais aplicações nas outras ciências: exactas, naturais, sociais.
A Estatística conquistou, hoje, o seu lugar entre as ciências. O poder do seu método é, sobretudo,
afirmado nas últimas décadas e aplica-se, agora, nos domínios mais variados. Até aqui, só um pequeno
número de pessoas se preocupou com estudos estatísticos, quer pela natureza das suas investigações,
quer por causa da sua utilidade para as diferentes profissões. O valor e a importância do método
estatístico residem no esforço para melhor compreender o nosso mundo, tão maravilhosamente
complexo, tanto no ponto de vista físico como social, levam-nos a sonhar que ele se torne objecto de
um conhecimento como as outras ciências. A vida corrente leva-nos a decisões para passar do conhecido
ao desconhecido, da experiência à previsão.
Este manual tem por fim fornecer conhecimentos estatísticos (sem ter muitos conhecimentos
matemáticos) e ajudar a interpretar os resultados que podem ser obtidos quer através do calculo manual,
quer através de programas de computador.

8
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
1. Noções Gerais

Para algumas pessoas, a Estatística não é senão um quadro de colunas mais ou menos longas de
números que dizem respeito à população, à indústria ou ao comércio, como se vê frequentemente em
revistas; para outras, ela dá gráficos mostrando a variação no tempo de um facto económico ou social,
a produção ou os números relativos aos negócios de uma empresa, assim como se encontra nos
escritórios de empresas privadas.
Tão diferenciados se apresentam os métodos estatísticos que não é possível estabelecer uma
definição que os contenha a todos. Apesar disso, apresentamos a seguir uma definição que, embora
necessariamente incompleta como qualquer outra, tem a vantagem de introduzir o aluno na matéria.
A Estatística tem como finalidade elaborar de uma síntese numérica que evidencie o que de mais
generalizado e significativo exista num conjunto numeroso de observações.
O grande número de observações de que se parte reflecte uma diversidade tal que se torna
ininteligível a sua interpretação. Para que, a partir dessa diversidade se possa começar a entender logo,
torna-se necessário reduzir sucessivamente as observações, ganhando-se em generalidade o que se vai
perdendo em individualidade.
A síntese implica, assim, que nos desprendamos do que é particular e individual para nos atermos
ao que existe de mais geral no conjunto das observações; à medida que a síntese progride, vai-se
perdendo o contacto com as particularidades imediatas.
Deste modo, a Estatística não se ocupa do que é excepcional, mas apenas do que é geral: não se
interessa pelo indivíduo, mas por grupos de indivíduos; não se ocupa, em suma, de uma só medição,
mas de um conjunto de medições.
Acrescente-se, ainda, que a síntese é numérica. Quer isto dizer que se prescinde inteiramente das
palavras e dos recursos literários de mais ou menos efeito que elas possibilitam. Alcança-se a síntese
pelo recurso exclusivo dos números.
Daí o afã com que frequentemente se escolhem os números de acordo com os argumentos. A
Estatística é intrinsecamente uma disciplina não literária, manipula exclusivamente números e alcança
a síntese ordenando-os e cooperando com eles.
“Estatística”, deriva de “status” que em latim significa Estado, e que só por si demonstra a ligação
que sempre existiu entre ambos;
O primeiro levantamento estatístico remonta a 3050 a.C., no Egipto, tendo como objectivo informar
o estado sobre recursos humanos e económicos.
No séc. XVII d.C., a disciplina de Estatística era já leccionada nas universidades alemãs,
continuando com a finalidade de descrever as populações e as riquezas do Estado.
Ainda no séc. XVII, dá-se a expansão dos seus campos de investigação a áreas como a Saúde
pública; a Indústria; o Comércio e os Estudos Demográficos.

9
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Os métodos de inferência estatística surgem com Jonh Graunt (1620-1674), um modesto
comerciante, que tira conclusões válidas sobre uma população desconhecida por ele.
Fermat (1601-1665) e Pascal (1623-1662) permitem que o estudo do acaso tome uma expressão
matemática, introduzindo o Cálculo das Probabilidades.
O Cálculo das Probabilidades e o aparecimento do Método dos mínimos quadrados, vêm
credibilizar a Estatística conferindo-lhe a fundamentação matemática em que ela assenta hoje.
No séc. XVIII Lambert Quetelet (1796-1874) introduziu a Estatística nas análises da Meteorologia;
da Antropometria; das Ciências Sociais; da Economia e da Biologia.
Aos contributos anteriores Francis Galton (1822-1911), acrescenta as noções de regressão e
correlação; Karl Pearson (1857-1936) apresenta a mais bela e acabada teoria de Estatística, ficando
também conhecido pelos seus coeficientes (r; c); Fisher com os seus trabalhos sobre inferência
Estatística também deu um grande contributo ao desenvolvimento da Estatística.
Em 1943, dá-se uma grande reviravolta, uma vez que o tratamento de dados deixa de ser feito
manualmente e passa a ser numa primeira fase apoiado por calculadoras potentes para mais Tarde ser
feito quase exclusivamente de forma computadorizada.
O Método Estatístico, segundo a teoria de Cramer, pressupõe as seguintes fases:
Recolha de dados estatísticos: obtenção da amostra a partir da população, devendo depurar
e rectificar os dados estatísticos, que no seu conjunto são denominados série estatística.
Descrição: conjunto de operações, numéricas ou gráficas, efectuadas sobre os dados
estatísticos determinando a sua distribuição; procede-se à sua ordenação, codificação e
representação por meio de quadros e tabelas.
Análise: consiste em tirar conclusões sobre a distribuição da população, determinar o seu
grau de confiança e ainda formular hipóteses, tentando verificá-las, quanto ao fenómeno em
estudo.
Predição: é uma previsão do comportamento do fenómeno em estudo, tendo em conta a
definição da distribuição estatística.

2. População e Amostra

População: somatório dos indivíduos ou elementos, com qualquer característica comum e que estão
sujeitos a uma análise estatística, por terem interesse para o estudo. Quanto à sua origem pode ser: um
conjunto de pessoas; um conjunto de objectos ou um conjunto de acontecimentos. Quanto à sua
natureza pode ser: Existente ou real; Hipotética ou parcialmente existente. Pode ainda ser: um conjunto
finito ou um conjunto infinito.

10
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Amostra: é um subconjunto retirado da população, que se supõe ser representativo de todas as
características da mesma, sobre o qual será feito o estudo, com o objectivo de serem tiradas conclusões
válidas sobre a população.
Amostragem: é o procedimento pelo qual um grupo de pessoas ou um subconjunto de uma
população é escolhido com vista a obter informações relacionadas com um fenómeno, e de tal forma
que a população inteira nos interessa esteja representada (fig. 1)

População

População-alvo

Amostra

Figura 1: População e Amostra


O Plano de Amostragem serve para descrever a estratégia a utilizar para seleccionar a amostra.
Este plano fornece os detalhes sobre a forma de proceder relativamente à utilização de um método de
amostragem para determinado estudo.
Logo que o investigador delimite a população potencial para o estudo, ele deve precisar os critérios
de selecção dos seus elementos, que podem ser de inclusão ou de exclusão dos sujeitos que farão parte
do estudo:

Um investigador interessado pela readaptação após cirurgia de revascularização, pode concentrar-


se somente nos sujeitos que tiveram uma única experiência deste tipo e excluírem os outros.
Uma amostra é dita representativa se as suas características se assemelham o mais possível às da
população-alvo. É particularmente importante que a amostra represente não só as variáveis em estudo,
mas também outros factores susceptíveis de exercer alguma influência sobre as variáveis estudadas,
como a idade, o sexo, a escolaridade, o rendimento, etc.
A Representatividade avalia-se comparando as médias da amostra com as da população-alvo.
Como se ignora se todas as características da população estão presentes numa amostra dado que
estas são muitas vezes desconhecidas, admite-se que existe sempre um grau de erro.
ERRO DE AMOSTRAGEM: é a diferença que existe entre os resultados obtidos numa amostra e
os que teriam sido obtidos na população-alvo.

Duas soluções existem para reduzir ao mínimo o erro amostral:

11
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
1. Retirar de forma aleatória e um número suficiente de sujeitos que farão parte da amostra.
2. Procurar reproduzir o mais fielmente possível a população pela tomada em conta das
características conhecidas desta.

3. Métodos de Amostragem

3.1 Amostragens Probabilísticas e Não-Probabilísticas

3.1.1 Tipos de Amostragens Probabilísticas

Os métodos de amostragem probabilística servem para assegurar uma certa precisão na estimação
dos parâmetros da população, reduzindo o erro amostral.
A principal característica dos métodos de amostragem probabilística reside no facto de que cada
elemento da população tem uma probabilidade conhecida e diferente de zero, de ser escolhida, aquando
da tiragem ao acaso para fazer parte da amostra.
O objectivo desta abordagem é obter a melhor representatividade possível.
Tipos de Amostragem probabilisticas:
1. A Amostragem Aleatória Simples;
2. A Amostragem Aleatória Estratificada;
3. A Amostragem em Cachos;
4. A Amostragem Sistemática.

Amostragem Aleatória Simples


A Amostragem aleatória simples é uma técnica segundo a qual cada um dos elementos (sujeitos)
que compõe a população alvo tem igual probabilidade de ser escolhido para fazer parte de uma amostra.
A amostragem aleatória simples consiste em elaborar uma lista numérica de elementos de onde se tira,
com a ajuda de uma tabela de números aleatórios, uma série de números para constituir a amostra.

Amostragem Aleatória Estratificada


A Amostragem aleatória estratificada é uma variante da amostra aleatória simples. Esta técnica
consiste em dividir a população alvo em subgrupos homogéneos chamados «estratos» e a seguir tirar de
forma aleatória uma amostra de cada estrato. A Amostragem aleatória estratificada é utilizada quando
12
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
a população inteira é reconhecida por certas características precisas, tais como a idade, o sexo, a
incidência de uma condição de saúde, tudo isto para assegurar a melhor representatividade possível.
População-Alvo

2000 estudantes em Ciências


Sociais

Classificação

Estratificação Proporcional

Estrato 1 Estrato 2 Estrato 3


Doutoramento Mestrado Licenciatura
400 = 20% 600 = 30% 1000 = 50%

Escolha Aleatória

Estratificação Não-Proporcional
Amostra = 200
Escolha Aleatória de 10% em cada Estrato

40 Estudantes 60 Estudantes 100 Estudantes


Doutoramento Mestrado Licenciatura

Figura 2: Amostra estratificada

Amostragem em Cachos
Consiste em retirar de forma aleatória os elementos por cachos em vez de unidades. É útil quando
os elementos da população estão naturalmente por cachos e por isso devem ser tratados como grupos
ou quando não é possível obter uma listagem de todos os elementos da população-alvo.

Amostragem Sistemática
Consiste quando existe uma lista ordenada de elementos da população. Esta técnica consiste K
elementos dessa lista sendo o primeiro elemento da amostra retirado ao acaso.
O intervalo entre os elementos corresponde à razão entre o tamanho da população e da amostra.
Exemplo: Se pretender uma amostra de 100 indivíduos e a população for de 1000 o sistema será
1000:100=10 (dez em dez é o sistema), isto é, será incluído um elemento da lista de 10 em 10 indivíduos
a partir do 1.º n.º sorteado.
Importante
Se se utilizar uma amostragem por cachos ou outros tipos de agrupamentos, a amostra só é
considerada probabilística se os grupos foram escolhidos ao acaso antes da repartição aleatória dos
sujeitos nos grupos.

13
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
3.1.2 Tipos de Amostragens Não Probabilísticas:
É um procedimento de selecção segundo o qual cada elemento da população não tem a mesma
probabilidade de ser escolhido para formar a amostra.
Este tipo de amostragem tem o risco de ser menos representativa que a probabilística no entanto é
muitas vezes o único meio de construir amostras em certas disciplinas profissionais nomeadamente na
área da saúde.
Tipos de Amostragens Não-Probabilísticas:
A Amostragem Acidental ou de Conveniência;
A Amostragem por Cotas;
A Amostragem de Selecção Racional ou Tipicidade;
A Amostragem por Redes ou Bola de Neve.

Amostragem Acidental ou de Conveniência


É formada por sujeitos facilmente acessíveis, que estão presentes num determinado local e momento
preciso.
Exemplo: pessoas hospitalizadas. Um investigador pode ter acesso a uma unidade hospitalar para
constituir uma amostra de pacientes hospitalizados.
Neste tipo de amostra tem a vantagem de ser simples em organizar e pouco onerosa, todavia este
tipo de amostra provoca enviesamentos, pois nada indica que as primeiras 30 a 40 pessoas sejam
representativas da população-alvo. São utilizadas em estudos que não têm como finalidade a
generalização dos resultados.

Amostragem por Cotas


Idêntica à amostragem aleatória estratificada diferindo desta apenas pelo facto dos sujeitos não
serem escolhidos aleatoriamente no interior de cada estrato ou de cada grupo.

Amostragem por Selecção Racional ou por Tipicidade


Tem por base o julgamento do investigador para constituir uma amostra de sujeitos em função do
seu carácter típico.
Por exemplo: o estudo de casos extremos ou desviantes como uma patologia rara ou uma instituição.

Amostragem por Redes ou Bola de Neve


Consiste em escolher sujeitos que seriam difíceis de encontrar de outra forma. Toma-se por base,
redes sociais amizades e conhecimentos.
Por exemplo: Imigrantes de Leste.
Quando o investigador encontra sujeitos que satisfazem os critérios escolhidos pede-lhes que
indiquem outras pessoas de características similares.

14
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

3.2 Determinação do Tamanho da Amostra

Os tamanhos das amostras são relativos, isto é, depende do tamanho da população. Para determinar
as amostras existem várias fórmulas, consoante o parâmetro em critério. As mais utilizadas na saúde
são as que se baseiam na percentagem do fenómeno:

3.2.1 Cálculo do Tamanho da Amostra para Populações Infinitas (>100.000 elementos)

A amostra depende da:


1. Extensão do universo;
2. Do Nível de Confiança;
3. Do Erro Máximo permitido;
4. Da percentagem com que o fenómeno se verifica.

Formula

n= Tamanho da amostra
 = Nível de confiança escolhido expresso em n desvios padrão (s)
p = % com o qual o fenómeno se verifica
q = % complementar (100-p)
e = Erro máximo permitido
Se desejarmos um nível de confiança bastante alto – superior a 99% aplica-se a fórmula dos três
desvios.

Figura 3: Conversão dos níveis de confiança em desvios padrão


15
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Logo, o desvio (s)2 seria igual a 32 = 9


Se o erro máximo for de 2% o e 2 será igual a 22 = 4

Exemplo: Se for possível admitir que o número de captações de água em profundidade se situam
por volta dos 50%, não ultrapassando esta %, então p=50 e, consequentemente, q=100-50 ou seja 50.
Assim, tem-se a equação

Isto é, para atender às exigências estabelecidas, o n.º de captações a analisar seria 5625.
Se todavia, for aceite o nível de confiança de 95% (2 desvios) e um erro máximo de 5% o n.º de
elementos será bem menor.
os cálculos.

Convém lembrar que sempre que não seja possível estimar uma percentagem do fenómeno, deve
utilizar-se sempre p=50

3.2.2 Cálculo do Tamanho da Amostra para Populações Finitas (<100.000 elementos)

1. A amostra depende da:


2. Extensão do universo;
3. Do Nível de Confiança;
4. Do Erro Máximo permitido;
5. Da percentagem com que o fenómeno se verifica.

Fórmula

Onde:
n = Tamanho da amostra
 = nível de confiança escolhido, expresso em números de desvios padrão
p = percentagem do fenómeno
q = percentagem complementar

16
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
N = tamanho da população
e2 = erro máximo permitido

Exemplo: Verificar quantos dos 100 empregados de uma cantina cumprem correctamente as normas
de higiene e segurança do trabalho.
Presume-se que esse n.º não seja superior a 30% do total; deseja-se um nível de confiança de 95%
(2 desvios) e tolera-se um erro até 3%.
Então, n=90,4 Logo deverão ser pesquisados 90 empregados.
Confirme aplicando a fórmula

Mas, se a população fosse de 10.000 empregados, com os mesmos critérios anteriormente referidos,
então:

O tamanho "óptimo" de uma amostra, não depende tanto do tamanho da população mas sim de dois
parâmetros estatísticos: a margem de erro e o nível de confiança
Margem de erro – Uma amostra representa aproximadamente (e nunca exactamente) uma
população. A medida deste "aproximadamente" é a chamada margem de erro, e é lido assim:
se uma pesquisa tem uma margem de erro de 2% e a Doença Cardíaca teve 25% de prevalência na
amostra recolhida, podemos dizer que, naquele instante, na população, ela terá uma prevalência entre
23% e 27% (25% menos 2% e 25% mais 2%).
Nível de confiança – As pesquisas são feitas com um parâmetro chamado nível de confiança,
geralmente de 95%. Estes 95% querem dizer o seguinte: se realizarmos uma outra pesquisa, com uma
amostra do mesmo tamanho, nas mesmas datas e locais e com o mesmo instrumento de recolha de
dados, há uma probabilidade de 95% de que os resultados sejam os mesmos (e uma probabilidade de
5%, é claro, de que tudo difira).
Quando já se efectivou uma pesquisa e se deseja conhecer a margem de erro utilizada aplica-se a
fórmula:

Onde:
n = Tamanho da amostra
p = Erro padrão ou desvio da percentagem com que se verifica determinado fenómeno

17
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
p = percentagem do fenómeno
q = percentagem complementar

3.2.3 Determinação da Margem de Erro da Amostra

Exemplo: Numa pesquisa efectuada com 1000 adultos, verificou-se que 30% bebem café pelo
menos uma vez por dia. Qual a probabilidade de que tal resultado seja verdadeiro para todo o universo.

Como o valor encontrado (margem de erro) corresponde a um desvio, então para dois desvios
(95,5%), temos 1,45 *2=2,90.
Para 3 desvios é o triplo (4,35).
Isto significa que, por exemplo, para um nível de confiança de 95% (2 desvios) o resultado da
pesquisa apresentará como margem de erro 2,90 para mais ou menos.
É provável, portanto, que o n.º de consumidores de café esteja entre 27,10% (30%-2,90) e 32,90%
(30%+2,90).

3.2.4 Determinação da Amostra sem conhecer os limites da população

Fórmula

Em que:
p= fenómeno]
= erro
{Se IC (intervalo de confiança)=95%, =5% (0,05)} Então /2 = 0,05/2 =0,025
Z (/2) = Z(0,025)= 1,96
d=número de desvios

Assim para um fenómeno que tenha uma prevalência de 25%, os resultados seriam:

18
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Em termos estatísticos consideramos que uma amostra é: Pequena se n < 30 que o valor para a qual
começa a tender à normalidade.
Cuidados a ter na escolha da amostra:
1. Imparcialidade: todos os elementos devem ter a mesma probabilidade e oportunidade de serem
escolhidos;
2. Representatividade: deve conter em proporção todas as características que a população possui,
qualitativa e quantitativamente, de modo a que não se torne tendenciosa;
3. Tamanho: suficientemente grande de modo a fornecer as principais características, por outro lado
pequena para economizar tempo, dinheiro e pessoal.

3.3 Indivíduo ou Unidade Estatística


O estudo Estatístico recai sobre a amostra, no entanto este é feito de modo pormenorizado a cada
um dos elementos da amostra, que são designados por Indivíduo ou Unidade Estatística.
Unidade Estatística: é o factor elementar, o objecto de análise, que independentemente da sua
natureza tem que possuir uma definição precisa.
As principais características de uma boa unidade Estatística são:
1. Propriedade ou adequação ao objectivo da investigação;
2. Clareza;
3. Mensurabilidade;
4. Comparabilidade.
No estudo de cada unidade Estatística, surgem resultados individuais com os quais são feitas as
inferências sobre a população. Estes resultados têm o nome de Dado Estatístico.
Dado Estatístico: é o resultado do estudo efectuado a cada unidade Estatística tendo em conta a sua
individualidade, sendo este depois tratado de modo a permitir inferir sobre a colectividade que a integra
(população).

19
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

3.4 Variáveis
Propriedade em relação à qual os indivíduos de uma amostra variam. Note-se que as propriedades
que não variam não são de interesse estatístico. Há muitos modos de dividir os diferentes tipos de
variáveis.
Ao ser efectuada uma análise Estatística a uma população, os aspectos (características) que se têm
em conta, um ou vários, são denominados por Variável Estatística.
Uma variável Estatística pode ser:
Qualitativa: se é a sua natureza que varia de elemento para elemento.
As variáveis qualitativas dividem:se em:
Variáveis nominais: quando o seu significado só se entende em função do nome e o número ou
código que se lhe atribua não nos dá nenhuma informação (sexo, cor de olhos, grau de parentesco, tipo
de patologia, presença/ausência de factores de risco, etc.).
Variáveis ordinais: quando existe uma ordenação possivel (gravidade de uma lesão, classe social,
grau de escolaridade, etc.).
Quantitativa: se é a sua intensidade que varia de elemento para elemento, tornando-a mensurável
ou referenciável.
As variáveis quantitativas dividem-se em:
Variáveis discretas: assume valores isolados, normalmente inteiros (n.º de filhos, n.º de factores de
risco, n.º de dependentes, n.º de respostas, etc)
Variáveis contínuas: em que é possível qualquer operação aritmética, podendo assumir qualquer
valor real (altura, peso, IMC, distância, etc).
Tendo em conta o número de atributos (características) que estão a ser estudadas, as variáveis
podem ser:
Unidimensionais: se apenas corresponde a um atributo
Bidimensionais: se corresponde a dois atributos;
Pluridimensionais: se corresponde a vários atributos.
Modalidade: é toda a manifestação possível de uma variável, isto é, as várias hipóteses de resposta,
podendo elas ser duas ou mais.
As modalidades têm obrigatoriamente que ser:
Incompatíveis: cada unidade Estatística não pode pertencer simultaneamente a duas ou mais
modalidades;
Exaustivas: todas as unidades Estatísticas têm que ser inseridas numa modalidade.
A escolha das modalidades deve ser feita de acordo com as informações possuídas. No entanto,
surgem situações em que há necessidade de se aumentar uma modalidade suplementar.

20
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Variáveis dependentes e independentes


Gostaríamos agora de introduzir a terminologias variáveis independentes e variáveis dependentes.
A variável manipulada pelo experimentador é conhecida como variável independente. Isto porque as
situações experimentais que testam esta variável são definidas independentemente mesmo antes de a
própria experiência se iniciar. A segunda variável, os resultados nos testes de estatística, é conhecida
como variável dependente (os resultados de estatística dependem da utilização de um esquema de
mnemónica), porque os resultados do teste são dependentes da maneira como o experimentador
manipula a variável independente «esquema de mnemónica».
Assumindo que demonstramos que o esquema de mnemónica produz algum efeito, lembrar-se-á
que a questão seguinte levantada pelo céptico tinha a ver com o facto dos alunos com menos dificuldades
com os cálculos serem aqueles que beneficiariam mais do esquema do que aqueles que tinham maiores
dificuldades com a estatística.

Uma forma de investigar esta possibilidade seria a de transformar a “facilidade em fazer operações
matemáticas” em variável independente. O investigador apresentaria então a todos os alunos um teste
que avaliasse aquele facto, e seleccionaria de seguida dois grupos de estudantes, um grupo com
facilidade em efectuar operações matemáticas e outro com dificuldades. Se a ambos os grupos fosse
apresentado o esquema de mnemónica, seria então possível avaliar o efeito da variável independente
“facilidade em efectuar operações matemáticas” na outra variável “resultados do teste.” Por outras
palavras, seria o grupo de “bons estatísticos” ou o grupo de “maus estatísticos” que apresentava maiores
progressos nos resultados do teste?

Um dos aspectos de que já se deve ter dado conta é de que não é possível manipular a variável
independente “facilidade em fazer operações matemáticas” da mesma forma como manipulamos
anteriormente variável dependente com ou sem esquema de mnemónica. Neste último caso é da inteira
responsabilidade do experimentador decidir quais os alunos a quem dá o esquema de mnemónica e a
quem não dá. No que diz respeito à “facilidade em fazer operações matemáticas”, não existe forma de
o experimentador dar ou retirar a um aluno facilidade em fazer operações matemáticas. Ainda assim, o
experimentador pode manipular essa variável criando dois grupos, um em que coloca os que têm
dificuldade e outro em que coloca os que não têm, constituindo assim dois grupos experimentais. A H1
poderá ser: Apenas os alunos que têm maior facilidade em fazer operações matemáticas aprese ntam
resultados superiores em estatística. O esquema de mnemónica deixou de ser variável e passou a
situação constante, já que neste caso todos usufruíram do mesmo. Por outras palavras, o investigador
previra uma diferença entre os resultados do teste dos dois grupos de alunos após ter sido apresentado
a ambos o esquema de mnemónica.

21
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Uma outra variável independente do mesmo tipo é o sexo. Até mesmo o experimentador mais
omnipotente não pode transformar um homem numa mulher e vice-versa. É até bastante comum formar
grupos de homens e mulheres para se investigarem as diferenças de performance nas mais diversas
tarefas, que possam ser devidas a esse fator.

Mas quando estamos perante um estudo cientifico, nem sempre é possível estabelecer relações de
dependência e, existem mesmo alguns tipos de estudos em que esta denominação é contra-indicada, por
conterem apenas questões de investigação e serem, por isso, exploratórios (nível I), descritivos e em
alguns casos descritivo-correlacionais (nível II). Consulte os níveis de estudo em anexo2. Nestes casos
podemos definir as variáveis como primárias, secundárias e complementares, embora não seja
obrigatório.

Variáveis primárias, Derivadas ou secundárias e complementares


As variáveis primárias são as consideradas como principais no nosso estudo e as únicas que têm
peso no momento da conclusão (variáveis incluídas nas hipóteses). Por exemplo, na pesquisa cuja
pergunta é qual a qualidade de vida dos cuidadores de idosos acamados? A variável primária é a
qualidade de vida.
As variáveis secundárias são importantes para avaliar a situação em estudo mas raramente são
determinantes na conclusão do estudo.
As variáveis complementares são aquelas que utilizamos para caracterizar a nossa população ou
amostra.
Em cada uma das variáveis deverá ser apresentado: a definição da variável, como, quem e quando
será mensurada
Por exemplo, numa pesquisa cuja a pergunta é: Qual a prevalência de obesidade nos estudantes
universitários? A variável primária será a prevalência de obesidade; as variáveis secundárias serão a
estatura, o peso, a circunferência abdominal e a qualidade de vida; os dados complementares serão a
idade, sexo, curso de graduação, ano do curso de graduação.
As variáveis derivadas (ou variáveis secundárias) são novas variáveis que podem ser criadas a partir
de operações lógicas e/ou matemáticas sobre variáveis existentes nas bases de dados (variáveis
primárias)

22
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

variáveis e respectivos Tipos de escalas de medida

NÍVEIS DE MENSURAÇÃO DAS VARIÁVEIS


As variáveis diferem em "quão bem" elas podem ser medidas, ou seja, em quanta informação seu
nível de mensuração pode gerar. Operacionalmente, muitas vezes pode-se estudar algo de diferentes
maneiras.

Exemplificando, supondo que pretende estudar os hábitos tabágicos. Qual seria a escala? Haveria
apenas 2 grupos: fumadores e não fumadores? Ou seria contado o número de cigarros consumidos
durante determinado período? Utilizaria a Unidade Masso Ano (UMA)? Como seria definido o
fumador? Quem fuma 1 cigarro por dia será considerado o quê? E que, fuma 1 maço de cigarros por
dia? Pertencem à mesma categoria?

Assim, de acordo com sua escala de medição, as variáveis podem ser classificadas em 3 tipos:

Escala nominal
São variáveis qualitativas. Os dados podem ser distribuídos em categorias mutuamente exclusivas.
Seus valores só são registados como nomes, só permitindo classificação qualitativa, não existindo ordem
entre as categorias existentes. Assim, pode-se dizer que dois indivíduos são diferentes em termos da
variável analisada, mas não se pode dizer qual deles "tem mais" da qualidade representada pela variável.
Exemplos: sexo, estado civil, presença/ ausência de doença, patologia, causa de morte, etc.
As análises estatísticas mais comuns são o estudo de proporções e testes baseados no Qui-quadrado.

Escala ordinal
São variáveis qualitativas. Os dados podem ser distribuídos em categorias mutuamente exclusivas,
mas que têm ordenação natural. São aquelas com possíveis resultados nominais, sem valores métricos,
mas em que existe uma ordenação entre as categorias, com um resultado precedendo o outro (hierarquia
ou grau). Portanto, permitem ordenar os itens medidos em termos de qual tem menos e qual tem mais
da qualidade representada pela variável, mas não possibilitam que se diga "o quanto mais".
Exemplos: estágio da doença (inicial, intermédio, terminal); escolaridade (1.º CEB, 2.º CEB, 3.º
CEB, Lic. MSC, PHD); peso, quando medido em 3 níveis (leve, médio, pesado); nível socioeconómico
de famílias residentes numa localidade (pobre, classe média, Alta); classificação no teste (muito bom,
bom, satisfaz, medíocre, mau), , grau de estenose (ligeira, moderada, severa), etc.

As análises estatísticas mais comuns são o estudo de proporções, medianas, quartis, moda. Testes:
Qui-quadrado, Kruskal-Wallis, regressão logística e outros testes não paramétricos.

23
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Escalas intervalar e proporcional ou de razão


A escala intervalar estabelecem-se intervalos iguais a partir de uma origem arbitrária, enquanto que
na de razão existe um ponto zero a partir do qual se estabelecem intervalos iguais. Ambas são
quantitativas e os seus dados são expressos por números. Permitem não apenas ordenar os itens que
estão sendo medidos, mas também possibilitam quantificar e comparar o tamanho das diferenças entre
eles. Os seus valores são medidos em uma escala métrica e por isso não são diferenciadas em alguns
softwares estatísticos, como é exemplo o SPSS, em que são denominadas de SCALE.
Exemplos: Temperatura em °C; Idade, em anos; Peso corporal em quilos, classificação no teste:
(0,..., 20), comprimento do segmento de recta desenhado etc.
É evidente que as variáveis quantitativas incluem mais informação, portanto permitem que sejam
aplicadas provas estatísticas mais potentes.

4. Estatística Descritiva

A Estatística Descritiva recolhe, organiza e analisa os dados de uma amostra, sem tirar qualquer
conclusão sobre um grupo maior, enquanto que a Estatística Indutiva ou inferencial recolhe, organiza,
analisa e estabelece relações entre os dados para fazer inferências sobre a população. Com base nos
resultados obtidos sobre a amostra podemos inferir conclusões válidas sobre a população (este ramo da
Estatística já exige a utilização de recursos matemáticos especiais, nomeadamente a Teoria das
Probabilidades).
Assim, a Estatística Indutiva permite-nos fazer inferências sobre a população e chegar a leis e a
teorias e a descritiva dá um apoio a esta tarefa.

4.1 Parâmetro e dado estatístico

O parâmetro é toda a função definida a partir dos dados numéricos de uma população.
Exemplo: consideremos as seguintes notas em Estatística - 10 11 10 15 9
Média =xi/n = 55/5 = 11
O valor 11 é o parâmetro (resultado da média aritmética).

O dado estatístico é toda a função definida a partir dos dados numéricos de uma amostra.
Exemplo: consideremos a amostra: 10 10

24
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Os dados consistem em informações provenientes de observações, contagens, medidas ou respostas
no exemplo anterior o valor 10 é o dado estatístico

4.2 Representação de uma variável estatística

Depois de termos definido algumas noções básicas de estatística, tratar-se-á, a seguir, da segunda
fase de um estudo estatístico. Como já referimos, os dados numéricos recolhidos registam-se em séries
estatísticas e, para serem analisados, devem ser ordenados e representados em quadros e em gráficos.
Quando trabalhamos com uma variável discreta ou descontínua falamos em seriação e quando
trabalhamos com uma variável contínua falamos em classificação.

SERIAÇÃO DE UMA AMOSTRA


Como já referimos anteriormente, uma seriação implica que a variável seja discreta (exemplo:
número de filhos de um casal, número de divisões de uma casa, etc.).

Distribuição de frequências
É o arranjo dos valores e suas respectivas freqüências. Assim, a distribuição de freqüências para o
exemplo será:
Valores Freqüência absoluta (Fi) Freqüência relativa (Fr) Percentagem (%)

Frequência absoluta (Fi)


É o número de vezes que o elemento aparece na amostra, ou o número de elementos pertencentes a
uma classe. A soma de todas as freqüências deve ser o número total de elementos do conjunto (N). Se
o número de elementos for muito grande ou pouco repetidos, podemos separar o conjunto em classes,
que são intervalos numéricos a Ib ou a x b.
A diferença b – a chama-se amplitude das classes (h) e é utilizada a mesma amplitude para todas as
classes com intervalos fechados à esquerda.

Frequência relativa (Fr)


A frequência relativa, para cada valor assumido por uma variável, é definida como a razão entre a
frequência absoluta (Fi) e o número total de dados (N). Para calcularmos a percentagem de cada valor,
basta multiplicar por 100 a frequência relativa.

Exercícios

25
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Tabela 1: distribuição de frequencias

Valores Frequência absoluta (Fi) Frequência relativa (Fr) Percentagem (%)


21 3 3/30 = 0.1 10
22 2 2/30 = 0.066 6.6
23 2 2/30 = 0.066 6.6
24 1 1/30 = 0.034 3.4
25 4 4/30 = 0.132 13.2
26 3 3/30 = 0.1 10
28 1 1/30 = 0.034 3.4
30 1 1/30 = 0.034 3.4
31 3 3/30 = 0.1 10
32 1 1/30 = 0.034 3.4
33 3 3/30 = 0.1 10
34 3 3/30 = 0.1 10
35 2 2/30 = 0.066 6.6
36 1 1/30 = 0.034 3.4
Total 30 1 100

Numa pesquisa socioeconómica sobre itens de conforto, perguntou-se a cada um dos 800
entrevistados: Quantos aparelhos de TV há em sua casa?
Os resultados que aparecem na tabela devem ser completados. Usando o exemplo da tabela anterior
complete a tabela.

Tabela 2: Exercício de distribuição de frequências

Nº Frequência Frequência Percentagem


aparelhos absoluta relativa

0 20
1
2 0.6
3 7.5
4 30

26
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Classificação de uma amostra

Como já referimos anteriormente, uma classificação implica que a variável seja contínua (exemplo:
a temperatura de um corpo, a altura de uma pessoa, a duração de certo fenómeno, etc. - variáveis
relacionadas com o espaço, o tempo ou a massa).
Na primeira coluna temos as classes. Por convenção, as classes são abertas superiormente, com
excepção da última classe, naturalmente.
Na segunda coluna temos as marcas da classe. Esta coluna pode ser também designada por x'i. A
marca de uma classe é o ponto médio dessa classe, ou seja, é o ponto equidistante dos extremos de uma
classe.

Exemplo: classe c0-c1 x'1 = (c0 + c1) / 2


Na terceira coluna apresentamos as frequências absolutas simples ou efectivas, ou seja, o número
de vezes que os valores de determinada classe foram observados. Esta coluna pode ser também
denominada por ni. Mais uma vez,  ni = n (número total de indivíduos pertencentes à população/ou
amostra, a que se chama efectivo total).
Na quarta coluna apresentamos as frequências acumuladas, isto é, a soma das frequências absolutas
correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser também denominada
por N(i).
Na quinta coluna temos as frequências relativas simples. Esta coluna pode ser também denominada
por fi, em que fi = ni/n e, de tal modo, que  fi =1.
Na sexta coluna apresentamos as frequências relativas acumuladas, isto é, a soma das frequências
relativas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser também
denominada por F(i).
Numa classificação é habitual representarmos por K o número de classes (em geral K varia entre 5
e 20, inclusive) e por A a amplitude (em que A=x máximo - x mínimo).
Então,
- Se K é dado  = A/K

- Se  é dado K=A/ , sendo  a amplitude do intervalo de classe e A a amplitude do


intervalo da amostra
Exemplo: Construa o quadro de frequências com os seguintes dados:
Classes [20-23[ [23-26[ [26-29[ [29-32[ [32-35[ [35-38]
ni 2 5 7 10 4 2

27
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Tabela 3: quadro de frequências de classes

Classes ni fi N( i) F( i) x'i

[20-22] 2 2/30 2 2/30 21

[23-25] 5 5/30 7 7/30 24

[26-28] 7 14

[29-31] 10 24

[32-34] 4 28

[35-38] 2 30

= 3 ni = 30 fi = 1 n = 30

4.3 Redução de uma variável estatística

Conceito de redução e sua conveniência


Anteriormente definimos o conceito de variável estatística e construíram-se quadros e gráficos
estatísticos com vista a uma descrição numérica e gráfica de uma variável estatística. Naturalmente, os
gráficos permitem uma primeira síntese das informações registadas nos quadros.
Por outro lado, por simples aproximação das curvas de frequências absolutas ou relativas de duas
ou mais variáveis, podemos fazer uma primeira comparação entre elas.
Há, porém, necessidade de sintetizarmos toda a informação respeitante a uma variável estatística,
resumindo-se os dados a um pequeno número de elementos que bastam para caracterizá-la. Tal síntese
consiste na redução de dados e os elementos numéricos obtidos designam-se por parâmetros da variável
estatística.
Feita a representação dos dados estatísticos por meio de quadros e/ou de gráficos, importa fazer
sobre os mesmos um estudo no sentido de se poder chegar a conclusões.
Para tal, impõe-se um trabalho de simplificação que consiste em proceder a sínteses, em reduzir
grandes quantidades de dados a números simples que permitam uma análise rápida e uma fácil
comparação com outras séries da mesma natureza ou de natureza diferente.
Tais números são designados, habitualmente, por características, parâmetros ou medidas e são
agrupados em categorias conforme o tipo de informação que fornecem.

28
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Medidas de tendência central ou de posição
Sob esta designação agrupam-se os parâmetros que, ou nos indicam algo de associável ao núcleo
ou centro da distribuição, ou nos permitem compartimentá-la. Vamos considerar as seguintes medidas
de tendência central ou de posição: média, mediana, moda e quantis.

Média
A média é o ponto de equilíbrio dos dados, isto é, tendo um conjunto de n valores x1, x2, ..., xn de
uma variável X é o quociente entre a soma desses valores e o número deles.
A média aritmética simples (dados não agrupados) pode ser representada pela seguinte fórmula
matemática:

Simplificando:x =  xi / n

Numa amostra seriada os valores x1, x2, ..., xk ocorrem n1, n2, ..., nk vezes, respectivamente, a
média aritmética ser x =  nixi / n =  fixi
Exercicio: Para distribuição de frequência por variável discreta: Para os dados Populacionais
calcule a Média, sabendo que
xi 4 6 7 8 10
ni 2 4 5 3 2

xi ni nixi

4 2 8

6 4 24

7 5 35

8 3 24

10 2 20

=16 =111
Então, x =  nixi / n = 111/16= 6,94

Numa amostra classificada a fórmula definidora da média não se pode aplicar directamente porque
não conhecemos os valores exactos da variável estatística, mas apenas o número de observações dentro
de cada classe, isto é, quando os dados estão agrupados em classes, para o cálculo da média simples,
devemos considerar o ponto médio de cada classe (marca) como representativo de todos os valores nela
incluídos, pelo que aquela pode ser representada pela seguinte fórmula matemática:
x’ =  nix'i / n =  fix'i

29
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Exemplo: Calcule a média aritmética, sabendo que
Classes [3-5[ [5-7[ [7-9[ [9-11[ [11-13]
ni 2 4 5 3 2

Classes ni x'i nix'i

[3-5[ 2 3,5 7
[5-7] 4 5,5 22
[7-9[ 5 7,5 37,5
[9-11[ 3 9,5 28,5
[11-13] 2 12 24

=16 =119
Então: x’ =  nix'i / n = 119/16 = 7,43

Temos de salientar que quando usamos a marca da classe estamos a colocar um certo erro de
agrupamento, pelo que devemos considerar a Correcção de Sheppard, de tal modo que:
x é semelhante a x’
Relativamente às propriedades da média aritmética podemos enunciar duas:
1. Somando ou subtraindo uma constante a todos os valores observados, a média resultante ficará
aumentada ou diminuída, respectivamente, dessa constante;
2. Multiplicando ou dividindo os valores observados por uma constante diferente de zero, a média
resultante ficará multiplicada ou dividida, respectivamente, por essa constante.

Média Aritmética Pesada ou Ponderada: É a média aritmética afectada por pesos (variável
discreta e variável contínua).
Por outras palavras, associa-se a x1, x2, ..., xk certos factores de ponderação ou pesos p1, p2, ..., pk
que dependem do significado ou importância atribuída às observações. Assim, a fórmula matemática da
média será:x p =  pixi / pi

Exemplo: Um professor de matemática quer saber a média poderada das suas avaliações nas quatro
turmas em que lecciona, sabendo que o teste tinha uma ponderação de 30% e o trabalho uma ponderação
de 70%:
Turma A - Média da nota do teste =65% Média da nota do trabalho =78%
Turma B - Média da nota do teste =60% Média da nota do trabalho =70%
Turma C - Média da nota do teste =40% Média da nota do trabalho =28%
Turma D – Média da nota do teste =80% Média da nota do trabalho =75%

30
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Determine a média ponderada das quatro turmas em conjunto.
xp=pixi/pi = [((65*30)/100) + ((78*70)/100) + ((60*30)/100) + ((70*70)/100) + ((40*30)/100)
+ ((28*70)/100) + ((80*30)/100) + ((75*70)/100)]/4 = 62,3

Se preferirmos em quadro a resolução será

xi pi pixi
65 30 1950
60 30 1800
40 30 1200
80 30 2400
78 70 5460
70 70 4900
28 70 1960
75 70 5250
 400 24920
x p =  pixi / pi=24920/400=62,3

Exercicio: Seja uma Amostra dos pesos de seis alunos de Administração. Encontre a média para:
xi = 68, 56, 47, 66, 93, 56

Para além da média aritmética e da média aritmética ponderada, temos também a média geométrica,
a média harmónica e a média quadrátrica (a estes três tipos de médias não iremos dar relevancia).

Mediana
MEDIANA (Md) é um valor que ocupa a posição central em uma série, logo, precisamos encontrar
a posição média entre os dados.
A mediana de uma série de n observações x1, x2, ..., xn de uma variável X é o valor que ocupa a
posição central quando as observações estão ordenadas por ordem crescente ou decrescente, isto é, a
mediana de uma variável estatística é o valor dessa variável tal que a frequência dos valores que lhe são
inferiores é a mesma que a frequência dos valores que lhe são superiores. Representa-se, habitualmente,
por Md.
A mediana é usada quando na amostra há valores excêntricos em relação a outros valores.
Para o cálculo da mediana, temos de considerar duas situações: o caso em que N é ímpar e o caso
em que N é par.

N é ímpar:
A mediana é um valor observado, de tal modo que o lugar que ocupa é dado pela fórmula

31
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Md = (N +1) / 2
Exemplo: Determine a mediana para a seguinte série de dados
5 9 8 7 6
Ordenando por ordem crescente, vem 5 6 7 8 9
Como N é ímpar, então Md=(N+1) / 2 = (5+1) / 2 = 6/2 = 3 então a mediana ocupa a terceira
posição ou terceiro termo, o seu valor é 7.

Exercicio: Determinar a Mediana da Amostra: X = 2, 20, 12, 23, 20, 8, 12.


Para n = 07 (ímpar) temos - Md = (n+1)/2 =

Interpretação:
Podemos dizer que 50 % dos valores da série são menores ou iguais a __________ e que 50 % dos
valores são maiores ou iguais a ____________.

N é par:
A mediana não coincide com nenhum valor observado ficando compreendida entre dois valores
centrais - classe mediana; convencionou-se tomar para mediana a média destes dois valores. A posição
que a mediana ocupa é dada pela fórmula
Md = média dos valores que se encontram na posição N / 2 e (N / 2) + 1
Exemplo: Determine a mediana para a seguinte série de dados
5 6 12 9 8 7
Ordenando por ordem crescente, vem 5 6 7 8 9 12
Como N é par, então N/2 = 6/2 = 3; ( N/2 + 1) = 3+1 = 4 Assim, a classe mediana é ocupada
pelas posições 3 e 4, ou seja, pelos valores 7 e 8, pelo que a Md = (7+8) / 2 = 15/2 = 7,5

Exercicio: Determinar a Mediana para a Amostra X = 7, 21, 13, 15, 10, 8, 9, 13.
Para n = 08 (par) temos: Md 1 = e Md 2 =
Logo, a Md =
Interpretação:
Podemos dizer que 50 % dos valores da série são menores ou iguais a __________ e que 50 % dos
valores são maiores ou iguais a ___________.

32
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Moda
A moda (ou valor modal) de uma série de n valores x1, x2, ..., xn de uma variável X é o valor onde
a frequência atinge o máximo (relativo). Representa-se, habitualmente, por Mo.
A moda é o valor da variável com maior efectivo, isto é, se uma variável é discreta, a(s) moda(s)
é(são) o(s) valor(es) da variável estatística que se observa(m) com maior frequência.
Exemplo2 : Determine a moda para a seguinte série de valores
xi 4 6 8 10 2
ni 1 3 5 4 2

Exercicio: Seja uma Amostra aleatória dos pesos de seis alunos de Administração. Encontre a
moda. se xi = 68, 56, 47, 66, 93, 56.
Relação empírica entre a média, a mediana e a moda
Pearson chegou à conclusão de que para as distribuições unimodais e moderadamente assimétricas,
vigora a seguinte relação empírica:
Média - Moda = 3 (Média - Mediana)
Vejamos, agora, a relação existente entre estas três medidas no caso das figuras que se seguem:

Figura 4: Curva simétrica

Figura 5: Curva assimétrica à direita


Média > Moda; Média > Mediana; Mediana > Moda

Figura 6: Curva assimétrica à esquerda


Moda > Mediana; Moda > Média; Mediana > Média

2 A moda é 8.
33
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

A utilização da média aritmética, da mediana e da moda

Média aritmética:
A medida de tendência central mais usada é a média aritmética, que apresenta em relação à mediana
e à moda vantagens apreciáveis, tais como:
 É facilmente calculável;
 É a que melhor se presta a ulteriores análises estatísticas;
 Depende de todos os valores da série;
 É uma medida de tendência central particularmente estável, variando o menos possível de
amostra para amostra extraídas da mesma população;
 Pode ser tratada algebricamente.
Existem, todavia, casos em que a informação fornecida pela mediana ou pela moda, parece ser mais
completa do que a fornecida pela média aritmética, como passamos a indicar.

Mediana:
 Esta medida de tendência central deverá utilizar-se quando:
 Se deseja conhecer o ponto médio exacto da distribuição;
Existem resultados extremos que afectariam grandemente a média. Importa salientar que a mediana
não é influenciada pelos resultados extremos - exemplo: na série 10,13,15,16,18,19,21, tanto a média
como a mediana são 16; se substituirmos 21 por 50 e os restantes resultados permanecerem os mesmos,
a mediana é 16 e a média será de 20,1;
A distribuição é truncada, isto é, incompleta nas extremidades - exemplo: desejamos medir os
tempos de reacção em Psicologia e as várias respostas ultrapassam as capacidades de medida do
aparelho; vemo-nos, assim, impossibilitados de calcular a média, já que não dispomos de todos os
valores da variável, sendo, no entanto, possível calcular o valor da mediana, já que conhecemos o
número de medidas efectuadas.

Moda:
Esta medida de tendência central deverá utilizar-se quando:
 Uma medida rápida e aproximada da tendência central for suficiente;
Se deseja conhecer o valor mais típico de uma distribuição - exemplos: descrever o estilo de vestido
usado pela mulher média, salário preponderante em determinada empresa.

É de salientar que, apesar das vantagens apresentadas para a moda, esta tem a desvantagem de ser
de determinação imprecisa, no caso das variáveis contínuas.

34
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Quantis
Chama-se quantil de ordem p com 0  p  1 e representa-se, habitualmente, por Cp ao valor de x
tal que F(x)=p. Alguns quantis têm denominações especiais:

Quartis:
Os quartis dividem a série ordenada em 4 partes iguais, contendo cada uma delas 1/4 ou 25% das
observações.
Q1=1º quartil (corresponde ao quantil de ordem p=1/4)
Q2=2º quartil (corresponde ao quantil de ordem p=1/2)
Q3=3º quartil (corresponde ao quantil de ordem p=3/4)
Assim, Q1 é o valor da variável estatística que deixa atrás de si 25% das observações; Q2 é o valor
da variável estatística que deixa atrás de si 50% das observações e Q3 é o valor da variável estatística
que deixa atrás de si 75% das observações. A (Q1- Q3) chama-se intervalo interquartil e é o intervalo
ao qual pertencem 50% das observações, deixando 25% para a direita e 25% para a esquerda.
É de notar que dizer que os quartis dividem a série em 4 partes iguais não significa que, por exemplo,
os intervalos (Q1, Q2) e (Q2, Q3) têm a mesma amplitude, mas sim que contêm o mesmo número de
observações.
Decis:
Os decis dividem a série ordenada em 10 partes iguais, contendo cada uma delas 1/10 ou 10% das
observações.
D1=1º decil (corresponde ao quantil de ordem p=1/10)
D2=2º decil (corresponde ao quantil de ordem p=2/10)
Centis:
Os centis dividem a série ordenada em 100 partes iguais, contendo cada uma delas 1/100 ou 1% das
observações.
C1=1º centil (corresponde ao quantil de ordem p=1/100)
C2=2º centil (corresponde ao quantil de ordem p=2/100)

Relações entre quartis, decis, centis e mediana:


Como podemos observar na figura ao lado
Q1=C25
Q2=Md=D5=C50
Q3=C75
D1=C10
D2=C20

Medidas de dispersão
35
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Uma medida de tendência central não nos dá, só por si, uma informação exaustiva da distribuição
considerada; pelo contrário, a capacidade que se lhe atribui de representar os elementos de uma
distribuição depende do modo como estes se concentram ou dispersam em torno dela. Assim, podemos
dizer que os parâmetros de tendência central não são suficientes para caracterizar uma série estatística,
apesar de a mediana e os quantis darem já uma ideia sumária do modo como estão distribuídas as
observações.
Consideremos o seguinte exemplo: Dois grupos de alunos com as seguintes classificações
A 23 10 16 19
B 89 10 11 12
A média e a mediana é 10 e, contudo, estas distribuições são muito diferentes. Com efeito, enquanto
no grupo A as notas apresentam desvios muito grandes, na distribuição B todos os valores se aproximam
de 10. A dispersão ou variabilidade da primeira série é mais acentuada do que na segunda.
Quer dizer: distribuições com a mesma tendência central podem apresentar aspectos bastante
diferentes no que concerne à dispersão ou variabilidade, e à medida que esta dispersão aumenta, menos
significativas da distribuição vão sendo as medidas de tendência central.
Assim, para melhor caracterizarmos uma distribuição, temos de considerar, além das medidas de
tendência central, uma outra medida que exprima o grau de dispersão ou variabilidade dos dados.
Vamos considerar as seguintes medidas de dispersão: amplitude total, amplitude interquartis, desvio
médio, variância, desvio padrão e coeficiente de dispersão ou de variação.

Amplitude
A amplitude total é a diferença entre o maior valor e o menor valor, isto é, a amplitude total de uma
variável estatística é a diferença entre o valor máximo e o valor mínimo dos valores observados. É a
forma mais simples de avaliar a dispersão dos dados, de tal modo que quanto maior for a amplitude total
maior é a dispersão dos dados.
A amplitude total pode ser também denominada de intervalo total ou campo de variação; representa-
se, habitualmente, por A e apenas usa valores extremos.
Numa amostra seriada
A = xmáximo - xmínimo
Numa amostra classificada
A = extremo superior da última classe - extremo inferior da primeira classe

Se alguma destas classes for de amplitude indeterminada não é possível definir o intervalo de
variação.
A amplitude total apresenta as seguintes desvantagens:
Embora seja fácil de calcular, a amplitude total depende somente dos valores extremos, que são,
geralmente, os menos frequentes e os menos significativos de uma distribuição, desprezando-se os

36
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
valores intermédios que são os mais frequentes. Além disso, os valores extremos são vulgarmente
anómalos e muito variáveis, consoante a amostra que se retire de uma população, de tal modo que duas
distribuições podem ter a mesma amplitude total, mas dispersões muito diferentes.
Outro inconveniente da amplitude total é consequência de não tomar em consideração as
frequências das observações.
Exemplo: Calcule a amplitude total do grupo G, sabendo que
G= 2 3 10 16 19
A = xmáximo - xmínimo = 19-2 = 17

Amplitude interquartis
Os quartis fornecem indicação quanto à forma como as observações se distribuem em torno da
mediana. Como o 1º e o 3º quartis representam valores abaixo dos quais estão, grosso modo,
respectivamente, 25% e 75% das observações, entre eles existirão, assim, 50% das observações centrais.
Consequentemente, quanto mais aproximados estiverem estes quartis, maior será a concentração das
observações em torno da mediana.
A amplitude interquartis pode ser definida como a diferença entre o Quartil 3 e o Quartil 1. Esta
medida de dispersão pode ser também denominada de intervalo interquartis ou intervalo quartílico.
Como podemos observar na figura que se segue, quanto mais achatada é a curva, maior é a
amplitude e quanto maior é a amplitude interquartílica, mais dispersa é a distribuição.

Figura 8: Curva simétrica achatada (platocurtica)

Figura 9: Curva simétrica

Exemplo: Calcule a amplitude interquartis, sabendo que Q3=177,46 e Q1=166,88


Q = Q3-Q1 = 177,46-166,88 = 10,58

Podemos também calcular a amplitude semi-interquatis ou intervalo inter-quartílico ou intervalo


semi-quartil ou desvio quartílico ou amplitude semi-interquartílico, que se representa, habitualmente,
por Q e pode ser definida do seguinte modo:
37
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Q = (Q3-Q1) / 2
A distribuição é tanto mais dispersa quanto maior for a amplitude interquartis.
Podemos enumerar as vantagens e as desvantagens do uso da amplitude interquartis e da amplitude
semi-interquartis:
Estas medidas são mais completas do que a amplitude total, porque usam dois valores menos
extremos (Q1 e Q3). No entanto, têm ainda a limitação de não entrarem em linha de conta com a
disposição das frequências nos intervalos definidos pelos valores separados - exemplo: a amplitude
interquartis será a mesma, quer as 50% das observações se acumulem num só ponto, quer estejam
uniformemente distribuídas por esse intervalo interquartis.
As medidas de dispersão que passaremos a descrever não têm esta limitação, porquanto o seu
cálculo depende de todos os valores da série.

Desvio
Dados n valores x1, x2, ..., xn de uma variável X, chama-se desvio de cada valor xi em relação à
constante c, a diferença de xi para c, isto é,
xi - c
Note-se que os desvios da variável X em relação a c, isto é, (x1-c), (x2-c), ..., (xn-c) constituem os
n valores da variável X-c.

Desvio médio
Falamos em desvio médio quando consideramos os desvios de cada valor xi em relação à média
aritmética, isto é:
xi-x
O simples total destes desvios não pode ser utilizado como medida de dispersão, por ser
identicamente nulo. De facto, para n valores singulares, ter-se-á:
 (xi-x)=0
No entanto, o quociente entre a soma dos módulos destes desvios e o número deles, já pode ser
considerado como medida de dispersão
D.M.=  |xi-x | / n

38
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Exemplo 20: Calcule o desvio médio para A = 4 5 3

Tabela 4: Cálculo do Desvio Médio

xi xi-x |xi-x |

4 4-4=0 0
5 5-4=1 1
3 3-4=-1 1
=12 3-4=-1 =2

x =  xi / n =12/3=4
D.M.= |xi-x| / n = 2/3=0,67

Observação: também se utiliza o desvio médio em relação a qualquer outra medida de posição
central.
Numa amostra seriada temos:
D.M.= ni |xi-x| / n =  fi |xi-x|
Se os valores da variável estiverem tabelados de modo que cada valor xi corresponda a frequência
absoluta ni, o desvio médio é igual à soma dos produtos das frequências pelos valores absolutos dos
respectivos desvios em relação à média, dividida pelo efectivo da distribuição.

Numa amostra classificada, os desvios em relação à média aritmética são calculados a partir dos
pontos médios de cada classe, ou seja,
D.M.=  ni |x'i-x'| / n =  fi |x'i-x'|
Exemplo: Calcule o desvio médio para classes [4-6[ [6-8]
ni 1 2

Tabela 5: Cálculo do Desvio Médio para classes


Classes ni x’i x’i-x’ |x’i-x’| ni|x’i-x’|
4-6[ 1 4,5 4,5-6,2 1,7 1,7
6-8 2 7 7-6,2 0,8 1,6
=2,4 =3,3

x' =  nix'i / n = (1x4,5) + (2x7) / 3 = 6,2

Então, o desvio médio é


D.M.= ni |x'i-x'| / n = 3,3 /3 = 1,1

39
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
O desvio médio apresenta a seguinte desvantagem:
Embora dependa de todos os valores observados, o desvio médio tem a desvantagem de considerar
os valores absolutos dos desvios, o que impede o seu tratamento algébrico.

Variância
Outra maneira de eliminarmos os sinais dos desvios, consiste em elevá-los ao quadrado. Por isso,
em vez da média dos valores absolutos dos desvios considera-se a média dos quadrados dos desvios.
Obtém-se, assim, uma outra medida de dispersão bastante usada - a variância amostral e a populacional.
n

 x  x
2
i
2
S  i 1
n 1

Dados n valores x1, x2, ..., xn de uma variável X, chama-se variância e representa-se, habitualmente,
por s2 ou s2 x a média aritmética dos quadrados dos desvios em relação à média dessas valores, isto é,
S2 =  (xi-x)2 / n-1

Exemplo: Calcule a variância para X=17,18,19,20,21

Então, a variância é 3

Tabela 6: Cálculo da Variância

x =  xi / n = (17+18+19+20+21) / 5 = 19

40
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
xi (xi-x) (xi-x)2
17 17-19=-2 4
18 18-19=-1 1
19 19-19=0 0
20 20-19=1 1
21 21-19=2 4
N=5 =10

S2 =  (xi-x)2 / n = 10/(5-1) = 2,5


Se x1, x2, ..., xn ocorrem n1, n2, ..., nk vezes, respectivamente, temos
Para uma amostra seriada:
S2 =  ni (xi-x)2 / n-1
Para uma amostra classificada:
S'2 =  ni (x'i-x ')2 / n-1

Exemplo 23: Calcule a variância para a distribuição cuja média é 103


Classes [85-90[ [90-95[ [95-100[ [100-105[ [105-110[ [110-115[ [115-120]
ni 12 25 38 85 93 16 9

Tabela 7: Cálculo da Variância

Classes ni x’i (nix’i) (x’i-x’) (x’i-x’)2 ni(x’i-x’)2

85-89 12 87 1044 -15,5 240,25 2883


90-94 25 92 2300 -10,5 110,25 2756,25
95-99 38 97 3686 -5,5 30,25 1149,5
100-104 85 102 8670 -0,5 0,25 21,25
105-109 93 107 9951 4,5 20,25 1883,25
110-114 16 112 1792 9,5 90,25 1444
115-120 9 117,5 1057,5 15 225 2025
278 28500,5 12162,25
x’ =  (nix’i) / n =28500,5/278 =102,5

Então, a variância é
S'2 =  ni (x'i-x’)2 / n = 12162,25/ (278-1) = 43,91

Podemos, agora, enumerar as propriedades da variância:


 Somando ou subtraindo uma constante a todos os valores observados, a variância resultante
permanecerá inalterada;
 Multiplicando ou dividindo todos os valores observados por uma constante diferente de
zero, a variância resultante virá multiplicada ou dividida, respectivamente, pelo quadrado
dessa constante.

41
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Correcção de Sheppard:
Ao calcular-se a média e a variância da amostra classificada através da distribuição empírica das
marcas, comete-se um certo erro (erro de agrupamento), pois supomos que as observações agrupadas
em cada classe têm todas o valor da respectiva marca. Todavia, existem fórmulas correctivas devidas a
Sheppard, isto é,na variancia, ao valor calculado deve subtrair-se 1/12 ao quadrado da amplitude das
classes (a)
s2 x = s2 x' - a2 /12 assim, no nosso exemplo anterior, a variancia corrigida era
s2 x =43,91 - (52 /12)
s2 x =41,827

Desvio padrão
O desvio padrão pode ser definido como a raiz quadrada da variância, representando-se,
habitualmente, por sx, isto é,

Ainda que a variância nos dê uma boa informação sobre a distribuição ou variabilidade dos valores
observados em relação à sua média, apresenta, no entanto, a desvantagem de não se exprimir na mesma
unidade a que estão referidos os dados iniciais. Contudo, esta desvantagem poderá ser eliminada se
extrairmos a raiz quadrada da variância. A nova medida chama-se desvio padrão ou desvio quadrático.
Numa amostra seriada, temos:

Exemplo: Calcule o desvio padrão, sabendo que a variância de uma amostra seriada é 2.
sx = s2 x = 2 = 1,414

Numa amostra classificada, temos

Exemplo: Calcule o desvio padrão, sabendo que a variância corrigida de uma amostra classificada
é 4327,16.

42
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Utilização das medidas absolutas de dispersão


Amplitude total
Utiliza-se quando:
Os dados forem muito raros ou demasiado dispersos para se justificar o cálculo de uma medida mais
precisa de dispersão;
For apenas necessário o conhecimento dos resultados extremos;
Desejamos um índice muito rápido de dispersão.
Amplitude interquartílica
Utiliza-se quando:
A mediana é a medida de tendência central usada;
Existirem resultados extremos que poderiam afectar o desvio padrão de uma maneira
desproporcionada;
A distribuição é truncada;
A distribuição apresenta uma forte assimetria.
Desvio médio
Utiliza-se quando:
Desejamos ponderar todos os desvios em relação à média de acordo com a sua grandeza;
Os desvios extremos influenciarem indeterminadamente o desvio padrão.
Desvio padrão e Variância
Utilizam-se quando:
Se procura uma medida de dispersão em relação com a curva normal;
Tiverem de ser calculados posteriormente coeficientes de correlação e outras estatísticas;
Se desejar obter uma medida que se revista de um máximo de estabilidade;
Se se trata somente de descrever uma distribuição prefere-se o desvio padrão à variância. A
variância intervém sobretudo na análise estatística.

Coeficiente de dispersão ou variação

As medidas de dispersão a que anteriormente nos referimos são medidas que se exprimem na mesma
unidade dos dados e, sendo assim, torna-se impossível comparar entre si as dispersões de duas
distribuições cujos valores não se refiram à mesma unidade.
Exemplo: Distribuição A: xA =30 sA =10
Distribuição B: xB=600 sB=20
Qual é a distribuição mais dispersa? Se compararmos os desvios padrões é a B, porque tem maior
desvio padrão. Mas a variação de 20 para 600 é muito maior do que 10 para 30. Assim, em vez de

43
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
compararmos os desvios padrões, aplicamos outra medida de dispersão relativa que é o coeficiente de
variação ou de dispersão, que pode ser definido pela fórmula.
S
CV  100%
X
Exemplo 26: A distribuição dos pesos e das alturas de um grupo de estudantes de determinada
Universidade conduziu aos seguintes resultados:
X: Pesos Média=57,5Kg Desvio Padrão=7,5Kg
Y: Alturas Média=170cm Desvio Padrão=7,1cm

Determine o coeficiente de dispersão para cada uma das distribuições e, depois, indique em qual
delas a dispersão relativa é maior.
Vx = sx / x = 7,5Kg / 57,5Kg = 0,130 = 13%
Vy = sy / Y = 7,1cm / 170cm = 0,042 = 4,2%

Assim, podemos dizer que a dispersão relativa é mais acentuada na distribuição dos pesos (X).
A dispersão é maior na distribuição que tiver maior coeficiente de dispersão.
Se pretendermos estabelecer comparações entre dispersões absolutas, devemos usar o desvio
padrão, de tal modo que quanto maior for o desvio padrão maior será a dispersão.
Se pretendermos estabelecer comparações entre dispersões relativas, devemos usar um coeficiente
de dispersão, de tal modo que quanto maior for o coeficiente de dispersão V maior será a dispersão.

5. Características da distribuição normal

A distribuição normal é simétrica e apresenta uma curva em forma de sino, como mostra a figura.
A sua principal característica é a de as três medidas de tendência central - média, mediana e moda - Se
encontrarem todas no mesmo ponto da curva, ou seja, todas terem o mesmo valor ou, pelo menos,
valores muito próximos. Se os elementos que constituem uma distribuição estão muito próximos ou
muito dispersos, encontraremos assimetrias positvas ou negativas, consoante a media seja inferior à
mediana e moda (negativa) ou superior às mesmas (positiva).

44
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Figura 7: Distribuição normal

Estas não são distribuições normais, apesar de a média, a mediana e a moda se encontrarem todas
no mesmo ponto (é isto que confere simetria à distribuição); a distribuição normal tem sempre a forma
de um sino. Como foi «descoberta» pelo matemático Gauss, também lhe chamamos distribuição
gaussiana.
A maior parte dos dados recolhidos com organismos vivos têm este padrão. Podemos observar que,
devido à forma da curva, há poucos resultados muito baixos e poucos resultados muito eleva. dos (a
curva «cai» nos extremos esquerdo e direito, o que se deve às baixas frequências encontradas), enquanto
a maioria dos resultados se encontram junto à média. Vamos debruçar-nos sobre o padrão de resultados
muito em breve, mas nesta fase referiremos outra característica muito importante da distribuição normal.
Teóricamente, a curva nunca toca o eixo horizontal, mas aproxima-se dele infinitamente. Esta é uma
propriedade matemática da distri' buição que não se reflecte na recolha de dados «real». Não nos
cruzamos com seres humanos com dimensões gigantescas ou microscóspicas!
Então as propriedades da distribuição normal são as seguintes:
1) É simétrica;
2) Tem forma de sino;
3) A média, a mediana e a moda encontram-se no mesmo ponto da curva;
4) Tem duas pontas que nunca tocam o eixo horizontal.

Podemos perguntar-nos quão rígida é a distribuição normal relativamente aos elementos. Por outras
palavras, quanto pode uma curva desviar-se da forma de sino e continuar a ser considerada normal?
Geralmente, usamos duas abordagens para tomarmos este tipo de decisão; na verdade, este problema é
mais importante do que o leitor pode pensar, pois existem testes estatísticos, descritos mais à frente, que
só podem realizar-se se os elementos forem normalmente distribuídos. Uma das abordagens baseia-se

45
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
na observação dos dados «por averiguação», para lhe darmos um nome mais respeitável. Se o conjunto
de números for extenso, tornar-se-á mais fácil desenhar uma distribuição de frequências. A outra
abordagem reside em seguir um dos procedimentos matemáticos para determinar se um conjunto de
resultados é normalmente distribuído. A versão do teste do quiquadrado que incluímos neste manual é
um desses procedimentos. Na verdade, é improvável que nesta fase da sua carreira estatística necessite
de saber com grande precisão se uma distribuição é considerada normal ou não, pelo que o teste gráfico
deve bastar. No entanto, deve ser sensível ao problema.

5.1 A curva normal e os desvios-padrão

Suponhamos que temos um conjunto de números cuja média é 50 e cujo desvio padrão é 5.
Chamamos a este valor (centímetros, segundos, pontos numa escala, ou outra coisa qualquer) um desvio
padrão. Dez centímetros, segundos, etc., seriam dois desvios padrão e quinze centímetros, segundos,
etc., três desvios padrão ... sempre com referência ao conjunto através do qual obtivemos o valor 5. É
como se pudéssemos tirar o desvio padrão e transformá-lo numa unidade de medida de uma escala; é
como se disséssemos que uma polegada são 2,54 cm. Nunca misturaríamos polegadas e centímetros nos
mesmos cálculos, mas poderíamos converter uma unidade na outra. Do mesmo modo, não misturamos
resultados de desvios padrão com resultados reais, mas convertemos uma escala na outra.
Voltemos às proporções de números em diferentes partes da distribuição. Se retirarmos uma parte
da curva entre a média, que esta marcada no eixo horizontal da figura que se segue como 50, e um
desvio padrão, marcado no eixo horizontal como 55, sabemos que devemos ter cerca de um terço de
todos os resultados neste conjunto, porque é o que acontece sempre com a distribuição normal. De uma
forma mais precisa, a proporção exacta do número total de resultados que se encontram entre a média e
um desvio-padrão acima da média (50 e 55 neste caso) é 34,13 %. Como a distribuição normal é
simétrica, deve verificar-se a mesma coisa abaixo da média, isto é, devemos ter outros 34,13 % dos
resultados entre os valores 50 e 45 - sendo 45 o valor da média menos um desvio-padrão de 5 pontos.
Observemos as duas partes a sombreado. A aritmética elementar diz-nos que 68,26 % do total dos
resultados se encontram entre os valores 45 e 55, pertencendo 31,74 % aos valores extremos que se
encontram nos outros dois lados. Mais uma vez, a simetria da curva significa que, para esta proporção,
metade de 31,74 %, ou seja, 15,87 %, encontra-se de cada um dos lados da distribuição. Por outras
palavras, cerca de 16 % de todos os números neste conjunto serão menores do que 45, sendo a mesma
quantidade maior do que 55.

Exemplo: Suponhamos que o professor obtém os resultados de um teste de leitura feito a 200
crianças. Os resultados são normalmente distribuídos com uma média de 60 e um desvio-padrão de 8.
A partir das propriedades da distribuição normal, sabemos que cerca de dois terços dos resultados, isto
46
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
é, aqueles que foram obtidos com cerca de 136 crianças, encontrar-se-ão entre os 52 e os 68 pontos.
Cerca de 32 crianças (16 %) terão resultados abaixo de 52 e cerca de 32 terão resultados acima de 68.
Já os referimos todos. Suponhamos então que os pais de uma criança que obteve 68 gostariam de
saber algo acerca do progresso do seu filho. Quando souberam que o resultado da criança estava «acima
da média», ficaram contentes, mas gostariam de saber, posteriormente, quão acima da média se
encontra, relativamente aos outros 50 % de crianças que também obtiveram resultados «acima da
média». Por outras palavras, os pais pretendem saber qual a posição relativa do desempenho do filho.
Se os resultados estivessem todos muito perto da média, sendo a nota máxima 68, os pais continuariam
encantados. Ficariam, porém, menos satisfeitos se soubessem que a nota máxima tinha sido 90, com um
grande conjunto de notas altas, acima de 70. No entanto, o professor sabe que o desvio-padrão das notas
foi 8 e, por isso, um terço de todos os resultados estava entre 60 e 68. Sabendo que 50 % dos resultados
obtidos estavam «abaixo da média», podemos perceber que a posição desta criança está ao nível de 84
% dos resultados, na parte superior de todos os resultados.
Afinal, os pais têm razões para estarem contentes! Se a criança tivesse obtido 76, os pais teriam
muito mais razões para estarem orgulhosos, pois saberiam que o seu filho estava acima de 98 % das
outras crianças (nota 76 e dois desvios-padrão acima da média); uma nota 84 colocaria o menino na
posição invejável de estar acima de 99,87 % das outras crianças - por outras palavras, num grupo de
200 crianças, estaria, muito provavelmente, no topo. Os desvios-padrão cortam proporções fixas da
distribuição normal, a partir da média e até ao infinito (pelo menos teoricamente), nas duas direcções.
Deve certificar-se de que percebeu como se obtém a posição relativa da nota 76 (isto é, 50 % + 33 % +
15 %) e como se calcula que neste grupo de crianças existem outras quatro com notas acima de 76. Veja
se consegue calcular a nota que colocaria a criança na posição, menos invejável, de estar apenas a quatro
lugares do fim.
A resposta é 44. Para obtermos esta nota necessitamos de saber que nota representa dois desvios-
padrão abaixo da média ou que nota corresponde a 2 %. Partindo de 60, a média, se lhe subtrairmos o
valor de dois desvios-padrão - 16, duas vezes o valor de 8, que é um desvio-padrão - obteremos 44.
Devemos ter cuidado e não misturar os valores dos desvios-padrão com os resultados reais. Neste
exemplo não subtraímos o valor 2 da média de 60, apesar de querermos o resultado que estava dois
desvios-padrão abaixo dele. Subtraímos 16 pontos, pois este é o número que corresponde a dois desvios-
padrão para este conjunto de re sultados.
Resultados z Nos exemplos considerados os resultados encontravam-se sempre na média, ou
exactamente um, dois ou três desvios-padrão acima ou abaixo dela. Temos, porém, de examinar
resultados que não sejam tão facilmente convertíveis para desvios-padrão. Suponhamos, por exemplo,
que uma criança com pais ansiosos obteve uma nota 64 num teste de leitura. A posição da criança na
curva seria a metade da distância, no eixo horizontal, entre o resultado da média (60) e um desvio-
padrão acima (68).
A posição da criança é exactamente a meio entre os pontos 60 e 68. Significará isto que a sua posição
no grupo é o ponto central entre a média de 50 % e 84 % da nota 68? Isto é, encontrar-se-á a criança
47
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
acima de 67 % dos colegas? Olhemos cuidadosamente para as duas porções da curva que está dividida
pela linha ao nível da nota 64. Serão simétricas? Não - e aqui temos um problema que torna o cálculo
de uma posição relativa muito mais complicado e cansativo do que gostaríamos. Quanto mais nos
afastamos da média, menos resultados correspondem às diferentes proporções. Assim, se tivermos duas
porções entre 60 e 64 e entre 64 e 68, haverá menos resultados neste último intervalo. Haverá ainda
menos no intervalo séguinte, entre as notas 68 e 72, e assim sucessivamente. Isto também é verdadeiro
para os resultados abaixo da média, mas, neste caso, são os resultados mais elevados, e não os mais
baixos, que se encontram mais perto da média. Há muito menos resultados entre 44 e 48 do que entre
48 e 52, apesar de, em ambos os casos, a variação de notas ser de 4 pontos, ou seja, meio desvio-padrão.
Quando olhamos para a forma de uma distribuição normal, o tamanho diferente das proporções que
cada desvio-padrão compreende parece óbvio. No entanto, o problema de decidir a posição relativa de
uma nota 64, quando comparada com os resultados, não desapareceu. Como podemos determiná-la? A
resposta é dada através de resultados z. Os resultados z correspondem a desvios-padrão e, na verdade,
são virtualmente a mesma coisa, excepto no facto de um resultado z se referir sempre à posição de um
ponto em relação a média. Isto vai tornar-se claro em breve. Para já, pensemos que um resultado z de 1
é a mesma coisa que um desvio-padrão de 1, que um resultado z de 2 e um dp 2, e assim por diante.
Como não há, virtualmente, nada numa distribuição normal depois do terceiro desvio-padrão ou
resultado z - em qualquer das direcções -, é r,aro que os desvios-padrão ou os resultados z incluam o
valor 4. E comum referirmo-nos aos resultados z como mais ou menos; aos desvios-padrão descrevemo-
los como situando-se acima ou abaixo da média, em vez de mais ou menos. Um desvio-padrão tem um
valor definido não variável, enquanto um resultado z se refere a uma posição relativa na curva e é
referido em função da média. Como, até agora, um resultado z tem o mesmo significado que um desvio-
padrão acima da média, podemos considerar que os resultados z e os desvios-padrão são iguais. No
entanto, um desvio-padrão pode referir-se a um conjunto de resultados que distem um desvio-padrão de
qualquer ponto da curva, enquanto os resultados z têm posições fixas. Um resultado z de + 1 corresponde
exactamente a um desvio-padrão acima da média, e não a qualquer conjunto de resultados que
constituam um desvio-padrão. Voltemos ao problema do resultado de 64 e à sua posição relativa.
Sabemos que a sua posição é exactamente metade de um desvio-padrão acima da média, pelo que lhe
damos um resultado z de + 0,5.

Há tabelas que nos permitem ver muito facilmente onde os resultados z se situam na curva normal.
Procure uma tabela estatística da distrbuição normal vejamos como utilizá-las. Utilizaremos o nosso
exemplo de 64, cujo valor z é + 0,5.
Lemos o valor na primeira coluna da esquerda, encabeçada por z, até chegarmos ao valor 0,5.
Olhamos para a coluna à direita e vemos o número 19,15. Temos de somar 50 %, de modo a obtermos
o valor 69,15. Sabemos então que há 69,15 % dos resultados abaixo de 64 e 30,85 % acima. Devemos
arredondar os valores para 69 % e 31 %, respectivamente. Consideremos outro exemplo, desta vez com
o valor 65. Este valor está 5 pontos acima da média e o desvio-padrão para o conjunto é de 8. Um
48
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
resultado de 5 pontos acima da média é 5/8 de desvio-padrão acima da média. Se fizermos as contas,
sabemos que z é + 0,63. Como se encontra acima da média, o seu valor é positivo. Voltemos à tabela.
Como z tem, desta vez, duas casas decimais, os procedimentos vão ser um pouco diferentes. O valor
imediatamente à direita (22,7) é a percentagem correcta para um resultado z de 0,6. No entanto, o nosso
resultado é 0,63, pelo que temos de andar três colunas da tabela até ao valor 0,03, no topo. Este valor,
somado ao valor 0,6, dá-nos o z de 0,63 - ou seja, 23,57. Como o nosso z é positivo, devemos somar-
lhe 50 % para obtermos o valor final de 73,57. Assim, a nota 65 está à frente de 74 % da escala. Podemos
ver pela tabela que 49 % de todas as notas em cada um dos lados da curva estão incluídas num z de 2,33
ou um bocadinho mais abaixo, para sermos mais precisos). Notemos que, matematicamente, as caudas
da curva nunca tocam o eixo horizontal, nem incluem todos os resultados possíveis.
Reparemos agora na posição relativa de uma pessoa que obtenha um resultado abaixo da média,
digamos uma nota 41 na amostra original. Esta nota está 19 pontos abaixo da média, apenas um pouco
menos do que dois desvios-padrão. Para sermos precisos, está 19/8 ou 2,375 abaixo. O seu z será -
2,375. Na tabela SI iem anexo vemos que um z de + 2,3 inclui 48,93 % dos resultados, mas o nosso
resultado z é o valor um pouco superior de 2,375. A nossa tabela só pode ser usada com duas casas
decimais, pelo que vamos arredondar este valor para 2,38. Paramos, desta vez, junto da coluna de 0,08
e obtemos o valor 49,13. Assim, um z de + 2,38 inclui 50 % + 49,13 % = 99,13 % de todos os resultados.
Até agora tudo bem, mas o problema é que o nosso valor era negativo. Basta virarmos a nossa curva ao
contrário e trabalharmos com a sua imagem ao espelho. Assim, com o nosso valor - 2,38 sabemos que
99,13 % de todas as notas da distribuição estão acima dele e apenas 0,87 % abaixo. Se considerarmos
esta pequena proporção de 1 %, devemos esperar que, na nossa amostra de 200 indivíduos, 1 %, ou seja,
dois indivíduos tenham notas inferiores a 41. No outro extremo das notas, devemos esperar que apenas
dois alunos tenham notas de 19 ou mais pontos acima da média, ou seja, notas que excedam os 79 %.
O modo de obter o valor z é dado pela expressão formal
Z= desvio da nota em relação à média
desvio-padrão
Se o desvio em relação à média tiver um sinal positivo ou negativo, se estiver acima ou abaixo da
média, respectivamente, z ficará com o sinal correcto.

Nota: : tenha cuidado quando trabalhar com z e dp, de modo a usá-los sempre que os dados através
dos quais foram obtidos sigam uma distribuição normal Ou aproximadamente normal. De outro modo,
arranjará confusões

6. Estatística Paramétrica e Não Paramétrica

Paramétricos: calcula as diferenças numéricas exactas entre os resultados.


49
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Não paramétricos: apenas consideram se certos resultados são superiores ou inferiores a outros
resultados.
Requisitos para utilização de testes paramétricos
Quando se pretende empregar um teste t de Student ou uma análise da variância para fazer
comparações entre amostras (testes paramétricos), existe uma lista de requisitos que inclui, entre outros:
que a variável tenha sido mensurada num nível mínimo intervalar;
que a distribuição seja simétrica e mesocurtica;
que a característica estudada (variável) tenha distribuição normal numa dada população.

Sempre que não se pode, honestamente, admitir a simetria e a normalidade de distribuição, ou os


dados foram recolhidos num nível de mensuração inferior ao intervalar, devemos recorrer a testes que
não incluem a normalidade da distribuição ou nível intervalar de mensuração. Esses testes chamam-se
não paramétricos

Vantagens dos testes não-paramétricos


Podem ser utilizados, mesmo quando os seus dados só podem ser medidos num nível ordinal, isto
é, quando for apenas possível ordená-los por ordem de grandeza) podem ser utilizados mesmo quando
os seus dados são apenas nominais, i.e., quando os sujeitos podem apenas ser classificados em
categorias.

Poder de um teste
O poder de um teste é a probabilidade de rejeitarmos a H0 quando ela é realmente nula
Os testes mais poderosos (os que têm maior probabilidade) de rejeição de H0, são testes que
possuem pré-requisitos mais difíceis de satisfazer (testes paramétricos como t e F).
As alternativas não paramétricas exigem muito menos pré-requisitos mas produzem testes de
significância com menos poder que os correspondentes paramétricos.

Em consequência
Ao rejeitar-se a H0 sem preencher as exigências mínimas dos testes paramétricos, é mais provável
que essa rejeição seja falsa (se rejeitar a H0 quando ela é verdadeira comete um erro de tipo I; se aceitar
a H0 quando ela é falsa comete um erro de tipo II). Quando os requisitos de um teste paramétrico são
violados, torna-se impossível conhecer o seu poder e a sua dimensão ()
É obvio que os investigadores querem, a todo o custo, rejeitar a H0 quando ela é mesmo falsa,
evitando um erro de tipo I.
O teste ideal seria aquele que =0 e =1, o que implicaria que o teste conduziria sempre à decisão
correcta, contudo este teste ideal raramente existe.

50
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
A probabilidade do erro de 1ª espécie deve ser reduzida, fixando  teórico em 0,1; 0,05 ou 0,01. o
valor fixado para  depende da importância que se dá ao facto de rejeitar a H0 quando esta é verdadeira.
Uma ilustração deste ponto de vista pode ser feita com o seguinte exemplo:
Uma pessoa é inocente até prova do contrário
H0: A pessoa é inocente
H1: A pessoa é culpada
Erro I: A pessoa é condenada mas está inocente
Erro II: A pessoa é absolvida mas é culpada

Naturalmente a justiça procura reduzir a possibilidade de ocorrer o erro de 1ª espécie, pois entende-
se que é mais grave condenar inocentes que absolver criminosos.
Para certos sistemas judiciais um  = 0,1 é demasiado elevado, optando por =0,01; noutros
sistemas judiciais pode admitir que = 0,05 é um valor razoável.

ASSIM …
Fixada a probabilidade do erro de tipo I (dimensão do teste), o teste mais potente é aquele em que
a escolha da região critica minimiza a probabilidade do erro de 2ª espécie. Diz-se também que esta
região critica é a mais potente.
Facilmente se conclui que o teste mais potente é aquele que, uma vez fixada a probabilidade de
rejeitar a H0, quando ela é verdadeira, maximiza a potência ou a capacidade para rejeitar a mesma
hipótese quando esta é falsa.

Pressupostos
Para saber se uma variável é simétrica dividimos o coeficiente assimetria (Skewness) pelo erro
padrão e se o resultado estiver entre 2 e -2 a distribuição é simétrica.
Para saber se uma variável é mesocurtica dividimos o coeficiente de achatamento (Kurtosis) pelo
erro padrão e se o resultado estiver entre 2 e -2 a distribuição é mesocurtica.
Mas se os resultados de um teste paramétrico, não cumpriram com os requisitos (no mínimo dados
intervalares; distribuição simétrica, mesocurtica e normal), então não têm interpretação significativa.
Quando acontecem estes factos, a maioria dos investigadores opta por testes de significância não-
paramétricos.

Para escolher qualquer tipo de teste estatístico


Distinguir se a nossa amostra é constituída pelos mesmos sujeitos em todas as situações ou se é
formada por diferentes sujeitos para cada situação

51
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Inter-sujeitos ou design não-relacionado
este tipo de design é utilizado quando um indivíduo ou objecto é avaliado apenas uma vez. A
comparação é efectuado entre os grupos de sujeitos/ objectos cujos resultados são não-relacionados.
Desvantagem: conjunto das diferenças individuais na forma como os sujeitos reagem ou respondem
à tarefa.

Intra-sujeitos ou design relacionado


A comparação é feita entre os mesmos sujeitos (sujeitos do mesmo grupo).
A importância destes designs é a eliminação de quaisquer particularidades individuais, uma vez que
ficam igualizadas em todas as situações.
Desvantagem: Efeito de memória e aprendizagem.

Amostras emparelhadas
Igualizam-se sujeitos diferentes mas emparelhados, em termos de idade, sexo, profissão e outras
características gerais que parecem importantes para cada pesquisa em particular.
estes tipos de designs podem ser considerados de designs relacionados, uma vez que é controlado
nas suas características relevantes.
Desvantagem: Dificuldade em encontrar sujeitos que permitam o emparelhamento de todas as
características relevantes.
Dificuldades arranjar grandes amostras.

Estratégias estatisticas de análise de dados


A maioria dos investigadores principiantes enfrenta sérias dificuldades quando tem de usar a análise
estatística. É apontado como prováveis causas o ensino de Estatística que, frequentemente, tem um
enfoque matemático ou de receita que não conduzem ao aproveitamento desta ferramenta e o
consequente despoletar de uma “ansiedade matemática”, que pode levar os estudantes a evitar o seu
uso. Essa situação conduz, não raras vezes, à dependência de outros para seleccionar a estatística
adequada ao seu projecto. O objetivo desta lição é ajudar a ter uma idéia da potencialidade da estatística
apropriada a sua pesquisa.

Primeiro examine seu estudo, identifique o que quer com sua análise estatística, devendo, para
isso, especificar claramente as várias questões a que quer que sua análise estatística responda (conhecer
a associação ou verificar as diferenças). Comece por escrever as suas questões de pesquisa e hipóteses.
Depois identifique a variável dependente e independente bem como os seus níveis de mensuração. Apos
estar na posse dessa informação consulte a figura que se segue e vai ver que tudo começa a ficar mais
fácil.

52
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Figura 8: identificar os testes estatisticos

Como segundo passo na escolha da estatística apropriada, verifique se sua variável dependente é
adequada para a estatística paramétrica. A estatística paramétrica envolve pelo menos dois
pressupostos iniciais: o primeiro é se a variável dependente segue uma distribuição normal e, o
segundo, é se os dados entre diferentes sujeitos são independentes ou emparelhados/relacionados.
Portanto, uma variável dependente qualitativa ou categórica não se enquadra neste tipo de estatística,
devendo usar o enfoque da estatística não paramétrica.

Assim recorremos a estatística paramétrica quando analisamos variáveis dependentes


contínuas. Se essas variáveis violam os pressupostos e não tem como corrigir essa violação, então deve

53
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
utilizar a estatística não paramétrica. Só tem duas opções: ou aprende a lidar com a Estatística não
paramétrica ou então aumenta o tamanho da amostra.

Examine cada variável dependente uma por uma nesse processo. Nem todas terão as mesmas
características. Um erro comum, por exemplo, é assumir que pode usar sempre o mesmo teste
estatístico se os grupos experimentais são equivalente em idade, género, anos de estudos e outras
variáveis demográficas. Idade e anos de estudo são duas variáveis geralmente analisadas com estatística
paramétrica. O género e a etnia são variáveis nominais e por isto devem ser analisadas com Estatística
não paramétrica.

Definir quais as estratégias estatísticas a utilizar exige o conhecimento das lições anteriores. As
mais robustas estratégias estatísticas exigem que as variáveis apresentem propriedades intervalares para
que sejam obtidos resultados fidedignos. Contudo na investigação com seres humanos nem sempre é
possível termos variáveis quantitativas, por isso para cada teste estatístico paramétrico existe um
equivalente não paramétrico mas destes últimos existem vários que não tem equivalente paramétrico.

Por exemplo se tanto a nossa variável dependente (VD) quanto a independente (VI) forem nominais
e quisermos conhecer a associação entre elas podemos recorrer ao qui-quadrado (x2 ) da independência;
se ambas forem ordinais podemos recorrer ao rho de spearman mas se forem quantitativas e cumprirem
com os restantes pré-requisitos da estatistica paramétrica (simétricas, mesocurticas e distribuição
normal) podemos utilizar o teste r de Pearson.

Se em vez de querermos ver umas associação ou correlação pretendermos verificar se existem


diferenças na distribuição de uma variável (VD) em função de outra com nivel de mensuração nominal
e dicotómica (VI) então podemos utilizar o teste t de Student para amostras independentes (caso estejam
cumpridos os prerequisitos impostos à VD ié, quantitativa, simétrica e apresente distribuição
aproximadamente normal) ou o seu equivalente não paramétrico u de Mann-Whitney (caso não estejam
cumpridos os pré-requisitos da estatistica paramétrica mas a VD tenha um nivel de mensuração no
minimo ordinal).

54
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Se a figura anterior não o deixou muito esclarecido experimente consultar o quadro que se segue.
Otestes estatísticos paramétricos estão assinados com um asterisco ( *)

Tabela 8: grelha de decisão dos testes

NIVEIS DE MENSURAÇÃO
Nominal Ordinal Quantitativa
Testes para
TESTE DE KOLMOROGOV- -TESTE DE
uma amostra
TESTE DE QUI-QUADRADO DA ADERÊNCIA SMIRNOV KOLMOROGOV-SMIRNOV
-TESTE T PARA UMA
AMOSTRA *

Variáveis Independentes
Qualitativas Quantitativa

Nominal/ dicotomica Ordinal/ Grupo


TESTE DE QUI-QUADRADO DA INDEPENDENCIA
Nomina
l KAPPA DE COHEN TESTE DE QUI-QUADRADO DA
INDEPENDENCIA
MACNEMAR
Q DE COCHRAN

TESTE DE QUI-QUADRADO DA INDEPENDENCIA RHO DE SPEARMAN


Variáveis Dependentes

TESTE DE U DE MANN-WHITNEY W DE WILCOXON

Ordinal TESTE DE H DE KRUSKAL-WALLIS KAPPA DE COHEN RHO DE SPEARMAN


MACNEMAR
TESTE DE QUI-QUADRADO DA
INDEPENDENCIA
TESTE T DE STUDENT PARA DADOS TESTE T DE STUDENT
INDEPENDENTES * PARA N EMPARELHADOS *
TESTE DE U DE MANN-WHITNEY W DE WILCOXON
TESTE ANOVA DE UM CRITÉRIO E RESPECTIVO
Quantit POST-HOC * R DE PEARSON *
RHO DE SPEARMAN
ativa
RHO DE SPEARMAN
TESTE DE H DE KRUSKAL-WALLIS e U POR TESTE ANOVA PARA
GRUPO MEDIDAS REPETIDAS *

TESTE FRIEDMAN

Supondo que suas variáveis dependentes tivessem uma distribuição normal ou que sua amostra
fosse suficientemente grande, deve verificar todas as possibilidades de análise: univariada , bivariada,
múltipla e multivariada, se for o caso. A análise univariada é quando a variável é analisada per se,
análise bivariada quando uma variável dependente é relacionada com uma única variável independente,
análise múltipla quando se analisa uma variável dependente em função de várias variáveis
independentes, e análise multivariada, quando se analisa várias variáveis dependentes contínuas em
função de variáveis independentes categóricas ou quando se analisa a estrutura das variáveis, visando a
redução do número de variáveis.
O quadro anterior não esgota as analises estatísticas, aliás existem outras tantas quantas as que
apresentamos aqui, contudo mostra as mais utilizadas nas análises univariadas e bivariadas.

55
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
6.1. Testes paramétricos passo-a-passo

6.1.1 Teste t de Student (não relacionado)

Características e requisitos do TESTE T não relacionado ou independente


1. Teste para a comparação de médias;
2. Distribuição com forma leptocúrtica, isto é, as caudas da distribuição são mais grossas do que na
distribuição normal;
3. Escala de medida intervalar e Contínua;
4. Simétrica;
5. De forma campanular;
6. Varia de mais infinito a menos infinito;
7. desvio padrão da variável de acordo com n.
8. distribuição normal;
9. n >=30).

Utiliza-se para designs experimentais com duas situações testando uma variável independente,
quando nessas situações se encontram sujeitos diferentes - designs não relacionados. O teste t não
relacionado é o equivalente paramétrico do teste não paramétrico U de Mann-Whitney; ambos
comparam diferenças entre dois grupos.
O objectivo deste teste é comparar a quantidade da variabilidade devida às diferenças previstas nos
resultados entre dois grupos com a variabilidade total nos resultados dos sujeitos. As diferenças
previstas são calculadas como uma diferença entre os resultados médios entre os dois grupos.
A estatística t representa o tamanho da diferença entre as médias para os dois grupos, tomando em
consideração a variância total.
Para que o valor observado de t seja significativo terá de ser igual ou superior aos valores
críticos de t apresentados na tabela.

56
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Instruções passo-a-passo

1. Elevar ao quadrado cada resultado individual para ambos os grupos em separado


2. Adicionar os totais dos resultados ao quadrado para cada grupo
3. Elevar ao quadrado todos os resultados individuais para cada grupo
4. Calcular a média para cada grupo
5. Calcular t:

em que

 1 = média do grupo 1
 2 = média do grupo 2
 x1 2 = soma dos quadrados para o grupo 1
 x2 2 = soma dos quadrados para o grupo 2
( x1 )2 = resultados totais do grupo 1 ao quadrado
( x2 )2 = resultados totais do grupo 2 ao quadrado
n1 = número de sujeitos do grupo 1
n2 = número de sujeitos do grupo 2
(n1 - 1) + (n2 - 1) = graus de liberdade (gl)

Se t observado  t crítico rejeita-se H0 Se t observado < t crítico aceita-se H0

57
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Exemplo: para verificar se duas dietas para emagrecer são igualmente eficazes, um médico
separou ao acaso um conjunto de pacientes em dois grupos. Cada paciente seguiu a dieta
designada para o seu grupo durante 4 meses. O médico registou a perda de peso em kg de cada
paciente por grupo. Os dados estão apresentados no quadro que se segue:

Tabela 9: Comparações médias

Grupo 1 (dieta 1) Grupo 2 (dieta 2)

Resultados Resultados ao quadrado Resultados Resultados ao quadrado

10 100 2 4

5 25 1 1

6 36 7 49

3 9 4 16

9 81 4 16

8 64 5 25

7 49 2 4

5 25 5 25

6 36 3 9

5 25 4 16

x 1 = 64 x1 2 = 450 x2 = 37 x2 2 = 165

Calcule o valor de t observado4 e verifique se é igual, superior ou inferior ao valor crítico e interprete
o resultado.

4
Solução:t Obs =3,1 t crit(18)=2,9

58
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
6.1.2 Teste t de Student (relacionado)

Características e requisitos do TESTE T relacionado ou emparelhado

Utiliza-se para designs experimentais com duas situações testando uma variável independente,
quando os mesmos sujeitos (ou emparelhados) se encontram em ambas as situações - design
relacionado. O teste t relacionado é equivalente ao teste não paramétrico de Wilcoxon.
O objectivo é comparar as diferenças entre as duas situações experimentais com a variabilidade
total nos resultados. Quando os mesmos sujeitos são usados em ambas as situações podem comparar-se
pares de resultados obtidos por cada indivíduo quando sujeito a ambas as situações.
A estatística t apresenta o tamanho das diferenças entre os resultados dos sujeitos para as duas
situações. Para que seja significativo o valor de t terá de ser igual ou superior aos valores críticos da
tabela

Instruções passo-a-passo
1. Calcular as diferenças entre os resultados dos sujeitos subtraindo os resultados da situação B para
a situação A
2. Elevar essas diferenças ao quadrado
3. Calcular o somatório das diferenças obtidas (d)
4. Calcular o somatório do quadrado das diferenças (d2 )
5. Elevar ao quadrado as diferenças totais (d)2
6. Calcular t:

59
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

em que
 d = soma das diferenças dos resultados A e B
 d2 = soma dos quadrados das diferenças
( d)2 = soma das diferenças elevadas ao quadrado
N = número de sujeitos
N – 1= gl
Por fim consulta-se a tabela dos valores críticos e,
Se t observado  t crítico rejeita-se H0 Se t observado < t crítico aceita-se H0

Tabela 10: valores criticos de t student

60
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Exemplo: Para verificar se a eficácia de uma dieta era influenciada pelo ministrar de um
fármaco, um médico decidiu administrar, a um grupo de individuos que o tinham procurado
para perder peso, um placebo em conjunto com uma dieta que já havia administrado um mês
antes aos mesmos sujeitos. Referiu aos seus casos que aquele medicamento servia para perder
apetite e ajudava a queimar gorduras. Registou a perda de peso que tinha ocorrido nos 30 dias
antecedentes à tomada de placebo e trinta dias após o placebo. Os resultados estão no quadro
que se segue
Tabela 11: experiment farmaco vs placebo

Sujeito Situação A (com placebo) Situação B (só com dieta) d (A-B) d2

1 10 2 8 64

2 5 1 4 16

3 6 7 -1 1

4 3 4 -1 1

5 9 4 5 25

6 8 5 3 9

7 7 2 5 25

8 5 5 0 0

9 6 3 3 9

10 5 4 1 1

Total 64 37  d = 27  d2 = 151

Instruções Passo-a-Passo:
1. construir tabela
2. calcular as médias
3.  d = 27
4.  d2 = 151
5. ( d)2 = 27 x 27 = 729
6. proceder aos calculos
7. g.l. = N - 1 = 10 - 1 = 9
calcule o valor observado5 de t e verifique se é superior, igual ou inferior ao valor crítico de e
interprete os resultados.

5
tobs=2,90; tcrit(0,010) =2,821

61
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
6.1.3 Correlação momento-produto de brawais-pearson

Quando estudamos um grupo relativamente a dois caracteres vemos, como já dissemos, que pode
existir uma relação entre eles.

Se medirmos os raios de várias circunferências e também os seus perímetros verificamos que existe
uma relação entre eles que é constante; neste caso temos "dependência funcional". Isto quer dizer que
existe uma fórmula exprimindo a medida do segundo em função da do primeiro: P=2r.

Suponhamos agora que registamos, durante todos os dias de um certo período de tempo, o numero
de alunos que frequentam a biblioteca do Instituto Superior Miguel Torga e o número de passageiros
dos SMTUC da linha 6 (CHC-HUC). Vê-se bem que entre as duas estatísticas assim obtidas não é
esperada nenhuma relação. Diremos que os dois caracteres são "independentes". Mas espera-se que
exista uma dependência estatística entre as pessoas que tentam o suicídio e a depressão. Diremos que
estes caracteres estão correlacionados.

Desde que os dois caracteres sejam tais que as suas variações sejam sempre no mesmo sentido, ou
em sentidos contrários, pressentimos que os caracteres estejam ligados entre si: dizemos, então, que
existe uma correlação entre eles.
Estes métodos de correlação foram criados por Sir Francis Galton, que trabalhou juntamente com
Pearson, nos fins do século XIX. A correlação e a regressão são dois aspectos que andam sempre muito
ligados, pertencendo à Estatística correlacional. Assim, importa fazermos a distinção entre eles:

A correlação pode ser definida como o grau de semelhança no sentido das variações entre os valores
correspondentes dos dois caracteres, isto é, a correlação preocupa-se quer com a descrição da relação
entre variáveis quer com a sua direcção (directa ou inversamente proporcional, positiva ou negativa).
Já a regressão é usada quando queremos conhecer as variáveis preditoras de uma outra conhecida.

Tipos de coeficiente de correlação


Basicamente, podemos considerar dois tipos de coeficientes de correlação:
- Coeficiente de correlação momento-produto de Brawais-Pearson, cujo símbolo é "r", e que é uma
técnica de estatística paramétrica;
- Coeficiente de correlação Rho de Spearman-Rank, cujo símbolo é "", e que é uma técnica de
estatística não paramétrica.

Devemos salientar que, para o cálculo das correlações, é necessário termos sempre duas medidas
para cada sujeito.

62
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Representação gráfica
À representação gráfica da correlação chamamos diagrama de dispersão de pontos ou scatterplot
ou scattergram e, genericamente, toma a seguinte forma:

Figura 9: Diagrama de dispersão de pontos ou scatterplot ou scattergram


A análise de r de pearson deve vir acompanhada do diagrama de dispersão, pois a associação pode
não ser linear.

140 160

r=0 r  0,90
0 0
0 20 0 14

Figura 10: Diagrama de dispersão de pontos ou scatterplot ou scattergram não linear

• Correlação não implica relação de Causa & Efeito.


Suponhamos que temos duas séries estatísticas formadas pelos valores xi e yi onde os pontos podem
ser dispersos e colocados ao acaso no plano; pode acontecer que os pontos cubram uma porção do plano
da qual se pode definir o contorno; esta forma sugere que as duas variáveis estão ligadas. Limitemo-nos
ao caso mais simples em que a nuvem tem uma forma alongada lembrando uma elipse e suponhamos
que a sua orientação é tal que desde que X cresça, a variável Y também cresce. A forma desta nuvem
sugere a possibilidade da existência de uma recta tal que os valores estimados por esta recta, a partir
dos valores de xi, sejam boas aproximações dos valores de yi. Podemos determinar pelo método dos
mínimos quadrados uma recta tal que a soma dos quadrados dos desvios seja mínima. Esta recta é
chamada recta de regressão de Y em X ou recta de estimação de Y em X.

63
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Mas, poderíamos, de um modo semelhante, procurar uma recta tal que os valores de x estimados ao
longo desta recta, a partir de yi, constituam igualmente boas aproximações de xi. Esta recta é chamada
recta de regressão de X em Y ou recta de estimação de X em Y.
Normalmente, estas rectas são distintas uma da outra. Elas serão confundidas quando existe ligação
funcional linear e são perpendiculares ao eixos quando há independência. Compreendemos, assim, que
a correlação entre os caracteres é tanto maior quanto maior as rectas de regressão estejam mais próximas
uma da outra.

Características e requisitos de utilização do teste r de pearson


1. As duas variáveis são contínuas;
2. A distribuição se aproxima da distribuição normal;
3. É preferível para distribuições unimodais;
 x  x y 
n
4. Escala intervalar de medida. i i y
Fórmulas alternativas r i 1

 n
 2 
 2
 
n

 i x  x    yi  y 
 i 1   i 1 

n XiYi   Xi  Yi
r
n Xi 2

 ( Xi ) 2 n Yi 2  ( Yi ) 2 
Então -1  r  1
Interpretação:
O coeficiente de correlação obtido pode se interpretado com base em:
Para Cardoso:
 r  0,2 Correlação muito baixa (valores desprezíveis)
 0,2 < r  0,5 Correlação baixa
 0,5 < r  0,7 Valores significativos
 0,7 < r  0,9 Alta correlação
 0,9 < r  1 Muito alta correlação
Para Borg:
 0,20 < r  0,35 Ligeira relação entre as variáveis, embora possam ser estatisticamente
significativas
 0,35 < r  0,65 Correlação estatisticamente significativa para além do nível de 1%
 0,65 < r  0,85 Correlações que tornam possíveis predições do grupo de que são dignas
 r > 0,85 Íntima relação entre as variáveis correlacionadas
Para Byrman e Cramer, se Eta, r, Rho, phi:
  0,2 Correlação muito fraca e sem significância
 0,2 < r  0,39 Correlação fraca
 0,4 < r  0,69 Correlação moderada
 0,7 < r  0,89 Correlação forte
 0,9 < r  1 Correlação muito elevada

Coeficiente de correlação dá-nos: A direcção que é indicada pelo sinal + ou -


A intensidade ou força que é dada pelo valor que varia entre -1 e 1. Se a correlação for zero não
existe correlação entre as variáveis (exemplo: cor dos olhos e inteligência).
64
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Exemplo: Considere as classificações (numa escala de 0 a 100) obtidas por 10 alunos nas disciplinas
Estatistica I, Estatistica II, Português e Françês:

Tabela 12

Estudante Estatistica I (X) Estatistica II (Y) Português (Z) Françês (W) X.Y X.Z X.W

1 75 75 45 45 5625

2 70 70 50 50 4900

3 70 70 50 50 4900

4 65 65 55 55 4225

5 60 60 60 60 3600

6 60 60 60 60 3600

7 55 55 65 65 3025

8 50 50 70 70 2500

9 50 50 70 70 2500

10 45 45 75 75 2025

 600 600 600 600 36900

Com base dos dados que se seguem calcule o coeficiente de correlação6 entre X e Y
Sabe-se que:

X=60 Y=60 .
X Y=36900

s2 x= 90 s2 y= 90
1. qual o valor de r e que conclusão retira dos resultados? _____________________________
______________________________________________________________________________

2. recorrendo ao valores da tabela precedente calcule os valores necessários à obtenção do


coeficiente de correlação entre Estatistica e Portugues.

Média das variáveis? _____________________Valor de r? ________________ e que conclusão


retira dos resultados? ________________________________________________________________

6
a)=1 b)=-1

65
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

6.1.4 Análise da variancia de um critério (ANOVA)

Características e requisitos da ANOVA

Como já observado, para comparar médias de duas populações, usamos o t de student, mas às vezes
é preciso comparar médias de mais de duas populações. Por exemplo, para verificar se pessoas com
diferentes níveis socioeconómicos, isto é, alto, médio e baixo têm, em média, o mesmo peso corporal,
é preciso comparar médias de três populações.
Para comparar médias de mais de duas populações aplica-se a ANOVA (o teste F), na forma que a
seguir se descreve, desde que a variável em estudo tenha distribuição normal ou aproximadamente
normal. Mas antes de mostrar como se faz esse teste, convém apresentar um exemplo.

6.1.4.1 Análise da Variância com Igual Tamanho

Se a variável em estudo tem distribuição normal ou aproximadamente normal, para comparar mais
de duas médias aplica-se o teste F.
Primeiro, é preciso estudar as causas de variação. Por que é os dados variam? Uma explicação é o
facto de as amostras provirem de populações diferentes. Outra explicação é o acaso, porque até mesmo
os dados provenientes de uma mesma população variam.
O teste F é feito através de uma análise de variância, que separa a variabilidade devido aos
"tratamentos" (no exemplo, devido às amostras terem provindo de populações diferentes) da
variabilidade residual, isto é, devido ao acaso. Para aplicar o teste F é preciso fazer uma série de
cálculos, que exigem conhecimento da notação. .

Para fazer a análise de variância é preciso proceder aos seguintes calculos:


1. Graus de liberdade
gl dos grupos: k – 1
gl do total: n-1
gl dos residuos: (n-1)-(k-1) = n-k
2. calcular o valor de Correcção (C) que é dado pelo total geral ao quadrado, dividido pelo
número de dados

66
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
3. calcular a Soma dos Quadrados Total (SQT)

4. calcular a Soma do Quadrado do Total de cada repetição (SQTr)

5. calcular a Soma dos Quadrados dos Resíduos (SQR)

calcular o Quadrado médio do Total de cada repetição (QMTr)

6. calcular o Quadrado médio do Total do Residuo (QMR)

7. finalmente calcular o valor de F

Se F observado  F crítico rejeita-se H0 Se F observado < F crítico aceita-se H0

para interpretar os resultados necessitamos de comparar o F calculado com o valor dado na tabela
de F, ao nivel de significância estabelecido, observando os k-1 graus de liberdade no numerador e os
n-k graus de liberdade no denominador (coluna da esquerda).

67
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Exemplo: Um profissional de saúde recém contratado para acompanhar um conjunto de atletas


de alta competição, verificou, pelos registos clínicos deixados pelo seu antecessor, que alguns atletas
com o mesmo tipo de lesão (em grau e extensão) tinham mais recidivas que outros, apesar das
condições de treino e o tempo de recuperação ser o mesmo. Colocou a hipótese de que tal
acontecimento se podia dever às diferentes terapêuticas que eram utilizadas para tratar as mesmas
lesões. Os resultados podem ser observados no quadro que se segue:

Tabela 13: recidivas por tratamento

Tratamento A Tratamento B Tratamento C Tratamento D

11 8 5 4

8 5 7 4

5 2 3 2

8 5 3 0

8 5 7 0

 40 25 25 10

 8 5 5 2

1.º passo:
os graus de liberdade (gl)dos grupos: k – 1 = 4-1=3
gl do total: n-1 = 20-1=19
gl dos residuos: n-k = 20-4=16

calcular o valor de Correcção (C) que é dado pelo total geral ao quadrado e dividido pelo número
de dados.

calcular a Soma dos Quadrados Total (SQT)

68
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

calcular a Soma do Quadrado do Total de cada repetição (SQTr)

calcular a Soma dos Quadrados dos Resíduos (SQR)

calcular o Quadrado médio do Total de cada repetição (QMTr)

calcular o Quadrado médio do Resíduo (QMR)

69
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
calcular o valor de F

Finalmente ir à tabela F para um nível de significância (p) de 5% (0,05) e observar qual o F teórico
para 3 e 16 graus de liberdade.
Como o valor calculado (7,06) é maior que o da tabela (3,24), concluímos que as médias das
recidivas diferem em função do tratamento, para um nível de significância de 0,05.
A acompanhar este comentário, os valores calculados devem ser apresentados num quadro, da
seguinte forma:

Tabela 14: ANOVA

Causas de variação gl SQ QM F p

Tratamentos 3 90 30 7,06 <0,05

Resíduo 16 68 4,25

Total 19 158

Mas, como se pode observar, apesar da tabela mostrar que existem diferenças significativas, não
nos informa, que tratamentos é que produzem diferenças e quais são semelhantes. Sempre que as
diferenças são significativas, e só nesse caso, temos que proceder às comparações à posteriori (Post-
Hoc). Podemo-nos socorrer de diversos testes (LSD; Bonferroni; Sidak; Scheffe; SNK; Tukey; etc.), a
grande diferença entre eles reside no tipo de distribuição em que assentam e no tipo de ajustamento).
Apresentaremos de seguida apenas o teste de Tukey, por ser dos mais utilizados e o mais simples de
calcular, quando recorremos ao cálculo manual.

6.1.4.1.1 Teste de Tukey para comparação entre as médias


O teste Tukey permite estabelecer a diferença mínima significante, ou seja, a menor diferença entre
as médias que deve ser tomada como significativa em determinado nível de significância. Essa diferença
(dms) é dada por:

Onde q é um valor dado em tabela


QMR é o quadrado médio do residuo da ANOVA
r é o número de repetições
70
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

assim, se consultarmos a tabela verificamos que o q para comparar quatro tratamentos com 16 gl no
residuo é de 4,05. como QMR=4,25 e r=5, temos:

De acordo com o teste de Tukey, duas médias são estatisticamente diferentes sempre que o valor
absoluto da diferença entre elas for igual ou superior ao valor da dms.
Passemos então à observação dos valores:

Tabela 15: post-hoc das recidivas

Pares de médias Valor absoluto da diferença dms p

A-B (8-5) 3 ns

A-C (8-5) 3 ns

A-D (8-2) 6 <0,05


3,73
B-C (5-5) 0 ns

B-D (5-2) 3 ns

C-D (5-2) 3 ns

É fácil de observar que só existem diferenças entre a média dos tratamentos A e a média dos
tratamentos D, em que o tratamento D é aquele com que se obtém, significativamente, menos recidivas

6.1.4.2 ANÁLISE DE VARIÂNCIA COM DIFERENTES TAMANHOS

O pesquisador, nem sempre tem amostras do mesmo tamanho, mesmo assim é possivel conduzir
uma análise da variância (ANOVA). Aliás todos os cálculos, com excepção SQTr, são feitos da mesma
forma em ambas as situações.
Assim em vez de fazer a soma dos quadrados pela fórmula

Utiliza:

71
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Para se certificar de que entendeu faça o seguinte exercicio:

Tabela 16: médias por tratamento

Tratamento A Tratamento B Tratamento C

15 23 19
10 16 15
13 19 21
18 18 14
15 16
13
 84 76 85

O resultado do valor de F tem de lhe dar 3,96. Confira e interprete

Não se esqueça que as diferenças foram significativas por isso tem de proceder às comparações à
posteriori (Post-Hoc) e também aqui a fórmula mudou, por isso vamos ver como se calcula o teste de
Tukey quando temos tamanhos diderentes:

6.1.4.2.1 Teste de Tukey para comparação entre as médias

O teste Tukey para amostras com tamanhos diferentes é dada pela seguinte fórmula:

No caso do exemplo, para comparar a média de A com a média de B tem-se:

72
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

De forma análoga faça os calculos para comparar a média de A com a média de C

e de B com a média de C.

Qual a sua conclusão?

De acordo com o teste de Tukey, duas médias são estatisticamente diferentes sempre que o valor
absoluto da diferença entre elas for igual ou superior ao valor da dms.
Passemos então à solução dos exercício proposto e observação dos valores:

Tabela 17: teste tukey

Pares de médias Valor absoluto da diferença dms p

A-B |14-19| = 5 4,87 <0,05

A-C |14-17| = 3 4,57 ns

B-C |19-17| = 2 5,06 ns

Conclui-se que em média A é significativamente diferente de B, ao nível de significância de 0,05.

73
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

6.2. Testes não paramétricos

Frank Wilcoxon (1892 - 1965) tornou-se conhecido por ter desenvolvido dois testes não
paramétricos muito utilizados: o Teste de Soma de Postos Wilcoxon Rank Sum Test que é
equivalente ao teste de Mann-Whitney, e o Teste de Postos com Sinais ou Wilcoxon Signed Rank
Test (Rosner, 1995).
A estatistica não paramétrica é de distribuição livre:
• Não incorpora as suposições restritivas, características dos testes paramétricos.
• Os dados não precisam estar normalmente distribuídos (Free Distribution). É necessário, apenas,
que eles sejam ordenáveis.
• São baseados em postos das observações e não em seus valores, como no caso dos paramétricos.
• Podem ser aplicados para variáveis quantitativas, falsas intervalares( também chamadas de semi-
quantitativas) e qualitativas.
Desvantagens
• Menos sensíveis aos erros de medida e rápidos para pequenas amostras.
• Se as suposições básicas de um teste paramétrico são satisfeitas, então os testes não-
paramétricos são menos poderosos do que a técnica paramétrica correspondente (exigirá uma
amostra maior);
• As hipóteses testadas por testes não-paramétricos tendem ser menos específicas;
• Por usarem postos, em vez do valor da observação, esses testes não aproveitam toda a
informação disponível sobre a distribuição dos dados;
• Se existem muitas distribuições empatadas, as estatísticas serão superestimadas, exigindo
correções.

O posto de uma observação é a sua posição relativa às demais observações, quando os dados estão
em ordem crescente. É uma forma de medir a posição relativa da observação, sem usar o valor observado
diretamente.
Os postos correspondentes às observações de uma variável X1 , X2 ,..., Xn são:
• Colocam-se as observações em ordem crescente, X1 < X2 ,...,< Xn .
• Associam-se valores, correspondendo às suas posições relativas na amostra. O primeiro elemento
recebe o valor 1, o segundo o valor 2, e assim por diante, até que a maior observação receba o
valor n.
• Se todas as observações são distintas, ou seja, se Xi  Xj para todo i, j, os postos R1 , R2 ,...,Rn são
iguais aos valores associados às observações no passo anterior. Para observações iguais,
associam-se postos todos iguais à média de suas posições relativas na amostra.

74
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Exemplo: Considere uma amostra de 8 idades de crianças do ambulátorio do IC, apresentada na
tabela abaixo:

Os postos devem ser cuidadosamente atribuídos, pois os testes serão baseados nesses valores.

6.2.1 Teste do qui-quadrado


O Qui-Quadrado (X2 ) é um teste estatístico não paramétrico, sendo um dos mais utilizados e
bastante aplicado em diferentes planos experimentais. O X2 é muito usado mesmo ao nível da estatística
multivariada (no sentido de obter o grau de aderência entre o modelo obtido e o teórico).
Existem vários testes baseados no qui-quadrado, contudo só dois tem esse nome: o teste do qui-
quadrado da aderencia ou ajustamento (para uma amostra) e o teste do quiquadrado da independencia.
O Qui-Quadrado (X2 ) de aderência consiste em comparar os dados obtidos experimentalmente com
os dados esperados de acordo com a lei. Das comparações surgem diferenças que podem ser grandes ou
pequenas: se forem grandes, a hipótese nula (H0) que pressupõe um bom ajustamento deverá ser
rejeitada em favor da hipótese alternativa (H1); se forem pequenas, a hipótese nula não será rejeitada e
as diferenças são atribuíveis ao acaso. O objectivo é comparar frequências observadas com frequências
teóricas ou esperadas, ou seja, verificar o seu grau de aproximação, que pode ser grande (=0) ou pequeno
(>0).
Utiliza-se quando os dados são nominais, pelo que em vez de se medirem resultados dos sujeitos
apenas se podem distribuir os sujeitos por uma ou mais categorias.
O Qui-Quadrado (X2 ) testa a hipótese experimental que prevê quantos sujeitos de cada grupo são
distribuídos por uma determinada categoria.

O X2 de independência serve para ajudar a decidir se as duas variáveis estão ou não "amarradas"
uma à outra por uma relação de dependência.
Utiliza-se quando os dados são qualitativos e se pretende saber como é que se comportam os dados
quando as variáveis se cruzam, isto é qual a contingencia entre as variáveis.
O objectivo é comparar as frequências observadas em cada uma das células de uma tabela de
contingência com as diferenças esperadas. O teste compara o número de sujeitos que se distribuem por

75
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
uma determinada categoria com o número de sujeitos que se esperaria se distribuíssem por essa mesma
categoria, caso não existissem diferenças.
O teste do X2 reflecte o tamanho das diferenças entre as frequências observadas e esperadas. Para
ser significativo, o valor de X2 deverá ser igual ou superior aos valores críticos da tabela.

6.2.1.1 Teste do qui-quadrado da aderencia passo-a-passo


1. Calcular as frequências esperadas (E) para cada célula, somando as frequencias observadas e
dividindo pelo número total de categorias.

em que
O = frequências observadas para cada categoria
C = número de categorias

2. Calcular X2 :

3. Calcular os graus de liberdade:


g.l. = (C-1)
Se X2 observado  X2 crítico rejeita-se H0 Se X2 observado < X2 crítico aceita-se H0

6.2.1.2 Teste do qui-quadrado da Independencia passo-a-passo


1. Numerar as "células" que representam cada uma das categorias e calcular as frequências
esperadas (E) para uma, multiplicando os dois totais parciais relevantes para cada uma e
dividindo pelo número total de sujeitos.

76
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

2. Calcular X2:

em que
O = frequências observadas para cada célula
E = frequências esperadas para cada célula

3. Calcular os graus de liberdade: g.l. = (r-1) (c-1)


em que
r = número de linhas da tabela de contingência
c = número de colunas da tabela de contingência
Exemplificando: para uma tabela de dupla entrada 2*2:
g.l. = (número de colunas - 1) (número de linhas - 1) = 1*1 = 1
consulta-se a tabela dos valores critico e,
Se X2 observado  X2 crítico rejeita-se H0 Se X2 observado < X2 crítico aceita-se H0

Exemplo: Suponha que quer saber se os estudantes de ciências sociais utilizam um método de estudo
significativamente diferente daquele que é utilizado pelos estudantes de tecnologia. A amostra prevista
ficou constituida por dois grupos, um composto por 50 estudantes de ciências sociais e o outro por 50
estudantes de tecnologia. Enviou-se, então, via mail, um questionário aos 100 estudantes pedindo-lhes
que indicassem se o seu método de estudo era regular (diário), irregular (só em epocas de avaliações)
ou misto (estudar diariamente um pouco com maior intensidade nos periodos de avaliações). Foram
recebidas 44 respostas dos estudantes de ciências sociais e 42 dos estudantes de tecnologia.
A hipotese experimental (H1 ) era:
H1 : O tipo de estudo varia em função curso frequentado
Os resultados são apresentados na forma de uma tabela 2*3, designada por tabela de contingência
(crosstab).
Tabela 18: Tabela de Contingência (Crosstab)

Tipo de estudo
Regular Irregular Misto
Grupo 1-Estudantes de Ciências
6 15 23
Sociais
Grupo 2-Estudantes de Tecnologia 10 8 24

77
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Instruções Passo-a-Passo:
1. numerar as células, obter os totais e calcular as frequencia esperadas (E)

Tipo de estudo
Regular Irregular Misto Total
E1= E2= E3=
Grupo 1
6 15 23 44
E4= E5= E6=
Grupo 2
10 8 24 42
Totais
16 23 47 N=86

Resolva:

78
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Confira:

Célula 1: E1 = 16X44 / 86 = 8,19


Célula 2: E2 = 23X44 / 86 = 11,77
Célula 3: E3 = 47X44 / 86 = 24,05
Célula 4: E4 = 16X42 / 86 = 7,81
Célula 5: E5= 23X42 / 86 = 11,23
Célula 6: E6 = 47X42 / 86 = 22,95

2. Aplicar a fórmula do x2 e proceder ao claculo do teste

X2 = (6-8,19)2 + (15-11,77)2 + (23-24,05)2 + (10-7,81)2 + (8-11,23)2 + (24-22,95)2


8,19 11,77 24,05 7,81 11,23 22,95
X2 = 0,59 + 0,89 + 0,05 + 0,61 + 0,93 + 0,05 = 3,12

3. Calcular os graus de liberdade (gl)


g.l. = (r - 1) (c - 1) = (2 -1) (3 - 1) = 2

4. Consultar a tabela dos valores criticos


Para p=0,05 e gl=2 x2 critico=5,99

Conclusões: Dado que o valor observado de X2 é apenas de 3,12, ou seja, inferior ao valor crítico
de 5,99 para p < 0,05, o resultado da experiência não é significativo. Aceita-se hipótese nula de que os
padrões de estudo dos estudantes de ciências sociais e de tecnologia não diferem, rejeitando-se desta
forma a nossa hipotese experimental (H 1 ).

79
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

6.2.2 Testes para duas amostras independentes

Ao estudarmos as diferenças entre dois grupos podemos utilizar grupos relacionados/emparelhados


ou grupos independentes. No caso de duas amostras independentes determinamos se as diferenças nas
amostras constituem uma evidência convincente de uma diferença nos processos de tratamento a elas
aplicados.
Conquanto o uso de duas amostras relacionadas em projectos de pesquisa tenha méritos
indiscutíveis, a sua aplicação, em geral, não é prática. Frequentemente, a natureza da variável
dependente impede a utilização dos indivíduos como seus próprios controlos, tal como ocorre quando a
variável dependente é o suicidio tentado; um problema que pode acontecer uma única vez. Pode ser
também impossível delinear um projecto que utilize pares de dados, talvez por desconhecimento, por
parte do investigador, de variáveis úteis que possam formar pares, ou pela impossibilidade de obter
mensurações adequadas de alguma variável de reconhecida importância ou, enfim, porque
simplesmente não se dispõe de “pares” adequados.
Quando a utilização de duas amostras relacionadas não é prática ou adequada, podemos utilizar
duas amostras independentes. Em tais projectos, as duas amostras podem ser obtidas por um de dois
métodos:

Podem ser extraídas aleatoriamente de duas populações;


Podem decorrer da atribuição aleatória de dois tratamentos aos membros de uma amostra de origem
arbitrária.

Nota: Em nenhum destes casos se exige que as amostras tenham o mesmo tamanho.

6.2.2.1 Procedimentos para ordenação de resultados

Os testes não paramétricos U de Mann-Whitney; Wilcoxon; H de Kruskal-Wallis; rho de Spearman;


tau de Kendall e Friedman, exigem o recurso a ordenações de resultados para efectuar os seus cálculos.
Neste sentido começaremos por explicar os procedimentos de ordenação de resultados
Ordenamento global de resultados (designs não-relacionados para sujeitos diferentes), utilizados
nas estatisticas U de Mann-whitney, H de Kruskal-Wallis e Rho de Spearman:

80
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Para se ordenar resultados, atribui-se a ordem 1 (ordem mais baixa) ao sujeito que fuma menos, a
ordem 2 ao seguinte, e por aí adiante, tal como no exemplo que se segue:

n.º de cigarros/ dia ordem


6 4
3 1
12 7
4 2
7 5
5 3
8 6

Sempre que exista um resultado 0 (zero) é contado como o valor observado mais baixo, sendo-lhe
atribuída a ordem 1, tal como no exemplo que se segue:

n.º de consultas ordem


2.ª feira 6 5
3.ª feira 3 2
4.ª feira 0 1
5.ª feira 4 3
6.ª feira 5 4

Quando existem resultados iguais são-lhe atribuídas a média das posições ou das ordens, calculadas
com base na globalidade das ordens que deviam ter sido atribuídas a estes resultados, tal como no
exemplo que se segue:

absentismo no mês de dezembro ordem


1 2
2 4
1 2
4 6,5
1 2
3 5
4 6,5
6 9
5 8

81
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Assim os sujeitos com uma falta são 3 (1+1+1) que ocupariam o 1.º - 2.º - 3.º lugar, então
3+2+1=6:(1+1+1)=2; com 4 faltas temos 2 sujeitos que ocupariam o 6.º e 7.º lugar, então
6+7=13:(1+1)=6,5

5.4 Teste U de Mann-Whitney

Teste U de Mann-Whitney
ou
Wilcoxon Rank Sum Test
ou
Teste da soma dos postos
(equivalente do teste t não pareado)

Quando Utilizar
Dadas duas amostras, de tamanhos n1 e n2, é possível, mediante a prova U de Mann-Whitney, saber
se ambas as amostras podem ser consideradas provenientes da mesma população.
Como já se sabe, a estatística paramétrica só pode ser usada desde que os dados tenham sido
mensurados, no mínimo, no nível intervalar. Além disso, as amostras devem ser aleatórias,
independentes e a variável observacional precisa de ter distribuição normal na população.
O teste U de Mann-Whitney deve ser utilizado em designs com duas situações, não-relacionados,
quando são utilizados sujeitos diferentes em cada uma das situações experimentais.

Mann-Whitney-Wilcoxon
Teste para Pequenas Amostras

O cálculo da estatística do teste (U critico), e a consequente regra de decisão, depende do tamanho


da amostra. Se qualquer dos grupos (n A ou n B) menor que 10 o valor crítico é obtido da tabela.

82
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Vejamos um exemplo em que o grupo A tem 4 sujeitos e o grupo B 5.


Um conjunto de 9 atletas 4 da equipa A e 5 da Equipa B vão em competição e chegara à meta nas
seguintes posições

Os tempos foram contabilizados e os atletas ordenados da seguinte forma:

Qual o valor de U critico?


Para o obter somamos as posições da equipa A e as posições da equipa B e obtemos

UB=9+8+6+3+2= 28 UA=7+5+4+1= 17
A seguir vamos à tabela dos valores criticos e cruzamos o numero de individuos de uma equipa com
o numero de individuos da outra:

83
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

menor n
nA=4 maior n
alpha

nB=5

Se os valores de R ,
A

R estiverem fora do
B

intervalo, rejeita-se H .
0

Intervalo de
aceitação de H
0

Como podemos observar os valores de aceitação da H 0 ( que não existem diferenças entre os grupos)
estão entre 11 e 29 e os valores observados são 17 e 28 o que está dentro do intervalo. Logo podemos
cncluir que as equipas não tem desempenhos significativamente diferentes.

Exercicio:
Um estudo visa a comparar, ao nível de significância de 5 %, se a taxa de creatinina é a mesma em
dois grupos de pacientes renais: um grupo com 6 indivíduos que apresentavam insuficiência renal aguda
(IRA), e outro, com 5 indivíduos, que não apresentavam IRA.

H0 : os grupos não são estatisticamente diferentes.


HA : os grupos são estatisticamente diferentes.

Taxa de Creatinina (mg/100ml)


Paciente com IRA sem IRA
1 3,3 0,9
2 3,0 0,8
3 4,0 0,6
4 1,5 0,7
5 2,4 0,8
6 0,9
Ordene, confira com as soluções e conclua com base na consulta da tabela
RA  10  9 11  7  8  5,5  50,5
RB  5,5  3,5 1  2  3,5  15,5

84
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Mann-Whitney-Wilcoxon Teste para Grandes Amostras


Se ambos os grupos têm pelo menos dez observações, podemos usar a chamada forma assintótica
do teste, na qual a estatística do teste pode ser aproximada por uma Normal.

Procedimento:
• Calculam-se as estatísticas padronizadas UA e UB , onde:

Mann-Whitney-Wilcoxon Forma Assintótica

• Calculam-se a média e a variância de U, dadas por:

nA  nB nA  nB (nA  nB  1)
E (U )  var(U )  ;
2 12

• Calcula-se a variável padronizada zU , dada por:

U  E (U )  0,5
zU  ;
var(U )
• Compara-se o valor absoluto de zU com o valor de z crítico (tabela z), para o nível de significância
desejado.

Exemplo
Considere as distribuições de scores de
idade mental normalizados de duas populações de crianças que sofrem de fenilcetonúria. Indivíduos
com essa disfunção são incapazes de metabolizar a proteína fenilalanina. Desconfia-se de que um
elevado nível sérico dessa proteína aumenta a probabilidade de deficiência mental da criança. Deseja-
se comparar dois grupos de crianças: um com baixa exposição à fenilalanina (menos que 10 mg/dl
diários) e outro com alta exposição (acima de 10 mg/dl diários).

85
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Não há evidências de que os scores normalizados de idade mental sejam normalmente distribuídos
nos pacientes com essa disfunção.
Os scores de idade mental normalizados para as duas amostras de crianças sofrendo de
fenilcetonúria estão na tabela abaixo:
Baixa Exp. Alta Exp.
39.5 35.0
40.0 37.0
45.5 37.0
47.0 43.5
47.0 44.0
47.5 45.5
48.7 46.0
49.0 48.0
51.0 48.3
51.0 48.7
52.0 51.0
53.0 52.0
54.0 53.0
54.0 53.0
55.0 54.0

As estatísticas padronizadas UA e UB são:

Para  de 5% (bicaudal), o z crítico é 2,24, o que conclui?

z 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
0, 0,000010,00392 0,00793 0,01194 0,01595 0,01996 0,02397 0,02798 0,0318 0,0358
9
0 0, 0,0398
9 0,0438
8 0,0477
7 0,0517
5 0,0556
4 0,0596
2 0,0635
0 0,0674
8 0,0714
6 0,0753
0
1 0, 3 0,0792
0 0,0831
6 0,0870
2 0,0909
7 0,0948
2 0,0987
6 0,1025
9 0,1064
2 0,1102
5 0,1140
2 0, 6 0,1179
7 0,1217
6 0,1255
5 0,1293
3 0,1330
1 0,1368
7 0,1405
2 0,1443
6 0,1480
9 0,1517
3 0, 1 0,1554
2 0,1591
2 0,1627
0 0,1664
7 0,1700
3 0,1736
8 0,1772
1 0,1808
3 0,1843
3 0,1879
4 0, 2 0,1914
0 0,1949
6 0,1984
0 0,2019
3 0,2054
4 0,2088
4 0,2122
2 0,2156
9 0,2190
3 0,2224
5 0, 6 0,2257
7 0,2290
7 0,2323
4 0,2356
0 0,2389
4 0,2421
6 0,2453
6 0,2485
4 0,2517
0 0,2549
6 0, 5 0,2580
7 0,2611
7 0,2642
5 0,2673
1 0,2703
5 0,2733
7 0,2763
7 0,2793
5 0,2823
0 0,2852
7 0, 4 0,2881
5 0,2910
4 0,2938
0 0,2967
5 0,2995
7 0,3023
7 0,3051
5 0,3078
0 0,3105
4 0,3132
8 0, 4 0,3159
3 0,3185
9 0,3212
3 0,3238
5 0,3263
4 0,3289
1 0,3314
5 0,3339
7 0,3364
7 0,3389
9 1, 4 0,3413
9 0,34371 0,3461
1 0,3484
9 0,3508
4 0,3531
7 0,3554
8 0,3576
6 0,3599
1 0,3621
0 1, 0,3643
5 0,36654 0,3686
9 0,3707
3 0,3728
4 0,3749
3 0,3769
9 0,3790
3 0,3810
4 0,3829
1, 4 0,3849 0,4014
1 3 0 0,38684 0,3887
6 0,3906
6 0,3925
3 0,3943
8 0,3961
0 0,3979
0 0,3997
8
2 3 6 7 5 1 5 7 6 3 7

86
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Exemplo: Suponha que quer investigar o n.º de queixas dolorosas durante um tratamento a um
mesmo problema terapêutico (controlada a gravidade e a extensão da lesão) em que se utilizaram duas
técnicas diferentes. A hipotese experimental supõe que é durante a utilização da técnica B que o doente
se apresenta mais queixoso.

Tabela 19: Resultados do registo das queixas


Paciente A Ordem (1) B Ordem (2)
1 3 3 9 11
2 4 4 7 9
3 2 1,5 5 5,5
4 6 7,5 10 12
5 2 1,5 6 7,5
6 5 5,5 8 10
TOTAL 22 T1=23 45 T2=55
MÉDIA 3,67 7,5

Racional
O racional que está por trás do teste U de Mann-Whitney é bastante semelhante ao do teste de
Wilcoxon. A diferença fundamental entre as duas reside no facto do segundo se aplicar a designs
relacionados e o U se aplicar a designs não-relacionados, utilizando, portanto, sujeitos diferentes. O
teste de Wilcoxon analisa as diferenças entre a performance dos mesmos sujeitos (ou pares de sujeitos
emparelhados) submetidos a duas situações experimentais. Com um design não-relacionado não temos
uma base que nos permita comparar diferenças entre pares de resultados. Assim, o teste U de Mann-
Whitney ordena os resultados de todos os sujeitos em ambas as situações como se fossem apenas um
conjunto simples de resultados.
Se as diferenças entre as situações forem aleatórias, como é postulado pela hipótese nula, então os
resultados devem ser aproximadamente os mesmos e, consequentemente, as ordens devem ser também
aproximadamente as mesmas para as duas situações. Se houver uma preponderância de ordens altas ou
baixas numa situação ou na outra, então é porque a diferença no total dos resultados ordenados para
cada situação é devida aos efeitos previstos da variável independente e não ao acaso. Se a soma total
das ordens for muito baixa para uma das situações, então terá de haver uma preponderância de ordens
elevadas na outra situação. Quanto menor for U mais significativas serão as diferenças entre as ordens
das duas situações.

87
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

INSTRUÇÕES PASSO-A-PASSO PARA CALCULAR W


Ordene todos os resultados para ambos os grupos como se se tratasse de um conjunto único de
resultados, atribuindo a ordem 1 ao resultado inferior e assim sucessivamente.
O ordenamento global de todos os resultados é apresentado em Ordens(1) e Ordens (2).
Adicione as ordens totais para o grupo 1 e grupo 2 em separado.
T1=23 e T2=55

Seleccione o maior total das ordens.


T2=55

Calcule o valor de U através da fórmula


Nx (nx + 1)
U = n1.n2 + __________________ - Tx,
2

em que:
n1 =número de sujeitos no grupo 1 n1 =6
n2 =número de sujeitos no grupo 2 n1 =6
Tx=maior total de ordens Tx=T2 =55
Nx=número de sujeitos do grupo com o maior total de ordens Nx=6

Cálculo de U
6x7
U = 6 x 6 + _______________ - 55 = 36+21-55=2
2

Quando existe o mesmo número de sujeitos em cada situação rapidamente se torna mais fácil
verificar qual o maior total de ordens. Normalmente, é preferível ter um número idêntico de sujeitos em
cada grupo; no entanto, se tiver de utilizar um número desigual de sujeitos em cada grupo, poderá fazê-
lo. Em caso de dúvida, calcule U para ambas as ordens totais, seleccionando o n apropriado a cada caso
e, depois, considere o U mais pequeno.

Consulta da significância na tabela

As Tabelas (Anexo II) apresentam-lhe os valores críticos de U nos diferentes níveis de significância
de testes unicaudais e bicaudais, para as diferentes combinações de n1 e n2 dos dois grupos.

88
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
O procedimento mais usual é começar por verificar se o valor de U é significativo ao nível de
significância de p<0,05 para testes unicaudais) ou para testes bicaudais. Uma vez que previmos que a
técnica B produzia mais queixas, poderemos consultar a Tabela para testes unicaudais. Localizando
n1 =6 na linha superior e n2 =6 na coluna do lado esquerdo, encontraremos o valor crítico de U na
intercepção dos dois.
Conclusão: Uma vez que se convencionou utilizar o nível inferior de U, o nosso valor de U=2 deve
ser igual ou inferior ao valor crítico 7, o que acontece, podemos, desta forma, rejeitar a hipótese nula e
aceitar que existem diferenças significativas ao nível da dor (p<0,05).

7. Testes para k amostras independentes


O investigador pode precisar de decidir se diversas variáveis independentes devem ser consideradas
como procedentes da mesma população. Os valores amostrais quase sempre são um tanto diferentes e
o problema é determinar se as diferentes amostras observadas sugerem realmente diferenças entre as
populações ou se são apenas variações casuais que podem ser esperadas entre amostras aleatórias da
mesma população.

Apresentamos técnicas para comparar a significância de diferenças entre três ou mais grupos
de amostras independentes, ou seja, para comprovar a hipótese de nulidade de que K amostras
independentes tenham sido extraídas da mesma população ou de populações idênticas.
As provas não-paramétricas têm a vantagem de permitir estudar, quanto à significância, dados que
são inerentemente classificados (escala nominal) ou se apresentam em postos (escala ordinal).

7.1 Teste de Kruskal-Wallis


Requisitos para o uso do teste de kruskal-wallis

O teste de Kruskal-Wallis pressupõe as seguintes condições para o seu adequado uso:


Comparação de três ou mais amostras independentes;
O teste de Kruskal-Wallis não pode ser usado para testar diferenças numa única amostra de
respondentes mensurados mais de uma vez;
Dados cujo nível de mensuração seja no mínimo ordinal;
Esta prova exige dados que possam ser ordenados e aos quais, por isso mesmo, seja possível atribuir
postos ou ordens;
O tamanho mínimo de cada amostra deve ser de 6 para se poder recorrer ao x2 .
Quando n > 5 por grupo de respondentes, a significância de H pode ser determinada por recorrência à Tabela do Qui -quadrado (Anexo I).
Para testar diferenças entre amostras de tamanho inferior a 6, deve recorrer a tabelas especiais (Anexo IV).

89
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Quando utilizar
Este teste pode ser considerado uma extensão do teste U de Mann-Whitney quando necessitamos
de utilizar três ou mais situações. Deve ser utilizado em designs não-relacionados quando sujeitos
diferentes são distribuídos por três ou mais situações.

Exemplo: Suponha que estamos interessados em descobrir se existem diferenças no acesso a uma
página da internet em função da caracteristica: muito ilustrada, com algumas ilustrações e, sem
ilustrações. Alocámos três páginas na internet com o mesmo assunto e titulo durante 4 meses. A seguir
verificámos o número de vezes que forma acedidas durante quatro sábados seguidos. Os resultados
foram
Tabela 20: Número de ideias relembradas para três tipos de testes
Sujeitos do grupo 1 Sujeitos do grupo 2 Sujeitos do grupo 3
(página muito ilustrada) (página com algumas (Página sem ilustrações)
ilustrações)

Result. Ordem Result. Ordem Result. Ordem


Sabado 1 19 10 14 6 12 3,5
Sabado 2 21 11 15 7 12 3,5
Sabado 3 17 9 9 1 13 5
Sabado 4 16 8 10 2
TOTAL 73 38 38 14 47 14
MÉDIA 18,25 12,67 11,75

Racional
Este teste pretende determinar se os resultados são significativamente diferentes para três ou mais
grupos. Uma vez que todos os resultados foram, em principio, obtidos por sujeitos diferentes a única
forma de verificarmos as diferenças entre as situações é ordená-las em conjunto, como se se tratassem
apenas de um conjunto de resultados, tal como havíamos efectuado no teste U de Mann-Whitney. Isto
acontece porque, não temos uma base para comparar resultados dos mesmos sujeitos ou de sujeitos
emparelhados em diferentes situações, como com o teste U de Mann-Whitney para designs
relacionados.
Este ordenamento global, quando posteriormente adicionamos as ordens de cada coluna em
separado, permite-nos obter o total das ordens para cada situação. Se existirem apenas diferenças
aleatórias entre as situações, como é postulado na hipótese nula, é de esperar que ordens altas e baixas
se distribuam de forma aproximadamente equivalente pelas diferentes situações. Mas, se pelo contrário,
houver uma preponderância de altos ou baixos resultados em qualquer uma das situações, é provável
que tal facto reflicta diferenças significativas devidas à variável independente.
O valor das diferenças entre os totais das ordens é dado pela estatística designada por H. Desde

que a hipótese experimental preveja a existência de diferenças significativas entre as situações, o

valor que obtivermos de H deverá ser igual ou superior ao valor crítico da Tabela, para que possa ser

considerado significativo.
90
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Instruções passo-a-passo para calcular H
Ordene todos os grupos do design como se se tratasse apenas de um conjunto de resultados,

atribuindo a Ordem 1 ao menor resultado e assim sucessivamente.

Para um ordenamento global dos resultados, veja as colunas ordem para os grupos 1, 2 e 3, em

que todos os resultados são considerados em conjunto

Adicione os totais das ordens para cada situação.

Calcule o valor de H a partir da fórmula

T2
12 c

H = ________________  __________ - 3 (N + 1)

N (N + 1) n
c

em que:

N=número total de sujeitos N=11


nc =número de sujeitos em cada grupo n1 =4; n2 =3; n3 =4
Tc=total de ordens para cada situação, ou seja,
os totais das ordens para cada coluna
T1 =38;T2 =14;T3 =14
Tc2 =total das ordens para cada situação, cada um elevado ao quadrado
T1 2 =382 ;T2 2 =142 ; T3 2 =142
 Tc2 = soma dos quadrados dos totais das ordens para cada situação dividido
nc pelo número de sujeitos dessa situação
382 /4 + 142 /3 + 142 /4

Cálculo de H
12 T2
c
= ------------  ----- - 3 (N + 1)
H
N (N + 1) n
c

12 T2
c
= ----------- -----------
H (382 /4 + 142 /3 + 142 /4 ) - 3 (11 + 1)
N (N + 1) n
c

H = 12/132- (1444/4 + 196/3 + 196/4 ) - 3 x 12

H = 0,91 (361 + 65,33 + 49) – 36

H = 43,255 – 36 = 7,26
91
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Calcule os graus de liberdade, ou seja, o número de situações (C) menos uma.


gl = C – 1 = 3 – 1 = 2

Consulta da significância na tabela


A Tabela (Anexo IV) utiliza-se em experiências com três grupos de sujeitos, e com um máximo

de cinco sujeitos em cada grupo. Para um maior número de sujeitos, deve ser utilizada a Tabela do

Qui-quadrado (Anexo I). Quando não são utilizados mais de três grupos, poderá localizar na coluna

da esquerda da Tabela o número de sujeitos de cada grupo. Localize então a combinação que procura

(no nosso caso: 4, 4, 3). Note que a ordem do número de sujeitos não é importante, mas a combinação

apropriada na Tabela é 4, 4 e 3. Para essa combinação encontrará os valores críticos de H para várias

probabilidades. Se o valor de H que obteve for igual ou superior ao valor crítico de um determinado

nível de significância pode rejeitar a hipótese nula. No nosso exemplo, o valor obtido de H=7,26 é

superior ao valor crítico de 7,1439 para p<0,01, pelo que podemos aceitar a hipótese experimental a

este nível de significância.

Se possuir mais de três situações, e/ou sujeitos em cada situação, deverá procurar o valor crítico

na Tabela do Qui-quadrado. Repare que para isso terá que calcular os graus de liberdade. Localize

os valores dos graus de liberdade (no nosso exemplo, gl=2) ao longo da coluna do lado esquerdo e

verifique ao longo da linha os valores críticos para as diferentes probabilidades. O valor que

obtivemos H=7,26 é superior ao valor crítico de 5,99 para p<=0,05, pelo que podemos aceitar que o

resultado é significativo a este nível. Dará conta que esta probabilidade é menos significativa de que

quando utilizamos a Tabela anterior. Isso acontece porque essa Tabela é especialmente concebida

para nos dar as probabilidades com um pequeno número de sujeitos e de situações.

Notará também que o teste de Kruskal-Wallis apenas lhe pode dizer que existem diferenças

globais nos resultados entre as situações experimentais. Na tabela apresentada parece existir uma

tendência para consultar páginas com mais ilustrações do que sem ilustrações. Mas para poder testar

se essa tendência realmente existe, terá de utilizar um teste de tendência.

92
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

6. Testes para duas amostras relacionadas

Empregam-se as provas estatísticas de duas amostras quando o investigador deseja determinar se


dois tratamentos são diferentes ou se um tratamento é “melhor” do que o outro. Em cada caso, compara-
se o grupo em que se aplicou o tratamento com outro que não sofreu nenhum tratamento ou que sofreu
tratamento diferente.
Em tais comparações de dois grupos observam-se, por vezes, diferenças significativas que não são
resultantes do tratamento aplicado.
Uma das maneiras de superar a dificuldade decorrente da introdução de diferenças “extrínsecas”
entre dois grupos consiste em utilizar na pesquisa duas amostras relacionadas, isto é, relacionar de
alguma forma as duas amostras estudadas. Tal relacionamento pode ser conseguido utilizando-se cada
indivíduo como seu próprio controlo ou então formando pares de indivíduos e, em seguida, associando
os dois membros de cada par às duas condições. Quando um indivíduo “serve como o seu próprio
controlo”, ele é submetido a ambos os tratamentos em ocasiões diferentes. Quando se utiliza o método
do emparelhamento devem procurar seleccionar-se, para cada par, indivíduos que sejam tão semelhantes
quanto possível em relação a quaisquer variáveis extrínsecas que possam influenciar os resultados da
pesquisa.
Sempre que possível, o método de utilização do indivíduo como o seu próprio controlo
(contrabalançando a ordem em que se aplicam os tratamentos ou métodos) é preferível ao método de
emparelhamento. E a razão disso é que é limitada a nossa capacidade para formar os pares
adequadamente, em consequência do nosso desconhecimento das variáveis relevantes que determinam
o comportamento. A validade por emparelhamento está na razão directa do investigador para determinar
como formar os pares, e essa capacidade é quase sempre muito limitada. Essa dificuldade é contornada
quando se utiliza cada indivíduo como seu próprio controlo; não se pode pretender relacionamentos
mais precisos do que a própria identidade.

Ordenamento de diferenças entre resultados (designs relacionados para os mesmos sujeitos ou


emparelhados):
Em geral, a atribuição de ordens às diferenças entre resultados efectua-se tal como fizemos para os
resultados, sendo atribuída a ordem mais baixa à menor diferença e por aí adiante;
Diferenças idênticas entre resultados são ordenadas da mesma forma que resultados idênticos,
atribuindo-se uma ordem média resultante da globalidade de ordens que essas diferenças deveriam
ocupar;
Resultados nulos de 0 são contados como o resultado mais baixo possível quando se calculam
diferenças entre resultados;
93
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Contudo, quando existe igualdade entre resultados que originem uma diferença nula entre as
situações experimentais, estes não são ordenados, sendo retirados da análise;
Diferenças positivas e negativas são ordenadas em conjunto como se se tratasse de um ordenamento
simples de resultados, ignorando os sinais positivos e negativos.

Exemplo: Suponha que quer ordenar as diferenças entre o número de frases correctas que um grupo
de crianças com suspeita de perda auditiva produziu antes da colocação de um aparelho auditivo e após
a colocação daquele.

Tabela 21: Ordenação para Amostras Relacionadas ou Emparelhadas

Nº de frases correctas Nº de frases correctas


Sujeitos antes do aparelho depois do aparelho diferenças ordem
auditivo auditivo
1 5 6 1 2

2 5 7 2 4

3 2 3 1 2

4 1 5 4 6,5

5 4 5 1 2

6 2 5 3 5

7 1 5 4 6,5

8 4 4 0 -

9 1 7 6 9

10 1 6 5 8

Ao contrário do que acontece nos casos das amostras relacionadas quando a diferença entre 2
situações é nula nas amostras relacionas a este tipo de resultado não é atribuída nenhuma ordem, sendo
que o resultado nem sequer é considerado na análise. No ordenamento de resultados negativos em
amostras relacionadas ignoram-se os sinais quando se ordenam os resultados.

6.1 Prova de mcnemar para a significância de mudanças

Quando utilizar
A prova de McNemar para a significância de mudanças é particularmente aplicável aos
planeamentos do tipo “antes e depois”, em que cada indivíduo é utilizado como o seu próprio controlo
e a mensuração se faz ao nível de uma escala nominal ou ordinal. Pode, assim, ser usada para testar a
eficiência de determinada técnica (reuniões, folhetos, visita, etc.) sobre as preferências eleitorais a
respeito de vários candidatos.

94
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Nestes casos, cada pessoa pode servir como o seu próprio controlo, utilizando-se a mensuração em
escala nominal para avaliar as alterações da situação “após” em relação à situação “antes”.

Exemplo: Suponha que um profissional de saúde está interessado em estudar os comportamentos


resultantes da iniciação de obesos à prática do exercicio fisico. Este profissional observou ao longo dos
anos que os obesos utilizam preferencialmente o elevador para se dirigirem à sua consulta cujo
consultório era no 1.º andar. Coloca a hipotese de que os obesos que tiveram com terapeutica exercico
fisico começariam a usar preferencialmente as escadas. A fim de testar a hipotese o técnico observa 25
doentes em que ministrou como exercicio fisico caminhar uma hora por dia cinco vezes por semana.
Decorrido um mês de exercicio ele observa os mesmos 25 doentes e faz a classificação comportamentos.
Os dados são os seguintes:

Tabela 22
Preferencia após 30º dias de exercicio
Escadas Elevador
Preferência antes da Elevador 4 (A) 14 (B)
terapêutica Escadas 4 (C) 3 (D)

Hipótese de nula:

H0: Para os obesos que modificaram a sua atitude, a probabilidade de mudar o percurso do elevador
para as escadas (PA) é igual à probabilidade de mudar de mudar das escadas para o elevador (PD) e
ambas são iguais a ½. Isto é,
H0: PA=PD=1/2 H1: PA>PD

95
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Prova estatística:

Utiliza-se a prova de McNemar para significância de mudanças, porque o estudo utiliza duas
amostras relacionadas, é do tipo antes-e-depois e utiliza a escala de medida nominal (classificativa).

Nível de significância:
p=0,05 N=25

Distribuição amostral:

A distribuição Qui-quadrado com 1 grau de liberdade dá uma boa aproximação da distribuição


amostral de Qui-quadrado, tal como calculada pela fórmula.

Região de Rejeição:

Como H1 especifica o sentido da diferença prevista, a região de rejeição é unilateral. Consiste de


todos os valores de Qui-quadrado que são tão grandes que acusem uma probabilidade unilateral,
associada à sua ocorrência sob H0 não superior a 0,05.

Decisão:
Estamos interessados nos obesos cujo comportamento acusa alteração: representados nas células A e D.

Para os dados, temos:


(A-D - 1)2 (4-3 - 1)2 (1 - 1)2 0
X2 = -------------------- = ---------------- = ------------- = -------- = 0
A+D 4+3 7 7

Sendo 0 valor observado de x2 =0, devemos consultar a tabela (Anexo I) para obter o valor critico,
não esquecendo que temos uma amostra unicaudal a um nivel de 0,05. consultando a tabela observamos
um x2 critico de 5,41.

Racional
Para comparar a significância de qualquer mudança observada, por este método, constrói-se uma
tabela de frequências de 4 casas para representar o 1º e o 2º conjunto de reacções dos mesmos
indivíduos. As características gerais desta tabela são as que se apresentam a seguir, em que se utilizam
os sinais “+” e “-” para indicar diferentes reacções.

96
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Tabela 23: Tabela de quatro casas para a prova de significância de mudanças

ANTES
- +
DEPOIS + A B
- C D

Note-se que os casos que acusam modificações entre a 1ª e a 2ª reacção aparecem nas células A e
D. Um indivíduo é localizado na célula A se passou de “+” para “-” e na célula D se passou de “-“ para
”+”. Na ausência de modificação, o indivíduo é classificado na célula B (reacção “+” antes e depois) ou
na célula C (reacção “-” antes e depois).
Como A e D representa o número total de indivíduos que acusam modificação, a perspectiva, sob a
hipótese de nulidade, seria que ½ (A+D) acusassem modificações num sentido e ½ (A+D) acusassem
modificações noutro sentido. Ou seja, ½ (A+D) é a frequência esperada, sob H0, tanto na célula A
como na célula D.
Na prova de McNemar de significância de mudança, estamos interessados apenas nas células A e
D. Portanto, A=número de casos observados na célula A, D=número de casos observados na célula D e
½ (A+D)=número esperado de casos tanto nas células A como D, então

(A-D)2
X2 = _____________
A+D com graus de liberdade=1

97
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
6.2 Correcção de continuidade

A aproximação, pela distribuição do Qui-quadrado, da distribuição amostral da fórmula torna-se


excelente se se introduzir uma correcção de continuidade. Tal correcção é necessária, porque se utilizou
um distribuição contínua (Qui-quadrado) para aproximar uma distribuição discreta. Quando todas as
frequências esperadas são pequenas, tal aproximação pode ser fraca. A correcção de continuidade
(Yates, 1934) constitui uma tentativa de remoção dessa fonte de erro.
Com a correcção de continuidade, tem-se:
(A-D - 1)2
X2 = ________________________________
A+D com graus de liberdade=1

Esta expressão indica que se deve subtrair 1 do valor absoluto da diferença entre A e D antes de
elevar ao quadrado. O grau de significância de qualquer valor observado de Qui-quadrado, tal como
calculado através da fórmula, é determinado mediante referência a uma Tabela (Anexo I). Se o valor
observado de Qui-quadrado é igual a, ou maior do que, o valor exibido na Tabela para determinado
nível de significância com gl=1, a implicação é que existe efeito “significativo” nas reacções “antes” e
“depois”.

Instruções passo-a-passo para calcular x2

Enquadrar as frequências observadas numa tabela de 4 casas.


Determinar as frequências esperadas nas células A e D
E=1/2 (A+D)
Se as frequências esperadas são inferiores a 5, empregar a prova binomial em substituição à prova
de McNemar.
Se as frequências esperadas não são inferiores a 5, calcular o valor de X2 através da fórmula
(A-D - 1)2
X2 = _______________________
A+D

Mediante referência à Tabela (Anexo I), determinar a probabilidade, sob H0, associado a um valor
tão grande quanto o valor observado de X2 . Se se trata de uma prova unilateral, dividir por 2 o valor da
probabilidade exibido na Tabela. Se o valor de p, dado pela Tabela para o valor observado de X2 com
gl=1, não supera p, rejeita-se H0 em favor de H1.

98
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
6.3 Teste dos sinais de Wilcoxon

Teste de Wilcoxon
ou
Wilcoxon Signed Rank Test
ou
Teste de postos com sinais
(equivalente do teste t pareado)

Quando utilizar
O teste de Wilcoxon deve ser utilizado num design experimental relacionado, com duas situações
experimentais quando são utilizados os mesmos sujeitos ou sujeitos emparelhados em ambas as
situações.
Exemplo: Suponha que quer investigar se existe alguma diferença na quantidade de vocabulário
utilizado por crianças que usam um aparelho auditivo ou por crianças que não usam. Este é um bom
exemplo dum caso em que é essencial a utilização de sujeitos emparelhados. Como é óbvio, não é
possível utilizar os mesmos sujeitos, uma vez que nenhuma criança que não precisa de usar aparelho
auditivo usa um mesmo tempo. Por outro lado, não podemos escolher aleatoriamente os sujeitos para
cada grupo. Pode dar-se o caso, por exemplo, de os sujeitos que usam aparelho auditivo serem mais
velhos. Qualquer efeito encontrado neste grupo pode ficar a dever-se unicamente a esta diferença. Os
dois grupos “com aparelho” e “sem aparelho” necessitam de ser emparelhados em termos de idade,
sexo, inteligência e todas as outras variáveis que achemos necessário serem controladas. Apresentamos
depois às crianças um teste que meça o seu vocabulário, traduzindo-o em resultados, tal como é
mostrado na tabela seguinte.
Tabela 24: Resultados do teste do vocabulário

Par de Situação A Situação B d (A-B) Ordem de d Ordem das Ordem das


sujeitos (com aparelho) (sem aparelho) diferenças diferenças
positivas negativas
1 3 5 -2 5(-) 5
2 4 5 -1 2(-) 2
3 3 2 +1 2(+) 2
4 1 5 -4 8,5(-) 8,5
5 5 4 +1 2(+) 2
6 2 5 -3 7(-) 7
7 3 5 -2 5(-) 5
8 4 4 0 -
9 1 5 -4 8,5(-) 8,5
10 3 5 -2 5(-) 5
TOTAL 29 45 4 41
MÉDIA 2,9 4,5

99
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
RACIONAL
O objectivo do teste dos sinais de Wilcoxon é comparar as performances de cada sujeito (ou pares
de sujeitos) no sentido de verificar se existem diferenças significativas entre os seus resultados nas duas
situações. Os resultados da Situação B são subtraídos dos da Situação A e à diferença resultante (d) é
atribuído o sinal mais (+) ou, caso seja negativa, o sinal menos (-). Estas diferenças são ordenadas em
função da sua grandeza (independentemente do sinal positivo ou negativo). O ordenamento assim obtido
é depois apresentado separadamente para os resultados positivos e negativos. O menor dos valores deste
segundo, dá-lhe o valor de uma “estatística” designada por W, que pode ser consultada na Tabela de
significância apropriada.
A ideia é que se existirem apenas diferenças aleatórias, tal como é postulado pela hipótese nula,
então haverá aproximadamente o mesmo número de ordens elevadas e de ordens inferiores tanto para
as diferenças positivas como negativas. Se se verificar uma preponderância de baixos resultados para
um dos lados, isso significa a existência de muitos resultados elevados para o outro lado, indicando uma
diferença em favor de uma das situações, superior àquilo que seria de esperar se os resultados se
devessem ao acaso. Dado que a estatística W reflecte o menor total de ordens, quanto menor for o W
mais significativas serão as diferenças nas ordenações entre as duas situações.

INSTRUÇÕES PASSO-A-PASSO PARA CALCULAR W


Calcule a diferença d entre cada par de resultados, atribuindo o sinal mais ou menos.
Veja a coluna d(A-B)
Ordene as diferenças por ordem de grandeza desde a ordem inferior até à superior, ignorando os
sinais positivos e negativos.
Veja a coluna ordenamento de d
Em separado, junte também a ordenação correspondente aos sinais diferentes (+ ou -).
Veja os totais para ordenamentos de diferenças positivas e de diferenças negativas nas respectivas
colunas

Considere o menor dos totais das ordens como W.


Valor observado de W=4, uma vez que o total das ordens para as diferenças positivas é o menor

Conte o número de pares de sujeitos N (não considere as igualdades).


N=10-1=9

Consulta da significância na tabela


A tabela anexada (Anexo III) apresenta-lhe o nível de significância de w tanto para os testes
unicaudais como bicaudais. Na coluna da esquerda encontra os valores de N. Uma vez que não
efectuámos uma previsão da direcção (como por exemplo, que obteríamos melhores resultados no
vocabulário de criança em jardim de infância) teremos de utilizar os níveis de significância para uma
hipótese bicaudal. Seleccione o valor adequado N=9 e verifique ao longo dessa linha se o valor de W é
significativo. Uma vez que se convencionou utilizar o menor valor das ordens, então o valor obtido de
100
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
W terá de ser igual ou inferior ao valor crítico da Tabela. Como o valor obtido W=4 é inferior ao valor
crítico de 6 para p<0,05 (bicaudal), pode rejeitar a hipótese nula e concluir que existe uma diferença
significativa entre os resultados no vocabulário dos dois grupos de sujeitos emparelhados.
Suponha que tinha efectuado uma previsão numa dada direcção, por exemplo, que as crianças que
usam aparelho auditivo (Situação B) obtêm resultados mais elevados no teste de vocabulário. O valor
obtido de W=4, é inferior a 6, que é o valor crítico de W para p<0,025 (hipótese unicaudal), uma
probabilidade inferior e, consequentemente, mais significativa do que o nível de significância para uma
hipótese bicaudal p<0,05.

101
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

8. Testes para k amostras relacionadas

São estatísticas para comprovar a significância de diferenças entre três ou mais grupos, ou seja,
para comparar a hipótese de nulidade de que K (3 ou mais) amostras tenham sido extraídas da mesma
população ou de populações idênticas.
As circunstâncias exigem, por vezes, o recurso a um experimento que nos permita estudar
simultaneamente mais de duas amostras ou condições. Quando se trata de comparar três ou mais
amostras ou condições de um experimento, é necessário aplicar uma prova estatística que indique se há
alguma diferença global entre as K amostras ou condições, antes que possamos cogitar de comprovar a
significância da diferença entre duas amostras quaisquer.
Só quando uma prova global (prova de K amostras) nos autoriza a rejeitar a hipótese nula é que
podemos empregar um processo para determinar diferenças significativas entre duas quaisquer das K
amostras.
Estas provas não-paramétricas têm a vantagem de permitir o estudo da significância de dados que,
inerentemente, se apresentam apenas sob a forma classificativa ou em postos.
Há dois planos básicos para comparar K grupos:
No primeiro deles, as K amostras de igual tamanho são postas em correspondência de acordo com
determinado(s) critério(s) que podem afectar os valores das observações. Nalguns casos, essa
correspondência obtém-se comparando os mesmos indivíduos ou casos sob todas as K condições ou
então cada um dos N grupos pode ser mensurado sob todas as K condições. Em tais planos, devem usar-
se provas estatísticas para K amostras relacionadas;
O segundo plano envolve K amostras aleatórias independentes (não necessariamente do mesmo
tamanho), uma de cada população. Em tais casos, devemos usar as provas estatísticas para K amostras
independentes.

8.1 Prova de Cochran

Quando utilizar
A prova de McNemar para duas amostras pode ser estendida para aplicação a pesquisas que
envolvem mais de duas amostras. Essa extensão, que constitui a prova Q de Cochran para K amostras
relacionadas, proporciona um método para comparar se três ou mais conjuntos correspondentes de
frequências ou proporções diferem entre si significativamente. A correspondência pode basear-se
em características relevantes dos diferentes indivíduos ou no facto de os mesmos indivíduos serem

102
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
observados sob condições diferentes. A prova Q de Cochran adapta-se especialmente ao caso em que
os dados se apresentam numa escala nominal ou sob a forma de informação ordinal dicotomizada.
Exemplo: Suponha que estamos interessados em saber se a atitude de um entrevistador
influencia a aceitação de participação num estudo por inquérito. Poderemos treinar o
entrevistador para efectuar as suas entrevistas de três maneiras diferentes:

 Demonstrando interesse, cordialidade, entusiasmo;


 Demonstrando formalismo, reserva e cortesia;
 Demonstrando modo abrupto, formalismo e aspereza.

Exemplo: O entrevistador visitaria 3 grupos de 18 casas, aplicando o tipo 1 de entrevista a um grupo,


o tipo 2 a outro grupo e o 3 ao terceiro grupo. Teríamos, assim, 18 conjuntos de potenciais inquiridos
com três deles correspondendo em cada conjunto. Em cada conjunto atribuir-se-íam aleatoriamente aos
três membros as três condições (tipos de entrevista). Teríamos, então, 3 amostras relacionadas
(correspondentes) com 18 elementos cada uma (N=18). Poderíamos, pois, comprovar se as diferenças
fundamentais nos tipos de entrevista influenciariam o número de respostas afirmativas “sim” dadas para
aceitação de participação pelos 3 grupos de correspondentes.

Tabela 25

Conjunto Resposta à entrevista 1 Resposta à entrevista 2 Resposta à entrevista 3

1 1 1 1
2 2 2 1
3 1 2 1
4 1 1 1
5 2 1 1
6 2 2 1
7 2 2 1
8 1 2 1
9 2 1 1
10 1 1 1
11 2 2 2
12 2 2 2
13 2 2 1
14 2 2 1
15 2 2 1
16 2 2 2
17 2 2 1
18 2 2 1
Respostas “Sim” (1) e “Não” (2) dadas por donas de casa a três tipos de entrevistas

103
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Hipótese nula:
A probabilidade de um “ Sim” é a mesma para os três grupos de entrevistas.

H1: As probabilidades de um “Sim” diferem conforme o tipo de entrevista.

Prova estatística:
Escolhe-se a prova Q de Cochran, porque os dados se referem a mais de dois grupos relacionados (K=3) e apresentam-se dicotomizados sob
a forma “ Sim” e “ Não”.

Nível de significância:
p=0,01 N=18

Distribuição amostral:
Sob a hipótese de nulidade, Q tem uma distribuição aproximadamente Qui-quadrado com gl=1. Isto é, a probabilidade associada à ocorrência,
sob Ho, de qualquer valor tão grande quanto um valor observado de Q pode ser determinada mediante referência à Tabela.

Região de Rejeição:
Consiste em todos os valores de Q tão grandes quanto a probabilidade associada à sua ocorrência, sob Ho, não seja superior a p=0,01.

Decisão:
Recodificámos “ Sim” por 1 e “ Não” por 0.

Tabela 26: Decisão:


Conjunto Resposta à Resposta à Resposta à Li Li2
entrevista 1 entrevista 2 entrevista 3

1 0 0 0 0 0
2 1 1 0 2 4
3 0 1 0 1 1
4 0 0 0 0 0
5 1 0 0 1 1
6 1 1 0 2 4
7 1 1 0 2 4
8 0 1 0 1 1
9 1 0 0 1 1
10 0 0 0 0 0
11 1 1 1 3 9
12 1 1 1 3 9
13 1 1 0 2 4
14 1 1 0 2 4
15 1 1 0 2 4
16 1 1 1 3 9
17 1 1 0 2 4
18 1 1 0 2 4
Total G1=13 G2=13 G3=3 Li=29  Li2 63

Li=número total de respostas “Sim” para cada linha


K=número de colunas
N=número de linhas

104
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Substituindo estes valores na fórmula, vem:
(K-1) K  Gj2 – ( Gj)2  (3-1)  3X (132 + 132 + 32 ) – 292 
Q = _____________________________________________ = ______________________________________________________ = 16,7
K  Li -  Li2 3X29 - 63

Em que K= n.º de grupos


Gj= n.º total de sucessos
A Tabela (Anexo I) indica que Q  16,7 tem uma probabilidade de ocorrência, sob Ho, p < 0,001,
quando gl=K-1=3-1=2. Essa probabilidade é inferior ao nível de significância de p=0,01. O valor de Q
está na região de rejeição e, consequentemente, a nossa decisão é rejeitar Ho em favor de H1, concluindo
que o número de respostas “Sim” difere significativamente em relação aos tipos 1, 2 e 3 de entrevista.

Racional
Se os dados de uma pesquisa se dispõem numa tabela de dupla entrada com N linhas e K colunas,
é possível testar a hipótese de nulidade de que a proporção ou frequência de respostas de determinado
tipo seja a mesma em cada coluna, exceptuando as diferenças devidas ao acaso. Cochran mostrou que
se a hipótese de nulidade é verdadeira, isto é, se não há diferença na probabilidade, digamos de
“Sucesso” sob cada condição (o que equivale a dizer que os “Sucessos” ou “Fracassos” se distribuem
aleatoriamente pelas linhas e colunas da tabela de dupla entrada), então, se o número de linhas é muito
pequeno
K(K-1)  (Gj - G)2
Q = __________________________________________
K  Li -  Li2

tem distribuição aproximadamente Qui-quadrado com gl=K-1, em que:


Gj=número total de “Sucessos” na coluna j
G=média dos Gj
Li=número total de “sucessos” na linha i

Uma expressão equivalente à fórmula anterior, e facilmente dedutível dela, mas que simplifica os
cálculos é:

(K-1) K  Gj2 – ( Gj)2 


Q = __________________________________________________
K  Li -  Li2

105
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Instruções passo-a-passo para calcular Q de COCHRAN
Para dados dicotomizados, atribuir o score “1” a cada “Sucesso” e o score “0” a cada “Falha”.

Dispor os dados numa tabela K.N, com K colunas e N linhas (N=número de condições em cada um
dos grupos).

Determinar o valor de Q, aplicando a fórmula.


A significância do valor observado de Q pode ser determinado mediante a observação do Anexo I,
pois Q recorre à distribuição do Qui-quadrado com gl=K-1. Se a probabilidade associada à ocorrência,
sob H0, de um valor tão grande quanto um valor observado de Q não supere p, rejeita-se Ho.

8.2 Teste de Friedman


Quando utilizar
Este teste pode ser considerado uma extensão do teste de Wilcoxon, quando é necessário utilizar
três ou mais situações experimentais. Deve ser utilizado para um design relacionado quando os
mesmos sujeitos (ou sujeitos emparelhados) são distribuídos por três ou mais situações experimentais.
Exemplo: Suponha que um editor de livros de estatistica produziu uma série de livros e quer
escolher de entre três tipos de ilustrações aquele que é mais eficaz para os estudantes. É pedido a oito
universitários que classifiquem as obras numa escala de cinco pontos, desde “nada boa” até “muito
boa”. Obtiveram-se os resultados apresentados na tabela seguinte.

Tabela 27: Avaliação de três tipos de ilustrações

Sujeitos Situação 1 Situação 2 Situação 3


(Ilustração (Ilustração B) (Ilustração C)
A)
Result. Ordem Result. Ordem Result. Ordem
1 2 1 5 3 4 2
2 1 1 5 3 3 2
3 3 1 5 2,5 5 2,5
4 3 2 5 3 2 1
5 2 1 3 2 5 3
6 1 1 4 2,5 4 2,5
7 5 3 3 2 2 1
8 1 1 4 3 3 2
TOTAL 18 11 34 21 28 16
MÉDIA 2,25 4,25 3,50

Racional: Uma vez que se trata de um design relacionado no qual o mesmo sujeito obtém resultados
em todas as situações, é permitido comparar os resultados de cada sujeito através de todas as situações,
no sentido de verificarmos em que situação obtêm maiores e menores resultados.

106
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Uma vez que existem mais do que duas situações, não é possível calcular as diferenças nos
resultados de duas situações, como era o caso do teste de Wilcoxon. Pelo contrário, o ordenamento dos
resultados de cada sujeito para as três condições será feita horizontalmente ao longo das linhas, tal como
mostra a tabela. Por exemplo, aos resultados do sujeito 1, respectivamente 2 na Situação 1, 5 na Situação
2 e 4 na Situação 3, são atribuídas três ordens, do menor resultado para o maior: Ordem 1 para a Situação
1, Ordem 2 para a Situação 3 e Ordem 3 para a Situação 2; este procedimento é semelhante para todos
os sujeitos. Claro que se existissem quatro situações experimentais, os resultados de cada sujeito seriam
ordenados de 1 a 4.
O próximo passo é calcular os totais de ordens para cada situação. Se existirem apenas diferenças
aleatórias entre os resultados de todas as situações, como é postulado pela hipótese nula, é de esperar
que estes totais sejam aproximadamente iguais partindo do princípio de que surgiriam algumas ordens
baixas (baixos resultados) e algumas ordens altas (altos resultados). Contudo, se as situações forem
significativamente diferentes, é de esperar que se obtenham totais das ordens significativamente
diferentes, com algumas situações a terem uma preponderância de ordens baixas e outras uma
preponderância de ordens altas. O tamanho das diferenças entre os totais das ordens é-nos dado por uma
estatística designada por Xr2 . Se o valor de Xr2 for igual ou superior aos valores críticos das Tabelas C
e D (Anexo V), isso implica que as diferenças nos totais das ordens são suficientemente grandes para
que se possam considerar significativas.
Instruções passo-a-passo para calcular w
Ordene os resultados de cada sujeito em separado, ao longo de cada linha, atribuindo a Ordem 1 ao
menor resultado e por aí adiante.
(Veja as colunas das Ordens na tabela. Note que a ordem para cada linha de resultados corresponde
às ordens 1,2 e 3, dado existirem três situações)
Calcule o total das ordens para cada situação.
Calcule o valor de XR2 a partir da fórmula
12
XR2 = ________________________  Tc2 - 3N (C + 1)

NC (C + 1)

em que
C=número de situações C=3
N=número de sujeitos N=8
Tc=total de ordens para cada situação T1 =11;T2 =21;T3 =16
Tc =quadrado do total de ordens para cada situação T1 =11 ;T2 2 =212 ; T3 2 =162
2 2 2

Tc2 =soma dos quadrados dos totais das ordens para cada situação: 112 +212 +162
Cálculo de XR2 12
XR2 = _____________________ (112 + 212 + 162 ) - 3 x 8 (3 + 1)
(8 x 3) (3 + 1)
107
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

12
XR2 = _____________________ (121 + 441 + 256) - (24 x 4)
24 x 4

12
XR2 = _________________ x 818 - 96
96
XR2 = 6,25

Calcule os graus de liberdade, ou seja, o número de situações menos uma.


(gl = C – 1 = 3 – 1 = 2)

Consulta da significância na tabela


Existem duas tabelas para consultar os valores críticos de Xr 2 . Uma delas, a Tabela C (Anexo V), é
utilizada quando o número de situações e de sujeitos é pequeno. A Tabela C (1) apresenta os valores de
Xr2 para três situações quando N (número de sujeitos) se situa entre 2 e 9. A Tabela C (2) apresenta os
valores de Xr2 para quatro situações quando N (número de sujeitos) é de 2, 3 ou 4. A Tabela D (Anexo
V) é a tabela de distribuição do Qui-quadrado; pode utilizá-la quando a amostra de sujeitos for superior
às das Tabelas C (1) e C (2), uma vez que o Xr 2 tem uma distribuição semelhante à do Qui-quadrado.
A Tabela que deve utilizar para consultar o valor de Xr 2 , no caso desta experiência, é a Tabela C
(1), uma vez que se trata de 8 sujeitos expostos a 3 situações experimentais. Aquilo que temos de fazer
é encontrar a coluna apropriada para N (número de sujeitos ou pares de sujeitos emparelhados) e
descobrir na coluna p a probabilidade mais próxima que seja inferior aos níveis de significância
convencionais. Consultando as probabilidades para N=8, o valor obtido de Xr 2 =6,25 é equivalente a
uma probabilidade de p<0,047, que é inferior aos níveis de significância convencionais (p<0,05=). Para
considerarmos o nível de significância de p<0,01 o nosso valor de Xr 2 teria de ser 9,00, dado que
p<0,009 é inferior a p<0,01. Se o valor de Xr2 não for apresentado na Tabela, deverá considerar o valor
seguinte mais próximo quando consulta as probabilidades. Por exemplo, se o valor de Xr 2 for 5,95 terá
de considerar a probabilidade apresentada para 5,25, ou seja, p<0,079, que é superior a p<0,05 e,
consequentemente, não significativa. Para consultar os valores da Tabela C (2) deverá proceder tal como
para a Tabela C (1).
Se tiver mais situações e/ou sujeitos e tiver de consultar a Tabela D, aquilo que tem a fazer é
localizar os valores dos graus de liberdade ao longo da coluna da esquerda (no nosso exemplo, gl=2, ou
seja, número de situações-1). Depois siga ao longo da linha de probabilidades até que encontre um dos
níveis de significância convencionais. O valor que obtivemos de Xr 2 =6,25 é superior ao valor crítico de
108
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
5,99 apresentado na Tabela do Qui-quadrado, pelo que podemos aceitar que os nossos resultados são
significativos ao nível de significância de p<0,05. Apesar disso, e dado que o nosso valor de Xr 2 é
inferior ao valor crítico de 9,21 para p<0,01, não podemos rejeitar a hipótese nula a este nível de
significância.
A partir da análise estatística da experiência pode concluir que as crianças mostram preferências
significativamente diferentes pelos três tipos de ilustrações. Em função das médias apresentadas na
tabela, sabemos que preferem a Ilustração B, que recolheu as ordens mais elevadas, seguindo-se a
Ilustração C e, por último, a Ilustração A. Contudo, o teste de Friedman pode apenas indicar que existem
diferenças globais entre as situações. Para verificar se existe uma tendência para uma determinada
ordem de preferência das Ilustrações, necessita de utilizar um teste de tendência.

9. Medidas de correlação e suas provas de significância

Frequentemente, o investigador quer saber se dois conjuntos de scores estão relacionados e qual o
grau desse relacionamento.
Apresentam-se medidas não-paramétricas de correlação e de provas estatísticas para determinar a
probabilidade associada à ocorrência de uma correlação tão grande quanto a observada na amostra, sob
a hipótese de nulidade de que as variáveis sejam não-relacionadas na população.
Mas é de muito maior interesse podermos afirmar se determinada associação observada numa
amostra de scores indica, ou não, a probabilidade de associação entre as variáveis na população da qual
se extraiu a amostra. O coeficiente de correlação, por si só, representa o grau de associação. As provas
de significância sobre aquele coeficiente determinam, a um certo nível de probabilidade, se existe a
associação na população da qual se extraiu a amostra que serviu de base para o cálculo do coeficiente.

9.1 Coeficiente de correlação rho de spearman-rank

Condições de utilização
Este tipo de coeficiente de correlação utiliza-se quando temos:
Teste não paramétrico (semelhante a uma distribuição livre), isto é, não coloca restrições quanto à
forma da distribuição;
Escala de medida no mínimo ordinal.

Pode acontecer que os caracteres estudados não sejam mensuráveis, mas podem ser ordenados ou
classificados. Por exemplo, se se considera um grupo de candidatos a um certo lugar, eles podem ser
examinados segundo dois pontos de vista: conhecimentos e personalidade. Estas duas qualidades não

109
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
podem ser medidas, mas é possível para cada uma delas efectuar uma classificação dos candidatos.
Podemos, assim, examinar se existe correlação entre estes dois caracteres; cada par de dados (xi, yi) é
formado pelas ordens ocupadas por um candidato nas duas classificações.
Formulário:
6(di2 )
=1- ________________
N(N2 -1)
Em que:
di= diferença entre as posições nas duas variáveis, isto é, di=xi-yi
Para tal, temos que dar valores às posições: à pontuação mais baixa damos o valor 1 e assim
sucessivamente. Quando os valores são iguais é a média dessas duas posições.
Então,
-1    1

Se as duas classificações são iguais, di é sempre zero e então r=1 e a correlação é perfeita. Se as
ordens mais altas de uma classe estão associadas às mais baixas da outra r torna-se negativo e se as duas
classificações são inversas =-1.

Interpretação
O coeficiente de correlação obtido pode ser interpretado, tal como o coeficiente de correlação
momento-produto de Brawais-Pearson (ver este coeficiente em testes paramétricos).

110
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Exemplo: Calcule , sabendo que:
xi 18 17 14 13 13 12 11 9 7 5
yi 24 27 17 22 19 20 14 11 3 6

Tabela 28
xi posição yi posição d d2
18 1 24 2 -1 1
17 2 27 1 1 1
14 3 17 6 -3 9
13 4,5 22 3 1,5 2,25
13 4,5 19 5 -0,5 0,25
12 6 20 4 2 4
11 7 14 7 0 0
9 8 11 8 0 0
7 9 3 10 -1 1
5 10 6 9 1 1

=19,5
6 x 19,5
 = 1- __________________ = 0,88
10(102 -1)

9.2 O coeficiente de concordância de Kendall

Quando utilizar:
O coeficiente de concordância de Kendall é uma medida da relação entre vários conjuntos de postos
de N objectos ou indivíduos.
Quando temos K conjuntos de postos, podemos determinar a associação entre eles utilizando o
coeficiente de concordância de Kendall (W).

111
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Racional e exemplo
Como solução do problema da determinação da concordância global entre K conjuntos de postos, poderia parecer razoável determinar os r’s
entre todos os pares possíveis de postos e então calcular a média desses coeficientes para determinar a associação global. Ad optando este
procedimento, o processo torna-se impraticável, uma vez que temos de calcular inúmeros coeficientes de correlação de postos.

Assim, o cálculo de W é muito mais simples e W tem uma relação linear com o valor médio de rs
relativo a todos os grupos. Denotando rsav o valor médio dos coeficientes de correlação por postos de
Spearman, Kendal mostrou que
KW – 1
rsav = __________
K–1

Outro processo consiste em imaginar como se apresentariam dados se não houvesse concordância
alguma entre os conjuntos de postos e, em seguida, como se apresentariam se houvesse concordância
perfeita. O coeficiente de concordância seria, então, um índice de divergência entre a concordância
efectiva acusada pelos dados e a concordância máxima possível (perfeita). De modo aproximado, W é
um coeficiente desta natureza.
Suponhamos que 3 chefes de pessoal estejam encarregados de entrevistar 6 candidatos a emprego e
classificá-los em postos, separadamente, segundo a capacidade de cada um para preencher a vaga. A
tabela seguinte dá os 3 conjuntos independentes de postos atribuídos pelos chefes de pessoal X, Y e Z
aos candidatos a a f; a última linha da tabela Rj dá as somas dos postos atribuídos a cada candidato.

Tabela 29: Postos atribuídos a 6 candidatos a emprego por 3 chefes de pessoal

Candidato

a b c d e f
X 1 6 3 2 5 4
Chefe Y 1 5 6 4 2 3
Z 6 3 2 5 4 1
Rj 8 14 11 11 11 8

Se os chefes de pessoal apresentassem perfeita concordância nos seus julgamentos sobre os


candidatos, isto é, se tivessem atribuído postos aos candidatos da mesma ordem, então um candidato
teria recebido três postos 1 e assim a sua soma de postos, R j , seria 1+1+1=3=K. O candidato que os 3
chefes tivessem considerado em segundo lugar receberia R j =2+2+2=6=2K e o menos promissor dos
candidatos seria Rj =6+6+6=18=NK.
De facto, no caso da concordância perfeita entre os 3 chefes, as várias somas de postos, R j , seriam
3,6,9,12,15,18, muito embora não necessariamente nesta ordem. Em geral, quando há concordância
perfeita entre K conjuntos de postos, obtemos, para valores significativos de Rj , a sequência K, 2K, 3K,
..., NK.

112
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Por outro lado, se não tivesse havido concordância entre os 3 chefes, então os diversos R j seriam
aproximadamente iguais.
Deste exemplo, vemos que o grau de concordância entre os K julgamentos é reflectido pelo grau de
variância entre as N somas de postos. W, coeficiente de concordância, é função desse grau de variância.
Assim,
W= S .
1/12 K2 (N3 – N)
em que
S=soma dos quadrados dos desvios observados a contar da média dos Rj,
isto é, S=  (Rj - Rj/N)2
K=número de conjuntos de postos
N=número de entidades (objectos ou indivíduos a que se atribuem postos)
1/12 K2 (N3 – N)=valor máximo possível da soma dos quadrados dos desvios, isto é, o valor de S
que ocorreria no caso de concordância perfeita entre os K conjuntos de postos
Então,
= (8 + 14 + 11 + 11 + 11 + 8) / 6 = 10,5

S = (8-10,5)2 + (14-10,5)2 + (11-10,5)2 + (11-10,5)2 + (11-10,5)2 + (8-10,5)2 =


6,25 + 12,25 + 0,25 + 0,25 + 0,25 + 6,25 = 25,5

Pelo que S
25,5 25,5 25,5
W=__________________________= ____________________________=_____________________
1/12 K2 (N3 – N) 1/12 x 32 (63 – 6) 1/12 x 9 x 210

= 0,16

W=0,16 exprime o grau de concordância entre os 3 colegas fictícios ao atribuírem postos aos 6
candidatos a emprego.
É de salientar que a razão porque W não pode tomar valores negativos é que, quando estão em jogo
mais de dois conjuntos de postos, esses conjuntos não podem ser completamente discordantes. Por
exemplo, se X e Y discordam, e se X também discorda de Z, então Y e Z certamente concordarão. Isto
é, quando estão em jogo mais de 3 juizes, concordância e discordância não são opostos simétricos. K
juizes podem todos concordar, mas é impossível todos eles discordarem completamente. Portanto, W
deve ser zero ou um número positivo.

NOTA: Quando ocorrem empates, atribuem-se às observações empatadas a média dos postos que
lhes caberiam se não houvesse empates.
O efeito dos empates é reduzir o valor de W. Se a proporção de empates é pequena, o efeito é
desprezível, podendo continuar a usar-se a fórmula anterior. Se a proporção de empates é grande, pode

113
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
introduzir-se uma correcção que aumentará ligeiramente o valor de W em relação ao valor que se
apresentaria sem correcção.
O elemento correctivo é
 (t3 – t)
_________________________
T=
12
Em que t=número de observações num grupo empatados em relação a um dado posto
Então, a fórmula será:
S
W = ______________________________________
1/12 K2 (N3 – N) -  T

Instruções passo-a-passo para calcular W


Seja N=número de objectos ou indivíduos a serem classificados em postos e K=número de juizes
classificadores. Dispor os postos observados numa tabela do tipo K X N.
Para cada indivíduo ou objecto determinar Rj , soma dos postos atribuídos áquele indivíduo pelos K
juizes.
Determinar a média dos Rj . Exprimir cada Rj como desvio a contar dessa média. Elevar ao quadrado
esses desvios e somá-los, obtendo S.
Se a proporção de empates nos K conjuntos é grande, para calcular W utilizar a fórmula

S
_________________________________
W=
1/12 K2 (N3 – N) -  T

Em caso contrário, usar


S
_______________________________
W=
1/12 K2 (N3 – N)

O método para determinar se o valor observado é significativamente diferente de zero depende do


tamanho de N:
Se N  7 a Tabela (Anexo VI) dá os valores críticos de S associados com os W’s significativos aos
níveis de 0,05 e de 0,01;
Se N > 7 podemos usar X2 = K (N – 1)W para calcular um valor de X2 cuja significância, para
g.l.=N-1, possa ser comparada recorrendo à Tabela do X2 (Anexo I).

114
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Consulta da significância na tabela


PROVA DE SIGNIFICÂNCIA PEQUENAS AMOSTRAS:

Utilizando-se a Tabela esta dá o valor de S para W’s significativos aos níveis de 0,05 e de 0,01. Esta
Tabela é aplicável para K de 3 a 20 e N de 3 a 7. Se um valor observado de S é igual ou superior ao
valor exibido na Tabela para um dado nível de significância, então H0 pode ser rejeitada áquele nível.
Por exemplo, vimos que quando K=3 chefes de pessoal fictícios classificaram N=6 candidatos a
emprego, a concordância dos julgamentos foi W=0,16. A Tabela indica que o S associado àquele valor
de W (25,5) não é significativo, uma vez que S crítico (103,9) é maior do que S observado (25,5).
Pequenas amostras:
Quando N>7, a distribuição é aproximadamente uma distribuição de Qui-quadrado com g.l.=N-1,
vindo
S
2 _______________________
X =
1/12 KN (N + 1)

Note-se que
S
_____________________________
= K (N – 1) W
1/12 KN (N + 1)

E, portanto, X2 = K (N – 1) W, pelo que se pode usar esta fórmula que é mais fácil para determinar
a probabilidade associada à ocorrência, sob H0, de qualquer valor tão grande quanto o W observado.
Se o valor de X2 observado iguala ou supera o valor da Tabela (Anexo I) para um dado nível de
significância e um particular valor de g.l.=N-1, então Ho (não há relação entre os K conjuntos de postos)
pode ser rejeitada àquele nível.

Interpretação de w

Um valor elevado ou significativo de W pode ser interpretado como indicando que os observadores
ou juizes estão aplicando essencialmente os mesmos padrões ao atribuírem postos aos N indivíduos em
estudo. Frequentemente a sua ordenação conjunta pode servir como “padrão”, especialmente quando
não há critérios externos relevantes para ordenar os indivíduos.
Kendall sugere que a melhor estimativa da “verdadeira” classificação de N objectos, quando W é
significativo, seja dada pela ordem das várias somas de postos, R j . Se se aceita o critério segundo o qual
diversos juizes concordarem na atribuição de postos a N indivíduos, então a melhor estimativa da
“verdadeira” ordenação desses indivíduos segundo aquele critério é dada pela ordem da soma dos
postos. Assim, a nossa melhor estimativa seria dada ao candidato a ou f, pois em ambos os casos Rj =0,
o menor valor observado.

115
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Anexos

Tabela com valores críticos de t (Student)

Graus de Nível de Confiança, 0,50 0,80 0,90 0,95 0,98 0,99


Liberdade (c)
(g.l.) unicaudal 0,25 0,10 0,05 0,025 0,01 0,005

Bicaudal ( ) 0,50 0,20 0,10 0,05 0,02 0,01

1 1,000 3,078 6,314 12,706 31,821 63,657


2 0,816 1,886 2,920 4,303 6,965 9,925
3 0,765 1,638 2,353 3,182 4,451 5,841
4 0,741 1,533 2,132 2,776 3,747 4,604
5 0,727 1,476 2,015 2,571 3,365 4,032
6 0,718 1,440 1,943 2,447 3,143 3,707
7 0,711 1,415 1,895 2,365 2,998 3,499
8 0,706 1,397 1,860 2,306 2,896 3,355
9 0,703 1,383 1,833 2,262 2,821 3,250
10 0,700 1,372 1,812 2,228 2,764 3,169
11 0,697 1,363 1,796 2,201 2,718 3,106
12 0,695 1,356 1,782 2,179 2,681 3,055
13 0,694 1,350 1,771 2,160 2,650 3,012
14 0,692 1,345 1,761 2,145 2,624 2,977
15 0,691 1,341 1,753 2,131 2,602 2,947
16 0,690 1,337 1,746 2,120 2,583 2,921
17 0,689 1,333 1,740 2,110 2,567 2,898
18 0,688 1,330 1,734 2,101 2,552 2,878
19 0,688 1,328 1,729 2,093 2,539 2,861
20 0,687 1,325 1,725 2,086 2,528 2,845
21 0,686 1,323 1,721 2,080 2,518 2,831
22 0,686 1,321 1,717 2,074 2,508 2,819
23 0,685 1,319 1,714 2,069 2,500 2,807
24 0,685 1,318 1,711 2,064 2,492 2,797
25 0,684 1,316 1,708 2,060 2,485 2,787
26 0,684 1,315 1,706 2,056 2,479 2,779
27 0,684 1,314 1,703 2,052 2,473 2,771
28 0,683 1,313 1,701 2,048 2,467 2,763
29 0,683 1,311 1,699 2,045 2,462 2,756
 0,674 1,282 1,645 1,960 2,326 2,576

116
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

117
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Anexo I
Tabela do Quiquadrado (x2 ):Valores críticos

gl 0,995 0,99 0,975 0,95 0,9 0,1 0,05 0,025 0,01 0,005

1 0,000 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879

2 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597

3 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,838

4 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,860

5 0,412 0,554 0,831 1,145 1,610 9,236 11,070 12,832 15,086 16,750

6 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548

7 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,278

8 1,344 1,647 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955

9 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589

10 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188

11 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757

12 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,300

13 3,565 4,107 5,009 5,892 7,041 19,812 22,362 24,736 27,688 29,819

14 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319

15 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801

16 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267

17 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718

18 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156

19 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582

20 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997

21 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401

22 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,796

23 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181

24 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,558

25 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928

26 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290

27 11,808 12,878 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,645

28 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,994

29 13,121 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,335

30 13,787 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672

31 14,458 15,655 17,539 19,281 21,434 41,422 44,985 48,232 52,191 55,002

32 15,134 16,362 18,291 20,072 22,271 42,585 46,194 49,480 53,486 56,328

33 15,815 17,073 19,047 20,867 23,110 43,745 47,400 50,725 54,775 57,648

34 16,501 17,789 19,806 21,664 23,952 44,903 48,602 51,966 56,061 58,964

35 17,192 18,509 20,569 22,465 24,797 46,059 49,802 53,203 57,342 60,275

36 17,887 19,233 21,336 23,269 25,643 47,212 50,998 54,437 58,619 61,581

118
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Anexo II
Tabela de U e Z
Tabela de U para 0,05

119
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Tabela Z
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,02392 0,02790 0,03188 0,03586
0,1 0,03983 0,04380 0,04776 0,05172 0,05567 0,05962 0,06356 0,06749 0,07142 0,07535
0,2 0,07926 0,08317 0,08706 0,09095 0,09483 0,09871 0,10257 0,10642 0,11026 0,11409

0,3 0,11791 0,12172 0,12552 0,12930 0,13307 0,13683 0,14058 0,14431 0,14803 0,15173
0,4 0,15542 0,15910 0,16276 0,16640 0,17003 0,17364 0,17724 0,18082 0,18439 0,18793
0,5 0,19146 0,19497 0,19847 0,20194 0,20540 0,20884 0,21226 0,21566 0,21904 0,22240
0,6 0,22575 0,22907 0,23237 0,23565 0,23891 0,24215 0,24537 0,24857 0,25175 0,25490

0,7 0,25804 0,26115 0,26424 0,26730 0,27035 0,27337 0,27637 0,27935 0,28230 0,28524
0,8 0,28814 0,29103 0,29389 0,29673 0,29955 0,30234 0,30511 0,30785 0,31057 0,31327
0,9 0,31594 0,31859 0,32121 0,32381 0,32639 0,32894 0,33147 0,33398 0,33646 0,33891

1,0 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,36214

1,1 0,36433 0,36650 0,36864 0,37076 0,37286 0,37493 0,37698 0,37900 0,38100 0,38298
1,2 0,38493 0,38686 0,38877 0,39065 0,39251 0,39435 0,39617 0,39796 0,39973 0,40147
1,3 0,40320 0,40490 0,40658 0,40824 0,40988 0,41149 0,41308 0,41466 0,41621 0,41774

1,4 0,41924 0,42073 0,42220 0,42364 0,42507 0,42647 0,42785 0,42922 0,43056 0,43189
1,5 0,43319 0,43448 0,43574 0,43699 0,43822 0,43943 0,44062 0,44179 0,44295 0,44408
1,6 0,44520 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,45254 0,45352 0,45449
1,7 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,46327

1,8 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,47062
1,9 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670
2,0 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169
2,1 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,48574

2,2 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,48899
2,3 0,48928 0,48956 0,48983 0,49010 0,49036 0,49061 0,49086 0,49111 0,49134 0,49158
2,4 0,49180 0,49202 0,49224 0,49245 0,49266 0,49286 0,49305 0,49324 0,49343 0,49361

2,5 0,49379 0,49396 0,49413 0,49430 0,49446 0,49461 0,49477 0,49492 0,49506 0,49520

2,6 0,49534 0,49547 0,49560 0,49573 0,49585 0,49598 0,49609 0,49621 0,49632 0,49643
2,7 0,49653 0,49664 0,49674 0,49683 0,49693 0,49702 0,49711 0,49720 0,49728 0,49736
2,8 0,49744 0,49752 0,49760 0,49767 0,49774 0,49781 0,49788 0,49795 0,49801 0,49807

2,9 0,49813 0,49819 0,49825 0,49831 0,49836 0,49841 0,49846 0,49851 0,49856 0,49861

3,0 0,49865 0,49869 0,49874 0,49878 0,49882 0,49886 0,49889 0,49893 0,49896 0,49900
3,1 0,49903 0,49906 0,49910 0,49913 0,49916 0,49918 0,49921 0,49924 0,49926 0,49929
3,2 0,49931 0,49934 0,49936 0,49938 0,49940 0,49942 0,49944 0,49946 0,49948 0,49950

3,3 0,49952 0,49953 0,49955 0,49957 0,49958 0,49960 0,49961 0,49962 0,49964 0,49965
3,4 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,49976
3,5 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49981 0,49982 0,49983 0,49983
3,6 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,49989

3,7 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,49992
3,8 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,49995
3,9 >0,49995 etc ...
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

120
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Tabela da Distribuição Normal Padrão


P(Z<z)
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
P(Z<z)

121
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

122
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Anexo III
Tabela de Wilcoxon Valores críticos:

TABLE: WILCOXON SIGNED RANK TEST (CI % = 95% )

Critical values:

Wilcoxon Signed-Ranks Test Critical values


Number (n) 2 sided 1 sided
6 0 2
7 2 3
8 3 5
9 5 8
10 8 10
11 10 13
12 13 17
13 17 21
14 21 25
15 25 30
16 29 35
17 34 41
18 40 47
19 46 53
20 52 60
21 58 67
22 65 75
23 73 83
24 81 91
25 89 100
Critical values: Wilcoxon Signed-Ranks test p=0.05 (CI% = 95%). Significant, if the calculated values
presented in this table [the sum of the positive ranks or the negative ranks] is too small.

123
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Anexo IV
Tabela H

If the sample sizes are 5 or more then H is a 2 distribution with degrees of freedom (k  1).
For a chi-squared distribution, the following table is needed:
Chi-Squared Table
Step 5 Compare H (found in step 3) with the number found in step 4

124
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Anexo V
Tabelas A a D (Tabelas de Friedman)

Testa a hipótese de que vários grupos relacionados têm, todos, a mesma distribuição – é
uma alternativa par a análise de variância com duas classificações.

Aplicar este teste se possuir poucos dados amostrais e/ou as pressuposições, exigidas pela
análise de variância, estiverem seriamente comprometidas.

Exigência: as observações precisam ser medidas pelo menos em escala ordinal.

 12 k 
Fr    R 2j   3N (k  1)
 Nk (k  1) j 1 

Valores Críticos para a análise de variância por número de ordem de Friedman*

k N   0.10   0.05  0.01


3 3 6.00 6.00
4 6.00 6.50 8.00
5 5.20 6.40 8.40
6 5.33 7.00 9.00
7 5.43 7.14 8.86
8 5.25 6.25 9.00
9 5.56 6.22 8.67
10 5.00 6.20 9.60
11 4.91 6.54 8.91
12 5.17 6.17 8.67
13 4.77 6.00 9.39

∞ 4.61 5.99 9.21


4 2 6.00 6.00
3 6.60 7.40 8.60
4 6.30 4.80 9.60
5 6.36 7.80 9.96
6 6.40 7.60 10.00
7 6.26 7.80 10.37
8 6.30 7.50 10.35

∞ 6.25 7.82 11.34


5 3 7.47 8.53 10.13
4 7.60 8.80 11.00
5 7.68 8.96 11.52

∞ 7.78 9.49 13.28


* Adaptado de Siegel, S. e Castellan Jr., N. J. Nonparametric statistics for the Behaviora l
Sciences, McGraw-Hill, 1988

125
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Anexo VI
Tabela S (Tabela de Kendal)

126
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

rho de spearman

Formula Spearman rho:


6∙𝑑𝑖2 6∙𝑆𝑅𝐷𝑆
𝜌[𝑠𝑝𝑒𝑎𝑟𝑚𝑎𝑛 ] = 1 − ou 𝜌 [𝑠𝑝𝑒𝑎𝑟𝑚𝑎𝑛 ] = 1 −
𝑁(𝑁2 −1) 𝑁(𝑁2−1)

SRDS é somtorio do quadrado das diferenças;


N é o numero de linhas ou casos
Para saber se os resultados são significativos compare os valores obtidos por si, com o valor
critico tabelado. Se o calculado exceder o critico, então a correlação é significativa

N critical value

5 0.9

6 0.829

7 0.714

8 0.643

9 0.6

10 0.564

12 0.506

16 0.425

20 0.377

127
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018

Anexo VII
Tabela T

128
(Bio) Estatística: Teoria e exercicios passo-a-passo 2018
Anexo VIII
Tabela F de Senedecor para p=0,05

129

View publication stats

Você também pode gostar