Você está na página 1de 35

UNIVERSIDADE JOSÉ DO ROSÁRIO VELLANO

UNIFENAS – CAMPUS DE ALFENAS

MATERIAL DIDÁTICO

ESTATÍSTICA MÉDICA

(PARTE I)

PROFESSORA: ROBERTA BESSA VELOSO SILVA


DOUTORADO EM ESTATÍSTICA E EXPERIMENTAÇÃO AGROPECUÁRIA/UFLA
PÓS-DOUTORADO EM ESTATÍSTICA APLICADA E BIOMETRIA/UNIFAL
E-MAIL DE ACESSO: bessaveloso@yahoo.com.br
CURRÍCULO LATTES: http://lattes.cnpq.br/3751378355325825

ALFENAS, MG
2018

1
ESTATÍSTICA DESCRITIVA

CAPÍTULO 1

1. DEFINIÇÕES BÁSICAS:

1.1. ESTATÍSTICA: É a ciência que se preocupa com a coleta, organização, análise e


interpretação dos dados experimentais.

EXEMPLO: Foram observados os pesos, em quilos, de todas as 500 crianças numa certa faixa
etária, atendidas nos ambulatórios da cidade de Alfenas, MG, em um determinado dia.
Coleta: 14, 10, 12, 8, etc. (em quilos)
Organização: Tabelas e Gráficos
Análise: Qual é o peso médio? Média = 6 quilos, por exemplo.
Interpretação: Por que tão baixo (ou alto) esse peso médio?

OBSERVAÇÃO: A ciência estatística é aplicável em qualquer ramo do conhecimento onde se


manipulam dados experimentais. Por exemplo: Epidemiologia, Física, Química, Biologia,
Ciências Sociais, Ciências Administrativas, Ciências Agrárias, etc.

1.2. POPULAÇÃO: É o conjunto de elementos com pelo menos uma característica comum.
Essa (s) característica (s) comum deve delimitar inequivocamente quais elementos que
pertencem à população e quais os que não pertencem. A população pode ser finita ou
infinita (população grande: não pode ser enumerada completamente).

1.3. AMOSTRA: É um subconjunto de uma população. É necessariamente finita, pois todos


os seus elementos serão examinados para efeito da realização do estudo estatístico
desejado.

1.4. VARIÁVEL: Característica pela qual deseja-se que a população seja descrita. Essa
característica pode assumir diferentes valores de elemento para elemento.

1.5. DADO: É o valor que assume a variável para um elemento em particular.

NOTAÇÃO:
Tamanho da população = número de elementos da população: N
Tamanho da amostra = número de elementos da amostra: n
Variável: X, Y, Z, etc. (São letras maiúsculas, geralmente as últimas do
alfabeto)

1.6. TIPOS DE VARIÁVEIS

As variáveis podem ser qualitativas ou quantitativas, sendo que as qualitativas se


dividem em nominais e ordinais, e as quantitativas em discretas e contínuas.

1.7. VARIÁVEL QUALITATIVA: São aquelas que correspondem a atributos ou categorias.


Podem ser:

1.7.1. VARIÁVEL QUALITATIVA NOMINAL: Quando os atributos não são passíveis


de ordenação. Exemplo: sexo, cor dos olhos, tipo sanguíneo, hábito de fumar, etc.
1.7.2. VARIÁVEL QUALITATIVA ORDINAL: Quando os atributos são passíveis de
ordenação. Exemplo: nível de conhecimento em inglês (básico, médio, avançado),
classe social (baixa, média, alta), estadiamento de uma doença (I, II, III, IV), etc.

2
1.8. VARIÁVEL QUANTITATIVA: São aquelas que correspondem a números resultantes
de contagens ou medidas. Podem ser:

1.8.1. VARIÁVEL QUANTITATIVA DISCRETA: São próprias de dados de contagem,


isto é, estão definidas em conjunto enumerável. Exemplos: número de filhos por
família (0, 1, 2, 3,...), número de bactérias por volume de urina, número de pessoas
com determinada doença, número de cáries nos pacientes, etc.
1.8.2. VARIÁVEL QUANTITATIVA CONTÍNUA: São aquelas em que as realizações
resultam de uma medida (uma mensuração) que pode assumir qualquer valor real
entre dois extremos. Exemplos: altura dos pacientes, peso, idade, nível de glicose,
etc.

1.9. ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS QUALITATIVOS

É feita mediante alguma representação que pode ser tabular ou gráfica. Para dados
qualitativos a enumeração é a forma mais simples de representá-los.

EXEMPLO 1: Em um determinado hospital de Alfenas, de todos os pacientes internados em um


mês qualquer, observou-se que as doenças mais prevalentes em 100 pacientes foram o diabetes
mellitus e a hipertensão. Os dados estão apresentados a seguir.

Dados brutos (da forma em que foram coletados)


Pacientes:
1 2 3 4 5 ... 100
diabetes diabetes hipertensão diabetes hipertensão ... diabetes

a) REPRESENTAÇÃO TABULAR – TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS


(T.D.F.)

Tabela 1. Doenças mais prevalentes observadas em 100 pacientes.


Doenças Número de Frequência
pacientes (Fi) percentual (Fpi)
Diabetes 60 60%
Hipertensão 40 40%
Total 100 100%

b) REPRESENTAÇÃO GRÁFICA

b1) GRÁFICO DE COLUNAS OU DE BARRAS

70
60%
60
50
40%
40
30
20
10
0
Diabetes Hipertensão
Gráfico 1. Doenças mais prevalentes observadas em 100 pacientes.

3
b2) GRÁFICO DE SETORES (PIZZA)

40%
60%

Diabetes Hipertensão

Gráfico 2. Doenças mais prevalentes observadas em 100 pacientes.

4
LISTA DE EXERCÍCIOS 1 – ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
QUALITATIVOS

1) Um agente comunitário do Programa da Saúde da Família deseja escrever um pequeno texto


alertando os jovens de sua comunidade sobre os problemas da gravidez indesejada. Com este
propósito ele decide investigar quais métodos que os jovens estão utilizando. Após realizar a
pesquisa com 50 jovens escolhidos de maneira aleatória obteve-se os seguintes dados:

Tabela Preserv Tabela Preserv Tabela Preserv Pilula Tabela Tabela Tabela
Preserv Tabela Outros Pilula Tabela Pilula Outros Tabela Preserv Tabela
Pilula Tabela Tabela Preserv Preserv Outros Tabela Preserv Tabela Tabela
Outros Preserv Preserv Preserv Pilula Preserv Preserv Outros Tabela Preserv
Tabela Pilula Preserv Pilula Tabela Pilula Tabela Tabela Tabela Preserv

a) Qual é a população em estudo? E a amostra?


b) Qual é a variável investigada na população? Classifique-a.
c) Faça a representação tabular para esses dados.
d) Represente os dados através dos gráficos de colunas e de setores.

2) Em 1969 foi realizado um estudo na população de Honolulu. Para 7.683 indivíduos, foram
pesquisadas as seguintes variáveis:

• nível educacional (nenhum, ensino fundamental, ensino médio, ensino superior);


• peso (kg);
• altura;
• idade;
• Tipo sanguíneo (B, A, O, AB)
• Tipos de doenças
• Percentual de gordura corporal

Cada indivíduo foi classificado como:

• hábito de fumar (fumante ou não);


• atividade física (pouca, moderada e muita).
Classifique TODAS as variáveis listadas na população de Honolulu.

3) Em uma amostra de 15 casos de fraturas de face registrados no Pronto Socorro do Hospital das
Clínicas da USP, Almeida et al. (1995) encontraram grande maioria de vítimas do sexo masculino
na faixa etária entre 20 e 40 anos. Os dados referentes aos seguintes agentes etiológicos: carro
(C), espancamento (E), atropelamento (A) e moto (M) estão apresentados a seguir.

Carro Atropelamento Carro


Carro Espancamento Carro
Carro Moto Moto
Carro Moto Moto
Atropelamento Atropelamento Carro

a) Qual é a variável em estudo? Classifique-a.


b) Organize os dados através de uma tabela computando-se as frequências absoluta e
percentual.
c) Faça a representação gráfica através do gráfico de colunas.

5
2. ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS QUANTITATIVOS

Como nos dados qualitativos, também é feita mediante uma representação. A forma
mais simples é a distribuição de frequências, definida a seguir:

2.1. DISTRIBUIÇÃO DE FREQUENCIAS DE CLASSES (T.D.F.C.): É a distribuição


dos dados em classes ou categorias. O número de elementos associados a cada classe
representa a frequência de classe.

2.1.1. CONSTRUÇÃO DE UMA TABELA DE DISTRIBUIÇÃO DE


FREQUENCIAS DE CLASSES (T.D.F.C)

EXEMPLO 2: A seguir são apresentados os dados referentes aos pesos (em quilos) de 20
crianças, de certa faixa etária atendidas nos ambulatórios da cidade de Alfenas, MG, num
determinado dia.

DADOS BRUTOS OU NÃO AGRUPADOS

14,2 16,2 20,6 21,4 23,4


14,4 18,4 20,6 21,8 25,2
15,8 18,4 20,6 22,0 26,6
16,2 19,2 20,8 22,2 27,0

10) DETERMINAR O NÚMERO DE CLASSES (k): podem-se adotar os seguintes critérios:


a) A familiaridade do pesquisador com os dados.
b) Critério empírico: baseado no número de observações (n):

Número de observações (n) Número de classes (k)


Até 100 n (inteiro superior mais próximo)

EXEMPLO 2: k  n  20  4, 47  5 classes, aproximadamente.

20) DETERMINAR A AMPLITUDE DE CLASSE (c): Diferença entre os limites superior e


inferior de uma determinada classe.

A maior observação - menor observação


c  ,
k 1 k 1

sendo,

A = amplitude total = maior observação – menor observação


k = número de classes

27, 0  14, 2
No exemplo 2: c   3, 2 kg
5 1

6
30) DETERMINAR O LIMITE INFERIOR DA PRIMEIRA CLASSE ( LI1 )

c
LI1  menor observação -
2
3, 2
No exemplo 2: LI1  14,2 -  12, 6 kg .
2

40) DETERMINAR OS LIMITES DAS OUTRAS CLASSES

LI1 conhecido  LS1  LI1  c (O limite superior da 1a classe passa a ser o limite inferior
da 2a classe)
LI 2  LS1 (O limite superior da 2a classe passa a ser o limite inferior da 3a classe + c)
LS2 =LI2  c (O limite superior da 3a classe passa a ser o limite inferior da 4a classe + c)
Continuar com os passos anteriores até completar k classes.

50) DETERMINAR O PONTO MÉDIO DE CLASSE X i   E AS FREQUÊNCIAS:


ABSOLUTA  F  , RELATIVA  F  E PERCENTUAL  F  :
i ri pi

LSi  LI i
Xi  (Limite superior da classe “i” + limite inferior da classe “i” dividido por 2).
2
Fi = número de observações contidas na classe “i”.
F
Fri  i (Frequência absoluta da classe “i” dividida pelo tamanho da amostra n).
n
Fpi  Fri 100 (Frequência relativa da classe “i” multiplicado por 100).

Logo,
A T.D.F. C. PARA O EXEMPLO 2 SERÁ:

DADOS AGRUPADOS

Tabela 2. Pesos (em quilos) de 20 crianças, de certa faixa etária, atendidas nos ambulatórios da
cidade de Alfenas, MG, num determinado dia.
Classes (Pesos) xi Número de Fri Fpi
estudantes  Fi 
[12,6; 15,8) 14,2 2 0,10 10%
[15,8; 19,0) 17,4 5 0,25 25%
[19,0; 22,2) 20,6 8 0,40 40%
[22,2; 25,4) 23,8 3 0,15 15%
[25,4; 28,6) 27,0 2 0,1 10%
Total 20 1,00 100,0%

7
2.2. REPRESENTAÇÃO GRÁFICA PARA DADOS QUANTITATIVOS

2.2.1. HISTOGRAMA: Gráfico formado por retângulos cujas bases são proporcionais às
amplitudes de classe e as alturas proporcionais às Frequências das classes (as
Frequências podem ser Fi , Fri e Fpi ).

2.2.2. POLÍGONO DE FREQUÊNCIAS: Gráfico onde os pontos médios das classes, no


topo dos retângulos do histograma, são unidos por linhas. O polígono começa e
termina nos pontos médios das classes anteriores à primeira e posterior à última,
respectivamente.

Peso (kg)
Figura 3. Pesos (em quilos) de 20 crianças, de certa faixa etária, atendidas nos
ambulatórios da cidade de Alfenas, MG, num determinado dia.

8
2.3. CLASSIFICAÇÃO DAS DISTRIBUIÇÕES DE FREQUENCIAS

A forma do polígono de frequência permite classificar a distribuição de frequências em:


simétrica, assimétrica à direita ou assimétrica à esquerda, para isto o polígono deve ser comparado
com as seguintes curvas, chamadas CURVAS DE FREQUENCIA.

Distribuição simétrica Distribuição Assimétrica à direita

Para o Exemplo 2: A distribuição é


aproximadamente simétrica.

Distribuição Assimétrica à esquerda

9
LISTA 2 – ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS QUANTITATIVOS

1) Dez indivíduos foram selecionados ao acaso para receberem a dieta A ou B. Decorrido certo
intervalo de tempo verificou-se que a perda de peso apresentada a seguir:

-1,0 0,0 2,1 3,1 3,3 4,3 5,0 5,2 5,5 6,8

a) Qual é a variável em estudo? Classifique-a.


b) Organize os dados numa Tabela de Distribuição de Frequências de Classes (k = 3 classes).
c) Faça a representação gráfica através do Histograma e do Polígono de Frequências.

2) Um exame geral tem 80 questões, sendo 40 de Bioquímica e 40 de Bioestatística. Para os 20


melhores classificados, apresentaram-se o número de acertos em cada disciplina, em ordem
decrescente do total de pontos.

Aluno 1 2 3 4 5 6 7 8 9 10
Bioquímica 35 35 34 32 31 30 26 26 24 23
Bioestatística 31 29 27 28 28 26 30 28 25 23

Aluno 11 12 13 14 15 16 17 18 19 20
Bioquímica 23 12 11 20 17 12 14 20 8 10
Bioestatística 21 32 31 20 21 25 20 13 23 20

a) Organize os dados em uma Tabela de Distribuição de Frequências de Classes para as


variáveis: notas de bioquímica e notas de bioestatística, separadamente.
b) Faça a representação gráfica para as notas de bioquímica e notas de bioestatística,
separadamente.
c) Construa uma Tabela de Distribuição de Frequências de Classes para a variável total de
pontos. Faça a representação gráfica.
d) Comente sobre a afirmação: os aprovados são melhores em bioquímica do que em
bioestatística.

3) Para estudar o nível de colesterol de uma população de obesos de uma cidade do interior de
Minas Gerais, 10 indivíduos foram selecionados aleatoriamente, cujo nível de colesterol foi
avaliado. Os resultados obtidos, mg/dl, foram os seguintes:

650 850 710 920 780 820 900 780 740 950

a) Organize os dados em uma Tabela de Distribuição de Frequências de Classes para o nível


de colesterol, em mg/dl.
b) Faça o histograma e o polígono de frequências. Classifique a distribuição de frequências.

10
CAPÍTULO 2

2.4. MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL

São aquelas que procuram sintetizar as informações (os dados ou observações) em um


único e informativo valor. Tais medidas têm a tendência de posicionar-se no centro da
distribuição. Estudaremos a média, a mediana e a moda.

OBSERVAÇÃO: Na distribuição de frequências (T.D.F.C, histograma e polígono) podemos


notar que os dados geralmente são mais frequentes perto de um valor central e mais raros
quando se afastam dele. Daí o nome de MEDIDAS DE TENDÊNCIA CENTRAL.

2.4.1. MÉDIA

É A SOMA DE TODAS AS OBSERVAÇÕES DIVIDIDAS PELO NÚMERO DELAS


(AMOSTRA OU POPULAÇÃO).

NOTAÇÃO:

Para dados não agrupados Para dados agrupados


No caso de n k

uma x i x F i i
amostra X i 1
X i 1

n n
soma de todos os dados X i é o ponto médio da classe "i";
X
tamanho da amostra Fi é a frequência absoluta da classe "i";
k é o número de classes.
No caso de N k

uma  xi xF i i
população  i 1
(Lê-se: mi)  i 1

N N

EXEMPLO 2: (Para o nosso exemplo: no caso do peso de 20 crianças, trata-se de uma amostra)

MÉDIA ARITMÉTICA PARA DADOS NÃO AGRUPADOS:


n 20

 xi x i
x1  x2  ...  x20 14, 2  14, 4  ...  27, 0
X i 1
 i 1
   20, 25 kg
n 20 20 20

MÉDIA PARA DADOS AGRUPADOS (EM UMA T.D.F.C.)

x F i i
somatório do produto ponto médio da classe "i" e frequência absoluta da classe "i"
X i 1

n tamanho da amostra
k 5

x F x F i i i i
14, 2  2  17, 4  5  20, 6  8  ...  27, 0  2
X i 1
 i 1
  20, 28 kg
n 20 20

11
OBSERVAÇÃO: A média para os dados não agrupados foi obtida usando os verdadeiros
dados. A média para dados agrupados foi obtida usando os valores representados pelo ponto
médio da classe. Isto faz com que a média para dados agrupados seja às vezes, diferente da
média para dados não agrupados. No cálculo com dados agrupados existe um erro devido à
perda de informação, porém, tal erro é mínimo e, portanto, desprezível.

2.4.2. MEDIANA

É o valor central da distribuição dos dados. A mediana divide as observações, ordenadas


ascendente ou descendentemente, partes iguais, isto é, 50% das observações estão acima e 50%
estão abaixo dela.

PARA DADOS BRUTOS DADOS AGRUPADOS


(OS DADOS PRECISAM SER (T.D.F.C.)
ORDENADOS)
n 
 2  FA 
x n  x n  2  md  LI md    Cmd
 F 
    md

md  2  2   
; se n for par
2 LI m
Amostra soma dos 2 valores centrais d : Limite inferior da
md  classe mediana;
2
Fm
d : Frequência absoluta da
md  x n 1  ; se n for ímpar classe mediana;
  FA : Frequência acumulada das
 2 
m  valor que divide o conjunto de dados ao meio classes anteriores à classe
d mediana;
Cm
d : Amplitude da classe
mediana.
x N  x N  2  N 
   
M d  x N 1   2  FA 
População Md  2  2 
 
M d  LI M d    CM d
2  2 
 FM d 
se n for par se n for ímpar  

OBSERVAÇÃO: A classe mediana é a classe que contém a observação


x n  na T.D.F.; se n
 
2

for par ou
x n1  ; se n for ímpar.
 
 2 

PARA O EXEMPLO 2:

n é par (n=20 crianças)

12
MEDIANA PARA OS DADOS NÃO AGRUPADOS:

x 20 2  x 20 2 2 x10  x11


md    20, 6 kg
2 2
x x
10  11 valor de x na posição 10 + valor de x na posição 11
md  
2 2
20,6 20,6

2
 20, 6 kg

MEDIANA PARA DADOS AGRUPADOS:

x n   x 20   x 10  3a classe
Classe mediana:      
2 2 
A classe mediana é a classe que contém o décimo elemento da amostra (X(10)). Logo,
 20 
 2  7
md  19, 0     3, 2  20, 2 kg
8
 
 

2.4.3. MODA

É o valor que ocorre com maior frequência. Um conjunto de dados pode ter mais de
uma moda ou também, pode não ter moda.

DADOS BRUTOS DADOS AGRUPADOS


(EM UMA T.D.F.C.)
 1 
mo  LI m     Cmo
o
USAR A DEFINIÇÃO  1   2 
LI m : Limite inferior da classe modal;
o
1 : Diferença entre a Frequência absoluta
Amostra da classe modal e a classe anterior;
2 : Diferença entre a Frequência
absoluta da classe modal e a classe
posterior;
Cm : Amplitude da classe modal.
d
Classe modal é a classe com maior
frequência absoluta.
População USAR A DEFINIÇÃO  1 
M o  LI M     CM o
o   
 1 2

13
PARA O EXEMPLO 2:

MODA PARA DADOS BRUTOS

mo  20, 6 kg (por definição)

MODA PARA DADOS AGRUPADOS


mo  19, 0  
8  5   3, 2  20, 2 kg

  8  5    8  3 

2.5. PROPRIEDADES COMUNS DA MÉDIA, MEDIANA E MODA

Sejam X , md e mo , a média, mediana e moda, de n observações, respectivamente, e


seja k uma constante qualquer:

1) Se em cada observação é acrescido (ou subtraído) um valor k, as novas média, X ' ,


mediana, md ' e moda, mo ' , serão, respectivamente:

X'  X k ;

m 'm k;
d d

mo '  mo  k ;

2) Se em cada observação é multiplicada por k, as novas média, X ' , mediana, md ' e moda,
mo ' , serão, respectivamente:

X'  X k ;

m '  m k ;
d d

mo '  mo  k ;

14
2.5. QUARTIL E PERCENTIL

Os quartis são utilizados na construção do Box Plot, um gráfico que permite a


identificação de valores extremos (outliers) em um conjunto de dados, na elaboração da curva
endêmica (epidemia de dengue), em exames laboratoriais, entre outros.

O quartil divide o conjunto de dados em 4 partes iguais, isto é:

___ 25% ___ | ___ 25% ___ | _____ 25% ___ | ___ 25% ___
10 quartil 20 quartil 30 quartil
ou mediana

10 Quartil ou quartil 25: é o valor que deixa 25% dos dados abaixo dele e 75% estão acima dele.

20 Quartil ou quartil 50: é o valor que deixa 50% dos dados abaixo dele e 50% estão acima dele.

30 Quartil ou quartil 75: é o valor que deixa 75% dos dados abaixo dele e 25% estão acima dele.

O percentil divide o conjunto em 100 partes iguais.

2.5.1. COMO CALCULAR UM QUARTIL OU UM PERCENTIL?

OBSERVAÇÃO: OS DADOS DEVEM ESTAR ORDENADOS ASCENDENTEMENTE


OU DESCENDENTEMENTE

n 1
Posição de Q1 
4
n 1
Posição de Q2 
2
3  n  1
Posição de Q3 
4

PARA O EXEMPLO 2: (peso de uma amostra de n = 20 crianças).

DADOS BRUTOS

14,2 16,2 20,6 21,4 23,4


14,4 18,4 20,6 21,8 25,2
15,8 18,4 20,6 22,0 26,6
16,2 19,2 20,8 22,2 27,0

20  1
Posição de Q1   5, 25  5
4
20  1
Posição de Q2   10
2
3  20  1
Posição de Q3   15, 75  16
4

15
LISTA DE EXERCÍCIOS 3 – MEDIDAS DE POSIÇÃO PARA DADOS BRUTOS E
AGRUPADOS/QUARTIL

1) Um teste de esforço foi realizado em 200 pacientes no estágio III de um mesmo tipo de câncer.
O tempo, em segundos, está apresentado na tabela abaixo.

Classes Ponto médio de classe Frequência


[7 ; 8) 7,5 27
[8 ; 9) 8,5 29
[9 ; 10) 9,5 46
[10 ; 11) 10,5 43
[11 ; 12) 11,5 55

Determine o tempo médio, mediano e modal para a realização do teste de esforço.

2) Uma certa região apresentou altos índices de suicídios, conforme pode ser constatado em uma
amostra dos últimos 12 meses: 5, 4, 7, 8, 5, 6, 4, 7, 9, 7, 6 e 8. Encontre o 30 quartil e interprete.

3) Como parte de uma avaliação médica em uma certa universidade, foi medida a frequência
cardíaca dos alunos do primeiro ano. Os dados são apresentados em seguida.

Frequência Cardíaca Frequência absoluta


[60 ; 65) 11
[65 ; 70) 35
[70 ; 75) 68
[75 ; 80) 20
[80 ; 85) 12
[85; 90) 10
[90 ; 95) 1
[95 ; 100) 3

a) Qual é a variável em estudo? Classifique-a.


b) Construa o Histograma e o Polígono de frequências. Classifique a distribuição quanto à
simetria.
c) Uma frequência ao redor de 72 batidas por minuto é considerada padrão. Você acha que de
modo geral esses alunos se encaixam nesse caso?
d) Frequências cardíacas que estejam acima de 90 requerem acompanhamento médico. Qual é a
porcentagem de alunos nessas condições?

4) Considere os conjuntos de dados a seguir referentes ao número de dias para a completa


recuperação de pacientes submetidos a três diferentes tipos de técnicas cirúrgicas.

TIPO I 48 46 47 50 52 130
TIPO II 72 75 74 73 76 72 77
TIPO III 48 45 46 45 45 47 47 45 45 46

Calcule a medida de posição mais apropriada para cada conjunto de dados.

16
2.6. MEDIDAS DE VARIABILIDADE OU DISPERSÃO

Para que as observações de uma amostra ou de uma população sejam bem representadas,
deve-se calcular para elas uma medida de posição de uma medida de variabilidade.
As medidas de variabilidade são medidas que informam sobre a dispersão dos dados e
são necessárias para, junto com a média, representar bem um conjunto de observações.
Estudaremos a variância, o desvio padrão e o coeficiente de variação.

NOTAÇÃO:
AMOSTRA (n) POPULAÇÃO
Variância (S2) 2
Medidas de Desvio Padrão (S) 
Variabilidade Coeficiente de variação (cv) CV

2.7. VARIÂNCIA E DESVIO PADRÃO: Medem a variabilidade absoluta de um conjunto


de observações. A variância e o desvio padrão permitem comparar a variabilidade entre
conjuntos numéricos que possuam a mesma média e a mesma unidade.

PARA DADOS BRUTOS

NO CASO DE UMA AMOSTRA

n   n  
2 (Variância
 ( xi  x )
2
  xi 
1  n 2  ì 1  
amostral)
S 
2 i 1

n 1
  xi  n 
n  1  ì 1
 
 
 2 
S   soma de cada valor  
2  2  total 

 tamanho da amostra 
 

S  S2 (Desvio Padrão
amostral)

S  variância

NO CASO DE UMA POPULAÇÃO

N 2

x  i (Variância


2  i 1 Populacional)
N

  2
(Desvio Padrão
Populacional)

17
PARA O EXEMPLO 2:

VARIÂNCIA PARA DADOS BRUTOS

1  (14, 2  14, 4  ...  27, 0) 2 


S2   (14, 2) 2
 (14, 4) 2
 ...  (27, 0) 2
   13,84 kg 2
20  1  20 

S  S 2  3, 72 kg

VARIÂNCIA PARA DADOS AGRUPADOS

NO CASO DE UMA AMOSTRA

  k  
2

  i i  
x F (Variância
1  k 2  ì 1  
S2 
 
n  1 ì 1
xi Fi 
n 
amostral)
 
 
(Desvio Padrão
S  S2
amostral)

NO CASO DE UMA POPULAÇÃO:


  k  
2


1  k 2   xi Fi    (Variância
    xi Fi   i 1
2   Populacional)
N  i 1 N 
 
 

  2 (Desvio Padrão
populacional)

Para o nosso exemplo: (É uma amostra de pesos de 20 crianças)

1  (2 14, 2  5 17, 4  ...  2  27, 0) 2 


S2   2  (14, 2) 2  5  (17, 4) 2  ...  2  (27, 0) 2    12,83 kg 2
20  1  20 
S  12,83=3,58 kg

OBSERVAÇÃO: A unidade da variância refere-se ao quadrado da unidade dos


dados originais. O desvio padrão é expresso na mesma unidade dos dados
originais.

Para o nosso exemplo: Dados originais quilos


Variância quilos2
Desvio Padrão quilos

b) COEFICIENTE DE VARIAÇÃO: É uma medida de variabilidade relativa. Refere-se à


variabilidade dos dados em relação à média. Permite comparar a variabilidade de dois ou mais
conjuntos de dados que possuam diferentes unidades e/ou diferentes médias.

18
NO CASO DE UMA AMOSTRA

S
cv   100
X

NO CASO DE UMA POPULAÇÃO


CV   100

PARA O EXEMPLO 2:

COEFICIENTE DE VARIAÇÃO PARA DADOS BRUTOS

3, 72 PARA DADOS
cv  100  18,37% BRUTOS
20, 25

COEFICIENTE DE VARIAÇÃO PARA DADOS AGRUPADOS

3,58 PARA DADOS


cv  100  17, 65% AGRUPADOS
20, 28

2.8. PROPRIEDADES DA VARIÂNCIA E DO DESVIO PADRÃO

1) Somando ou subtraindo uma constante “k” em cada observação, a variância e o desvio


padrão não se alteram.

2) Multiplicando todos os dados por “ k ”, a variância ficará multiplicada por k 2 e o desvio


padrão por k .

No SISVAR (SOFTWARE DE ANÁLISE ESTATÍSTICA)

• Ir em Análise, Estatísticas Descritivas, digitar os dados, acrescentar valor por valor e


finalizar. Se os dados estiverem digitados em arquivo pronto, clicar em arquivo pronto
e marcar as opções desejadas e, por último, analisar.

19
CAPÍTULO 3 – NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Antes de se iniciar as principais considerações sobre Amostragem será necessário a


compreensão de alguns conceitos importantes em Estatística.

3. CONCEITOS IMPORTANTES

3.1. PARÂMETRO: É uma constante (um número) que caracteriza uma população.
 
Exemplo: média populacional    , variância populacional  2 , etc. Em geral, os
parâmetros são desconhecidos.

3.2. ESTIMADOR: É uma expressão algébrica utilizada para obter um valor aproximado
de um parâmetro.

3.3. ESTIMATIVA: É o valor numérico de um estimador. É determinada usando os


dados amostrais.

EXEMPLO 3: Deseja-se conhecer o nível médio de colesterol, em mg/dl, da população de


Alfenas, MG, mas o pesquisador somente tem recursos para realizar 300 análises (n=300).

População: Todas os habitantes da cidade de Alfenas  N  .

Parâmetro: Nível de colesterol médio    .

Amostra: 300 pessoas  n  .

x i
Estimador: X  i 1
.
n

Estimativa: por exemplo, X  210 mg/dl (valor aproximado para  ).

20
CAPÍTULO 4. AMOSTRAGEM

4.1. AMOSTRAGEM PROBABILÍSTICA: Se todos os elementos da população


tiverem probabilidade conhecida e não nula de pertencer à amostra o processo de
amostragem é denominado probabilístico. Os mais importantes são:

(i) Amostragem Simples ao Acaso (A.S.A)


(ii) Amostragem Sistemática
(iii) Amostragem Estratificada

Um desses processos de amostragem probabilístico é aplicável quando é possível enumerar


todos os elementos da população.

4.2. AMOSTRAGEM NÃO-PROBABILÍSTICA: Quando a escolha dos elementos da


população é não aleatória, isto é, nem todos os elementos podem pertencer à amostra.
Neste caso, não é possível enumerar todos os elementos da população. A escolha é
justificada ou racional. Entre as diversas causas temos:

(i) INACESSIBILIDADE A TODA POPULAÇÃO: A amostragem é realizada na


parte da população que é acessível. Exemplo: Produção em série de algum produto
lácteo (Iogurte - frasco).

(ii) AMOSTRAGEM SEM NORMA (A ESMO): Embora o pesquisador procure ser


aleatório, não se usa nenhum procedimento probabilístico. Exemplo: Escolher os 5
primeiros alunos de uma turma de 80.

(iii) POPULAÇÃO FORMADA POR MATERIAL CONTÍNUO: Aquela população


cujos elementos não podem ser enumerados e identificados. Exemplo: Qualidade do
.ar, qualidade da água. É impossível identificar cada elemento da população, neste
caso cada litro de água, para obter uma amostra aleatória.

(iv) PESQUISA INTENCIONAL: O pesquisador escolhe deliberadamente certos


elementos para formar a amostra baseado num pré-julgamento. Exemplo: Ao
experimentar os efeitos de uma nova droga para o tratamento da AIDS o pesquisador
escolhe n=20 pacientes terminais entre todos os pacientes com a doença.

IMPORTANTE: Como a finalidade de uma amostra é a de descrever,


indiretamente, a população, é necessário que as amostras sejam representativas da
população, isto é, que guardem características mais próximas possíveis da
população. As amostras devem reproduzir as mesmas propriedades da população.

4.3. PROCESSOS DE AMOSTRAGEM PROBABILÍSTICOS

4.3.1. AMOSTRAGEM ALEATÓRIA SIMPLES (A.S.A.)

OBJETIVO: Obter uma amostra representativa quando os elementos da população são todos
homogêneos. Neste processo de amostragem todos os elementos da população têm a mesma
probabilidade de seres coletados.

21
PROCEDIMENTO: Aqui enumera-se todos os elementos da população e sorteia-se n
elementos através de um dispositivo aleatório, por exemplo as “tabelas de números aleatórios”.

EXEMPLO: Deseja-se conhecer o nível de colesterol, em mg/dl na população de Alfenas, MG,


mas o pesquisador tem recursos para realizar somente 300 análises (n=300).

INFORMAÇÃO: tamanho da população de Alfenas (N=79.000 habitantes).

Execução da A.S.A.: Com o auxílio da tecla RAN# da calculadora científica, vamos gerar 300
números aleatórios. Lembrando que a população está enumerada. A sequência poderia ser:

RAN# X 79000 = 1.075; 102; 10; 70.020; 65.000; ...(até completar 300 pessoas)

4.3.2. AMOSTRAGEM SISTEMÁTICA

OBJETIVO: Aumentar a representatividade da amostra dando maior cobertura à população. É


usada quando todos os elementos são homogêneos.

PROCEDIMENTO: Os elementos da população são enumerados (1, 2, ..., N), e o primeiro


elemento da amostra é sorteado, por exemplo, “i”. Os demais são retirados em uma progressão
aritmética, saltando r elementos, até completar o total da amostra  n  , isto é,
i  r , i  2r , i  3r ,..., i  r (n  1) . O valor r é determinado pela seguinte razão:
N
r (r é chamado de passos de amostragem ou intervalo a ser seguido)
n

EXEMPLO: Deseja-se conhecer o nível de colesterol, em mg/dl na população de Alfenas, MG,


mas o pesquisador tem recursos para realizar somente 300 análises (n=300).

INFORMAÇÃO: tamanho da população de Alfenas (N=79.000 habitantes).

79.000
r  263,33  263
300

Em seguida, sorteia-se o primeiro entre 1 e r, que no exemplo é igual a 263. Por exemplo, RAN#
X 263 = 30. Então, a sequência será:
 
 
30, 293, 556 , 819 ,..., 78.667 
 i ir i2r i 3r ir  n1  ; n = 300 indivíduos

4.3.3. AMOSTRAGEM ESTRATIFICADA

OBJETIVO: Melhorar a representatividade da amostra quando os elementos da população são


heterogêneos, porém, podem ser agrupados em subpopulações (ESTRATOS) contendo elementos
homogêneos.

PROCEDIMENTO: A população é dividida em grupos ou estratos contendo elementos


homogêneos e as amostras são retiradas separadamente de cada um desses grupos.

22
EXEMPLO: Deseja-se conhecer o nível de colesterol, em mg/dl, na população de Alfenas, MG,
nas faixas etárias pré-estabelecidas, mas o pesquisador tem recursos para realizar somente 300
análises (n=300).

INFORMAÇÃO: tamanho da população de Alfenas (N=79.000 habitantes), porém considerando


as faixas de idades pré-estabelecidas, a população alvo será de 65.000 habitantes.

Estratos Idade (em anos) Número de


indivíduos  N i 
1 18 a 25 anos 17.500
2 25 a 50 anos 35.000
3 Acima de 50 anos 12.500
Total 65.000

PROBLEMA: Qual é o tamanho de amostra em cada estrato? A amostra de 300 indivíduos


deverá ser retirada de maneira tal que os 3 estratos sejam considerados. Pode-se utilizar o critério
proporcional para retirar as amostras dos estratos.

CRITÉRIO PROPORCIONAL: O estrato “i” fornece uma quantidade ni de elementos


proporcional ao tamanho do estrato  N i  . Isto é:

N
ni  i  n
N
No exemplo 2:

17500
Estrato 1: n1   300  81 pessoas
65000
35000
Estrato 2: n2   300  161 pessoas
65000
12500
Estrato 3: n3   300  58 pessoas
65000

A soma dos tamanhos de amostras dos estratos é igual a 300.

23
LISTA DE EXERCÍCIOS 4 - AMOSTRAGEM

1) Critique os seguintes planos amostrais:

a) Para levantar a opinião das brasileiras sobre a importância e necessidade da


prevenção do câncer de colo de útero, decidiu-se entrevistar as todas as mulheres
atendidas no município de Alfenas, MG.

b) Para comparar a eficiência dos atendimentos prestados à família e a comunidade


pretende-se acompanhar 2 PSF’s na zona sul de uma capital (região com
moradores de maior poder aquisitivo). Nos 2 PSF’s na zona sul, a prestação de
serviço é de alta qualidade, com uma bem equipe estruturada e integrada,
enquanto nos outros PSF’s zona norte, de baixa qualidade, sem a devida atenção
ao paciente. No fim do mês foram comparados o desempenho dos 4 PSF’s, os
zona sul com os da zona norte.

c) Para estimar a proporção de pessoas de uma determinada cidade que tem por
hábito fazer uso de plantas medicinais, resolveu-se entrevistar 150 jovens (com
idade entre 18 e 25 anos) deste município.

2) Uma clínica médica dispõe de um arquivo com 200 fichas (enumeradas de 1 a 200) que contém
informações sobre cada paciente atendido durante o mês de abril do ano 2005. Desejando fazer
uma pesquisa com estes pacientes, a administração da clínica resolveu coletar uma amostra de 20
pacientes atendidos nesse mês. Execute uma amostragem sistemática com n = 20 e identifique os
números das fichas dos cinco primeiros pacientes coletados para a amostra.

2) Identifique o tipo de Amostragem

Um psicólogo da Universidade de São Paulo seleciona 15 homens e 12 mulheres de uma turma


com baixo desempenho acadêmico.

(a) A. A. Estratificada
(b) A. A. Sistemática
(c) A. A. Simples
(d) A. não probabilística

Um cabo eleitoral escreve o nome de cada senador em cartões separados, mistura-os e extrai 10
nomes.

(a) A. A. Estratificada
(b) A. A. Sistemática
(c) A. A. Simples
(d) A. não probabilística

O programa de Planejamento Familiar pesquisa 500 homens e 600 mulheres sobre seus pontos de
vista sobre o uso de anticoncepcionais.

(a) A. A. Estratificada
(b) A. A. Sistemática
(c) A. A. Simples
(d) A. não probabilística

Um pesquisador seleciona um a cada 25 registros para coletar informações sobre o tipo de incisão
e o método cirúrgico utilizado em cirurgias de apendicite.

24
(a) A. A. Estratificada
(b) A. A. Sistemática
(c) A. A. Simples
(d) A. não probabilística

25
GABARITOS

LISTA DE EXERCÍCIOS 1 – ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS


QUALITATIVOS
1)
a) População: todos os jovens de uma comunidade. Amostra: 50 jovens de uma comunidade
escolhidos aleatoriamente.

b) Variável: métodos contraceptivos. Classificação: Qualitativa nominal.

Tabela 1. Métodos contraceptivos utilizados por 50 jovens de uma determinada


comunidade.
Métodos Fi Fri Fpi
Tabela 21 0,42 42%
Pílula 8 0,16 16%
Preservativo 16 0,32 32%
Outros 5 0,10 10%
Total 50 1,00 100%

c) Representação gráfica.

Gráfico de colunas Gráfico de setores

50% 47%
45%
40%
35% 26%
30% 26%
25%
47%
20% 7%
20%
15% 20%
10% 7%
5%
0%
Carro Atropelamento Espancamento Moto Carro Atropelamento Espancamento Moto

Gráfico 1. Porcentagem de jovens de uma determinada comunidade Gráfico 2. Porcentagem de jovens de uma determinada
que utilizam métodos contraceptivos. comunidade que utilizam métodos contraceptivos.

2) nível educacional (nenhum, ensino fundamental, ensino médio, ensino superior) = variável
qualitativa ordinal; peso (kg) = variável quantitativa contínua; altura = variável quantitativa
contínua; idade = variável quantitativa contínua; tipo sanguíneo (B, A, O, AB) = variável
qualitativa nominal; tipos de doenças = variável qualitativa nominal; percentual de gordura
corporal = variável quantitativa contínua; hábito de fumar (fumante ou não) = variável qualitativa
nominal; atividade física (pouca, moderada e muita) = variável qualitativa ordinal.

3) a) Variável: Agentes etiológicos de fratura na face.


Classificação: Qualitativa nominal.

26
b) Tabela 2. Agentes etiológicos de fraturas na face registrados no Pronto Socorro do Hospital
das Clínicas da USP.
Agentes Fi Fri Fpi
etiológicos
Carro 7 0,4667 46,67%
Atropelamento 3 0,2000 20,00%
Espancamento 1 0,0667 6,67%
Moto 4 0,2667 26,67%
Total 15 1,0000 100,00%

b)

50% 47%
45%
40%
35%
30% 26%
25% 20%
20%
15%
10% 7%
5%
0%
Carro Atropelamento Espancamento Moto

Gráfico 1. Porcentagem agentes etiológicos de fraturas na face registrados no


Pronto Socorro do Hospital das Clínicas da USP.

27
LISTA DE EXERCÍCIOS 2 – ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
QUANTITATIVOS

1) a) Variável: Peso. Classificação: Quantitativa contínua.


b)
Tabela1. Distribuição de frequências da perda de peso de 10 indivíduos que
receberam a dieta A ou B.
Classes Xi Fi Fri Fpi
(Pesos)
[-2,95 ; 0,95) -1,0 2 0,20 20,0%
[0,95 ; 4,85) 2,9 4 0,40 40,0%
[4,85 ; 8,75) 6,8 4 0,40 40,0%
TOTAL 10 1,00 100,0%

REPRESENTAÇÃO GRÁFICA: HISTOGRAMA E POLÍGONO DE FREQUÊNCIAS.

Gráfico 1. Perda de pesos de 10 indíviduos que receberam a dieta A ou B.

Classificação da distribuição de frequências: Distribuição aproximadamente assimétrica à


esquerda.

2) a) Variável: Notas. Classificação: Quantitativa contínua.


b)

NOTAS DE BIOQUÍMICA

1  k  20  5 classes
0

 2  c  k A 1  355 18  274  6, 75 pontos


0

3 
0
LI1  menor valor -
c
2
 8
6, 75
2
 4, 62 pontos

TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS DE CLASSES PARA AS NOTAS DE


BIOQUÍMICA

Tabela 2. Notas de bioquímica dos 20 melhores classificados em um exame geral.


Classes (Notas Xi Fi Fri Fpi
de Português)
[4,62 ; 11,37) 8 3 0,15 15%
[11,37 ; 18,12) 14,75 4 0,20 20%
[18,12 ; 24,87) 21,5 5 0,25 25%
[24,87 ; 31,62) 28,25 4 0,20 20%
[31,62 ; 38,37) 35 4 0,20 20%
Total 20 1,00 100%

28
NOTAS DE BIOESTATÍSTICA

1  k  20  5 classes
0

 2  c  k A 1  325 13
0

1

19
4
 4, 75 pontos

3 
0
LI1  menor valor -
c
2
 13 
4, 75
2
 10, 62 pontos

TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS DE CLASSES PARA AS NOTAS DE


BIOESTATÍSTICA

Tabela 3. Notas de bioestatística dos 20 melhores classificados em um exame de


vestibular para uma faculdade.
Classes (Notas) X Fi Fri Fpi
i
[10,62 ; 15,37) 13 1 0,05 5%
[15,37 ; 20,12) 17,75 3 0,15 15%
[20,12 ; 24,87) 22,50 4 0,20 20%
[24,87 ; 29,62) 27,25 8 0,40 40%
[29,62 ; 34,37) 32 4 0,20 20%
Total 20 1,00 100%

c) REPRESENTAÇÃO GRÁFICA PARA AS NOTAS DE BIOQUÍMICA

Gráfico 2. Notas de bioquímica dos 20 melhores classificados em um exame geral.

OBSERVAÇÃO: O HISTOGRAMA E O POLÍGONO DE FREQUÊNCIAS PARA AS


NOTAS DE BIOQUÍMICA FORAM CONSTRUÍDOS CONSIDERANDO APENAS 4
CLASSES NO SOFTWARE ESTATÍSTICO SISVAR. VOCÊS DEVEM CONSTRUIR
CONSIDERANDO AS 5 CLASSES.

Classificação da distribuição de frequências das notas de bioquímica: aproximadamente


simétrica.

29
REPRESENTAÇÃO GRÁFICA PARA AS NOTAS DE BIOESTATÍSTICA

Gráfico 3. Notas de bioestatística dos 20 melhores classificados em um exame geral.

OBSERVAÇÃO: O HISTOGRAMA E O POLÍGONO DE FREQUÊNCIAS PARA AS


NOTAS DE BIOESTATÍSTICA FORAM CONSTRUÍDOS CONSIDERANDO
APENAS 4 CLASSES NO SOFTWARE ESTATÍSTICO SISVAR. VOCÊS DEVEM
CONSTRUIR CONSIDERANDO AS 5 CLASSES.

Classificação da distribuição de frequências para as notas de bioestatística aproximadamente


assimétrica à esquerda.

c) Variável: Total de pontos

T.D.F.C
k  20  5 classes
66  30
c 9
5 1
9
LI1  30   25,5
2

Classes Xi Fi Fri Fpi  % 


(Notas)
[25,5 ; 34,5) 30 4 0,20 20%
[34,5 ; 43,5) 39 5 0,25 25%
[43,5 ; 52,5) 48 3 0,15 15%
[52,5 ; 61,5) 57 6 0,30 30%
[61,5 ; 70,5) 66 2 0,10 10%
Total 20 1,00 100%

d) Observando o Histograma e o Polígono de frequências para as notas de bioquímica e de


bioestatística verifica-se uma maior frequência de alunos com maiores notas em bioestatística do
em bioquímica.

30
3) CONSTRUÇÃO DA T.D.F. C. PARA O NÍVEL DE COLESTEROL DE 10 INDIVÍDUOS.

1  k  10  4 classes
0

 2  c  k A 1  9504  650
0

1

300
3
 100 mg/dl

3 
0
LI1  menor valor -
c
2
 650 
100
2
 600 mg/dl

TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS DE CLASSES PARA O NÍVEL DE


COLESTEROL.

Tabela 4. Nível de colesterol avaliado em uma amostra de 10 indivíduos obesos de


uma cidade do interior de Minas Gerais.
Classes (Nível Xi Fi Fri Fpi
de colesterol)
[600 ; 700) 650 1 0,10 10%
[700 ; 800) 750 4 0,40 40%
[800 ; 900) 850 2 0,20 20%
[900 ; 1000) 950 3 0,30 30%
Total 10 1,00 100%

31
LISTA DE EXERCÍCIOS 3 – MEDIDAS DE POSIÇÃO PARA DADOS BRUTOS E
AGRUPADOS/QUARTIL

1)
MÉDIA PARA DADOS AGRUPADOS

x F i i
X i 1

X
  27  8,5  29  9,5  46  ...  11,5  55
7,5
200
1934
  9, 67 segundos
200

MEDIANA PARA DADOS AGRUPADOS

Classe mediana: n é par (n = 200)

Classe mediana = X(n/2) = X(200/2) = X(100) = 102 = 3ª classe


 n  FA  100  56 
Md  LI md   2   Cmd  9   1
 Fmd  
 46 
 
44
9  9  0,95
46
 9,95segundos

MODA PARA DADOS AGRUPADOS

Classe modal: 5ª classe


 1 
Mo  LI mo  
  55  43 
  Cmo  11    1

 1   2   55  43    55  0  
 12 
 11   
 12  55 
12
 11  
67
 11  0,18  11,18segundos

2) a) PARA O CÁLCULO DE UM QUARTIL OU PERCENTIL OS DADOS DEVEM ESTAR


ORDENADOS.

4 4 5 5 6 6
7 7 7 8 8 9

3 12  1
Posição de Q3   8, 25  8
4

Interpretação: 75% dos suicídios têm um índice abaixo de 7,5 e 25% acima de 7,5.

32
3) a) VARIÁVEL: Nível de potássio
CLASSIFICAÇÃO: Quantitativa contínua.

b) Será feito em aula.

c) Qual a porcentagem dos valores que são superiores ao nível 3,15? 52,38%  T.D.F.C.

4) a) VARIÁVEL: Frequência cardíaca (número de batimentos cardíacos por minuto).


CLASSIFICAÇÃO: Quantitativa discreta.

b) Será feito em aula.

c) Sim, pois houve uma maior frequência de alunos com batimentos cardíacos contidos na 3ª
classe (classe modal).

d)
2,5%  T.D.F.C.

5) TIPO I: Existe um valor extremo (fora do padrão), portanto a mediana é a medida mais
apropriada para representar esse conjunto de dados. Ela não é influenciada por um ou mais valores
atípicos.

DADOS ORDENADOS

46 47 48 50 52 130

n é par (n = 6).

X  n   X  n2  X  6   X  6 2 
        X  3  X  4 
md  2  2 
 2  2 

2 2 2
48  50
md   49 dias
2

TIPO II: Não existem valores extremos. A média é a medida de posição que melhor representa
esse conjunto de dados.
n

X i
72  75  ...  77 519
X i 1
   74,14 dias
n 7 7

TIPO III: O valor “45” se repete 5 vezes entre os 10 valores. Neste caso, a moda é a medida
preferida.

Moda = 45 dias

33
LISTA DE EXERCÍCIOS 4 - AMOSTRAGEM

1)
a) Amostragem não-probabilística, pois não é possível generalizar opinião das brasileiras sobre a
importância e necessidade da prevenção do câncer de colo de útero com base apenas no município
de Alfenas, MG.

b) Amostragem probabilística estratificada. É possível comparar o desempenho dos PSF’s da zona


sul com os da zona norte de acordo com o poder aquisitivo dos pacientes cadastrados em cada um
deles.

c) Amostragem não-probabilística. Não é possível generalizar para toda a população sobre o


hábito de fazer uso de plantas medicinais, tendo como base apenas os jovens dessa cidade.

2) PROCEDIMENTO:

1) Determinar o intervalo a ser seguido.

N 200
r   10
n 20

2) O primeiro elemento a ser sorteado tem que estar entre 1 e r, ou seja, entre 1 e 10.

Por exemplo, o número 5 (gerado aleatoriamente através da tecla RAN# da calculadora


científica).

Logo, os números das cinco primeiras fichas são: (5, 15, 25, 35, 45).

3)
a)
c)
a)
b)

34
REFERÊNCIAS BIBLIOGRÁFICAS

Bussab, W. O. & Morettin, P. A. (2013). Estatística Básica. 8a Edição. Atual Editora: São Paulo.

FERREIRA, D. F. Estatística básica. 2 ed. revisada; 668 p. Editora Ufla. Lavras, 2009.

Magalhães, M. N. & Lima, A. C. P. (2001), Noções de Probabilidade e Estatística, Editora USP:


São Paulo.

SOARES, J. F.; SIQUEIRA, A. L. Introdução à Estatística Médica. 2.ed. Belo Horizonte;


COOPMED, 2002.

VIEIRA, S. Elementos de Estatística. Editora Atlas, 2009.

SOFTWARES ESTATÍSTICOS

FERREIRA, D. F. SISVAR: Sistema de Análise de Variância, versão 5.1. Lavras: DEX/UFLA,


2005. Software estatístico.

R Development Core Team (2015). R: A language and environment for statistical computing. R
Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL
http://www.R-project.org.

CONTATO

Roberta Bessa Veloso Silva


Professora da Universidade José do Rosário Vellano/UNIFENAS
Mestrado em Estatística e Experimentação Agropecuária/UFLA/2003 - 2005
Doutorado em Estatística e Experimentação Agropecuária/UFLA/2005 - 2009
Pós-doutorado em Estatística Aplicada e Biometria/UNIFAL/2015 - 2017
Linha de pesquisa: Análise Multivariada
e-mail: bessaveloso@yahoo.com.br

35