Você está na página 1de 33

CBM115 - Bioestatística

Estatística
É a ciência que se ocupa de coletar, organizar, analisar e interpretar
dados.

Estatística Descritiva
Coleta, organização e apresentação dos dados.

Inferência Estatística

A partir de dados de uma amostra, tira conclusões (infere) sobre a


população em estudo.

CBM115 - Bioestatística

População Amostra
Todos os itens ou indivíduos sobre Parcela ou subconjunto da
os quais se deseja obter população.
informações.

Apresentam, pelo menos, uma


característica comum.

2
CBM115 - Bioestatística

População e amostra

Na maioria das vezes, por impossibilidade ou inviabilidade


econômica ou temporal, limitamos as observações referentes
a uma determinada pesquisa a apenas uma parte da
população, a amostra.

Para as inferências serem corretas, é necessário garantir


que a amostra seja representativa da população, isto é, a
amostra deve possuir as mesas características básicas da
população, no que diz respeito ao fenômeno que desejamos
pesquisar.

CBM115 - Bioestatística

Amostragem

É a técnica para a seleção de amostras que garante, tanto


quanto possível, o acaso da escolha.

Assim, cada elemento da população passa a ter a mesma


chance de ser escolhido, o que garante à amostra caráter de
representatividade.

4
CBM115 - Bioestatística

Inferência Estatística

Estimação
Estima o peso médio da população, usando
o peso médio da amostra.

Teste de hipótese

Testa a afirmação de que o peso médio da população é de 75kg.

CBM115 - Bioestatística

Parâmetro Estimador
Medida numérica que descreve Medida numérica que descreve uma
uma característica de uma característica de uma amostra.
população.

Número de peças produzidas em Número de peças verificadas em um


um lote de fabricação teste de qualidade.

N  Tamanho
  → n
µ  Média
 → x
σ2  Variância
  → S2
σ  Desvio
 Padrão
 → S
π   
Proporção
→ pˆ
6
CBM115 - Bioestatística

Variável
É uma característica de um item ou indivíduo.

Dado
Diferentes valores associados a uma variável.

Tipos de Variáveis

Nominal Discreta
Qualitativas Quantitativas
Ordinal Contínua

CBM115 - Bioestatística

Variáveis Qualitativas
Representam uma classificação dos indivíduos.

Nominal
Podemos utilizar números para representa-la porém, não
existe ordenação dentre as categorias, e não é possível
realizar operações matemáticas com os valores.
Sexo, marca de veículo, curso universitário
Ordinal
Existe uma ordenação entre as categorias, entretanto não
é possível realizar operações matemáticas com os valores.

ível socioeconômico, grau de escolaridade


8
CBM115 - Bioestatística

Variáveis Quantitativas
São as características que podem ser medidas em uma escala
quantitativa, ou seja, apresentam valores numéricos que fazem sentido.

Discreta
Podem assumir um número finito ou infinito enumerável de valores.
Geralmente são resultado de contagens.
úmero de filhos, defeitos por hora
Contínua
Assumem valores em um intervalo finito (número infinito não
enumerável de valores). Usualmente são medidas através de algum
instrumento.
Peso (balança), altura (régua), tempo (relógio)
9

CBM115 - Bioestatística

Exercício 1 - Classificar as variáveis a seguir:


Variável Classificação
Sexo Nominal

Diâmetro da cintura Contínua

Número de filhos Discreta


IMC (classificação) Ordinal
Altura Contínua

Pulsação Discreta

Daltonismo Nominal
Classe Social Ordinal
Peso Contínua 10
CBM115 - Bioestatística

Fases do método estatístico

Exposição ou apresentação dos dados

Por mais diversa que seja a finalidade que se tenha em


vista, os dados devem ser apresentados sob a forma
adequada (tabelas ou gráficos), tornando mais fácil o exame
daquilo que está sendo objeto de tratamento estatístico e
ulterior obtenção de medidas típicas.

11

CBM115 - Bioestatística

Tabelas

Um dos objetivos da Estatística é sintetizar os valores que


uma ou mais variáveis podem assumir, para que tenhamos
uma visão global da variação dessa ou dessas variáveis.

Tabela é um quadro que resume um conjunto de observações.

12
CBM115 - Bioestatística

Tabelas
Uma tabela compõe-se de:

título: conjunto de informações, as mais completas


possíveis, respondendo às perguntas: O quê?,
Quando?, Onde?, localizado no topo da tabela.

corpo: conjunto de linhas e colunas que contém


informações sobre a variável em estudo;

cabeçalho: parte superior da tabela que especifica o


conteúdo das colunas;

13

CBM115 - Bioestatística

Tabelas

coluna indicadora: parte da tabela que especifica o


conteúdo das linhas;

linhas: retas imaginárias que facilitam a leitura, no


sentido horizontal, de dados que se inscrevem nos
seus cruzamentos com as colunas;

casa ou célula: espaço gerado no cruzamento de uma


linha e uma coluna, destinado a um dado.

14
CBM115 - Bioestatística

Tabelas

Há ainda os elementos complementares da tabela, que


são a fonte, as notas e as chamadas, colocados, de
preferência, no seu rodapé.

15

CBM115 - Bioestatística

Tabelas

Título Taxa de incidência de AIDS nos estados da Região Sudeste no período: 2004 - 2008

Cabeçalho Unidade da Federação 2004 2005 2006 2007 2008


Minas Gerais Corpo
Coluna
indicadora Espírito Santo
Rio de Janeiro Célula
Linha
São Paulo

Fonte Fonte: Ministério da Saúde/SVS/Programa Nacional de DST/Aids

Nota Notas:
1. Taxa de incidência: casos por 100.000 habitantes
2. Casos consolidados até 30/06/2009
3. Dados de 2000 a 2007 atualizados em relação ao IDB anterior.

16
CBM115 - Bioestatística

Séries estatísticas

Denominamos série estatística toda tabela que apresenta a


distribuição de um conjunto de dados estatísticos em função
da época, do local ou da espécie.

Daí, podemos inferir que numa série estatística


observamos a existência de três elementos ou fatores: o
tempo, o espaço e a espécie.

Conforme varie um dos elementos, podemos classificá-las


em histórica, geográfica e específica.

17

CBM115 - Bioestatística

Séries estatísticas

Séries históricas, cronológicas ou temporais

Descrevem os valores da variável, em determinado local,


discriminados segundo intervalos de tempo variáveis.
Taxa de incidência de AIDS no Rio de Janeiro - 2004 a 2008
Ano Taxa
2004 35,34
2005 32,80
2006 30,81
2007 28,88
2008 26,27
Fonte: Ministério da Saúde/SVS/Programa Nacional de DST/Aids
Notas:
1. Taxa de incidência: casos por 100.000 habitantes
2. Casos consolidados até 30/06/2009
3. Dados de 2000 a 2007 atualizados em relação ao IDB anterior.

18
CBM115 - Bioestatística

Séries estatísticas

Séries geográficas, espaciais, territoriais ou de localização

Descrevem os valores da variável, em determinado


instante, discriminados segundo regiões.
Taxa de incidência de AIDS na Região Sudeste em 2008
UF Taxa
MG 13,07
ES 17,84
RJ 26,27
SP 19,56
Fonte: Ministério da Saúde/SVS/Programa Nacional de DST/Aids
Notas:
1. Taxa de incidência: casos por 100.000 habitantes
2. Casos consolidados até 30/06/2009
3. Dados de 2000 a 2007 atualizados em relação ao IDB anterior.

19

CBM115 - Bioestatística

Séries estatísticas

Séries específicas ou categóricas


Descrevem os valores da variável, em determinado tempo e local,
discriminados segundo especificações ou categorias.
Número de Agravos no
Município do Rio de Janeiro - 2006
Agravo Casos
Dengue 14.213
Dengue Hemorrágica 34
Doença meningocócica 157
Hepatite viral 42
Leptospirose 103
Malária 106
Rubéola 272
Fonte: Secretaria de Saúde
20
CBM115 - Bioestatística

Séries conjugadas – Tabela de dupla entrada

Muitas vezes temos necessidade de apresentar, em uma


única tabela, a variação de valores de mais de uma variável,
isto é, fazer uma conjugação de duas ou mais séries.

Conjugando duas séries em uma única tabela, obtemos


uma tabela de dupla entrada. Em uma tabela desse tipo
ficam criadas duas ordens de classificação: uma horizontal
(linha) e uma vertical (coluna).

21

CBM115 - Bioestatística

Séries conjugadas – Tabela de dupla entrada

Exemplo:

Casos confirmados de hanseníase, por região e ano de diagnóstico


Região 2007 2008 2009 2010
Norte 9.874 10.022 9.053 3.733
Nordeste 19.308 19.022 17.640 7.489
Sudeste 9.007 8.408 7.705 3.008
Sul 2.045 2.028 1.775 793
Centro Oeste 7.732 7.499 7.337 3.100
Total 47.966 46.979 43.510 18.123
Fonte: Ministério da Saúde/SVS - Sistema de Inf ormação de Agravos de Notif icação

22
CBM115 - Bioestatística

Séries conjugadas – Tabela de dupla entrada

A conjugação, no exemplo, foi série geográfica-série


histórica, que dá origem à série geográfico-histórica ou
geográfico-temporal.

Podem existir, se bem que mais raramente, pela


dificuldade de representação, séries compostas de três ou
mais entradas.

23

CBM115 - Bioestatística

Dados Brutos
São aqueles que não foram numericamente organizados, ou seja,
estão na forma em que foram coletados.

Exemplo: Estatura de 40 alunos da turma A, em cm.

166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161

24
CBM115 - Bioestatística

Rol
É a organização dos dados brutos em ordem de grandeza
crescente ou decrescente.

Exemplo: Estatura de 40 alunos da turma A em cm.

150 151 152 153 154 155 155 155 155 156
156 156 157 158 158 160 160 160 160 160
161 161 161 161 162 162 163 163 164 164
164 165 166 167 168 168 169 170 172 173

25

CBM115 - Bioestatística

Distribuição de Frequência
É uma tabela onde os dados observados são listados fazendo-se uma
correspondência com o número de repetições ou observações de um
valor (frequência).

Estatura de 40 alunos da turma A


Estat. (cm) Freq. Estat. (cm) Freq. Estat. (cm) Freq.
150 1 158 2 167 1
151 1 160 5 168 2
152 1 161 4 169 1
153 1 162 2 170 1
154 1 163 2 172 1
155 4 164 3 173 1
156 3 165 1 Total 40
157 1 166 1

26
CBM115 - Bioestatística

Distribuição de Frequência em classes


É uma tabela onde os dados são agrupados em classes (intervalos).

Estatura de 40 alunos da turma A


Estaturas (cm) Frequência
150 |---- 154 4
154 |---- 158 9
158 |---- 162 11
162 |---- 166 8
166 |---- 170 5
170 |---- 174 3
Total 40

27

CBM115 - Bioestatística

Distribuição de Frequência em classes


A distribuição de frequência em classes apresenta os seguintes
elementos:

Classes: são os intervalos de variação da variável. 158 |---- 162


Limites de classe: são os extremos de cada classe. O menor
número é o limite inferior ( li ) e o maior número, o limite superior ( Li ) .
Amplitude do intervalo de classe: é a medida (tamanho) do
intervalo que defina a classe hi = Li − li .
Ponto médio: é o ponto que divide o intervalo de classe em duas
partes iguais.
l + Li
xi = i
2

28
CBM115 - Bioestatística

Distribuição de frequência
Exemplo: Casos confirmados notificados de tuberculose
no Brasil em 2010, por faixa etária
Faixa Etária fi
<1 251
1a4 306
5a9 239
10 a 14 554
15 a 19 2.260
20 a 39 19.101
40 a 59 13.913
60 a 64 1.716
65 a 69 1.248
70 a 79 1.673
80 ou > 618
Total 41.879
Fonte: Ministério da Saúde/SVS
Sistema de Inf ormação de Agravos de Notificação
Dados adaptados

29

CBM115 - Bioestatística

Tipos de frequências

A frequência nada mais é do que uma contagem no número


de ocorrências de determinado elemento, integrante de uma
classe ou fenômeno em estudo.

A frequência pode ser:

Simples ( f i )
Freqüência Absoluta 
Acumulada ( Fi )

Simples ( fri )
Freqüência Relativa 
 Acumulada ( Fri )

30
CBM115 - Bioestatística

Tipos de frequências
1 – Frequência Absoluta Simples

São os dados estatísticos resultantes da coleta direta da fonte,


sem outra manipulação senão a contagem ou medida.

No exemplo anterior, a coluna fi representa a frequência


absoluta da distribuição.

31

CBM115 - Bioestatística

Tipos de frequências
1 – Frequência Absoluta Acumulada

Trata-se da acumulação das frequências simples a cada nível.

Faixa Etária fi Fi
<1 251 251
1a4 306 251+306=557
5a9 239 557+239=796
10 a 14 554 796+554=1350
15 a 19 2.260 3.610
20 a 39 19.101 22.711
40 a 59 13.913 36.624
60 a 64 1.716 38.340
65 a 69 1.248 39.588
70 a 79 1.673 41.261
80 ou > 618 41.879
Total 41.879 -

32
CBM115 - Bioestatística

Tipos de frequências
1 – Frequência Relativa Simples

Destaca a participação de parte no todo. Em geral, representamos


este tipo de frequência em percentual.

Para calcularmos a frequência relativa de determinado componente


de nossa tabela, realizamos a seguinte conta:

fi
fri = ⋅100
∑f i

33

CBM115 - Bioestatística

Tipos de frequências
1 – Frequência Relativa Simples

Faixa Etária fi fri


<1 251 251/41879*100=0,599
1a4 306 306/41879*100=0,731
5a9 239 0,571
10 a 14 554 1,323
15 a 19 2.260 5,396
20 a 39 19.101 45,610
40 a 59 13.913 33,222
60 a 64 1.716 4,098
65 a 69 1.248 2,980
70 a 79 1.673 3,995
80 ou > 618 1,476
Total 41.879 100,000

34
CBM115 - Bioestatística

Tipos de frequências
1 – Frequência Relativa Acumulada

É a acumulação das frequências relativas.

Faixa Etária fi fri Fri


<1 251 0,599 0,599
1a4 306 0,731 1,330
5a9 239 0,571 1,901
10 a 14 554 1,323 3,224
15 a 19 2.260 5,396 8,620
20 a 39 19.101 45,610 54,230
40 a 59 13.913 33,222 87,452
60 a 64 1.716 4,098 91,549
65 a 69 1.248 2,980 94,529
70 a 79 1.673 3,995 98,524
80 ou > 618 1,476 100,000
Total 41.879 100,000 -

35

CBM115 - Bioestatística

Exercício 2 – Completar as colunas da tabela abaixo.


Internações hospitalares do SUS no Rio de Janeiro em dez/2010

Especialidade fi Fi fri Fri


Aids - hospital-dia 9
Clínica cirúrgica 15.617
Clínica cirúrgica - hospital-dia 24
Clínica médica 17.998
Cuidados prolongados (crônicos) 97
Obstetrícia 10.128
Pediatria 6.573
Pneumologia sanitária (tisiologia) 146
Psiquiatria 1.078
Reabilitação 175
Saúde mental - hospital-dia 155
Total 52.000
Fonte: Datasus
36
CBM115 - Bioestatística

Exercício 2 – Completar as colunas da tabela abaixo. (solução)


Internações hospitalares do SUS no Rio de Janeiro em dez/2010

Especialidade fi Fi fri Fri


Aids - hospital-dia 9 9 0,02 0,02
Clínica cirúrgica 15.617 15.626 30,03 30,05
Clínica cirúrgica - hospital-dia 24 15.650 0,05 30,10
Clínica médica 17.998 33.648 34,61 64,71
Cuidados prolongados (crônicos) 97 33.745 0,19 64,89
Obstetrícia 10.128 43.873 19,48 84,37
Pediatria 6.573 50.446 12,64 97,01
Pneumologia sanitária (tisiologia) 146 50.592 0,28 97,29
Psiquiatria 1.078 51.670 2,07 99,37
Reabilitação 175 51.845 0,34 99,70
Saúde mental - hospital-dia 155 52.000 0,30 100,00
Total 52.000 - 100,00 -
Fonte: Datasus
37

CBM115 - Bioestatística

Exercício 3 – Completar as colunas da tabela abaixo.


Morbidade hospitalar do SUS no Rio de Janeiro em out/2010

Faixa Etária 1 fi Fi fri Fri


Menor 1 ano 64
1 a 4 anos 16
5 a 9 anos 9
10 a 14 anos 12
15 a 19 anos 20
20 a 29 anos 80
30 a 39 anos 127
40 a 49 anos 255
50 a 59 anos 470
60 a 69 anos 614
70 a 79 anos 802
80 anos e mais 783
Total 3.252
Fonte: Datasus
38
CBM115 - Bioestatística

Exercício 3 – Completar as colunas da tabela abaixo. (solução)


Morbidade hospitalar do SUS no Rio de Janeiro em out/2010

Faixa Etária 1 fi Fi fri Fri


Menor 1 ano 64 64 1,97 1,97
1 a 4 anos 16 80 0,49 2,46
5 a 9 anos 9 89 0,28 2,74
10 a 14 anos 12 101 0,37 3,11
15 a 19 anos 20 121 0,62 3,72
20 a 29 anos 80 201 2,46 6,18
30 a 39 anos 127 328 3,91 10,09
40 a 49 anos 255 583 7,84 17,93
50 a 59 anos 470 1.053 14,45 32,38
60 a 69 anos 614 1.667 18,88 51,26
70 a 79 anos 802 2.469 24,66 75,92
80 anos e mais 783 3.252 24,08 100,00
Total 3.252 - 100,00 -
Fonte: Datasus
39

CBM115 - Bioestatística

Exercício 4 – Completar as colunas da tabela abaixo.


Casos de aids identificados no Rio de Janeiro, por faixa etária em 2009

Fx. Etária fi fri Fi


< 5 anos 1,96
5 - 12 139
13-19 82
20-24 551
25-29 13,71
30-34 2.023
35-39 2.814
40-49 1279
50-59 11,89
60 e mais 4,70
ignorado
Total 4.910 32,26 -
Fonte: Datasus
40
CBM115 - Bioestatística

Exercício 4 – Completar as colunas da tabela abaixo. (solução)


Casos de aids identificados no Rio de Janeiro, por faixa etária em 2009

Fx. Etária fi fri Fi


< 5 anos 96 1,96 96
5 - 12 43 0,88 139
13-19 82 1,67 221
20-24 330 6,72 551
25-29 673 13,71 1.224
30-34 799 16,27 2.023
35-39 791 16,11 2.814
40-49 1279 26,05 4.093
50-59 584 11,89 4.677
60 e mais 231 4,70 4.908
ignorado 2 0,04 4.910
Total 4.910 100,00 -
Fonte: Datasus
41

CBM115 - Bioestatística

Gráficos

Transmitem uma ideia visual do comportamento de um conjunto de


valores.

Requisitos de um gráfico:
 Simplicidade: possibilitar a análise rápida do fenômeno
observado. Deve conter apenas o essencial.
 Clareza: possibilitar a leitura e interpretação correta dos
valores do fenômeno em estudo.
 Veracidade: deve expressar a verdade sobre o fenômeno
observado.

42
CBM115 - Bioestatística

Gráfico de linha
Utilizado na representação de séries temporais.

Casos confirmados de Casos confirmados de hanseníase no Brasil 2001 - 2010


hanseníase no Brasil
2001 - 2010 70.000
Anos Casos
60.000
2001 50.616
número de casos

2002 54.795 50.000


2003 58.243 40.000
2004 56.565
30.000
2005 55.596
2006 50.826 20.000
2007 47.966 10.000
2008 46.979 0
2009 43.510 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
2010 18.123
anos
Fonte: Ministério da Saúde

43

CBM115 - Bioestatística

Gráfico de colunas (ou barras)

Utilizado na comparação de dados de uma série estatística.


São utilizados retângulos dispostos verticalmente (em colunas) ou
horizontalmente (em barras).
Quando em colunas, os retângulos têm a mesma base e as alturas
são proporcionais aos respectivos dados.
Quando em barras, os retângulos tem a mesma altura e os
comprimentos são proporcionais aos respectivos dados.

44
CBM115 - Bioestatística

Gráfico de colunas (ou barras)

Casos confirm ados de hanseníase por Região em 2008


Casos confirmados de
hanseníase por Região 20.000
Região 2008 18.000
Norte 10.022 16.000
Número de casos

Nordeste 19.022 14.000


Sudeste 8.408 12.000
Sul 2.028 10.000
8.000
Centro Oeste 7.499
6.000
Total 46.979
4.000
2.000
0
Norte Nordeste Sudeste Sul Centro Oeste
Região

45

CBM115 - Bioestatística

Gráfico de colunas (ou barras)

Casos confirmados de hanseníase no Nordeste e m 2008


Casos confirmados de
hanseníase no Nordeste Rio Grande do Norte
UF 2008
Alagoas
Maranhao 5.043
Número de casos

Bahia 3.373 Sergipe


Pernambuco 3.245 Paraiba
Ceara 2.901 Piaui
Piaui 2.266
Ceara
Paraiba 869
Sergipe 531 Pernambuco
Alagoas 464 Bahia
Rio Grande do Norte 330 Maranhao
Total 19.022
0 1.000 2.000 3.000 4.000 5.000 6.000

Estados

46
CBM115 - Bioestatística

Gráfico em colunas ou em barras múltiplas

Utilizado para representar, simultaneamente, dois ou mais fenômenos


estudados com o propósito de comparação.

Casos confirmados de hanseníase Casos confirmados de hanseníase por sexo e por região em 2008
por sexo e por região em 2008
Região Homens Mulheres 12.000
Norte 5.967 4.055
10.000
Número de casos

Nordeste 10.258 8.764


Sudeste 4.713 3.695 8.000
Sul 1.175 853 6.000
Centro Oeste 4.442 3.057
4.000
Total 26.555 20.424
2.000
0
Norte Nordeste Sudeste Sul Centro Oeste
Região

Homens Mulheres

47

CBM115 - Bioestatística

Gráfico em setores
Utilizado quando desejamos ressaltar a participação do dado no total.
O total é representado pelo círculo, que fica dividido em setores
proporcionais às frequências.
Casos confirm ados de hanseníase por Região em 2008
Casos confirmados de
Centro Oeste
hanseníase por Região 16% Norte
Região 2008 21%
Norte 10.022
Nordeste 19.022 Sul
Sudeste 8.408 4%
Sul 2.028
Centro Oeste 7.499
Total 46.979
Sudeste
18%

Nordeste
41%

48
CBM115 - Bioestatística

Amostragem

Amostragem casual ou aleatória simples

Esse tipo de amostragem é equivalente a um sorteio


lotérico, ou seja, todos os elementos da população têm a
mesma probabilidade se serem selecionados.

Na prática, a amostragem casual ou aleatória


simples pode ser realizada enumerando-se a população de 1
a n e sorteando-se, por meio de um dispositivo aleatório,
qualquer k números dessa sequência, os quais
corresponderão aos elementos pertencentes à amostra.

49

CBM115 - Bioestatística

Amostragem

Amostragem casual ou aleatória simples

Uma forma de se realizar a seleção de amostras aleatórias


é a utilização de uma Tabela de Números Aleatórios, ou
gerá-los através de algum recurso computacional.

No excel, há duas funções que geram números aleatórios:

ALEATORIO() e ALEATORIOENTRE(x,y)

50
CBM115 - Bioestatística

Amostragem

Amostragem casual ou aleatória simples

Exemplo:
Obter uma amostra correspondente a 10%, de uma população de
100 alunos, a fim de avaliar a estatura.

- numeramos os alunos de 001 a 100;

- escreve-se os números de 001 a 100 em pedaços de papel iguais,


colocando-os em uma caixa para sorteio. Seleciona-se um a um,
dez números que formarão a amostra.
51

CBM115 - Bioestatística

Amostragem

Amostragem casual ou aleatória simples

População: N = 40
Amostra: n = 8

52
CBM115 - Bioestatística

Amostragem

Amostragem estratificada

Muitas vezes a população se divide em subpopulações __


estratos.

Como é possível que a variável em estudo apresente, de


estrato em estrato, um comportamento heterogêneo e, dentro
de cada estrato, um comportamento homogêneo, convém que
o sorteio dos elementos da amostra leve em consideração tais
estratos.

É exatamente isso que fazemos quando empregamos a


amostragem estratificada.
53

CBM115 - Bioestatística

Amostragem

Amostragem estratificada

Exemplo:

Consideremos no exemplo anterior, que dos 100 alunos, 60 são


do sexo feminino e 40 do sexo masculino.

Temos dois estratos (sexo masculino e sexo feminino). Se


queremos uma amostra de 10%, teremos:

4 homens (10% de 40) e 6 mulheres (10% de 60).

54
CBM115 - Bioestatística

Amostragem

Amostragem estratificada

Estrato 2

População: N = 40
Amostra: n = 8
Estrato 1

55

CBM115 - Bioestatística

Amostragem

Amostragem sistemática

Quando os elementos da população já se acham


ordenados, não há necessidade de construir o sistema de
referência. São exemplos os prontuários médicos de um
hospital, os prédios de uma rua, etc...

Nesses casos, a seleção dos elementos que constituirão a


amostra pode ser feita por um sistema imposto pelo
pesquisador. A esse tipo de amostragem denominamos
sistemática.

56
CBM115 - Bioestatística

Amostragem

Amostragem sistemática

Nesse processo de amostragem, semelhante ao da aleatória simples,


procedemos da seguinte forma:

1) divide-se o tamanho da população (N) pelo tamanho da amostra


(n), obtendo um intervalo de retirada (k);

2) sorteia-se um ponto de partida;

3) a cada k elementos retira-se um para amostra.


57

CBM115 - Bioestatística

Amostragem

Amostragem sistemática

Exemplo:

Dispomos dos prontuários médicos de 720 pacientes. Desejamos


selecionar uma amostra de 40 prontuários para análise.

Temos a população de 720 e a amostra de 40. Assim nosso intervalo


de retirada (K) será 720/40=18.

58
CBM115 - Bioestatística

Amostragem

Amostragem sistemática

Partindo de um ponto aleatório inicial, por exemplo, o terceiro


prontuário, selecionamos cada décimo oitavo elemento daí em diante.

Assim, a amostra seria composta pelos prontuários de número:

3, 21, 39, 57, 75, ..., 669, 687 e 705

59

CBM115 - Bioestatística

Amostragem 2º 7º

Amostragem sistemática
12º

População: N = 40
17º 22º
Amostra: n = 8
Intervalo: k = 5
Partida: 2º 27º 32º

37º

60
CBM115 - Bioestatística

Distribuição de frequência em classes - construção

i. Sendo n o total de observações, determinar o número de classes


através do critério da raiz: k = n (*)

ii. Determinar a amplitude total dos dados: AT = X máx − X mín

AT
iii. Determinar a amplitude do intervalo de classe: h =
k

iv. Estabelecer os limites inferiores e superiores dos intervalos de


classe, sendo que o limite inferior do primeiro intervalo deve ser
menor ou igual ao menor valor da série.
(*) Podemos também utilizar a fórmula de Sturges, onde: k = 1 + 3,32 log n
61

CBM115 - Bioestatística

Distribuição de frequência em classes - construção

Exemplo:

Apresentamos a seguir a sequência de valores referentes ao resultado de


um teste de QI aplicado em determinada classe de alunos de uma
faculdade.
111 90 121 105 122 61 128 112 128 93
108 138 88 110 112 112 97 128 102 125
87 119 104 116 96 114 107 113 80 113
123 95 115 70 115 101 114 127 92 103
78 118 100 115 116 98 119 72 125 109
79 139 75 109 123 124 108 125 116 83
94 106 117 82 122 99 124 84 91 130
62
CBM115 - Bioestatística

Distribuição de frequência em classes - construção

Temos, então:
i. número de classes: K = 70 = 8, 37 ≈ 8 (*)

ii. amplitude total dos dados: AT = 140 − 60 = 80

80
iii. amplitude do intervalo de classe: h = = 10
8

(*) – podemos trabalhar com 7, 8 ou 9 classes.

63

CBM115 - Bioestatística

Distribuição de frequência em classes - construção

O maior valor da seqüência é X máx = 139 e o menor valor da seqüência é X mín = 61 .

Assim, a amplitude total da seqüência é At = 139 − 61 = 78 .

No entanto, sabemos que pelo fato de o critério adotado do intervalo de classe ser semi-
aberto à direita, devemos ajustar o valor X máx .

Ajustando para 140, a amplitude passa a ser At = 140 − 61 = 79 .

Este valor não é divisível, de forma inteira, por 7, 8 ou 9, que são as opções de classes.

64
CBM115 - Bioestatística

Distribuição de frequência em classes - construção

Nesta situação devemos ajustar X máx para 141 obtendo At = 141 − 61 = 80 que é
divisível exatamente por 8, obtendo-se uma amplitude de intervalo de classe dada
por: h = At = 80 = 10
K 8

Observe que o ajuste do valor de X máx foi de duas unidades, passando de 139 para
141.

A experiência do pesquisador, nesta situação, o levaria a distribuir este erro de duas


unidades, iniciando a representação da série em 60 e terminando em 140. A
amplitude total ajustada para a série é de At = 140 − 60 = 80 .

65

CBM115 - Bioestatística

Distribuição de frequência em classes - construção

A distribuição em classes fica conforme apresentado abaixo.

Intervalo de
fi
Classe
60 | 70 1
70 | 80 5
80 | 90 6
90 | 100 10
100 | 110 12
110 | 120 19
120 | 130 14
130 | 140 3
Total 70

66