Você está na página 1de 26

UNIVERSIDADE FEDERAL DO PARÁ

INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

ESTATÍSTICA APLICADA À BIOESTATÍSTICA

Profa. Silvia dos Santos de Almeida, Dra.


Profa. Adrilayne dos Reis Araújo, M.Sc.
Prof. Edson Marcos L. S. Ramos

Campus Guamá (Belém), Abril de 2009.


UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

DISCIPLINA: ESTATÍSTICA APLICADA À BIOESTATÍSTICA - C.H: 60 h.

SÚMULA
Estatística descritiva; Tabelas e gráficos; Medidas descritivas; Conceitos Fundamentais – Tabelas Estatísticas
– Representação Gráfica – Propriedades do Somatório - Arredondamento de Números – Distribuição de
Freqüência – Medidas de Tendência Central: Média, Moda e Mediana – Medidas Separatrizes: Quartil, Decil
e Percentil – Medidas de Dispersão ou Variabilidade: Variância, Desvio Padrão e Coeficiente de Variação.
Tipo de Variáveis.

PROGRAMA

01. CONCEITOS FUNDAMENTAIS: Estatística, Bioestatística, População, Censo, Amostra,


Amostragem, Experimento Aleatório, Tipos de Variáveis, Parâmetro, Estimativa e Estimador.
02. ARREDONDAMENTO DE NÚMEROS: Regras Gerais e Exemplos
03. PROPRIEDADES DO SOMATORIO: Principais propriedades e Exemplos
04. TABELAS ESTATÍSTICAS: Normas de Apresentação Tabular (Resolução Nº 886/66 de 26/10/66
do Conselho Nacional de Estatística). Séries Estatísticas: Temporal, Geográfica, Especificativa,
Mista e Distribuição de Freqüência por intervalo e por ponto.
05. REPRESENTAÇÃO GRÁFICA: Conceito, Requisitos Fundamentais, Principais Tipos de
Gráficos: gráfico em coluna e barra, gráfico em linha, gráfico de setores. Histograma e polígono de
freqüência.
06. MEDIDAS DE TENDÊNCIA CENTRAL: Conceito, Média Aritmética, Mediana e Moda.
07. MEDIDAS SEPARATRIZES: Conceito, Quartil, Decil e Percentil.
08. MEDIDAS DE DISPERSÃO OU VARIABILIDADE: Conceito, Desvio Médio, Variância,
Propriedades da Variância, Desvio Padrão e Coeficiente de Variação.

REFERÊNCIAS BIBLIOGRÁFICAS:
1. BUSSAB, W. e MORETTIN, P. A. Estatística básica. Editora Saraiva. 5ª Edição. 2005.
2. IBGE. Centro.Normas de Apresentação Tabular – 3 ed. – Rio de Janeiro, 1993. 62 p.
3. MARTINS, G. de Andrade e DONEIRE, Denis – Princípios de Estatística – Editora Atlas.
4. SPIEGEL, Murray – Estatística – Coleção Schaum – Editora Mc Grawhil do Brasil, 1985.
5. TOLEDO, G. L. e OVALLE I. I. Estatística básica. São Paulo: Atlas. 1987

1
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

Introdução

Os métodos estatísticos destacam-se cada vez mais como estratégias de solução para problemas, na
área de pesquisa médica, nas quais se podem citar Estudos de Bioequivalência, Bioestatística,
Análise de Sobrevivência e Epidemiologia, dentre outros. Além disso, tem ocorrido notável
utilização da Estatística no controle de processos de indústrias farmacêuticas e na implementação de
projetos de melhoria de qualidade em hospitais e clínicas. Neste sentido, a Estatística é atualmente
um recurso essencial para a divulgação de resultados de pesquisas da área médica. Não só na
análise dos dados, mas também como uma forma de planejamento de estudos clínicos, que
constituem uma poderosa ferramenta de investigação científica para a avaliação de intervenções na
saúde. Isto se dá desde a análise descritiva mais simples até as modelagens e técnicas Multivariada
mais complexas.

1. ALGUNS CONCEITOS IMPORTANTES

1.1 - Estatística
É a ciência que se preocupa com coleta, análise, interpretação e apresentação dos dados,
permitindo-nos a obtenção de conclusões válidas a partir destes dados, bem como a tomada de
decisões razoáveis baseadas nessas conclusões.

Bioestatística – é o conjunto de métodos estatísticos voltado ao planejamento, coleta,


avaliação e interpretação de dados obtidos em estudos médicos e biológicos, com o objetivo de
se tomar decisões ótimas na presença de incerteza, estabelecendo faixas de confiança para a
eficácia dos tratamentos e verificando a influência de fatores de risco no aparecimento de
doenças.

A Estatística se apresenta didaticamente em duas partes:


a) Estatística Descritiva: é aquela que se preocupa com a coleta, análise, interpretação e
apresentação dos dados estatísticos;
b) Estatística Indutiva (amostral ou inferencial): é aquela que partindo de uma amostra, estabelece
hipóteses sobre a população de origem e formula previsões fundamentando-se na teoria das
probabilidades.

1.2 – População ou Universo


É todo conjunto que possui determinada característica em comum entre todos os seus
elementos componente, limitados no tempo e no espaço.
Exemplo: Em um estudo sobre a ocorrência de sobrepeso em crianças de 7 a 12 anos no Município
de Belém no mês de Março/2009.

1.3 - Censo
É a coleta exaustiva das informações de todas as “N” unidades da população.

2
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

1.4 - Amostra
É um subconjunto, uma parte selecionada da totalidade de observações abrangidas pela
população da qual se quer inferir alguma coisa.
a) Amostra Aleatória, Casual ou Randônica: é amostra obtida sem a interferência externa, onde
cada unidade da população tem a mesma chance de ser incluída na amostra.
1.5 - Amostragem
É o processo (método) de coleta das informações da amostra, mediante métodos adequados
de seleção destas unidades.
1.6 - Experimento Aleatório
É quando efetuamos um experimento repetidas vezes, sob condições praticamente idênticas,
e obtemos resultados que não são essencialmente os mesmos.

Exemplo: Na jogada de uma moeda o resultado do experimento é o aparecimento de uma “cara” ou


uma “coroa”.

1.7 - Variável
É o conjunto de resultados possíveis de um fenômeno (resposta), ou ainda são as
propriedades (características) dos elementos da população que se pretende conhecer.

  No min al
 Qualitativ a 
  Ordinal
var iável 
  Discreta
Quantitati va 
 Continua
1.7.1 - Variáveis Qualitativas ou Categóricas
É quando se obtém como resposta palavras. Se existir uma ordem natural nas respostas, se
diz que a variável é qualitativa ordinal, caso contrario, ela é dita variável qualitativa nominal.
Exemplos:
a) Presença ou ausência de um sintoma;
b) Adesão ao tratamento (completa, parcial, contraria);
c) Classificação da dor segundo a intensidade (pouca, média e grande);
d) Sexo de um paciente.

3
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

1.7. 2 - Variáveis Quantitativas


É quando se obtém como resposta números. Podem ser ditas Discretas, quando obtidas através
de contagem ou Contínuas quando obtidas através de medições.
Exemplos:
a) Número de comprimidos não tomados;
b) Pressão arterial;
c) Diâmetro de artérias;
d) Número de gestações interrompidas;

1.8 – Parâmetro: valor singular que existe na população e que serve para caracterizá-la. Em geral,
é representado por letra grega.
Exemplos: média populacional ( µ ) e variância populacional ( σ 2).

1.9. Estimativa: é um valor aproximado do parâmetro e é calculado com o uso da amostra.

1.10. Estimador: é a forma, ou meio de se obter a estimativa. Por exemplo,


n

∑x i
X = i =1
, i = 1,2, L , n.
n

EXERCÍCIOS DO TÓPICO 1

1) Imagine o seu dia a dia no trabalho e dê um exemplo de população.

2) Dê exemplos de variáveis: Nominal, Ordinal, Discreta e Contínua.

3) Classifique as variáveis apresentadas na Tabela:

Idade Sexo Hemoglobina Tipo de Urticária Duração


58 M 15,1 Física Curta
31 M 14,2 Física Longa
34 F 14,4 Idiopática Média
49 M 10,9 Idiopática Média
39 F 14,4 Física Longa
33 M 14,1 Física Curta
35 F 14,0 Idiopática Longa

4
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

2. ARREDONDAMENTO DE NÚMEROS
Quando for conveniente ou necessário suprimir unidades inferiores às de determinada
ordem, utiliza-se a técnica do arredondamento de dados. Neste sentido, de acordo com a resolução
886/66 da Fundação IBGE, o arredondamento deve ser feito utilizando uma das seguintes regras
mostradas a seguir.

Regra 1 - Quando o primeiro algarismo a ser abandonado for: 0, 1, 2, 3 e 4. Fica inalterado o último
algarismo a permanecer. Por exemplo, arredondar para uma casa decimal os números:
53,24 → 53,2; 88,01 → 80,0; 10,43 → 10,4

Regra 2 - Quando o primeiro algarismo a ser abandonado for: 5, 6, 7, 8 ou 9. Aumenta-se uma


unidade no algarismo a permanecer. Por exemplo, arredondar para uma casa decimal os números:
53,25 → 53,3; 88,09 → 88,1; 10,47 → 10,5

Observação - Não se devem fazer arredondamentos sucessivos, se houver necessidade de um novo


arredondamento, recomenda-se a volta aos dados originais.

Quando se tem várias parcelas de percentagens ou taxas que sofreram arredondamento, a soma
provavelmente não dará 100%, faltando ou sobrando alguns décimos. Neste caso, torna-se necessário fazer o
ajustamento do total até chegar a 100 %. O critério recomendado é adicionar ou subtrair – conforme o caso –
a falta ou excesso à parcela maior. Isto porque a parcela maior ficará menos desfigurada, quando ajustada
com alguns décimos, que outra parcela qualquer.

EXERCÍCIOS DO TÓPICO 2

1) Faça os arredondametos para uma decimal e para inteiro


Uma decimal Inteiro
a) 23,45  
b) 10,03  
c) 27,39  
d)17,44  
e) 1,17  

5
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

3. PROPRIEDADES DO SOMATÓRIO

A letra maiúscula grega Σ (sigma) é usada para indicar somatório. Assim,


n

∑x
i =1
i = x1 + x 2 + ... + x n .

3.1. Propriedades Importantes do Σ

a) O somatório de uma constante é igual ao produto do número de termos do somatório pela constante,
n
isto é ∑ k = k + k + ... + k = nk.
i =1
5
Exemplo: ∑10 = 10 + 10 + 10 + 10 + 10 = 5 × 10 = 50
i =1

b) O Somatório do produto de uma constante por uma variável que depende do somatório é igual ao
n n
produto da constante pelo somatório da variável, ou seja ∑ k xi = k ∑ xi .
i =1 i =1
n
Exemplo: Seja x = {4,5,2,3,7} e k = 3 , então ∑ kx i = 3 × 21 = 63
i =1
n n n
c) Propriedade Distributiva com relação à adição, isto é ∑ ( xi + y i ) = ∑ x i + ∑ y i .
i =1 i =1 i =1

Exemplo: Seja x = {10,12,15,9,7} e y = {2,1,3,7,4}, então


5 5 5

∑ ( xi + y i ) = ∑ x i + ∑ y i
i =1 i =1 i =1
= 53 + 17 = 70.
n n n
d) Propriedade Distributiva com relação à subtração, isto é ∑ ( xi − y i ) = ∑ xi − ∑ y i .
i =1 i =1 i =1

Exemplo: Seja x = {13,10,9,3} e y = {15,8,10,4} , então


4 4 4

∑ ( xi − y i ) = ∑ xi − ∑ y i
i =1 i =1 i =1
= 35 − 37 = −2.
2
 n  n
e) O quadrado da soma é diferente da soma dos quadrados, ou seja  ∑ xi  ≠ ∑ xi2 .
 i =1  i =1
2
 3  3
Exemplo: Seja x = {7,6,2} então  ∑ xi  = (15) = 225 ∑x = 89.
2 2
e i
 i =1  i =1
2
 3  3
Portanto  ∑ xi  ≠ ∑ xi2 .
 i =1  i =1
n n n
f) O Produto de duas somas é diferente da soma dos produtos, isto é ∑ xi × ∑ yi ≠ ∑ (xi × yi ).
i =1 i =1 i =1
4
Exemplo: Seja x = {3,5,7,9} e y = [2,1,8,10] então ∑ ( xi × y i ) = 157 e
i =1
4 4

∑ xi ∑ yi = 24 × 21 = 504
i =1 i =1

6
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

g) O somatório de um quociente é diferente do quociente de duas somas.


n

n
xi ∑x i

∑ yi
≠ i =1
n
i =1
∑y
i =1
i

4 ∑x i
y = [3,4,5,7] , como ∑ i = 8 e
x
Exemplo: Seja x = {6,8,10,14}
38
e i =1
4
= = 2 , logo 8 ≠ 2.
i =1 y i 19
∑y
i =1
i

h) O somatório duplo de um produto é igual ao produto dos somatórios tomados separadamente.


n m n m

∑∑ xi y j = ∑ xi × ∑ y j
i =1 j =1 i =1 j =1
2 3 2 3
Exemplo: Seja x = {2,3} e y = [4,7,9] , como ∑∑ xi y j = 100 , ∑ xi = 5 e ∑y j = 20 ,
i =1 j =1 i =1 j =1

logo 100 = (5 × 20) = 100 .

EXERCÍCIOS DO TÓPICO 3

1) Sendo, X = {7,3,9,5,6} e Y = {3,2,8,1,1} calcular:


a) ∑x
b) ∑y
c) ∑x 2

d) ∑y 2

e) ∑ xy
f) ∑ (x + 2)
g) ∑ (x + y )
h) ∑ (x − y )
i) (∑ x ) 2

x
j) ∑y

7
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

4. TABELAS ESTATÍSTICAS

A apresentação tabular é uma apresentação numérica dos dados. Consiste em dispor os dados em
linhas e colunas distribuídos de modo ordenado, segundo algumas regras práticas adotadas pelos diversos
sistemas estatísticos. As regras que prevalecem no Brasil foram fixadas pelo Conselho Nacional de
Estatística.

I - Tabela: é uma maneira de apresentar de forma resumida um conjunto de observações (dados). As tabelas
têm a vantagem de conseguir expor, organizadamente em um só local, os resultados sobre determinado
assunto, de modo a se obter uma visão global mais rápida daquilo que se pretende analisar.

Uma tabela compõe-se de: título, corpo [cabeçalho, colunas (indicadoras e numéricas)] e rodapé.

Título: O que? Quando? Onde?


Corpo  cabeçalho
da coluna coluna O cruzamento de linha com a coluna
Tabela indicadora Numérica chama-se casa ou célula.
Rodapé: fonte, notas, observações.

Principais elementos de uma Tabela

a) Titulo da Tabela: localizado no topo da tabela, deve conter informações, as mais completas
possíveis, respondendo às perguntas: O que?, Quando? e Onde?, além de conter a palavra
“TABELA” e sua respectiva numeração.

b) Corpo da tabela: é o conjunto de linhas e colunas que contém informações sobre a variável em
estudo, onde:
# na parte superior da tabela tem-se o cabeçalho da coluna, que especifica o conteúdo das colunas;
# verticalmente tem-se as colunas (indicadora e numérica), onde a coluna indicadora é aquela que
especifica o conteúdo das linhas e na coluna numérica os valores numéricos destas linhas.

c) Rodapé: localizado na parte inferior da Tabela (fora) e contém informações sobre o responsável pela
informação (FONTE), algum texto esclarecedor a cerca do conteúdo da tabela (NOTA) e por fim
algum símbolo remissível atribuído a algum elemento da tabela que necessite de uma nota
(CHAMADA).

Observações:
 Recomenda-se não delimitar (fechar) por traços verticais, os extremos da tabela, à direita e à
esquerda;
 Usa-se um traço horizontal ( - ) quando o dado for nulo, inexisti o fenômeno;
 Usa-se (...) quando não se dispuser dos dados, embora ele possa ser quantificado;
 Usa-se zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada.

È importante ressaltar que nesta apostila TODAS as FONTES das tabelas que serão apresentadas são
Fictícias, ou seja, dados não reais, que foram criados somente para ilustrar o conteúdo.

8
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

II - Séries Estatísticas: é um conjunto de dados estatísticos referenciados aos seguintes fatores: tempo,
local e fenômeno.
a) Série Temporal ou Cronológica: nesta série o elemento de variação é o tempo (dia, mês, ano, etc).
TABELA 01: Casos Registrados de Raiva na RMB no período de 2006 a 2008
Anos Quantidade
2006 10
2007 23
2008 38
Fonte: Fundação Nacional de Saúde, JAN/09.
b) Série Geográfica: o elemento de variação é o lugar (município, bairro, escola, etc...)
TABELA 02: Casos Registrados de Raiva por Bairro em Belém no Ano de 2008
Bairro Quantidade
Guamá 6
Pedreira 4
Marco 7
Jurunas 3
Fonte: Fundação Nacional de Saúde, JAN/09.
c) Série Especificativa: o elemento de variação é a espécie (material escolar, produto de uma fabrica,
remédios, etc.)
TABELA 03: Solicitação de Material de Expediente no Campus de Cametá - UFPA no 1º semestre de 2008.
Material Quantidade
Pincel Atômico 62
Resma de Papel 21
Caixa de Transparência 3
Fonte: Almoxarifado da UFPA, FEV/2009.
d) Série Mista: é a junção de duas ou mais séries simples (geográfica, especificativa ou temporal).
TABELA 04: Casos de Malária por Município no período de 2005 a 2008
Anos
Município 2005 2006 2007 2008
Abaetetuba 1 3 4 2
Barcarena 2 1 1 1
Belém 3 2 1 2
Cametá 1 2 1 1
Fonte: dados hipotéticos.
e) Séries de Dados Agrupados ou Distribuição de Freqüências
Neste caso TODOS os elementos são fixos (época, local e fenômeno). A distribuição de freqüência
pode ser por intervalo ou por pontos, dependendo da quantidade de informações que se tenha ou/e do tipo de
variável.

Distribuição de Freqüência por Intervalos


É uma série estatística na qual a variável observada está dividida em subintervalos do
intervalo total observado e o tempo, a espécie e a região permanecem fixos.

9
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

Exemplo de Distribuição de Freqüência por Intervalo:


TABELA 05: Tempo de Internação (em dias) de 160 pacientes no Hospital X no ano de 2008.
Tempo de Internação Número de pacientes Fi fri Fri Xi
(em dias) (fi)
1ª classe 10 |---- 20 38
2ª classe 20 |---- 30 45
3ª classe 30 |---- 40 30
4ª classe 40 |---- 50 22
5ª classe 50 |---- 60 10
6ª classe 60|---- 70 15
Σ 160
Fonte: Dados Hipotéticos
- Construção de Distribuições de Freqüências por Intervalos:
1O - Passo: montar o Rol (organizar os dados em ordem crescente ou decrescente).
2O - Passo: calcular a Amplitude Total da distribuição de freqüência (∆T), que é a diferença
existente entre o maior (Xmáximo) e o menor valor (Xminimo) observado.
∆T = X máximo − X mínimo
3O - Passo: Determinar o Número de Classes da Distribuição de Freqüência (K), que são os
subintervalos nos quais são contadas as observações da variável. Existem varias maneiras de se
calcular o número de classes, isto vai depende da sensibilidade do pesquisador. A seguir algumas
maneiras de se obter K:
1a - K = 1 + 3,322 log. N ⇒ fórmula de STURGES

2a - K = N

3a - K = ∆hT
Observação: sempre arredondar o valor de K seguindo as regras de arredondamento.
4O - Passo: calcular o intervalo de Classe ou Amplitude do Intervalo de Classe (h), que é o
comprimento da classe. (geralmente este valor é fornecido)
∆T
h= .
k
5O - Passo: Construção das Classes
1a Classe → Limite Inferior = menor valor do Rol
Limite Superior = Limite Inferior da 1a Classe + Valor do Intervalo de classe

2a Classe → Limite Inferior = Limite Superior da 1a Classe


Limite Superior = Limite Inferior da 2a Classe + Valor do Intervalo de classe
.....................................................................................................................................
....................................................................................................................................

10
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

ka Classe → Limite Inferior = Limite Superior da (k-1)a Classe


Limite Superior = Limite Inferior da ka Classe + Valor do Intervalo de classe
Convenção:
|----- inclui à esquerda e exclui à direita.
-----| exclui à esquerda e inclui à direita.
----- exclui ambos.
|-----| inclui ambos.
O
6 - Passo: obtenção da Freqüência Simples ou Freqüência Absoluta da Classe (fi), que é o
número de observações contadas dentro da classe.
Elementos secundários da distribuição de freqüência:

i) Frequência Absoluta acumulada de Classe (F): é a acumulação sucessiva , a partir da primeira


classe até uma classe qualquer, das freqüências simples ou absoluta das classes.
F1 = f1
F2 = f1 + f 2
...
Fk = f 1 + f 2 + ... + f k
ii)Frequência Relativa de Classe ( fr ): é a relação existente entre a freqüência absoluta ou simples
de classe e o número de observações da variável.

fr = ∑f f i

Obs.: 1º ⇒Σ fr = 1
2º ⇒ N = Σ f

iii)Freqüência Relativa Acumulada ( Fr ): é a acumulação sucessiva, a partir da primeira classe


até uma classe qualquer das freqüências relativas das classes.
Fr1 = f r1
Fr2 = f r1 + f r2
...
Frk = f r1 + f r 2 + ... + f rk
iv) Ponto Médio de Classe (Xi): é a média aritmética calculada entre o limite inferior (li) e o
superior (ls) da classe. É o valor em estatística que representa os valores da variável dentro da
classe.

X i = (l +2l )
i s

11
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

Distribuição de Freqüência por Pontos


É uma série estatística na quais as freqüências observadas estão associadas a um ponto real
observado. Na construção da distribuição por ponto, o numero linhas (classes) na tabela é igual ao
número de pontos existentes, e utilizam-se os mesmos elementos da distribuição por intervalo, com
a diferença que o próprio ponto já é o valor de X (ponto médio na distribuição por intervalo).

Exemplo de Distribuição de Freqüência por Pontos:


TABELA 06: Convulsões diárias em pacientes do Hospital W - Dezembro/2008
Convulsões Nº de Pacientes Fi fri Fri
(x) (f)
1º ponto 0 40
2º ponto 1 50
3º ponto 2 30
4º ponto 3 20
5º ponto 4 10
Σ 150
Fonte: Dados Hipotéticos

Observação: As séries de dados grupados (distribuição de freqüências por intervalos e por


pontos) são também chamadas de “séries de magnitude de variável”.

EXERCÍCIOS DO TÓPICO 4

1) Considere os seguintes dados, referentes ao peso de 30 crianças com sete anos, em kg:
13,00 13,63 14,10 14,10 14,70 15,35 15,54 16,00 16,00 16,30
17,40 17,40 17,70 17,70 17,90 17,90 18,20 18,35 19,10 19,30
19,50 19,70 20,00 20,32 20,50 21,45 21,50 22,00 22,25 24,00
Construa uma tabela de freqüências para os dados acima.

2) Para a Tabela (distribuição de freqüência) montada na questão 1 calcule as freqüências relativas, as


frequencias acumuladas simples e relativas e os pontos médios para todas as classes.

3) Pesquise dados referentes a saúde e monte exemplos de séries: especificativa, temporal, geográfica e
mista.

4) Utilize os dados da questão 1, desprezando as decimais, e monte uma distribuição de freqüência por
pontos.

12
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

5 – REPRESENTAÇÃO GRÁFICA

O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de
produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em
estudo, já que os gráficos falam mais rápido à compreensão que as séries.

I - REQUISITOS FUNDAMENTAIS DE UMA REPRESENTAÇÃO GRÁFICA:


a) Simplicidade  Deve ser destituída de detalhes de importância secundária, assim como de traços
desnecessários que possam levar o observador a uma análise morosa ou com
erros.

b) Clareza  Deve possibilitar uma correta interpretação dos valores representativos do fenômeno
em estudo.

c) Veracidade  Deve expressar a verdade sobre o fenômeno em estudo.

II –TIPOS DE GRÁFICOS:
a) Gráfico em linha ou em curva: Este tipo de gráfico utiliza a linha poligonal para representar a série
estatística. É muito utilizado para representar uma série temporal.
O gráfico em linha constitui uma aplicação do processo de representação das funções num sistema
de coordenadas cartesianas. Neste sistema faz-se uso de duas retas perpendiculares; as retas são os eixos
coordenados e o ponto de intersecção, a origem. O eixo horizontal é denominado eixo das abscissas (ou
eixo dos x) e o vertical, eixo das ordenadas (ou eixo dos y).

40

30
Quantidade

20

10

0
2006 2007 2008
Anos

Gráfico 01: Casos Registrados de Raiva na RMB no período de 2006 a 2008

b) Gráfico em coluna ou em barras: É a representação de uma série por meio de retângulos, dispostos
verticalmente (em colunas) ou horizontalmente (em barras).
Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos
dados. E Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos
respectivos dados.

13
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

Gráfico em Colunas (geralmente utilizado para representar uma série temporal)

40

30
Quantidade

20

10

0
2006 2007 2008
Anos

Gráfico 02: Casos Registrados de Raiva na RMB no período de 2006 a 2008

Gráfico em Barras (geralmente utilizado para representar uma série geográfica ou especificativa)

Jurunas

Pedreira
Bairro

Guamá

Marco

0 2 4 6 8
Quantidade

Gráfico 03: Casos Registrados de Raiva por Bairro em Belém no Ano de 2008
NOTAS:
 Sempre que os dizeres a serem inscritos forem extensos, deve-se dar preferência ao gráfico em barra
(séries geográficas e específicas). Se ainda assim preferir o gráfico em coluna, os dizeres deverão ser
dispostos de baixo para cima, nunca ao contrário.
 A ordem a ser observada é a cronológica, se a série for temporal, e a decrescente, se for geográfica
ou categórica(especificativa).
 A distância entre as colunas (ou barras), por questões estéticas, não deverá ser menor que a metade
nem maior que os dois terços da largura (ou da altura) dos retângulos.

14
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

c) Gráfico em coluna ou em barras múltiplas: Este tipo de gráfico é geralmente empregado quando deseja-
se representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação.
Gráfico em Barras Multiplas

Cameta

Belém 2008
Municipio

2007
2006
Barcarena 2005

Abaetetuba

0 1 2 3 4
Quantidade

Gráfico 04: Casos de Malária por Município no período de 2005 a 2008


Gráfico em colunas Multiplas
Municipio
4 Abaetetuba
Barcarena
Belém
3 Cameta
Quantidade

0
2005 2006 2007 2008

Anos

Gráfico 05: Casos de Malária por Município no período de 2005 a 2008

e)- Gráfico em setores: Este gráfico é construído com base em um círculo, e é empregado sempre que
deseja-se ressaltar a participação do dado no total.
O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes.
Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série.
Obtém-se cada setor por meio de uma regra de três simples e direta, lembrando que o total da série
corresponde a 360º.

15
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

Como exemplo utilize a Tabela 02 dos Casos Registrados de Raiva por Bairro em Belém no Ano de 2008,
insira uma coluna e calcule o percentual, conforme apresentado a seguir:
Bairro Quantidade %
Guamá 6 30
Pedreira 4 20
Marco 7 35
Jurunas 3 15
Total 20 100
Fonte: Fundação Nacional de Saúde, JAN/09.

Temos:
20 – 360º
6 – X1
X1 = 108 ⇒ X1 = 108º

X2= 92,2 ⇒ X2 = 92º, e assim por diante.

Com esses dados (valores em graus), marca-se num círculo de raio arbitrário, com um transferidor,
os arcos correspondentes, obtendo o gráfico:

jurunas
15% guama
30%

marco
35%
pedreira
20%

Gráfico 06: Percentual de Registrados de Raiva por Bairro em Belém no Ano de 2008
NOTAS:
 O gráfico em setores só deve ser empregado quando há, no máximo, sete dados.
 Se a série já apresenta os dados percentuais, obtêm-se os respectivos valores em graus
multiplicando o valor percentual por 3,6.

II – REPRESENTAÇÂO GRÀFICA DA DISTRIBUIÇÃO DE FREQÜÊNCIAS

a) Histograma: é a representação gráfica de uma distribuição de freqüência, por meio de retângulos


justapostos onde a base é colocada no eixo das abscissas corresponde ao intervalo das classes, e a altura é
dada pela freqüência absoluta (ou relativa) das classes.

16
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

50

45

40

35
Frequencia Simples

30

25

20

15

10

0
10 20 30 40 50 60 70
Tempo de Internações (dias)

Gráfico 07: Histograma do Tempo de Internação (em dias) de 160 pacientes no Hospital X no ano de 2008.

b) Polígono de Freqüência: é um outro tipo de apresentação bastante comum para dados quantitativos, ou
seja, é um sumário gráfico que pode ser preparado para dados que tenham sido sumariamente sintetizados
numa distribuição de freqüência. Utilizando-se os pontos médios de cada classe para a construção do mesmo,
ou seja, é um gráfico em linhas, sendo que as freqüências são marcadas no eixo vertical e no eixo horizontal
são colocados os pontos médios dos intervalos de cada classe.

50

45

40

35
Frequencia Simples

30

25

20

15

10

0
5 15 25 35 45 55 65 75
Tempo de Internações (dias)

Gráfico 08: Polígono de Freqüência do Tempo de Internação (em dias) de 160 pacientes no Hospital X no ano de 2008.

EXERCÍCIOS DO TÓPICO 5

1. Para as Tabelas montadas nas questões 01 e 03 dos Exercícios do Tópico 2 faça um gráfico
apropriado para cada tabela.

17
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

6 – MEDIDAS DE TENDÊNCIA CENTRAL.

Torna-se necessário, após a tabulação dos resultados e da representação gráfica, encontrar valores que
possam representar a distribuição como um todo. São as chamadas medidas de tendência central ou medidas
de posição.

a) MÉDIA ARITMÉTICA ( X ): consiste em somar todas as observações ou medidas dividindo-se o


resultado pelo número total de valores.

Observação: têm-se duas formas de calcular uma média aritmética:

1 – Média Aritmética de dados brutos (dados não organizados em tabelas de freqüência):


n
∑ xi
x1 + x 2 +L+ x n
X= n
= i =n1

Exemplo 1: Calcule a pressão arterial diastólica média das 5 pessoas do sexo feminino, cujo os dados são X
= {81, 84, 68, 91, 80}.

∑(f )
n

i × xi
2 - Média Aritmética de dados tabulados: X = i =1
n

∑f
i =1
i

n
onde : fi = freqüência simples e a ∑f
i =1
i = n (número total de informações)

Observação: se os valores forem distribuídos em classes o Xi será o ponto médio de cada classe.

a) MEDIANA (Me): é o valor central em um rol, ou seja, a mediana de um conjunto de valores ordenados,
ou ainda a mediana divide a distribuição ao meio.

1- mediana de valores brutos

 Ordenar os valores em ordem crescente (Rol);


 Verifica se o número de elementos é par ou ímpar;
 Se n for ímpar, posição da mediana no conjunto, será o valor localizado na posição dada por:
P= n +1 ;
2
 Se n for par, o conjunto terá dois valores centrais, neste caso, a mediana será igual à média
aritmética dos valores centrais, cujas posições são dadas por:
P1 = n / 2 e P2 = (n / 2) + 1

Exemplo 1: calcule a mediana dos valores: 2 ; 5; 7; 15; 13; 4; 10.


 Rol: 2; 4; 5; 7; 10; 13; 15.
 n = 7 (ímpar)
 Posição da mediana: P = (7 + 1) / 2 = 4
 Me = 7

Exemplo 2: Em um grupo de 6 pessoas cujas as alturas medidas em centímetros fossem as seguintes: 183
cm, 170 cm, 165 cm, 180 cm, 185 e 160 cm, qual a altura mediana deste grupo de pessoas?

18
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

2 - Mediana de valores tabelados

• Localiza-se primeiro, por meio da frequencia acumulada, a posição (P) da mediana na tabela:
P = (Σfi / 2) → F

 n f 
 i∑ i 
• Calcula-se o valor da mediana por =1
 2 − FAA 
Me = l i +  ×h
fi
 
 
 
onde:
li = Limite inferior da classe da mediana;
Faa = Freqüência acumulada anterior da classe da Me;
fi = Freqüência simples da classe da mediana;
h = Intervalo de classe.

Observação: a mediana é muito empregada em pesquisas onde não interessam valores extremos, por terem
pouca significação para o conjunto em geral.

c) MODA (Mo): é aquilo que está em evidencia, o valor que mais aparece num conjunto de informações ou
o de maior freqüência em uma tabela.

Observação: a moda pode não ser única ou ate mesmo pode não existir.

1 - Moda de valores brutos: basta observar o valor que mais aparece no conjunto.
Exemplo: 3 ; 3 ; 6 ; 8 ; 10 ; 10; 10; 11; 11; 12 → Mo = 10.

2 - Moda de valores tabelados:


a) Moda Bruta: é ponto médio da classe de maior frequencia simples. Denomina-se de classe modal à classe
que possui maior freqüência simples numa distribuição de frequencia.
 f Mo − f ant 
Mo = l i +  ×h
b) Moda pelo processo de Czuber →
(
 2 f Mo − f ant + f post )
onde:
li = Limite inferior da classe modal;
fpost = Freqüência simples posterior à classe modal;
fant = Freqüência simples anterior à classe modal;
h = Intervalo de classe;
fMO = Freqüência modal.

3 Me − M o
Observação: É valida a seguinte relação empírica x= 2

EXERCÍCIOS DO TÓPICO 6

01. Para a Tabela 05, que apresenta o tempo de internação (em dias) de 160 pacientes no Hospital X no ano de
2008. Pede-se:
a) O tempo médio de internação;
b) O percentual de pacientes que permaneceram 2 meses ou mais internados;
c) O tempo de internação mediano;
d) O tempo de internação mais frequente, pelo processo de Czuber.

19
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

07 – MEDIDAS SEPARATRIZES.

a) Quartis (Qi): são os valores que dividem um conjunto de dados em quatro partes iguais, representados por
Q1, Q2 e Q3 denominam-se primeiro, segundo e terceiro quartis, respectivamente, sendo o valor de Q2 igual à
mediana. Assim, temos;

0% ----------------- 25% ----------------- 50% ----------------- 75% ----------------- 100%


Q1 Q2 Q3

A formula para determinação dos quartis para dados agrupados é semelhante à usada para o cálculo da
mediana.

Determinação de Qi:
n
i× ∑ f i
1º passo: calcula-se a posição p = i =1 ;
4
2º passo: identifica-se a classe Qi pela coluna das Freqüências Acumuladas;
3º passo: Aplica-se a fórmula:
 i× ∑ f i 
n

 i = 1 − Faa 
Q i = l iQ i + 4 ×h
 f iQ i 
 
onde:
i = Ordem do quartil, i =1 ou 2 ou 3;
liQi = Limite inferior da classe do quartil de ordem i.
Faa = Freqüência acumulada anterior da classe do quartil de ordem i;
fiQi = Freqüência simples da classe do quartil de ordem i;
h = Intervalo de classe.

Exemplo: considerando a tabela abaixo, calcule o Q1, Q2 e Q3.

Tabela 07: Idades dos pacientes do Hospital X no ano de 2008


IDADES fi
17 |-- 19 8
19 |-- 21 12
21 |-- 23 20
23 |-- 25 6
25 |-- 27 4
Soma 50
Fonte: dados hipotéticos

b) Decis (Di): são as medidas separatrizes que dividem a série em 10 partes iguais, e são representadas por
D1, D2, ...,D9. O quinto decil corresponde à mediana.

0% ----- 10% ---- 20% ---- 30% ---- 40% ---- 50% ----- 60% ---- 70% ---- 80% ---- 90% ---- 100%
D1 D2 D3 D4 D5 D6 D7 D8 D9

A formula, neste caso, é semelhante à das separatrizes anteriores.

20
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

Determinação de Di:
n
i× ∑ f i
1º passo: calcula-se a posição p = i =1 , onde i = 1,2,3,4,5,6,7,8 e 9.
10
2º passo: identifica-se a classe Di pela Freqüência acumulada.
3º Passo: aplica-se a fórmula:
 i× ∑ fi 
n

 i =1 − Faa 
D i = l iD i +  10 ×h
 f iD i 
 
onde:
i = Ordem do decil, i =1; 2; 3; 4; 5; 6; 7; 8 ou 9;
liDi = Limite inferior da classe do decil de ordem i.
Faa = Freqüência acumulada anterior da classe do decil de ordem i;
fiDi = Freqüência simples da classe do decil de ordem i;
h = Intervalo de classe.

Exemplo: Considerando a Tabela 07, calcule o D3.

c) Percentis (Pi): são as medidas separatrizes que dividem a série em 100 partes iguais, e são representadas
por P1, P2, ...,P99. O qüinquagésimo centil corresponde à mediana.

0% ---- 1% ---- 2% ---- 3% ---- ---- ---- 50% ---- ---- ---- 97% ---- 98% ---- 99% ---- 100%
P1 P2 P3 P50 P97 P98 P99

A formula, neste caso, é semelhante à das separatrizes anteriores.

Determinação de Pi:
n
i× ∑ fi
1º passo: calcula-se a posição p = 100 i =1
, onde i = 1,2,3,...,97,98 e 99.
2º passo: identifica-se a classe de Pi pela Freqüência acumulada.
3º Passo: aplica-se a fórmula:
 i×∑ f i 
n

 i = 1 − Faa 
Pi = l iPi +  100 ×h
 f iPi 
 
onde:
Ordem do percentil, i =1; 2; 3; 4; 5; 6; 7; 8 ou 9;
i =
Limite inferior da classe do percentil de ordem i.
liPi =
Freqüência acumulada anterior da classe do percentil de
Faa =
ordem i;
fiPi =
Freqüência simples da classe do percentil de ordem i;
h =
Intervalo de classe.

Exemplo: Considerando a Tabela 07, calcule o P5.

21
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

08– MEDIDAS DE DISPERSÃO OU VARIABILIDADE.

São as medidas que determinam o comportamento dos valores em termos de variabilidade.

a) DESVIO MÉDIO: é a média dos valores absolutos dos desvios dos dados a partir de um valor de
tendência central.

1 - Desvio médio de valores brutos


n
∑ ( xi − x )
DM = i = 1
n
Exemplo 1: calcule o desvio médio de 4, 2,3, 5 e 1

2 - Desvio médio de valores tabelados

n
∑ [ ( xi − x ) . f i ]
n
DM = i = 1 , onde : ∑ fi = n
n
∑ fi i =1
i =1

Exemplo 2: calcule o desvio médio da distribuição dada pela Tabela 07.

b) VARIÂNCIA OU VARIÂNCIA ABSOLUTA: é a média quadrática das somas dos desvios em relação
à média aritmética.

Símbolo ⇒ S2 (amostra) ou σ2 (população)

1- Fórmula para dados brutos

Processo longo Processo breve ou simplificado


n n 2
∑ ( xi − x ) 2
2
∑ xi − nx
S2 = i =1
n −1 S2 = i =1
n −1

Observação: quando se tratar de população, dividi-se apenas por “N”.

Exemplo 3: calcular a variância dos valores amostrais: 4, 2, 3, 5 e 1.

2 - Fórmula para dados tabelados:

Processo longo Processo breve ou simplificado


n n 2
∑ [( xi − x ) . fi ] 2
2
∑ xi f i − nx
S2 = i = 1
n −1 S2 = i =1
n −1

Observação: quando se trata de população dividi-se apenas por “n”.

Exemplo 4: calcule a variância da distribuição dada pela Tabela 07.

22
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

PROPRIEDADES DA VARIÂNCIA:

a) A variância absoluta de uma constante é igual a zero;

b) Somando-se ou diminuindo-se a todos os valores da série um valor constante K ≠ 0, a nova variância será
igual a anterior, isto é, não se altera.

c) Multiplicando-se ou dividindo-se todos os valores de uma série por um valor constante, K ≠ 0, a nova
variância calculada será igual à variância absoluta original multiplicada ou dividida pelo quadrado da
constante utilizada.

c) DESVIO PADRÃO OU AFASTAMENTO PADRÃO: é a raiz quadrada da variância; assim:

S = S 2 , é o desvio padrão amostral.

σ = σ 2 , é o desvio padrão populacional.

Resumindo: para o cálculo do desvio padrão, deve-se primeiramente determinar o valor da variância e, em
seguida, extrair a raiz quadrada desse resultado.

Exemplo 5: calcular o desvio padrão amostral dos valores: 2, 4, 5, 3 e 1.

Exemplo 6: calcule o desvio padrão amostral da distribuição dada pela Tabela 07.

d) COEFICIENTE DE VARIAÇÃO: é o valor positivo da raiz quadrada da variância relativa.

CV = S × 100
X

Observação 1: Será considerada a série mais homogênea, aquela que apresentar menor valor do coeficiente
de variabilidade.

Observação 2: é uma medida estatística que serve para avaliar a homogeneidade de séries estatísticas, que é
o grau de concentração dos valores observados em torno da sua média aritmética.

Exemplo 7: calcule o coeficiente de variação da distribuição dada pela Tabela 07.

EXERCÍCIOS DO TÓPICO
1. Com a Tabela abaixo, responda o que se pede:
Tempo de Internação (em dias) de 160 pacientes no Hospital
X no ano de 2008.
Tempo de Internação Número de pacientes
(em dias) (fi)
10 |---- 20 38
20 |---- 30 45
30 |---- 40 30
40 |---- 50 22
50 |---- 60 10
60|---- 70 15
Σ 160
Fonte: Dados Hipotéticos
a) O desvio padrão do tempo de internação;
b) O coeficiente de variação;

23
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

EXERCÍCIOS EXTAS

1. Construa uma tabela apropriada para mostrar que o número de pacientes atendidos em um
consultório pela parte da manhã, tarde e noite era, respectivamente, 40, 35 e 29 em Fevereiro e
42, 48 e 50 em Março de 2008.

2. Que tipo de tabela (série) você construiu no exercício 1?

3. Construa uma série temporal para mostrar a quantidade de pacientes atendidos no Hospital WH
no período de 2002 a 2008: 40690; 41372; 42764; 42869; 43572; 43268; 44345,
respectivamente.

4. Construa uma série geográfica para representar os estabelecimentos de ensino na região norte do
Brasil em 2002. Esta região subdivide-se em: Pará; Amazonas; Acre; Rondônia; Roraima e
Amapá e possuíam um total de 250, 240, 142, 134, 168 e 92 estabelecimentos respectivamente.

5. Identifique e esboce um gráfico apropriado para a tabela do exercício 1.

6. Identifique e esboce um gráfico apropriado para a tabela do exercício 3.

7. Identifique e esboce um gráfico apropriado para a tabela do exercício 4.

8. Os dados abaixo se referem às notas escolares de 60 alunos do Curso de Biometria do turno da


tarde da Universidade Federal WXH no primeiro semestre de 2008.
3 3 3 3 3 3 4 4 4 5 5 5 5 5 5 5 5 5 6 6
6 6 6 6 7 7 8 8 8 8 9 9 9 9 9 9 4 5 5 7
8 9 4 5 5 7 8 10 4 5 6 7 8 10 4 5 6 7 9 10
Com base nos dados acima pede-se:
a) Montar uma tabela de distribuição de freqüência por intervalo para as notas escolares;
b) Construa um histograma e um polígono de freqüência simples para a distribuição por
intervalo;
c) Calcule as freqüências simples, relativas, acumuladas e ponto médio para a distribuição de
freqüência por intervalo;
d) A nota média destes alunos;
e) A variabilidade individual.

24
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS

9. A partir da tabela montada da questão 08 determine:


a) a nota média ;
b) O terceiro Quartil;
c) a moda pelo processo de Czuber;
d) a mediana;
e) a amplitude total da distribuição;
f) o desvio padrão;
g) o coeficiente de variação.

10. A Tabela abaixo se refere Pressão Arterial de 40 pacientes atendidos no


Hospital WXS no mês de Março de 2008
Pressão Arterial fi
83 |--- 84 8
84 |--- 85 9
85 |--- 86 6
86 |--- 87 4
87 |--- 88 7
88 |--- 89 6
Total 40
Pede-se:
b) A amplitude total;
c) O número de pacientes com pressão arterial igual ou superior a 87;
d) A pressão média destes 40 pacientes;
e) Pressão Arterial central destes 40 escolas;
f) A Pressão Arterial mais freqüente destes 40 pacientes (por Czuber);
g) O desvio padrão.

11 – Dada a distribuição de freqüência abaixo, calcular:

a) os pontos médios;
b) as freqüências acumuladas;
c) a estatura média (Média); Estaturas fi
1,45 |----- 1,55 2
d) a estatura mais evidente (Moda); 1,55 |----- 1,65 4
e) a estatura central (Mediana); 1,65 |----- 1,75 8
1,75 |----- 1,85 4
f) a variância das estaturas; 1,85 |-----| 1,95 2
g) o coeficiente de variação.

25

Você também pode gostar