Escolar Documentos
Profissional Documentos
Cultura Documentos
SÚMULA
Estatística descritiva; Tabelas e gráficos; Medidas descritivas; Conceitos Fundamentais – Tabelas Estatísticas
– Representação Gráfica – Propriedades do Somatório - Arredondamento de Números – Distribuição de
Freqüência – Medidas de Tendência Central: Média, Moda e Mediana – Medidas Separatrizes: Quartil, Decil
e Percentil – Medidas de Dispersão ou Variabilidade: Variância, Desvio Padrão e Coeficiente de Variação.
Tipo de Variáveis.
PROGRAMA
REFERÊNCIAS BIBLIOGRÁFICAS:
1. BUSSAB, W. e MORETTIN, P. A. Estatística básica. Editora Saraiva. 5ª Edição. 2005.
2. IBGE. Centro.Normas de Apresentação Tabular – 3 ed. – Rio de Janeiro, 1993. 62 p.
3. MARTINS, G. de Andrade e DONEIRE, Denis – Princípios de Estatística – Editora Atlas.
4. SPIEGEL, Murray – Estatística – Coleção Schaum – Editora Mc Grawhil do Brasil, 1985.
5. TOLEDO, G. L. e OVALLE I. I. Estatística básica. São Paulo: Atlas. 1987
1
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
Introdução
Os métodos estatísticos destacam-se cada vez mais como estratégias de solução para problemas, na
área de pesquisa médica, nas quais se podem citar Estudos de Bioequivalência, Bioestatística,
Análise de Sobrevivência e Epidemiologia, dentre outros. Além disso, tem ocorrido notável
utilização da Estatística no controle de processos de indústrias farmacêuticas e na implementação de
projetos de melhoria de qualidade em hospitais e clínicas. Neste sentido, a Estatística é atualmente
um recurso essencial para a divulgação de resultados de pesquisas da área médica. Não só na
análise dos dados, mas também como uma forma de planejamento de estudos clínicos, que
constituem uma poderosa ferramenta de investigação científica para a avaliação de intervenções na
saúde. Isto se dá desde a análise descritiva mais simples até as modelagens e técnicas Multivariada
mais complexas.
1.1 - Estatística
É a ciência que se preocupa com coleta, análise, interpretação e apresentação dos dados,
permitindo-nos a obtenção de conclusões válidas a partir destes dados, bem como a tomada de
decisões razoáveis baseadas nessas conclusões.
1.3 - Censo
É a coleta exaustiva das informações de todas as “N” unidades da população.
2
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
1.4 - Amostra
É um subconjunto, uma parte selecionada da totalidade de observações abrangidas pela
população da qual se quer inferir alguma coisa.
a) Amostra Aleatória, Casual ou Randônica: é amostra obtida sem a interferência externa, onde
cada unidade da população tem a mesma chance de ser incluída na amostra.
1.5 - Amostragem
É o processo (método) de coleta das informações da amostra, mediante métodos adequados
de seleção destas unidades.
1.6 - Experimento Aleatório
É quando efetuamos um experimento repetidas vezes, sob condições praticamente idênticas,
e obtemos resultados que não são essencialmente os mesmos.
1.7 - Variável
É o conjunto de resultados possíveis de um fenômeno (resposta), ou ainda são as
propriedades (características) dos elementos da população que se pretende conhecer.
No min al
Qualitativ a
Ordinal
var iável
Discreta
Quantitati va
Continua
1.7.1 - Variáveis Qualitativas ou Categóricas
É quando se obtém como resposta palavras. Se existir uma ordem natural nas respostas, se
diz que a variável é qualitativa ordinal, caso contrario, ela é dita variável qualitativa nominal.
Exemplos:
a) Presença ou ausência de um sintoma;
b) Adesão ao tratamento (completa, parcial, contraria);
c) Classificação da dor segundo a intensidade (pouca, média e grande);
d) Sexo de um paciente.
3
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
1.8 – Parâmetro: valor singular que existe na população e que serve para caracterizá-la. Em geral,
é representado por letra grega.
Exemplos: média populacional ( µ ) e variância populacional ( σ 2).
∑x i
X = i =1
, i = 1,2, L , n.
n
EXERCÍCIOS DO TÓPICO 1
4
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
2. ARREDONDAMENTO DE NÚMEROS
Quando for conveniente ou necessário suprimir unidades inferiores às de determinada
ordem, utiliza-se a técnica do arredondamento de dados. Neste sentido, de acordo com a resolução
886/66 da Fundação IBGE, o arredondamento deve ser feito utilizando uma das seguintes regras
mostradas a seguir.
Regra 1 - Quando o primeiro algarismo a ser abandonado for: 0, 1, 2, 3 e 4. Fica inalterado o último
algarismo a permanecer. Por exemplo, arredondar para uma casa decimal os números:
53,24 → 53,2; 88,01 → 80,0; 10,43 → 10,4
Quando se tem várias parcelas de percentagens ou taxas que sofreram arredondamento, a soma
provavelmente não dará 100%, faltando ou sobrando alguns décimos. Neste caso, torna-se necessário fazer o
ajustamento do total até chegar a 100 %. O critério recomendado é adicionar ou subtrair – conforme o caso –
a falta ou excesso à parcela maior. Isto porque a parcela maior ficará menos desfigurada, quando ajustada
com alguns décimos, que outra parcela qualquer.
EXERCÍCIOS DO TÓPICO 2
5
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
3. PROPRIEDADES DO SOMATÓRIO
∑x
i =1
i = x1 + x 2 + ... + x n .
a) O somatório de uma constante é igual ao produto do número de termos do somatório pela constante,
n
isto é ∑ k = k + k + ... + k = nk.
i =1
5
Exemplo: ∑10 = 10 + 10 + 10 + 10 + 10 = 5 × 10 = 50
i =1
b) O Somatório do produto de uma constante por uma variável que depende do somatório é igual ao
n n
produto da constante pelo somatório da variável, ou seja ∑ k xi = k ∑ xi .
i =1 i =1
n
Exemplo: Seja x = {4,5,2,3,7} e k = 3 , então ∑ kx i = 3 × 21 = 63
i =1
n n n
c) Propriedade Distributiva com relação à adição, isto é ∑ ( xi + y i ) = ∑ x i + ∑ y i .
i =1 i =1 i =1
∑ ( xi + y i ) = ∑ x i + ∑ y i
i =1 i =1 i =1
= 53 + 17 = 70.
n n n
d) Propriedade Distributiva com relação à subtração, isto é ∑ ( xi − y i ) = ∑ xi − ∑ y i .
i =1 i =1 i =1
∑ ( xi − y i ) = ∑ xi − ∑ y i
i =1 i =1 i =1
= 35 − 37 = −2.
2
n n
e) O quadrado da soma é diferente da soma dos quadrados, ou seja ∑ xi ≠ ∑ xi2 .
i =1 i =1
2
3 3
Exemplo: Seja x = {7,6,2} então ∑ xi = (15) = 225 ∑x = 89.
2 2
e i
i =1 i =1
2
3 3
Portanto ∑ xi ≠ ∑ xi2 .
i =1 i =1
n n n
f) O Produto de duas somas é diferente da soma dos produtos, isto é ∑ xi × ∑ yi ≠ ∑ (xi × yi ).
i =1 i =1 i =1
4
Exemplo: Seja x = {3,5,7,9} e y = [2,1,8,10] então ∑ ( xi × y i ) = 157 e
i =1
4 4
∑ xi ∑ yi = 24 × 21 = 504
i =1 i =1
6
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
n
xi ∑x i
∑ yi
≠ i =1
n
i =1
∑y
i =1
i
4 ∑x i
y = [3,4,5,7] , como ∑ i = 8 e
x
Exemplo: Seja x = {6,8,10,14}
38
e i =1
4
= = 2 , logo 8 ≠ 2.
i =1 y i 19
∑y
i =1
i
∑∑ xi y j = ∑ xi × ∑ y j
i =1 j =1 i =1 j =1
2 3 2 3
Exemplo: Seja x = {2,3} e y = [4,7,9] , como ∑∑ xi y j = 100 , ∑ xi = 5 e ∑y j = 20 ,
i =1 j =1 i =1 j =1
EXERCÍCIOS DO TÓPICO 3
d) ∑y 2
e) ∑ xy
f) ∑ (x + 2)
g) ∑ (x + y )
h) ∑ (x − y )
i) (∑ x ) 2
x
j) ∑y
7
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
4. TABELAS ESTATÍSTICAS
A apresentação tabular é uma apresentação numérica dos dados. Consiste em dispor os dados em
linhas e colunas distribuídos de modo ordenado, segundo algumas regras práticas adotadas pelos diversos
sistemas estatísticos. As regras que prevalecem no Brasil foram fixadas pelo Conselho Nacional de
Estatística.
I - Tabela: é uma maneira de apresentar de forma resumida um conjunto de observações (dados). As tabelas
têm a vantagem de conseguir expor, organizadamente em um só local, os resultados sobre determinado
assunto, de modo a se obter uma visão global mais rápida daquilo que se pretende analisar.
Uma tabela compõe-se de: título, corpo [cabeçalho, colunas (indicadoras e numéricas)] e rodapé.
a) Titulo da Tabela: localizado no topo da tabela, deve conter informações, as mais completas
possíveis, respondendo às perguntas: O que?, Quando? e Onde?, além de conter a palavra
“TABELA” e sua respectiva numeração.
b) Corpo da tabela: é o conjunto de linhas e colunas que contém informações sobre a variável em
estudo, onde:
# na parte superior da tabela tem-se o cabeçalho da coluna, que especifica o conteúdo das colunas;
# verticalmente tem-se as colunas (indicadora e numérica), onde a coluna indicadora é aquela que
especifica o conteúdo das linhas e na coluna numérica os valores numéricos destas linhas.
c) Rodapé: localizado na parte inferior da Tabela (fora) e contém informações sobre o responsável pela
informação (FONTE), algum texto esclarecedor a cerca do conteúdo da tabela (NOTA) e por fim
algum símbolo remissível atribuído a algum elemento da tabela que necessite de uma nota
(CHAMADA).
Observações:
Recomenda-se não delimitar (fechar) por traços verticais, os extremos da tabela, à direita e à
esquerda;
Usa-se um traço horizontal ( - ) quando o dado for nulo, inexisti o fenômeno;
Usa-se (...) quando não se dispuser dos dados, embora ele possa ser quantificado;
Usa-se zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada.
È importante ressaltar que nesta apostila TODAS as FONTES das tabelas que serão apresentadas são
Fictícias, ou seja, dados não reais, que foram criados somente para ilustrar o conteúdo.
8
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
II - Séries Estatísticas: é um conjunto de dados estatísticos referenciados aos seguintes fatores: tempo,
local e fenômeno.
a) Série Temporal ou Cronológica: nesta série o elemento de variação é o tempo (dia, mês, ano, etc).
TABELA 01: Casos Registrados de Raiva na RMB no período de 2006 a 2008
Anos Quantidade
2006 10
2007 23
2008 38
Fonte: Fundação Nacional de Saúde, JAN/09.
b) Série Geográfica: o elemento de variação é o lugar (município, bairro, escola, etc...)
TABELA 02: Casos Registrados de Raiva por Bairro em Belém no Ano de 2008
Bairro Quantidade
Guamá 6
Pedreira 4
Marco 7
Jurunas 3
Fonte: Fundação Nacional de Saúde, JAN/09.
c) Série Especificativa: o elemento de variação é a espécie (material escolar, produto de uma fabrica,
remédios, etc.)
TABELA 03: Solicitação de Material de Expediente no Campus de Cametá - UFPA no 1º semestre de 2008.
Material Quantidade
Pincel Atômico 62
Resma de Papel 21
Caixa de Transparência 3
Fonte: Almoxarifado da UFPA, FEV/2009.
d) Série Mista: é a junção de duas ou mais séries simples (geográfica, especificativa ou temporal).
TABELA 04: Casos de Malária por Município no período de 2005 a 2008
Anos
Município 2005 2006 2007 2008
Abaetetuba 1 3 4 2
Barcarena 2 1 1 1
Belém 3 2 1 2
Cametá 1 2 1 1
Fonte: dados hipotéticos.
e) Séries de Dados Agrupados ou Distribuição de Freqüências
Neste caso TODOS os elementos são fixos (época, local e fenômeno). A distribuição de freqüência
pode ser por intervalo ou por pontos, dependendo da quantidade de informações que se tenha ou/e do tipo de
variável.
9
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
2a - K = N
3a - K = ∆hT
Observação: sempre arredondar o valor de K seguindo as regras de arredondamento.
4O - Passo: calcular o intervalo de Classe ou Amplitude do Intervalo de Classe (h), que é o
comprimento da classe. (geralmente este valor é fornecido)
∆T
h= .
k
5O - Passo: Construção das Classes
1a Classe → Limite Inferior = menor valor do Rol
Limite Superior = Limite Inferior da 1a Classe + Valor do Intervalo de classe
10
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
fr = ∑f f i
Obs.: 1º ⇒Σ fr = 1
2º ⇒ N = Σ f
X i = (l +2l )
i s
11
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
EXERCÍCIOS DO TÓPICO 4
1) Considere os seguintes dados, referentes ao peso de 30 crianças com sete anos, em kg:
13,00 13,63 14,10 14,10 14,70 15,35 15,54 16,00 16,00 16,30
17,40 17,40 17,70 17,70 17,90 17,90 18,20 18,35 19,10 19,30
19,50 19,70 20,00 20,32 20,50 21,45 21,50 22,00 22,25 24,00
Construa uma tabela de freqüências para os dados acima.
3) Pesquise dados referentes a saúde e monte exemplos de séries: especificativa, temporal, geográfica e
mista.
4) Utilize os dados da questão 1, desprezando as decimais, e monte uma distribuição de freqüência por
pontos.
12
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
5 – REPRESENTAÇÃO GRÁFICA
O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de
produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em
estudo, já que os gráficos falam mais rápido à compreensão que as séries.
b) Clareza Deve possibilitar uma correta interpretação dos valores representativos do fenômeno
em estudo.
II –TIPOS DE GRÁFICOS:
a) Gráfico em linha ou em curva: Este tipo de gráfico utiliza a linha poligonal para representar a série
estatística. É muito utilizado para representar uma série temporal.
O gráfico em linha constitui uma aplicação do processo de representação das funções num sistema
de coordenadas cartesianas. Neste sistema faz-se uso de duas retas perpendiculares; as retas são os eixos
coordenados e o ponto de intersecção, a origem. O eixo horizontal é denominado eixo das abscissas (ou
eixo dos x) e o vertical, eixo das ordenadas (ou eixo dos y).
40
30
Quantidade
20
10
0
2006 2007 2008
Anos
b) Gráfico em coluna ou em barras: É a representação de uma série por meio de retângulos, dispostos
verticalmente (em colunas) ou horizontalmente (em barras).
Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos
dados. E Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos
respectivos dados.
13
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
40
30
Quantidade
20
10
0
2006 2007 2008
Anos
Gráfico em Barras (geralmente utilizado para representar uma série geográfica ou especificativa)
Jurunas
Pedreira
Bairro
Guamá
Marco
0 2 4 6 8
Quantidade
Gráfico 03: Casos Registrados de Raiva por Bairro em Belém no Ano de 2008
NOTAS:
Sempre que os dizeres a serem inscritos forem extensos, deve-se dar preferência ao gráfico em barra
(séries geográficas e específicas). Se ainda assim preferir o gráfico em coluna, os dizeres deverão ser
dispostos de baixo para cima, nunca ao contrário.
A ordem a ser observada é a cronológica, se a série for temporal, e a decrescente, se for geográfica
ou categórica(especificativa).
A distância entre as colunas (ou barras), por questões estéticas, não deverá ser menor que a metade
nem maior que os dois terços da largura (ou da altura) dos retângulos.
14
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
c) Gráfico em coluna ou em barras múltiplas: Este tipo de gráfico é geralmente empregado quando deseja-
se representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação.
Gráfico em Barras Multiplas
Cameta
Belém 2008
Municipio
2007
2006
Barcarena 2005
Abaetetuba
0 1 2 3 4
Quantidade
0
2005 2006 2007 2008
Anos
e)- Gráfico em setores: Este gráfico é construído com base em um círculo, e é empregado sempre que
deseja-se ressaltar a participação do dado no total.
O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes.
Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série.
Obtém-se cada setor por meio de uma regra de três simples e direta, lembrando que o total da série
corresponde a 360º.
15
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
Como exemplo utilize a Tabela 02 dos Casos Registrados de Raiva por Bairro em Belém no Ano de 2008,
insira uma coluna e calcule o percentual, conforme apresentado a seguir:
Bairro Quantidade %
Guamá 6 30
Pedreira 4 20
Marco 7 35
Jurunas 3 15
Total 20 100
Fonte: Fundação Nacional de Saúde, JAN/09.
Temos:
20 – 360º
6 – X1
X1 = 108 ⇒ X1 = 108º
Com esses dados (valores em graus), marca-se num círculo de raio arbitrário, com um transferidor,
os arcos correspondentes, obtendo o gráfico:
jurunas
15% guama
30%
marco
35%
pedreira
20%
Gráfico 06: Percentual de Registrados de Raiva por Bairro em Belém no Ano de 2008
NOTAS:
O gráfico em setores só deve ser empregado quando há, no máximo, sete dados.
Se a série já apresenta os dados percentuais, obtêm-se os respectivos valores em graus
multiplicando o valor percentual por 3,6.
16
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
50
45
40
35
Frequencia Simples
30
25
20
15
10
0
10 20 30 40 50 60 70
Tempo de Internações (dias)
Gráfico 07: Histograma do Tempo de Internação (em dias) de 160 pacientes no Hospital X no ano de 2008.
b) Polígono de Freqüência: é um outro tipo de apresentação bastante comum para dados quantitativos, ou
seja, é um sumário gráfico que pode ser preparado para dados que tenham sido sumariamente sintetizados
numa distribuição de freqüência. Utilizando-se os pontos médios de cada classe para a construção do mesmo,
ou seja, é um gráfico em linhas, sendo que as freqüências são marcadas no eixo vertical e no eixo horizontal
são colocados os pontos médios dos intervalos de cada classe.
50
45
40
35
Frequencia Simples
30
25
20
15
10
0
5 15 25 35 45 55 65 75
Tempo de Internações (dias)
Gráfico 08: Polígono de Freqüência do Tempo de Internação (em dias) de 160 pacientes no Hospital X no ano de 2008.
EXERCÍCIOS DO TÓPICO 5
1. Para as Tabelas montadas nas questões 01 e 03 dos Exercícios do Tópico 2 faça um gráfico
apropriado para cada tabela.
17
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
Torna-se necessário, após a tabulação dos resultados e da representação gráfica, encontrar valores que
possam representar a distribuição como um todo. São as chamadas medidas de tendência central ou medidas
de posição.
Exemplo 1: Calcule a pressão arterial diastólica média das 5 pessoas do sexo feminino, cujo os dados são X
= {81, 84, 68, 91, 80}.
∑(f )
n
i × xi
2 - Média Aritmética de dados tabulados: X = i =1
n
∑f
i =1
i
n
onde : fi = freqüência simples e a ∑f
i =1
i = n (número total de informações)
Observação: se os valores forem distribuídos em classes o Xi será o ponto médio de cada classe.
a) MEDIANA (Me): é o valor central em um rol, ou seja, a mediana de um conjunto de valores ordenados,
ou ainda a mediana divide a distribuição ao meio.
Exemplo 2: Em um grupo de 6 pessoas cujas as alturas medidas em centímetros fossem as seguintes: 183
cm, 170 cm, 165 cm, 180 cm, 185 e 160 cm, qual a altura mediana deste grupo de pessoas?
18
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
• Localiza-se primeiro, por meio da frequencia acumulada, a posição (P) da mediana na tabela:
P = (Σfi / 2) → F
n f
i∑ i
• Calcula-se o valor da mediana por =1
2 − FAA
Me = l i + ×h
fi
onde:
li = Limite inferior da classe da mediana;
Faa = Freqüência acumulada anterior da classe da Me;
fi = Freqüência simples da classe da mediana;
h = Intervalo de classe.
Observação: a mediana é muito empregada em pesquisas onde não interessam valores extremos, por terem
pouca significação para o conjunto em geral.
c) MODA (Mo): é aquilo que está em evidencia, o valor que mais aparece num conjunto de informações ou
o de maior freqüência em uma tabela.
Observação: a moda pode não ser única ou ate mesmo pode não existir.
1 - Moda de valores brutos: basta observar o valor que mais aparece no conjunto.
Exemplo: 3 ; 3 ; 6 ; 8 ; 10 ; 10; 10; 11; 11; 12 → Mo = 10.
3 Me − M o
Observação: É valida a seguinte relação empírica x= 2
EXERCÍCIOS DO TÓPICO 6
01. Para a Tabela 05, que apresenta o tempo de internação (em dias) de 160 pacientes no Hospital X no ano de
2008. Pede-se:
a) O tempo médio de internação;
b) O percentual de pacientes que permaneceram 2 meses ou mais internados;
c) O tempo de internação mediano;
d) O tempo de internação mais frequente, pelo processo de Czuber.
19
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
07 – MEDIDAS SEPARATRIZES.
a) Quartis (Qi): são os valores que dividem um conjunto de dados em quatro partes iguais, representados por
Q1, Q2 e Q3 denominam-se primeiro, segundo e terceiro quartis, respectivamente, sendo o valor de Q2 igual à
mediana. Assim, temos;
A formula para determinação dos quartis para dados agrupados é semelhante à usada para o cálculo da
mediana.
Determinação de Qi:
n
i× ∑ f i
1º passo: calcula-se a posição p = i =1 ;
4
2º passo: identifica-se a classe Qi pela coluna das Freqüências Acumuladas;
3º passo: Aplica-se a fórmula:
i× ∑ f i
n
i = 1 − Faa
Q i = l iQ i + 4 ×h
f iQ i
onde:
i = Ordem do quartil, i =1 ou 2 ou 3;
liQi = Limite inferior da classe do quartil de ordem i.
Faa = Freqüência acumulada anterior da classe do quartil de ordem i;
fiQi = Freqüência simples da classe do quartil de ordem i;
h = Intervalo de classe.
b) Decis (Di): são as medidas separatrizes que dividem a série em 10 partes iguais, e são representadas por
D1, D2, ...,D9. O quinto decil corresponde à mediana.
0% ----- 10% ---- 20% ---- 30% ---- 40% ---- 50% ----- 60% ---- 70% ---- 80% ---- 90% ---- 100%
D1 D2 D3 D4 D5 D6 D7 D8 D9
20
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
Determinação de Di:
n
i× ∑ f i
1º passo: calcula-se a posição p = i =1 , onde i = 1,2,3,4,5,6,7,8 e 9.
10
2º passo: identifica-se a classe Di pela Freqüência acumulada.
3º Passo: aplica-se a fórmula:
i× ∑ fi
n
i =1 − Faa
D i = l iD i + 10 ×h
f iD i
onde:
i = Ordem do decil, i =1; 2; 3; 4; 5; 6; 7; 8 ou 9;
liDi = Limite inferior da classe do decil de ordem i.
Faa = Freqüência acumulada anterior da classe do decil de ordem i;
fiDi = Freqüência simples da classe do decil de ordem i;
h = Intervalo de classe.
c) Percentis (Pi): são as medidas separatrizes que dividem a série em 100 partes iguais, e são representadas
por P1, P2, ...,P99. O qüinquagésimo centil corresponde à mediana.
0% ---- 1% ---- 2% ---- 3% ---- ---- ---- 50% ---- ---- ---- 97% ---- 98% ---- 99% ---- 100%
P1 P2 P3 P50 P97 P98 P99
Determinação de Pi:
n
i× ∑ fi
1º passo: calcula-se a posição p = 100 i =1
, onde i = 1,2,3,...,97,98 e 99.
2º passo: identifica-se a classe de Pi pela Freqüência acumulada.
3º Passo: aplica-se a fórmula:
i×∑ f i
n
i = 1 − Faa
Pi = l iPi + 100 ×h
f iPi
onde:
Ordem do percentil, i =1; 2; 3; 4; 5; 6; 7; 8 ou 9;
i =
Limite inferior da classe do percentil de ordem i.
liPi =
Freqüência acumulada anterior da classe do percentil de
Faa =
ordem i;
fiPi =
Freqüência simples da classe do percentil de ordem i;
h =
Intervalo de classe.
21
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
a) DESVIO MÉDIO: é a média dos valores absolutos dos desvios dos dados a partir de um valor de
tendência central.
n
∑ [ ( xi − x ) . f i ]
n
DM = i = 1 , onde : ∑ fi = n
n
∑ fi i =1
i =1
b) VARIÂNCIA OU VARIÂNCIA ABSOLUTA: é a média quadrática das somas dos desvios em relação
à média aritmética.
22
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
PROPRIEDADES DA VARIÂNCIA:
b) Somando-se ou diminuindo-se a todos os valores da série um valor constante K ≠ 0, a nova variância será
igual a anterior, isto é, não se altera.
c) Multiplicando-se ou dividindo-se todos os valores de uma série por um valor constante, K ≠ 0, a nova
variância calculada será igual à variância absoluta original multiplicada ou dividida pelo quadrado da
constante utilizada.
Resumindo: para o cálculo do desvio padrão, deve-se primeiramente determinar o valor da variância e, em
seguida, extrair a raiz quadrada desse resultado.
Exemplo 6: calcule o desvio padrão amostral da distribuição dada pela Tabela 07.
CV = S × 100
X
Observação 1: Será considerada a série mais homogênea, aquela que apresentar menor valor do coeficiente
de variabilidade.
Observação 2: é uma medida estatística que serve para avaliar a homogeneidade de séries estatísticas, que é
o grau de concentração dos valores observados em torno da sua média aritmética.
EXERCÍCIOS DO TÓPICO
1. Com a Tabela abaixo, responda o que se pede:
Tempo de Internação (em dias) de 160 pacientes no Hospital
X no ano de 2008.
Tempo de Internação Número de pacientes
(em dias) (fi)
10 |---- 20 38
20 |---- 30 45
30 |---- 40 30
40 |---- 50 22
50 |---- 60 10
60|---- 70 15
Σ 160
Fonte: Dados Hipotéticos
a) O desvio padrão do tempo de internação;
b) O coeficiente de variação;
23
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
EXERCÍCIOS EXTAS
1. Construa uma tabela apropriada para mostrar que o número de pacientes atendidos em um
consultório pela parte da manhã, tarde e noite era, respectivamente, 40, 35 e 29 em Fevereiro e
42, 48 e 50 em Março de 2008.
3. Construa uma série temporal para mostrar a quantidade de pacientes atendidos no Hospital WH
no período de 2002 a 2008: 40690; 41372; 42764; 42869; 43572; 43268; 44345,
respectivamente.
4. Construa uma série geográfica para representar os estabelecimentos de ensino na região norte do
Brasil em 2002. Esta região subdivide-se em: Pará; Amazonas; Acre; Rondônia; Roraima e
Amapá e possuíam um total de 250, 240, 142, 134, 168 e 92 estabelecimentos respectivamente.
24
UNIVERSIDADE FEDERAL DO PARÁ
INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS
a) os pontos médios;
b) as freqüências acumuladas;
c) a estatura média (Média); Estaturas fi
1,45 |----- 1,55 2
d) a estatura mais evidente (Moda); 1,55 |----- 1,65 4
e) a estatura central (Mediana); 1,65 |----- 1,75 8
1,75 |----- 1,85 4
f) a variância das estaturas; 1,85 |-----| 1,95 2
g) o coeficiente de variação.
25