Escolar Documentos
Profissional Documentos
Cultura Documentos
2
1 INTRODUÇÃO
Desde a antiguidade, vários povos já registravam o número de habitantes, de
nascimentos, de óbitos, faziam estimativas das riquezas individual e social, distribuíam
equitativamente terras ao povo, cobravam impostos e realizavam inquéritos quantitativos por
processos que, hoje, chamaríamos de ESTATÍSTICA.
Na Idade Média colhiam-se informações, geralmente com finalidades tributárias ou
bélicas. A partir do Século XVI começaram a surgir as primeiras análises sistemáticas de fatos
sociais, como batizados, casamentos, funerais, originando as primeiras tábuas e tabelas e os
primeiros números relativos. No Século XVIII começaram a surgir os estudos de tais fatos que
foram adquirindo, aos poucos, feição verdadeiramente científica. Godofredo Achenwall batizou
a nova Ciência (ou método) com o nome de ESTATÍSTICA, determinando o seu objetivo e
suas relações com as ciências.
Atualmente, a definição de Estatística não é única, pois abrange muito mais do que um
traçado de gráfico e cálculos de medidas. Uma definição seria:
“A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição,
análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões” (CRESPO, 2002, p.13).
¾ Ramos da Estatística
ESTATÍSTICA DEDUTIVA ou DESCRITIVA: Trata da coleta, da organização e da descrição
dos dados.
TEORIA DA PROBABILIDADE: Proporciona uma base racional para lidar com situações
influenciadas por fatores que envolvem o acaso.
ESTATÍSTICA INDUTIVA ou INFERENCIAL: Trata da análise e da interpretação desses
dados.
¾ Método Estatístico
Método é o caminho pelo qual se chega a determinado resultado (existem outras
definições). O método estatístico, diante da impossibilidade de manter as causas constantes,
admite essas causas presentes variando-as, registrando essas variações e procurando
determinar, no resultado final, que influências cabem a cada um deles.
Fases do método estatístico: Coleta de dados, crítica dos dados, apuração dos
dados, exposição dos dados, análise dos resultados
¾ Objetivo da ESTATÍSTICA
O objetivo último da estatística é tirar conclusões sobre o todo (população) a partir de
informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases
anteriores (Estatística Descritiva), procede-se a análise dos resultados obtidos, através dos
métodos da Estatística Indutiva ou Inferencial, que tem base a indução ou inferência, e tira-se
desses resultados conclusões e previsões.
¾ Alguns conceitos fundamentais:
POPULAÇÃO: É um conjunto de indivíduos ou objetos que apresentam pelo menos uma
característica em comum. A população pode ser finita ou infinita, dependendo de o número de
elementos ser finito ou infinito. Na prática, quando uma população é finita, com um número
grande de elementos, considera-se como população infinita.
AMOSTRA: Considerando-se a impossibilidade, na maioria das vezes, do tratamento de todos
os elementos da população, retira-se uma amostra (subconjunto finito de uma população), de
acordo com alguma técnica de amostragem.
VARIÁVEIS QUALITATIVAS: podem ser separados em diferentes categorias, atributos, que se
distinguem por uma característica não numérica. Divide-se em:
I – Nominal: São dados caracterizados por rótulos ou categorias. Por exemplo: sexo,
estado civil, cor dos olhos, etc.
II – Ordinal: são dados caracterizados por uma ordem, mas não podem ser definidos por
valor numérico. Exemplo: Nível de escolaridade (Fundamental, médio, superior),
3
intensidade da luz (muito forte, forte, média, suave, muito suave), etc.
VARIÁVEIS QUANTITATIVAS: Consistem em números que representam contagens ou
medidas. Dividem-se em:
I – Discretas: Resultam de um conjunto finito, enumerável, de valores possíveis.
Exemplo: número de filhos.
II – Contínuas: Resultam de um número infinito de valores possíveis, que podem ser
associados a pontos em uma escala contínua. Exemplo: peso, altura.
EXERCÍCIOS
Classifique cada uma das variáveis a seguir em qualitativa nominal ou ordinal e em quantitativa
discreta ou contínua:
a) Cor dos cabelos
b) Números de filhos
c) O ponto obtido ao se jogar um dado
d) Saldo em uma conta corrente (R$)
e) Grau de instrução
f) Classe econômica
g) Hierarquia de uma empresa
h) Diâmetro de peças produzidas
i) Comprimento de peças produzidas
j) Tempo de espera na fila do banco (em minutos)
k) Nome dos países exportadores de petróleo
l) Grau de satisfação dos clientes de uma loja
m) nº de ações negociadas na bolsa de valores
n) Nº de alunos de uma universidade
o) Estatua dos alunos de uma escola
p) Precipitação pluviométrica durante um ano
q) Nº de volumes de livros existentes nas bibliotecas de Rondônia
r) Índice de liquidez das indústrias de Rondônia
¾ Arredondamento de Dados
Muitas vezes, é necessário ou conveniente suprimir unidades inferiores às de
determinada ordem. Esta técnica é denominada ARREDONDAMENTO DE DADOS. De acordo
com a resolução número 886/66 da Fundação IBGE, o arredondamento é feito da seguinte
maneira:
a) Quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3 ou 4, fica inalterado o último
algarismo a permanecer (arredondamento por falta). Exemplo:
53,24> 53,2 58,83> 58,8
0,34853> 0,3485 3,0047523> 3,004752
b) Quando o primeiro algarismo a ser abandonado é 6, 7, 8 ou 9, aumenta-se de uma
unidade o algarismo a permanecer (arredondamento por excesso). Exemplo:
42,87> 42,9 24,39> 24,4
25,089> 25,09 72,99> 73
c) Quando o primeiro algarismo a ser abandonado é 5, há duas soluções:
I - Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma
4
unidade ao algarismo a permanecer. Exemplos:
2,352> 2,4 76,25002> 76,3
25,6501> 25,7 2,3851> 2,39
II - Se ao 5 seguirem zeros ou se o 5 for o último algarismo a ser conservado só será
aumentado de uma unidade se for ímpar. Exemplos:
24,75> 24,8 24,85> 24,8
24,65> 24,6 24,7500> 24,8
Obs: Nunca devemos fazer arredondamentos sucessivos; é conveniente primeiro somar e
depois fazer o arredondamento.
EXERCÍCIOS
1) Arredonde para o décimo mais próximo (uma casa decimal):
a) 2,38 c) 4,24 e) 6,829 g) 0,351 i) 89,99
b) 24,65 d) 328,35 f) 5,550 h) 2,97 j) 3,75
2) Arredonde para o centésimo mais próximo (duas casas decimais):
a) 46,727 c) 299,951 e) 253,650
b) 123,842 d) 28,255 f) 34,485
3) Arredonde para a unidade mais próxima (nenhuma casa decimal):
a) 26,6 c) 67,5 e) 128,5
b) 49,98 d) 68,2 f) 39,49
3. DISTRIBUIÇÃO DE FREQUÊNCIAS
¾ Amplitude total (At) ou Range (R): É a diferença entre o maior e o menor valor
observados. No exemplo anterior temos: At = 36 − 21 = 15 ⇒ At = 15 .
¾ Freqüência absoluta (fi): É o número de vezes que o elemento aparece na amostra, ou o
número de elementos pertencentes a uma classe. No exemplo anterior temos: F(21) = 3, F(36 ) = 1 ,
etc.
¾ Freqüência absoluta acumulada (Fi): É a soma das freqüências dos valores inferiores ou
iguais ao valor dado.
¾ Freqüência relativa (fri): São os valores das razões entre as freqüências absolutas e a
freqüência total.
5
¾ Freqüência relativa acumulada (FRi): É a soma das freqüências relativas dos valores
inferiores ou iguais ao valor dado. Exemplo:
xi fi Fi fri FRi
21 3 3 0,1000 0,1000
22 2 5 0,0667 0,1667
23 2 7 0,0667 0,2334
24 2 9 0,0667 0,3001
25 4 13 0,1333 0,4334
26 3 16 0,1000 0,5334
28 1 17 0,0333 0,5667
30 1 18 0,0333 0,6000
31 3 21 0,1000 0,7000
32 1 22 0,0333 0,7333
33 3 25 0,1000 0,8333
34 2 27 0,0667 0,9000
35 2 29 0,0667 0,9667
36 1 30 0,0333 1,0000
Σ 30 1,0000
a) O tamanho da amostra → n = 40
b) A amplitude total → At = 173 − 150 = 23
c) O número de classes → k = 40 = 6,3 , podemos ter 5, 6 ou 7 classes.
d) A amplitude das classes → Como At =23 e não é divisível por 5, 6 ou 7, nesse caso
24
precisaremos ajustar seu valor At = 23 + 1=24 → h = =4
6
e) A distribuição de freqüência contendo: classes, freqüência, ponto médio, freqüência
acumulada e freqüência relativa.
6
ESTATURA DE 40 ALUNOS DO COLÉGIO A
Classes fi xi Fi fri FRi
150 |— 154 4 152 4 0,10 0,10
154 |— 158 9 156 13 0,22 0,32
158 |— 162 11 160 24 0,28 0,60
162 |— 166 8 164 32 0,20 0,80
166 |— 170 5 168 37 0,12 0,92
170 |— 174 3 172 40 0,08 1,00
Σ 40 - - 1,00
¾ Representação gráfica
a) Histograma e polígono de freqüência
EXERCÍCIOS
1) Dada a amostra: 3, 4, 4, 5, 7, 6, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6. Pede-se: o Rol;
amplitude da amostra; a distribuição de frequência contendo frequência absoluta, frequência
absoluta acumulada, frequência relativa e frequência relativa acumulada; o gráfico das
frequências; a porcentagem de elementos maiores que 5.
2) Considere os dados obtidos pelas medidas das alturas de 100 indivíduos (dadas em cm):
151 152 154 155 158 159 159 160 161 161
161 162 163 163 163 164 165 165 165 166
166 166 166 167 167 167 167 167 168 168
168 168 168 168 168 168 168 168 169 169
169 169 169 169 169 170 170 170 170 170
170 170 171 171 171 171 172 172 172 173
173 173 174 174 174 175 175 175 175 176
176 176 176 177 177 177 177 178 178 178
179 179 180 180 180 180 181 181 181 182
182 182 183 184 185 186 187 188 190 190
Pede-se: a amplitude da amostra; o número de classes; a distribuição de freqüência
contendo as classes, as freqüências absolutas, as freqüências absolutas acumuladas, as
freqüências relativas, as freqüências relativas acumuladas e os pontos médios das classes;
o histograma; o polígono de freqüência; o polígono de freqüência acumulada.
7
4. MEDIDAS DE POSIÇÃO
As medidas de posição mais importantes são as MEDIDAS DE TENDÊNCIA CENTRAL
que recebem tal denominação pelo fato de os dados observados tendem, em geral, a se
agrupar em torno dos valores centrais. São medidas de tendência central: MÉDIA, MEDIANA e
MODA. As outras medidas de posição são as SEPARATRIZES, que englobam: a própria
MEDIANA, os QUARTIS, os DECIS e os PERCENTIS.
⎛ −− ⎞
4.1 Média Aritmética ⎜ X ⎟
⎝ ⎠
¾ Para dados não agrupados: Sejam X1, X2, X3, ... , Xn, portanto “n” valores da variável X. A
__
média aritmética SIMPLES de X representada por X é definida por:
n
__ ∑X i __
∑X
X= i =1
, ou ainda X =
i
n n
Exemplo: Sabendo-se que a produção leiteira de uma vaca, durante uma semana, foi
de 10, 14, 13, 15, 16, 18 e 12 litros, temos, para produção média da semana:
__
X=
∑ X i = 10 + 14 + 13 + 15 + 16 + 18 + 12 = 98 = 14 litros
n 7 7
¾ Dados agrupados
Sem intervalos de classe: Quando os dados estiverem agrupados (sem intervalos de
classe) numa distribuição de freqüência usa-se a média aritmética dos valores X1, X2, X3, ... ,
Xn, PONDERADOS pelas representativas freqüências absolutas: F1, F2, F3, ... , Fn. Assim,
__
X=
∑ xi f i , ou ainda X__ = ∑ xi f i
n ∑ fi
Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando
para variável o número de filhos do sexo masculino. Qual é a média de filhos masculinos, por
família?
Nº. de meninos (xi) Nº. de famílias (fi)
0 2
1 6
2 10
3 12
4 4
Σ 34
__
X=
∑x f i i
=
∑x f
i i
=
78
= 2,3 meninos
n ∑f i 34
Interpretação: O valor médio 2,3 meninos sugere, neste caso, que o maior número de famílias
tem 2 meninos e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade
numérica em relação ao número de meninos.
8
Com intervalos de classe: Neste caso, convenciona-se que todos os valores incluídos
em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a
média aritmética ponderada por meio da fórmula:
__
x =
∑ xi f i ou __x = ∑ xi f i
n ∑ fi
Exemplo: Determinar a média da distribuição:
Renda Familiar
2 |— 4 4 |— 6 6 |— 8 8 |— 10 10 |— 12
Milhares de R$
Nº de famílias 5 10 14 8 3
Neste caso tem-se:
Classes fi xi xi*fi
2 |— 4 5 3 15
4 |— 6 10 5 50
6 |— 8 14 7 98
8 |— 10 8 9 72
10 |— 12 3 11 33
Σ 40 - 268
__
X=
∑x f i i
=
∑x f
i i
=
268
= 6,7
n ∑f i 40
Como a renda familiar foi dada em milhares de reais, conclui-se que a renda média
desse grupo de 40 famílias é de R$ 6.700,00.
¾ Emprego da média: A média é utilizada quando deseja-se obter a medida de posição que
possui a maior estabilidade ou quando houver a necessidade de um tratamento algébrico
ulterior.
xi 80 85 87 89 90
fi 5 10 15 8 4
Para dados agrupados em classes, existem diversas fórmulas para o cálculo da moda.
Será apresentado a seguir uma que é bastante usada, a fórmula de CZUBER. Procedimentos:
I – Identificar a classe modal (aquela que possuir maior freqüência absoluta).
II – Aplicar a fórmula de Czuber:
Δ1
Mo = l + .h , onde:
Δ1 + Δ 2
l = limite inferior da classe modal;
Δ1 = diferença entre a freqüência de classe modal e a imediatamente anterior.
Δ2 = diferença entre a freqüência da classe modal e a imediatamente posterior.
h = amplitude de classe.
Exemplo: Em uma sala de aula de 40 alunos foi medida a estatura de cada um,
conforme tabela abaixo. Determine qual a estatura predominante na sala.
Estaturas (cm) Fi A classe modal é a 3ª.
150 |— 154 4 Δ1 = 11 – 9 = 2 l = 158
154 |— 158 9 Δ2 = 11 – 8 = 3 h=4
158 |— 162 11 Δ1 2
162 |— 166 8 Mo = l + .h = 158 + .4 = 159,6cm
Δ1 + Δ 2 2+3
166 |— 170 5
Isto é, a altura (estatura) predominante (a que mais aparece)
170 |— 174 3
entre os alunos da sala é de 159,6cm.
Σ 40
Obs: Para o cálculo da moda, existem outras fórmulas bem conhecidas, que são a
Fórmula de PEARSON e a Fórmula de KING
¾ Utilizações das medidas de tendência central
4) Uma máquina produz peças que são embaladas em caixas contendo 48 unidades. Uma
pesquisa realizada com 59 caixas, revelou a existência de peças defeituosas segundo a
tabela:
Nº de peças defeituosas por a) Determine o valor mediano da série.
Nº de caixas
caixas
0 20 b) Interprete o valor mediano.
1 15
2 12
3 6
4 4
5 2
5) Calcule a moda da série representativa da idade de 50 alunos de uma classe de primeiro
ano de uma faculdade e a interprete.
Idade (anos) Nº de alunos
17 3
18 18
19 17
20 8
21 4
6) A distribuição abaixo representa o consumo, em kg de um produto colocado em oferta em
um supermercado, que limitou o consumo máximo por cliente em 5kg.
Consumo em kg Nº de clientes Pede-se:
0 |— 1 12 Calcule a média aritmética, a mediana e
1 |— 2 15 a moda.
2 |— 3 21
3 |— 4 32
4 |— 5 54
4.4 SEPARATRIZES
I) Quartis: Denomina-se quartis os valores de uma série que a dividem em quatro partes
iguais.
II) Decis: São valores que dividem a série em dez (10) partes iguais.
12
III) Percentis: São as medidas que dividem a amostra em 100 partes iguais.
⎛ in ⎞
⎜ − ∑ f ⎟.h
Pi = l Pi + ⎝ ⎠ , i = 1, 2, 3, ... , 100.
100
fPi
Exemplo: Determinar o 72º percentil (P72) da seguinte distribuição:
Classes fi Fi ⎛ 72 * 40 ⎞
⎜ − 20 ⎟.5
4 |— 9 8 8
P72 = 14 + ⎝
100 ⎠ = 14 + (28,8 − 20 ).5 = 14 + 1,6 = 16,6
9 |— 14 12 20
17 17
14 |— 19 17 37
19 |— 24 3 40
Σ 40 -
Obs: Para calcular os quartis ou os decis, basta convertê-los em porcentis.
∑ xi − x . f i ∑d . f
DM = =
i i
∑ fi ∑ fi
Exemplo: Calcular e interpretar o DM da distribuição a seguir.
xi xi.fi ___
Classes fi xi − x . f i
2 |— 4 5 3 15 10,50
4 |— 6 10 5 50 1,00
6 |— 8 4 7 28 7,60
8 |— 10 1 9 9 3,90
Σ 20 102 23,00
___
___
∑x .f
102 23
∑ xi − x . f i
Assim, X = =
= 5,10 DM = = = 1,15
i i
∑ fi 20 ∑ fi 20
Interpretação: Em média, cada elemento da série esta afastado de 5,10 por 1,15 unidades.
5.3 Variância e Desvio Padrão
Têm-se as seguintes situações:
I – Dados não agrupados
Variância populacional Desvio padrão populacional
2
⎛ __ ⎞
∑⎜ xi − x ⎟ 2
⎜ ⎟ σ= σ
σ 2 ( x) = ⎝ ⎠
n
Variância amostral Desvio padrão amostral
⎛ __ ⎞ 2
∑⎜ xi − x ⎟ 2
⎜ ⎟ s= s
s 2 ( x) = ⎝ ⎠
n −1
II – Dados agrupados
Variância populacional Desvio padrão populacional
⎛ __ ⎞ 2
∑⎜ xi − x ⎟ f i 2
⎜ ⎟ σ= σ
σ 2 ( x) = ⎝ ⎠
∑ fi
Variância amostral Desvio padrão amostral
⎛ __ ⎞ 2
∑⎜ xi − x ⎟ f i 2
⎜ ⎟ s= s
2
s ( x) = ⎝ ⎠
∑ fi − 1
2
⎛ __ ⎞
∑⎜ xi − x ⎟
⎜ ⎟
σ 2 ( x) = ⎝ ⎠ = 2,25 + 0,25 + 6,25 + 0,25 = 9 = 2,25 (var.) σ = 2,25 = 1,5u (d.p.)
n 4 4
Interpretação: Em média, cada elemento da série esta afastado de 5,5 por 1,15 unidades.
8) Calcule a variância e o desvio padrão para as alturas de 70 alunos de uma classe (amostra)
altura (cm) Nº de alunos (Fi)
150 |— 160 2
160 |— 170 15
170 |— 180 18
180 |— 190 18
190 |— 200 16
200 |— 210 1
Σ
REFERÊNCIAS
COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 3.ed. São Paulo: Herbra, 1998.
CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva, 2002.
SILVA, Ermes Medeiros da; SILVA, ELIO Medeiros da; GONÇALVES, Valter; MUROLO,
Afránio Carlos. Estatística para os cursos de: Economia, administração, ciências contábeis.
3.ed. São Paulo: Atlas, 2006.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2.ed. São Paulo: Atlas,
1985.
17
ANEXO – TABELAS E GRÁFICOS
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem
assumir, para que tenham uma visão global da variação dessa ou dessas variáveis. E isto ela
consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que irão nos
fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos
determinações administrativas e pedagógicas mais coerentes e científicas.
1. Tabela
Tabela é um quadro que resume um conjunto de observações. Uma tabela compõe-se
de:
a) TÍTULO: O título deve responder as seguintes questões:
O que? (Assunto a ser representado (Fato));
Onde? (O lugar onde ocorreu o fenômeno (local));
Quando? (A época em que se verificou o fenômeno (tempo)).
b) CABEÇALHO: parte da tabela na qual é designada a natureza do conteúdo de cada coluna.
c) CORPO: parte da tabela composta por linhas e colunas.
d) LINHAS: parte do corpo que contém uma seqüência horizontal de informações.
e) COLUNAS: parte do corpo que contém uma seqüência vertical de informações.
f) COLUNA INDICADORA: coluna que contém as discriminações correspondentes aos valores
distribuídos nas linhas.
g) CASA OU CÉLULA: parte da tabela formada pelo cruzamento de uma linha com uma
coluna.
h) ELEMENTOS COMPLEMENTARES (rodapé): Colocados no espaço abaixo da tabela –
Fonte: é a indicação de entidade responsável pelo fornecimento dos dados ou sua elaboração;
Notas: são informações de natureza geral, identificadas por algarismos romanos.
Exemplo:
2. Gráficos
O gráfico estatístico é uma forma de apresentação dos dados estatísticos cujo objetivo é
o de produzir, no investigador ou público em geral, uma impressão mais rápida e viva do
fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries.
A representação gráfica de um fenômeno deve obedecer a certos requisitos
fundamentais, para ser realmente útil:
SIMPLICIDADE: O gráfico deve ser destituído de detalhes de importância secundariam,
assim o como de traços desnecessários que possam levar o observador a uma análise
morosa ou com erros.
CLAREZA: O gráfico deve possibilitar uma correta interpretação dos valores
representativos do fenômeno em estudo.
VERACIDADE: O gráfico deve expressar a verdade sobre o fenômeno em estudo.
Para a construção de gráficos, você deverá observar alguns itens que se fazem
necessários neles:
- todo gráfico deve ter título (na parte superior) e fonte (no rodapé), para que o leitor não
tenha a necessidade de voltar ao texto para saber do que se trata;
- a escala do eixo horizontal deve ser escrita abaixo desse eixo e deverá crescer da
esquerda para a direita;
- a escala do eixo vertical deve ser escrita à esquerda do eixo e crescer de baixo para
cima;
- cada eixo deve ser identificado com o que está sendo medido ou representado;
- não é necessário colocar linhas de grade (que saem das marcas das escalas
horizontais e verticais). Estas são opcionais.
Exemplo:
Cartograma:
REFERÊNCIAS
COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 3.ed. São Paulo: Herbra, 1998.
CRESPO, Antônio Arnot. Estatística fácil. São Paulo: Saraiva, 2002.