Escolar Documentos
Profissional Documentos
Cultura Documentos
A Estatística é a parte da Matemática que trata dos métodos científicos para coleta, organização,
resumo, apresentação e análise de dados.
Divide-se em duas:
Estatística Descritiva : que apenas descreve e analisa um conjunto de dados, sem tirar conclusões;
Estatística Indutiva ou Inferência : que trata das inferências e conclusões, isto é, a partir de dados são
tiradas conclusões.
Séries Estatísticas
Uma série estatística define-se como toda e qualquer coleção de dados estatísticos referidos a uma
mesma ordem de classificação: em geral quantitativa.
Em termos gerais, a palavra série é usada normalmente para designar um conjunto de dados
dispostos de acordo com um caráter variável.
As tabelas e gráficos servem para apresentar séries estatísticas. As três variações possíveis em séries
estatísticas são:
A Época (fator temporal ou cronológico) – a que se refere o fenômeno analisado;
O Local (fator espacial ou geográfico) – onde o fenômeno acontece;
O Fenômeno (espécie do fato ou fator especificativo) – que é descrito.
Séries Homógradas: aquelas em que a variável descrita apresenta variação discreta ou descontínua.
São séries homógradas a série temporal, a série geográfica, a série específica e as séries mistas.
Séries Heterógradas: aquelas nas quais o fenômeno ou o fato apresenta gradações ou subdivisões.
Embora fixo, o fenômeno varia em intensidade. A Distribuição de freqüências é uma série heterógrada.
Obviamente tería-se uma precisão muito superior se fosse analisado o grupo inteiro, a população, do
que uma pequena parcela representativa, denominada amostra. Observa-se que é impraticável na grande
maioria dos casos, estudar-se a população em virtude de distâncias, custo, tempo, logística, entre outros
motivos.
A alternativa praticada nestes casos é o trabalho com uma amostra confiável. Se a amostra é confiável
e proporciona inferir sobre a população, chamamos de inferência estatística. Para que a inferência seja válida,
é necessária uma boa amostragem, livre de erros, tais como falta de determinação correta da população,
falta de aleatoriedade e erro no dimensionamento da amostra.
Dados Brutos : São aqueles valores a que se chegou pela simples coleta, sem qualquer preocupação
quanto à sua ordenação. Como se pode ser observado, as cifras estão dispostas de forma desordenada. Em
razão disso, pouca informação se consegue obter inspecionando os dados anotados. Mesmo uma informação
tão simples como a de saber os consumos máximo e mínimo requer um certo exame dos dados da tabela.
Distribuição de Freqüências
Observe a tabela a seguir que apresenta as notas de quarenta alunos de uma classe de ensino médio.
1 8 4 9 6,5 6 9 10 2 3
8,5 4 9 6 5 5,5 6,5 9 8 7
4,5 6 6,5 7,5 5 6 5,5 8 9 8
6 7 8 9 10 3 2,5 1,5 4 7
Colocando-se esses dados em ordem crescente, obtemos uma nova tabela, denominada ROL.
Podemos agora estabelecer a AMPLITUDADE, que é a diferença entre o maior e o menor valor. No
caso, temos 10 – 1 = 9 como amplitude.
O número de vezes que determinado valor se repete é denominado FREQÜÊNCIA desse valor.
Podemos então montar uma nova tabela em que a cada valor associamos a sua freqüência:
Notas
0| 2 2| 4 4| 6 6| 8 8 | 10
Freqüênci 2 4 8 12 14
a
Os extremos de cada classe são chamados de LIMITES, que podem ser INFERIORES (li) e
SUPERIORES (Li). Assim: 0, 2, 4, 6 e 8 são limites inferiores e 2, 4, 6, 8 e 10 são limites superiores.
O PONTO MÉDIO de cada intervalo de classe é obtido pela média aritmética dos limites inferior e
superior da classe. São pontos médios os valores 1, 3, 5, 7 e 9.
Temos que considerar a FREQÜÊNCIA RELATIVA ou PERCENTUAL (Fr), em que se associa à freqüência
de cada classe o percentual que ela representa em relação à freqüência total.
UNIP – Tatupé – Estatística - 2007 3
Prof. Ecila Alves de Oliveira
Já a FREQÜÊNCIA ACUMULADA (Fi) de cada classe é dada pela soma das freqüências de todas as
classes, desde a primeira até a classe considerada.
Exemplo
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 174 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 174
Quantida
de Freqüência
(i)
150 1
151 1
152 1
153 1
154 1
155 4
156 3
157 1
158 2
160 5
161 4
162 2
163 2
164 3
165 1
166 1
167 1
168 2
169 1
170 1
172 1
174 1
Total 40
UNIP – Tatupé – Estatística - 2007 4
Prof. Ecila Alves de Oliveira
a-) Amplitude ð é a diferença entre o maior valor e o menor valor encontrado na distribuição.
At = Vmáx - Vmin
At = 174 – 150 ð At = 24
b-) Classes ð é cada um dos grupos de valores em que se subdivide a amplitude total do conjunto de
valores observados da variável.
K= √ 40 ð K = 6,32 ð K@6
h = 24 / 6 ð h = 4
mi = li + Li
e-) Ponto Médio de uma Classe ð 2
Ponto médio ou valor médio de uma classe é o ponto eqüidistante dos limites de classe.
Para obter o ponto médio de uma classe, ou aplica-se a fórmula acima, ou basta acrescentar ao
seu limite inferior a metade da amplitude do intervalo de classe.
Tipos de freqüência
fi fri Fri
Fi
freqüência mi freqüência Freqüência
Qte. Freqüência
simples ponto médio simples Acumulada
Acumulada
absoluta relativa relativa
150├ 154 4 152 0,100 4 0,100
154├ 158 9 154 0,225 13 0,325
158├ 162 11 160 0,275 24 0,600
162├ 166 8 164 0,200 32 0,800
166├ 170 5 168 0,125 37 0,925
170├ 174 3 172 0,075 40 1,000
Total 40 1,000
Medidas de posição:
Dentre as medidas de distribuição, a média aritmética (x), a mediana (Md) e a moda (Mo) têm
especial importância. São medidas de tendência central, visto que ocupam posições centrais numa
distribuição.
a) MÉDIA ARITMÉTICA ð
A Média Aritmética é o quociente da divisão da soma dos valores pelo número de elementos. Sendo x 1,
x2, x3, ... , xn os elementos, temos:
x
x 1 + x 2 + x3 +.. .+ x n ∑ xi
i=1
X= n = n
A média aritmética para dados não agrupados é a média aritmética simples dos elementos. Vejamos
um exemplo: para os elementos 1, 2, 3, 5,7, 8 e 9, temos:
Se os elementos x1, x2, x3, ... , xn apresentam, respectivamente, freqüências f1, f2, f3, ... , fn, então:
n
∑ f i xi
i=1
f 1 . x1 + f 2 . x 2 + f 3 . x 3 + .. .+f n . x n n
f 1 + f 2 + f 3 +. . .+f n ∑ fi
X= = i =1
Ou seja, trata-se da Média Ponderada.
UNIP – Tatupé – Estatística - 2007 6
Prof. Ecila Alves de Oliveira
Exemplo:
n
∑ f i xi
i=1
n
3 x 3+4 x 5+5 x 6+6 x 7+7 x 6 143
∑ fi 3+4+5+6+7+6 27
X= i =1 = = = 5,296
Neste caso, consideramos todos os valores de um determinado intervalo como coincidentes com o
ponto médio do intervalo. Assim:
n
∑ f i mi
i=1
n
∑fi
X= i=1
Exemplo:
n
∑ f i mi
i=1
n
296
∑fi 50
X= i=1 = = 5,92
b) MEDIANA (Md) ð é definida como o número que se encontra no centro de uma série de números,
estando estes dispostos segundo uma ordem. É o valor situado de tal forma que
separa o conjunto de em dois subconjuntos de mesmo número de valores.
Exemplo
Salário fi Fi
s
1500 12 12
2000 10 22
2500 8 30
3000 4 34
3500 1 35
f i
= 35
∑ fi 35
Como ∑ fi
= 35, temos: 2 = = 17,5 2
Assim, a mediana é um valor ent5re o 17º e o 18º elemento. Esses valores ocorrem para o salário de
2.000. Portanto, Md = 2.000
∑ fi
Devemos inicialmente localizar a classe mediana, ou seja, a que contém o elemento 2 . Em
seguida, calculamos seu valor usando a fórmula:
Σ fi - Fant .h
2
Md = linf +
fi
Em que:
c) MODA (Mo) ð é o valor que ocorre com maior freqüência em uma série de valores. No caso de
dados não agrupados, basta procurar pelo valor que mais se repete. Caso os dados
estejam agrupados, basta ir à classe com maior freqüência e a MODA poderá ser
calculada pela fórmula:
A Mo de um cojunto de elementos é o elemento que ocorre com maior freqüência. Assim, um conjunto
de elementos pode ter uma moda, mais de uma ou nenhuma.
O conjunto de números 2, 3, 4, 6, 8 e 9 não tem nenhum elemento com maior freqüência que os
demais. Portanto não tem moda.
UNIP – Tatupé – Estatística - 2007 8
Prof. Ecila Alves de Oliveira
A classe modal é a classe que apresenta maior freqüência. Consideramos como moda de uma
distribuição de freqüência o valor compreendido entre os limites da classe modal. Tal valor é dado por:
Mo = l* + L*
APLICANDO NO EXEMPLO:
MÉDIA
MODA (Mo)
MEDIANA (Md)
Medidas de dispersão
At = Vmáx - Vmin
São valores que nos mostram o quanto os dados se comportam ao redor da média. Quanto maior o
valor, significa que mais os dados estão afastados da média. Quanto menor, mais perto da média estão os
valores.
A VARIÂNCIA é um número calculado a partir dos quadrados dos desvios, ela é um número em
unidade quadrada em relação à variável em questão. Por esta razão, neste primeiro momento, ela não será
UNIP – Tatupé – Estatística - 2007 9
Prof. Ecila Alves de Oliveira
utilizada.
É a raiz quadrada da Variância, ou seja, elimina-se o inconveniente de se ter uma variável em unidade
quadrada, o que torna sua interpretação mais tranqüila.
s= Σ fix2i - Σ f ixi 2
Σ fi Σ fi
Aplicando ao Exemplo:
2
s= 1.038.080 - 6.440
40 40
c) COEFICIENTE DE VARIAÇÃO:
Como o Desvio Padrão é proporcional a grandeza do histórico, para sabermos se o mesmo é um valor
alto ou um valor baixo, devermos compara-lo com a média, na forma de porcentagem.
CV = s 100
x
Portanto: