TEMA I
Este conceito tem um significado mais amplo do que aquele que usualmente se
dá à palavra "estatística", isto é, o resultado de contagens sobre a ocorrência de
determinados eventos e a sua representação através de gráficos e tabelas,
como, por exemplo, as estatísticas de ocorrência de chuvas numa certa época
do ano; as estatísticas sobre os ganhadores de prémios de lotaria; as
estatísticas de renda média por região etc.
Exemplo: Imagine-se agora que no exemplo anterior não houve condições para
entrevistar todas as famílias moçambicanas e como alternativa entrevista-se
uma parte dela de acordo com os recursos disponíveis.
Para este exemplo a parte das famílias entrevistadas seria a amostra do estudo
e o conjunto de todas as famílias moçambicanas constituiria a população.
Variáveis qualitativas são aquelas que só podem ser caracterizadas por meio
de uma descrição e não comportam uma escala dimensional rígida.
Variáveis quantitativas são aquelas que podem ser caracterizadas por meio de
uma escala dimensional rígida.
Por sua vez, as variáveis quantitativas subdividem-se em discretas e contínuas.
Diz-se que a variável é discreta se for possível enumerar (ou pelo menos
numerar) os valores possíveis dessa variável; e contínua se entre dois valores
21 23 34 21 34 22
22 20 21 23 21 20
17 34 21 22 23 23
20 20 22 21 17 21
22 21 22 22 22 23
23 22 23 34 19 21
eles apareçam mais de uma vez na tabela, como ocorre no rol. A tabela de
frequências proporciona uma apresentação estética mais vantajosa dos dados,
facilitando ainda a verificação do comportamento do fenómeno em estudo.
Muitas vezes os gráficos são elaborados utilizando-se as frequências dos
valores da variável. Para tal, necessitamos definir alguns conceitos importantes.
=1
Gráfico circular
Gráfico de barras
Histograma
k – Número de classes;
c – Amplitude do intervalo de classe;
− Amplitude total.
1. Fórmula de Sturges
= 1 + 3,3 ∗ log
= √
Para traçar o polígono não vamos levantar colunas, mas registar pontos
de intersecção de cada ponto médio e a respectiva frequência. Após o
registo de todas as frequências ligam-se os pontos, resultando uma linha
quebrada, poligonal, que limita a área do polígono de frequências
xi 1
i
x (1)
n
sendo que ∑ (lê-se “sigma”) indica o somatório dos elementos xi. Quando se
pretende calcular a média a partir de dados agrupados, em tabelas de frequências
com k classes, a média obtém se com:
x
i 1
i fi
x k (2)
i 1
fi
Onde:
n = número de observações
xi = valor de cada observação
fi = frequência
k = número de classes ou de valores individuais diferentes da variável.
15 @ VASCO CHIMENE e CALTON DOS SANTOS@
PROBABILIDADES E MÉTODOS ESTATÍSTICOS - UNIZAMBEZE 2011
∑
=
Rendimento
i f fr
(MT)
1 3000 13 43.3%
2 6000 7 23.3%
3 7000 8 26.7%
4 1000 2 6.7%
soma 30 100.0%
x
i 1
i fi
3000 13 6000 7 7000 8 10000 2
x 4
5233 MT
13 7 8 2
f
i 1
i
Para achar a nota média dessa turma deve-se acrescentar uma coluna dos
pontos médios de cada classe (chama-se ponto médio de uma classe à média
aritmétrica dos limites dessa classe) e com base nesses valores determinar a
média procurada.
0 |----- 10 5 5 1%
10 |----- 20 15 15 3%
20 |----- 30 25 20 4%
30 |----- 40 35 45 9%
70 |----- 80 75 60 12%
80 |----- 90 85 15 3%
90 |----- 100 95 10 2%
i 1
xi fi
5 5 15 15 25 20 ...... 95 10
x 4
54 . 4
500
i 1
fi
0 2
1 4
2 6
3 8
4 4
5 2
6 1
f
i 1
i 27
f post
M0 l c (3)
f ant f post
Onde:
l = Limite inferior da classe modal
c = Amplitude da classe modal
fant = Frequência simples da classe anterior à classe modal.
fpost = Frequência simples da classe posterior à classe modal.
classes fj
10 |----- 20 2
20 |----- 30 3
30 |----- 40 10
40 |----- 50 9
50 |----- 60 4
f
i 1
i 28
f post 9
M0 l c 3010 37.5MT
f ant f post 39
Este valor indica que o preço mais observado nas vendas desse dia é de
37.5MT.
14 18 8
Mediana de Y: Md = 16 , pois o n é par E Md 4 .
2 2
0 2 2
1 4 6
2 6 12
3 8 20
4 4 24
5 2 26
6 1 27
f
i 1
i 27
Solução:
Resultados do teste de Estatística
classes fi Fi fr Fr
0 |----- 10 5 5 1% 1%
10 |----- 20 15 20 3% 4%
20 |----- 30 20 40 4% 8%
30 |----- 40 45 85 9% 17%
500
EMd 250
2
E Md Fant 250 185 0.5 Frant 0.5 0.37
Md l c = 50 10 ou Md l c = 50 10 =55
f Md 130 frMd 0.26
Para fazer uma análise completa dos dados não basta apenas fazer uma
apresentação, através de gráficos e tabelas, ou das medidas de posição. Por
exemplo caracterizar uma distribuição apenas através da media, é uma discrição
inadequada, pois nessa situação despreza ria-se a variabilidade, além do mais a
variabilidade é muitas vezes considerada um indicador de qualidade. Ocorre,
portanto, que se a variabilidade dum conjunto de dados for muito alta, sua média
terá um grau confiabilidade tão pequeno que será inútil calcular. Por exemplo,
suponhamos que se pretende comparar a performance de dois empregados,
com base na seguinte produção diária de determinada peça.
xi fi
20 3
50 7
60 3
70 5
total 18
At = 70 – 20 = 50
Exemplo:
classes f
10|---20 15
20|---30 7
30|---40 13
40|---50 5
total 40
At = 50 – 10 = 40
(x i x)2 (x i x) 2 f
s ou s (a)
n n
(x i x)2 (x i x) 2 f
s ou s (b)
n 1 n 1
Exemplo: Para o exemplo acima, A = {5, 3, 12, 7, 11, 9, 6}, admitindo que
os dados correspondem a renda diária, em dólares, de uma amostra de 7
estudantes.
x
x i
7.6 então
n
x
x i
52.222 então
n
s
(x x) i f
=
(20 52.2)2 *3 (5052.2)2 *7 ... (70 52.2)2 *5
16.997
n 1 181
s s2
Coeficiente de Variação
Tabela 1.14 -
A 15 5
B 9 4
s 5
CVpA 100% 100% 30.3% CVp B s 100 % 4 100 % 44.4%
x 15 x 9
n k
xir
i 1
x
i 1
i
r
fi
mr () Para dados simples ou m r k () Para dados agrupados
n
i 1
fi
n _
( xi x ) r
i 1
mr () Para dados simples ou
n
n _
( xi x ) r f
i 1
mr () Para dados agrupados
n
Uma curva de distribuição tem assimetria negativa quando ela está desviada à
esquerda; e positiva se estiver desviada à direita. Se não estiver desviada nem à
esquerda, nem à direita, então a curva é simétrica e a distribuição é normal.