Escolar Documentos
Profissional Documentos
Cultura Documentos
( x − )
2
i
= i =1
(4.1)
N
A Equação acima é empregada quando tratamos de uma população de dados não
agrupados.
Quando nosso interesse não se restringe à descrição dos dados, mas partindo da
amostra, visamos tirar inferências válidas para a respectiva população, convém efetuar uma
modificação, que consiste em usar o divisor n - 1 em lugar de N. A equação ficará então:
( x − x )
2
s= i
(4.2)
n −1
s= + + + +
5 −1 5 −1 5 −1 5 −1 5 −1
( 0, 4 ) ( −4, 6 ) ( −2, 6 ) ( 4, 4 ) ( 2, 4 )
2 2 2 2 2
s= + + + +
4 4 4 4 4
0,16 + 21,16 + 6, 76 + 19,36 + 5, 76 53, 2
s= = 3, 65
4 4
( x − ) fi
2
=
i (4.3)
f i
( x − x ) f
2
i i
s= (4.4)
f −1 i
= + + +
333 333 333 333
2, 43 58 0,31106 0,19 95 2, 07 74 346, 23
= + + + = 1, 02
333 333 333 333 333
Não podemos dizer que o desvio padrão do exemplo 4.2 é menor que o do exemplo
4.1, já que possuem unidades de medidas diferentes.
4.3 Variância (σ²)
É o desvio padrão elevado ao quadrado e é simbolizado por σ². A variância é uma
medida que tem pouca utilidade como estatística descritiva, porém é extremamente
importante na inferência estatística.
Mede a variabilidade total dos dados, a variância populacional é dada pela equação
(4.5) e a variância amostral pela equação (4.6).
n
( x − )
2
i
2 = i =1
(4.5)
N
( x − x )
2
i
s2 = i =1
(4.6)
n −1
A equação a seguir, pode ser bastante útil no cálculo da soma dos quadrados dos desvios:
( X − X ) = X i2 −
1
( Xi )
2 2
i (4.7)
n
Exemplo 4.3: utilizando o valor do desvio padrão do Exemplo 4.1, tem-se:
s = 3, 65
s ² = 3, 65² = 13,3
4.4 Erros
4.4.1 Bias ou Viés
Chama-se bias ou viés a diferença entre o valor de uma estatística amostral pela
estatística populacional, ou seja, a diferença entre o estimado subtraído pelo parâmetro.
Exemplo 4.4: Dado uma média amostral x = 1250 e a média populacional = 1200 , o bias
ou viés é dado por:
Bias ou viés = 1250 – 1200 = 50
Dizemos que os dados estão viesados ao menos 50 unidades.
4.4.2 Erro Amostral
O erro amostral ocorre em amostras aleatórias e é decorrente da variação entre
indivíduos, de um mesmo indivíduo em momentos diferentes, de instrumentos de medição
etc.
Então, fica intuitivo admitir que ocorra alguma diferença entre as estatísticas
(estimativas) e os parâmetros. Pode-se reduzir e medir o erro amostral.
1,02
sx = 0,06
333
3, 65
CVP = 100 = 0, 4803 100 = 48, 03%
7, 6
Para o Exemplo 4.2, temos = 3,56 e σ = 1,02, calculando novamente:
1, 02
CVP = 100 = 0, 2865 100 28, 65%
3,56
4.6 Medidas De Forma
Quando as amostras são examinadas sob a forma de histograma, onde o valor de cada
variável e respectiva frequência é considerado, verifica-se que elas podem se apresentar sob
diferentes formas, como será discutido a seguir.
4.6.1 Simetria
As curvas das amostras, considerando a Simetria, podem apresentar:
a) Curva Simétrica: quando a média aritmética, a média e a moda apresentam o mesmo
valor e as caudas têm a mesma configuração. Assim sob a forma gráfica e símbolos
temos:
b) Curva Assimétrica Positiva: apresenta uma cauda mais alongada para o lado direito
do observador, a média é maior que a mediana, com a seguinte representação gráfica:
c) Curva assimétrica Negativa: neste caso, a cauda mais alongada é para esquerda do
observador, a média é menor que a mediana, com a seguinte representação gráfica:
Interpretando o coeficiente:
a) g1 = 0, curva Simétrica
b) g1 > 0, curva Assimétrica Positiva
c) g1 < 0, curva Assimétrica Negativa
Exemplo 4.6: Calcule o coeficiente de Assimetria do Exemplo 4.2.
Primeiramente calculamos o valor de m3, sabendo que μ 3,5556.
m3 = = −0, 01556
333
Sabendo que s 1,0212, logo s³ = 1,06494. Substituindo o valor de m3, s³ e n = 333
na equação (4.10).
3332 (−0, 01556)
g1 = −0.01
( 333 − 1) (333 − 2) 1, 06494
O resultado mostra que os dados possuem levemente assimetria negativa, quase sendo
simétrica.
A curva normal, que é a nossa base referencial, recebe o nome de mesocúrtica. Como
mostrado na figura.
sendo m2 = e m4 =
n n
a) g2 = 0, curva Mesocúrtica
b) g2 > 0, curva Leptocúrtica
c) g2 < 0, curva Platicúrtica
Exemplo 4.7: Calcule o coeficiente de Curtose do Exemplo 4.2.
Calculando o valor de m4, sabendo que μ 3,5556.
m4 = = 2, 0286
333
Sabendo que s 1,0212, logo s4 = 1,08751 e m2 = 1,03971. Substituindo o valor de
m4, s4 e n = 333 na equação (4.10).
3332 ( 333 + 1) 2, 02865 − 3 1, 039711, 03971 ( 333 − 1) 3332
g2 = −1,12
( 333 − 1) (333 − 2) (333 − 3) 1, 08751
Indica que a distribuição é platicúrtica, ou seja, sua média não é muito distante em
relação aos demais valores.
4.7 Separatrizes
Além das medidas de posição que estudamos, há outras que, consideradas
individualmente, não são medidas de tendência central, mas estão ligadas à mediana
relativamente à sua característica de separar a série em duas partes que apresentam o mesmo
número de valores.
Essas medidas são os quartis, os decis e os percentis, que juntamente com a mediana,
são conhecidas pelo nome genérico de separatrizes. Assim como na mediana, aqui são
fornecidos os valores da posição onde se encontra as separatrizes.
4.7.1 Quartis
Denominamos quartis os valores de uma série que a dividem em quatro partes iguais.
Precisamos, portanto, de 3 quartis (Q1, Q2 e Q3) para dividir a série em quatro partes iguais.
O primeiro quartil é o valor que divide o conjunto de dados em duas partes, sendo que
25% dos valores são menores que esse coeficiente e 75%, maiores, para isso ordenamos os
valores em um Rol crescente e calculamos o elemento do primeiro quartil, dado por:
1 n
Q1 = (4.12)
4
onde n é o número de valores do conjunto da amostra.
O segundo quartil também divide o conjunto de dados em duas partes, sendo que 50%
dos valores são maiores e 50% são menores. De forma análoga ao primeiro quartil segue:
2 n
Q2 = (4.13)
4
O terceiro quartil também divide em duas partes nas quais 75% dos valores são
menores que o coeficiente e 25% são maiores, dado por:
3 n
Q3 = (4.14)
4
4.7.2 Decis
A definição dos decis obedece ao mesmo princípio dos quartis, com a modificação da
porcentagem de valores que ficam aquém e além do decil que se pretende calcular.
O primeiro decil divide o conjunto em duas partes, sendo que a primeira representa
10% dos valores, enquanto a segunda constitui 90%, ordenando-se os valores em Rol
crescente, calcula-se por:
in
D1 = (4.15)
10
onde i representa o decil a ser calculado (de 1 a 9) e n o número de observações da amostra.
Q3 + 3 IQ Valor Superior
(4.20)
Q1 − 3 IQ Valor Inferior
1100
Q1 = = 25º
4
2 100
Q2 = = 50º
4
3 100
Q3 = = 75º
4
O primeiro quartil (Q1) é referente aos 25% dos alunos que ficam abaixo do número
82, dividindo em 25% dos dados menores que esse valor e 75% maiores.
O segundo quartil (Q2) é referente ao número 95 que ocupa a 50º posição dos dados
em rol, dividindo em 50% dos dados menores que esse valor e 50% maiores. Esse valor é
igual ao da mediana.
O terceiro quartil (Q3) é referente ao número 107 que ocupa a 25º posição dos dados
em rol, dividindo em 75% dos dados menores que esse valor e 25% maiores.
Com o auxílio dos quartis o pesquisador consegue visualizar o comportamento do seu
conjunto de dados nas diferentes concentrações de ocorrências. Podendo obter estimativas
para cada grupo dividido, ou seja, o pesquisador poderia querer conhecer a média das notas
do teste de inteligência para os primeiros 25%, 50% e 75% da amostra.
Para os decis utilizaremos a equação (4.15) indicando como é realizado o seu cálculo
para alguns.
1100
D1 = = 10º
10
2 100
D2 = = 20º
10
3 100
D3 = = 35º
10
9 100
D9 = = 90º
10
Sendo D1, D2, D3 e D9 referentes aos seguintes números 68, 78, 85 e 119.
Os percentis são calculados pela equação (4.16), como anteriormente é realizado para
alguns casos como exemplo.
1 100
C1 = = 1º
100
2 100
C2 = = 2º
100
3 100
C3 = = 3º
100
45 100
C45 = = 45º
100
Sendo C1, C2, C3 e C45 referentes aos seguintes números 62, 63, 64 e 91.
O Intervalo interquartílico é calculado pela equação (4.18).
IQ = Q3 – Q1 = 107 – 82 = 25
Então sabemos que a variabilidade dos prováveis valores ocorrerem é de 25 pontos.
Verificando a existência de valores Outliers e extremos pelas equações (4.19) e (4.20),
respectivamente.
Outliers Valor extremo
107 + 1,5 25 = 144,5 Valor Superior 107 + 3 25 = 182 Valor Superior
82 − 1,5 25 = 44,5 Valor Inferior 82 − 3 25 = 7 Valor Inferior