Escolar Documentos
Profissional Documentos
Cultura Documentos
A estatística pode ser definida como a ciência que trata com a organização, descrição,
análise e interpretação de conjuntos de dados. Usando esta definição, podemos considerar que a
ciência estatística pode ser dividida basicamente em duas partes: a estatística descritiva, que trata
da organização e descrição dos dados e a estatística inferencial que cuida da sua análise e
interpretação. A estatística descritiva descreve um conjunto de dados sem tirar conclusões de
caráter mais genérico e a inferência estatística tira conclusões sobre uma determinada população
utilizando apenas uma parte dela. Assim, pode se dizer que a estatística é aplicável a todas as
áreas do conhecimento que usam dados experimentais.
Em uma pesquisa estatística precisamos coletar dados que possam fornecer informações
capazes de responder nossos questionamentos. Mas para que os resultados de uma pesquisa
tenham confiabilidade, tanto a coleta dos dados quanto a sua análise devem ser feitas de forma
criteriosa e objetiva.
As principais etapas de uma pesquisa são:
a) definição do problema (objetivos);
b) planejamento da pesquisa;
c) execução da pesquisa;
d) dados;
e) análise dos dados;
f) resultados;
g) conclusões.
Embora a aplicação de técnicas estatísticas seja feita basicamente na etapa de análise dos
dados, a metodologia estatística deve ser aplicada nas diversas etapas da pesquisa, interagindo
com a metodologia da área em estudo. Ou seja, desde o planejamento da pesquisa, até a obtenção
dos resultados. Do mesmo modo, para que a utilização dos resultados estatísticos seja feita de
forma correta, torna-se necessário que o pesquisador conheça os princípios básicos das técnicas
usadas.
População: é o conjunto de elementos que formam o universo de nosso estudo e que são
passíveis de serem observados.
2
Unidade experimental ou parcela: é o elemento que vai ser observado ou a unidade que
vai receber o tratamento. Por exemplo, dependendo do experimento, a unidade experimental
pode ser um animal, uma peça fabricada, uma pessoa, etc.
Estatística: é uma característica descritiva dos elementos da amostra, como por exemplo,
a média de alguma variável, etc.
Variáveis quantitativas: são aquelas que descrevem quantidades e são associadas a números.
As variáveis quantitativas são classificadas em discretas e contínuas.
Variáveis quantitativas discretas: assumem apenas determinados valores no campo dos reais.
Em geral, descrevem problemas de contagem. Assumem, portanto, somente valores inteiros.
Exemplos:
a) Conceito obtido pelos alunos de pós-graduação de uma determinada Universidade (A, B, C,
D, E).
b) Sexo dos alunos da UNIOESTE (M, F).
c) Classe de renda dos operários do bairro B (baixa, média, alta).
d) Raça dos bovinos da estância E (holandês, nelore, zebu).
Exemplo: Visando planejar uma dieta alimentar padrão para os funcionários de certa empresa,
um nutricionista anotou o peso e a altura de 10 deles. Tomando X e Y para descrever,
respectivamente, as variáveis quantitativas contínuas peso em kg e altura em cm, temos a
variável bidimensional (X, Y) e um conjunto de pares ordenados (xi, yi). Por exemplo:
Note que o nutricionista poderia ter julgado relevante tomar a idade Z dos funcionários. Neste
caso, teríamos uma variável tridimensional (X, Y, Z) descrita por ternas ordenadas (xi, yi, zi).
Poderia-se incluir, também, a variável sexo (qualitativa).
1.5.1 Tabelas
Título é a indicação que precede a tabela e que contém a designação do fato observado, o
local de ocorrência e a época em que o mesmo foi registrado.
Corpo é um conjunto de colunas e linhas que contém nas ordens vertical e horizontal, as
informações sobre o fato observado. Casa é o cruzamento de uma coluna com uma linha.
Cabeçalho é a parte superior da tabela, que explica o conteúdo das colunas.
Coluna indicadora é a parte da tabela que especifica o conteúdo das linhas.
Estatística – Prof. Wilson Alves de Oliveira
4
Exemplo:
1.5.2 Gráficos
Exemplo: Para a variável “nº de defeitos por unidade”, cujos valores são dados na tabela abaixo,
obtém-se um gráfico de colunas da seguinte forma.
Xi Frequência
0 4
1 7
2 5
3 2
4 1
5 1
Total 20
Exemplo:
3 Gráfico em linhas
Sua construção requer a representação da variável tempo no eixo das abcissas (horizontal)
e a frequência no eixo das ordenadas (vertical). Utiliza-se, geralmente, para estudos de séries
temporais (cronológica). Seus objetivos são: em primeiro lugar descrever o comportamento
passado desses dados e em segundo lugar analisar este comportamento.
Exemplo:
4 Gráfico em setores
Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos
ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em
tantos setores quantas são as partes. Os setores são tais que suas áreas são, respectivamente,
proporcionais aos dados da tabela. Obtemos cada setor por meio de uma regra de três simples e
direta, lembrando que o total da tabela corresponde a 360º.
Obs: 1. O gráfico em setores só deve ser empregado quando há, no máximo, sete classificações.
2. Se a tabela já apresenta os dados em porcentagem, obtemos os respectivos valores em
graus multiplicando o valor percentual por 3,6.
Estatística – Prof. Wilson Alves de Oliveira
8
1. Dados brutos. O conjunto dos dados numéricos obtidos após a crítica dos valores coletados
constitui-se nos dados brutos.
2. Rol. É o arranjo dos dados brutos em ordem de frequência crescente ou decrescente.
3. Amplitude total ou “range” (R). É a diferença entre o maior e o menor valor
observado.
4. Frequência absoluta (fi). É o número de vezes que o elemento aparece na amostra, ou o
número de elementos pertencentes a uma classe.
5. Distribuição de frequência. É o arranjo dos valores e suas respectivas frequências.
6. Número de classes (K). Não há uma fórmula exata para o cálculo do número de classes. São
dadas duas soluções.
a) K = 5 para n 25 e K n , para n > 25;
b) Fórmula de Sturges K 1 3,22 log n .
7. Amplitude das classes (h).
hRK
Assim como no caso do número de classes (K), a amplitude das classes (h) deve ser aproximada
para um número inteiro.
8. Limites das classes. Existem diversas maneiras de expressar os limites das classes.
a) a b, a classe compreende valores de a, inclusive, até b, exclusive.
b) a b, a classe compreende valores de a, exclusive, até b, inclusive.
c) a b, a classe compreende valores de a, exclusive, até b, exclusive.
d) a b, a classe compreende valores de a, inclusive, até b, inclusive.
9. Ponto médio das classes (Xi). É a média aritmética entre o limite superior e o limite inferior
da classe.
10. Frequência absoluta acumulada (Fac). É a soma das frequências dos valores inferiores ou
iguais ao valor dado.
fi
11. Frequência relativa (ri). É dada por ri .
n
12. Frequência relativa acumulada (Ri). É o quociente entre a frequência acumulada da classe
Fac
e o total de elementos, Ri .
n
Estatística – Prof. Wilson Alves de Oliveira
9
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97
Solução:
Amplitude total (R): R = 97 – 33 = 64;
64
Amplitude das classes (h): h 9,14 . Para facilitar usaremos h = 10.
7
Classes fi Fac Xi ri Ri
30 40 4 4 35 0,08 0,08
40 50 6 10 45 0,12 0,20
50 60 8 18 55 0,16 0,36
60 70 13 31 65 0,26 0,62
70 80 9 40 75 0,18 0,80
80 90 7 47 85 0,14 0,94
90 100 3 50 95 0,06 1,00
Total 50 - - 1,00 -
Tanto o histograma como os gráficos em colunas dão uma idéia da forma da distribuição
da variável sob consideração.
Um procedimento alternativo para resumir um conjunto de valores, com o objetivo de se
obter uma idéia da forma de sua distribuição, é o ramo e folhas (Tukey, 1977). Uma vantagem do
ramo e folhas sobre o histograma é que não perdemos informação sobre os dados em si.
Não existe uma regra fixa para construir o ramo e folhas, mas a idéia básica é dividir cada
observação em duas partes: a primeira (o ramo) é colocada à esquerda de uma linha vertical, a
segunda (a folha) é colocada à direita.
Estatística – Prof. Wilson Alves de Oliveira
11
Vamos construir o ramo e folhas dos salários dos 36 empregados. Assim, para os salários
4,00 e 4,56, o 4 é o ramo e 00 e 56 são as folhas.
4 00 56
5 25 73
6 26 66 86
7 39 44 59
8 12 46 74 95
9 13 35 77 80
10 53 76
11 06 59
12 00 79
13 23 60 85
14 69 71
15 99
16 22 61
17 26
18 75
19 40
20
21
22
23 30
Estatística – Prof. Wilson Alves de Oliveira
12
LISTA DE EXERCÍCIOS Nº 1
1. Classifique as variáveis: Estado civil, Grau de instrução, Nº de filhos, Salário, Idade e Região
de procedência, quanto aos tipos de variáveis.
2. Faça uma tabela de distribuição de frequências e um gráfico de setores para a variável grau de
instrução. Comente os resultados.
5. As taxas médias geométricas de incremento anual (por 100 habitantes) dos 30 maiores
municípios do Brasil estão dadas abaixo.
Estatística – Prof. Wilson Alves de Oliveira
13
x
i 1
i
x , onde n é o número de elementos do conjunto.
n
x
i 1
i
3 7 8 10 12 40
x 8.
n 5 5
Sejam x1, x2, ... , xn, n valores da variável X e sejam f1, f2, ... , fn as respectivas
frequências. A média aritmética de X é dada por:
n
xi fi n
x i 1
, onde n f i .
n i 1
Exemplos:
xi 1 2 3 4
fi 1 3 5 1
xi fi xifi
1 1 1
2 3 6
3 5 15
4 1 4
Total 10 26
Estatística – Prof. Wilson Alves de Oliveira
15
Então,
n
x f i i
26
x i 1
2,6 .
n 10
Então,
n
x f i i
268
x i 1
6,7.
n 40
Portanto, podemos afirmar que a renda média deste grupo de 40 famílias é de 6,7 salários
mínimos.
n .x n .x nk .xk n .x i i
xG 1 1 2 2 i 1
.
n1 n2 nk n i
i
Estatística – Prof. Wilson Alves de Oliveira
16
1) 4, 5, 6, 7, 8 onde, n1 = 5 e x1 6;
2) 1, 2, 3 onde, n2 = 3 e x2 2;
3) 9, 10,11, 12, 13 onde, n3 = 5 e x3 11;
5 6 3 2 5 11 91
xG 7.
535 13
1.8.4 Mediana
2º) Se n for par, a mediana será a média aritmética entre os elementos centrais, de ordem
n n
e 1.
2 2
Exemplos:
a) 5, 7, 8, 10, 14.
n 1 5 1
n = 5 (ímpar), então, a mediana será o elemento de ordem 3º.
2 2
Logo, Md = 8.
n= 6 (par), então, colocados os valores em ordem, a mediana será a média entre os elementos de
n 6 n
ordem 3º e 1 4º .
2 2 2
Logo,
8 10
Md 9.
2
Estatística – Prof. Wilson Alves de Oliveira
17
n 1 11 1
n = 11, n é ímpar, logo a mediana será o elemento de ordem 6º.
2 2
Através da frequência acumulada (Fac) encontra-se o valor xi correspondente á mediana.
Portanto, Md = 3.
b)
xi fi Fac
82 5 5
85 10 15
87 15 30 21º e 22º
89 8 38
90 4 42
Total 42 -
n 42
n = 42, n é par, logo a mediana será a média entre os elementos de ordem 21º e
2 2
n 87 87
1 22º , ou seja, Md 87.
2 2
O procedimento usado para o cálculo da mediana para dados agrupados é dado a seguir.
Md lmd
n
2
f .h
, onde:
f Md
Estatística – Prof. Wilson Alves de Oliveira
18
Exemplo: Determinar a mediana para a variável renda familiar utilizada no item 1.8.2 (b).
n 40
1º passo: 20 ;
2 2
2º passo: pela frequência acumulada identifica-se a classe que contém a mediana, ou seja, 6 8
é a classe mediana.
3º passo: aplica-se a fórmula:
Md lmd
n2 f .h 6 20 15 2 6 0,7 6,7 .
f Md 14
1.8.6 Moda
Moda (Mo) é o valor que aparece mais vezes, isto é, o valor ao qual esteja associada à
frequência absoluta mais alta.
Um conjunto pode não apresentar moda, sendo então, denominado conjunto amodal, caso
em que todos os valores da variável ocorrem com a mesma intensidade. Por outro lado, podemos
ter conjuntos plurimodais, quando houver mais de um valor predominante.
Exemplos:
b) 4, 4, 5, 5, 6, 6 Conjunto amodal.
d) 1, 2, 3, 4, 5 Conjunto amodal.
A classe que apresenta maior frequência é denominada classe modal. Pela definição,
podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os
limites da classe modal. Existem diversas fórmulas para o cálculo da moda. Veremos duas delas.
Estatística – Prof. Wilson Alves de Oliveira
19
1) Moda bruta
Uma idéia aproximada da moda e muito útil em problemas práticos é a moda bruta,
definida como o ponto médio da classe modal.
2) Fórmula de Czuber
Procedimento:
1º) Identifica-se a classe modal.
2º) Aplica-se a fórmula:
d1
Mo l h, onde:
d1 d 2
Exemplo: Determinar a moda para a variável renda familiar utilizada no item 1.8.2 (b).
Classes fi
2 4 5
4 6 10
6 8 14
8 10 8
10 12 3
Total 40
d1 (14 10)
Mo l h 6 2 6,8 .
d1 d 2 (14 10) (14 8)
Média = 6,7
Mediana = 6,7
Moda = 6,8
Estatística – Prof. Wilson Alves de Oliveira
20
x Md Mo
Mo Md x
x Md Mo
Estatística – Prof. Wilson Alves de Oliveira
21
De maneira geral, uma primeira idéia sobre qual delas escolher pode ser dada pelos
seguintes itens:
a) Escolha da média
i) Quando é necessário o tratamento matemático;
ii) Quando os dados têm distribuição aproximadamente simétrica;
iii) Quando for necessário obter posteriormente outros parâmetros que podem depender
da média, como o desvio padrão, a variância, etc.
b) Escolha da mediana
i) Quando há valores discrepantes que podem “distorcer” a média;
ii) Quando desejamos conhecer o ponto central exato da distribuição;
iii) Quando a distribuição dos dados é muito assimétrica.
c) Escolha da moda
i) Quando a medida de interesse é o ponto mais típico ou popular dos dados;
ii) Quando precisamos apenas de uma rápida idéia sobre a tendência central dos dados.
A mediana caracteriza um conjunto de dados devido à sua posição central. Mas ela tem
uma outra característica importante, pois divide o conjunto de dados em dois grupos com o
mesmo número de elementos. Existem outras medidas de posição com esta característica. São os
quartis, os decis, e os percentis que são chamadas de “separatrizes”.
1.8.8 Quartis
Os quartis dividem um conjunto de dados em quatro partes iguais. Assim:
Q1 = 1º quartil, deixa 25% dos elementos abaixo.
Q2 = 2º quartil, coincide com a mediana, deixa 50% dos elementos abaixo.
Q3 = 3º quartil, deixa 75% dos elementos abaixo.
Determinação de Q1:
1º Passo: calcula-se n/4;
2º Passo: identifica-se a classe Q1 pela frequência acumulada;
3º Passo: aplica-se a fórmula:
Q1 lQ1
n4 f .h .
f Q1
Estatística – Prof. Wilson Alves de Oliveira
22
Determinação de Q3:
1º Passo: calcula-se 3n/4;
2º Passo: identifica-se a classe Q3 pela frequência acumulada;
3º Passo: aplica-se a fórmula:
Q3 lQ3
34n f .h .
f Q3
Exemplo: Determinar Q1 e Q3 para a variável renda familiar utilizada no item 1.8.2 (b).
1º Passo: n = 40;
n 40 3n 3(40)
10 (Q1); 30 (Q3);
4 4 4 4
2º Passo: pela frequência acumulada identifica-se a classe Q1 e a classe Q3.
3º Passo: aplicam-se as fórmulas:
Q1 lQ1
n4 f .h 4 10 5.2 5 e
f Q1 10
Q3 lQ3
34n f .h 8 30 29.2 8,25 .
f Q3 8
Então, 25% dos elementos estão abaixo de Q1 = 5, ou seja, 25% das famílias ganham
menos que 5 salários mínimos e 75% dos elementos estão abaixo de Q3 = 8,25, ou seja 75% das
famílias ganham menos que 8,25 salários mínimos.
Obs: 50% dos elementos estão abaixo de Q2 = Md = 6,7, ou seja, 50% das famílias ganham
menos que 6,7 salários mínimos.
Estatística – Prof. Wilson Alves de Oliveira
23
1.8.9 Decis
Os decis são valores que dividem um conjunto de dados em 10 partes iguais. O cálculo é
dado por:
in
1º Passo: calcula-se , onde i = 1, 2, 3, 4, 5, 6, 7, 8 e 9;
10
2º Passo: identifica-se a classe Di pela frequência acumulada;
3º Passo: aplica-se a fórmula:
Di lDi
10in f .h .
f Di
1.8.10 Percentis
São medidas que dividem um conjunto de dados em 100 partes iguais. O cálculo é dado
por:
in
1º Passo: calcula-se , onde i = 1, 2, 3, ... , 98, 99;
100
2º Passo: identifica-se a classe Pi pela frequência acumulada;
3º Passo: aplica-se a fórmula:
Pi lPi
100in f .h .
f Pi
Exemplo: Determinar o decil 1 (D1) e o percentil 90 (P90) para a variável renda familiar
utilizada no item 1.8.2 (b).
Classes fi Fac
2 4 5 5 (D1)
4 6 10 15
6 8 14 29
8 10 8 37 ( P90)
10 12 3 40
Total 40 -
1º Passo: n = 40;
in 1(40) in 90(40)
4 (D1); 36 (P90);
10 10 100 100
Estatística – Prof. Wilson Alves de Oliveira
24
D1 lD1
10in f .h 2 4 0.2 3,6 e
f D1 5
P90 lP90
100in f .h 8 36 29.2 9,75 .
f p90 8
Então, 10% dos elementos estão abaixo de D1 = 3,6, ou seja, 10% das famílias ganham
menos que 3,6 salários mínimos e 90% das famílias ganham menos que 9,75 salários mínimos.
1.9.2 Variância
A variância pode ser definida como a soma dos quadrados dos desvios dividida pelo
número de elementos da amostra menos 1 (n – 1). Este valor é chamado de graus de liberdade.
É obtida pela fórmula:
1 n
s2 x i x 2 .
n 1 i 1
1 x 2
x i
i
s
2 2
.
n 1 i n
Estatística – Prof. Wilson Alves de Oliveira
25
1 x f 2
x i f i
i i
s
2 2
.
n 1 i n
Obs. s2 indica a variância amostral. Se os dados são provenientes de uma população, usa-
se 2 para indicar a variância e no lugar de n – 1 usa-se N (tamanho da população).
Exemplo. Determinar a variância e o desvio padrão para a variável renda familiar utilizada no
item 1.8.2 (b).
Classes fi
2 4 5
4 6 10
6 8 14
8 10 8
10 12 3
Classes fi xi xi f i xi2 f i
2 4 5 3 15 45
4 6 10 5 50 250
6 8 14 7 98 686
8 10 8 9 72 648
10 12 3 11 33 363
Total 40 - 268 1992
268
A média, já obtida anteriormente, é dada por x 6,7 .
40
Estatística – Prof. Wilson Alves de Oliveira
26
A variância,
s s 2 5,04 2,24 .
Portanto, podemos afirmar que a renda média deste grupo de 40 famílias é de 6,7 salários
mínimos, com uma variação de 2,24 salários mínimos, medidas pelo desvio padrão.
s
CV 100 para dados referentes a uma amostra ou
x
CV 100 para dados referentes a uma população.
x
Sua vantagem é caracterizar a dispersão dos dados em termos relativos ao seu valor médio.
Assim, uma pequena dispersão absoluta pode ser, na verdade, considerável quando comparada
com a ordem de grandeza dos valores da variável e vice-versa.
Grupo A: 1, 3 e 5;
Grupo B: 53, 55 e 57.
s 2
CV (100) (100) 66,67 % .
x 3
s 2
CV (100) (100) 3,64 % .
x 55
Um CV = 66,67 % indica uma dispersão dos dados em relação à média muito grande, ou
seja, a dispersão relativa é alta. Já um CV = 3,64 % indica que a dispersão dos dados em relação
à média é pequena.
Estatística – Prof. Wilson Alves de Oliveira
27
x Mo
As ( P ) , onde se As(P) = 0, a distribuição é simétrica;
s
se As(P) > 0, a distribuição é assimétrica positiva;
se As(P) < 0, a distribuição é assimétrica negativa.
Para a variável renda familiar utilizada no item 1.8.2 (b), o coeficiente de assimetria é dado por:
x Mo 6,7 6,8
As ( P) 0,045 , portanto, a distribuição tem uma leve assimetria
s 2,24
negativa.
Quando |As(P)| < 0,15, podemos considerar a distribuição como praticamente simétrica.
Por outro lado, costuma-se considerar a assimetria como moderada se 0,15 < |As(P)| < 1, e forte
se |As(P)| > 1.
Q1 Q3 2Q2
A(Y ) .
Q3 Q1
Estatística – Prof. Wilson Alves de Oliveira
28
Uma distribuição cuja curva tem a forma da curva 1, tem seu coeficiente de curtose
C = 0,263 e é dita mesocúrtica. Se ela tem uma curva mais afilada, como a curva 2, ela é dita
leptocúrtica e tem C < 0,263. Se a curva é mais achatada, como a curva 3, ela é dita platicúrtica e
tem coeficiente de curtose C > 0,263.
Dentre os vários coeficientes de curtose disponíveis, tem-se o coeficiente de Keley,
definido com base nas separatrizes.
Q3 Q1 dQ
C(K ) onde,
2D9 D1 D9 D1
Q3 Q1
dQ é o desvio semi-quartil, uma medida de dispersão que, em geral, é pouco afetada
2
por valores extremos.
Para a variável renda familiar utilizada no item 1.8.2 (b) o coeficiente de curtose é dado por:
Q3 Q1 8,25 5
C(K ) 0,264 .
2D9 D1 29,75 3,6
Portanto, a curva que descreve os dados tem uma tendência para a forma platicúrtica (C > 0,263).
Lembrando que esta distribuição é praticamente simétrica.
Vários são os procedimentos que adotam as separatrizes para descrever os dados. Dentre
eles, o resumo de cinco números que associa os limites inferior e superior do rol aos quartis,
fornecendo uma idéia bastante razoável da dispersão, da tendência central e da forma da
distribuição. O resumo de cinco números tem a seguinte forma:
Título
Md
Q1 Q3
l L
Estatística – Prof. Wilson Alves de Oliveira
29
Pontos discrepantes
Q3 + 3dQ
Região de Alerta
Q3 + 2dQ
Q3
Md
Q1
Q1 - 2dQ
Região de Alerta
Q1 - 3dQ
Pontos discrepantes
Obs. As linhas tracejadas seguem, abaixo e acima da caixa, até encontrar l ou L, tendo como
limites Q1 - 2dQ e Q3 + 2dQ, respectivamente.
Estatística – Prof. Wilson Alves de Oliveira
30
6,0 2,3 4,3 8,5 3,9 5,3 6,0 4,1 11,3 3,8
4,1 2,2 4,2 4,6 7,7 5,0 6,9 3,0 6,5 4,9
4,1 4,1 6,0 2,5 13,8 7,2 6,0 7,1 5,0 8,3
2,6 3,5 6,0 5,8 4,4 4,4 3,5 4,3 3,8 4,1
Como vamos utilizar as separatrizes, é de grande auxílio, a ordenação dos dados. Então,
fazendo o rol temos:
2,2 2,3 2,5 2,6 3,0 3,5 3,5 3,8 3,8 3,9
4,1 4,1 4,1 4,1 4,1 4,2 4,3 4,3 4,4 4,4
4,6 4,9 5,0 5,0 5,3 5,8 6,0 6,0 6,0 6,0
6,0 6,5 6,9 7,1 7,2 7,7 8,3 8,5 11,3 13,8
n 40 n
Cálculo da mediana: n é par, logo 20 e 1 20 1 21 .
2 2 2
Portanto,
4,4 4,6
Md 4,5.
2
Cálculo do Q1: o 1º quartil (dados não agrupados) é a média aritmética dos elementos de ordem
n 40 n
10 e 1 10 1 11 .
4 4 4
Portanto,
3,9 4,1
Q1 4,0 .
2
3n 3(40) 3n
30 e 1 30 1 31 .
4 4 4
Portanto,
6,0 6,0
Q3 6,0 .
2
Estatística – Prof. Wilson Alves de Oliveira
31
Q3 Q1 6,0 4,0
dQ 1,0 .
2 2
Assim, o limite superior do rol, L = 13,8 parece ser um valor discrepante dos demais.
Q1 – 2dQ = 4 – 2(1) = 2
Q1 – 3dQ = 4 – 3(1) = 1 e
Q3 + 2dQ = 6 + 2(1) = 8
Q3 + 3dQ = 6 + 3(1) = 9
e devem ser vistos com cautela. Já os valores 11,3 e 13,8 que estão além do ponto crítico
Q3+3dQ são candidatos a valores discrepantes e devem ser estudados. Detalhes sobre o assunto
podem obtidos em Tukey (1977), entre outros.
Estatística – Prof. Wilson Alves de Oliveira