Escolar Documentos
Profissional Documentos
Cultura Documentos
1.1 Introdução
Variáveis quantitativas: são aquelas que descrevem quantidades e são associadas a números.
As variáveis quantitativas são classificadas em discretas e contínuas.
Variáveis quantitativas discretas: assumem apenas determinados valores no campo dos reais.
Em geral, descrevem problemas de contagem. Assumem, portanto, somente valores inteiros.
Exemplos:
Exemplo: Visando planejar uma dieta alimentar padrão para os funcionários de certa empresa,
um nutricionista anotou o peso e a altura de 10 deles. Tomando X e Y para descrever,
respectivamente, as variáveis quantitativas contínuas peso em kg e altura em cm, temos a
variável bidimensional (X, Y) e um conjunto de pares ordenados (xi, yi). Por exemplo:
Note que o nutricionista poderia ter julgado relevante tomar a idade Z dos funcionários. Neste
caso, teríamos uma variável tridimensional (X, Y, Z) descrita por ternas ordenadas (xi, yi, zi).
Poderia-se incluir, também, a variável sexo (qualitativa).
1.3.1 Tabelas
Título é a indicação que precede a tabela e que contém a designação do fato observado, o
local de ocorrência e a época em que o mesmo foi registrado.
Corpo é um conjunto de colunas e linhas que contém nas ordens vertical e horizontal, as
informações sobre o fato observado. Casa é o cruzamento de uma coluna com uma linha.
Cabeçalho é a parte superior da tabela, que explica o conteúdo das colunas.
Coluna indicadora é a parte da tabela que especifica o conteúdo das linhas.
Nota é a informação de natureza geral, que tem por objetivo conceituar ou esclarecer o
conteúdo apresentado nas tabelas, ou indicar a metodologia utilizada para o levantamento e
elaboração dos dados.
Exemplo:
1.3.2 Gráficos
Exemplo: Para a variável “nº de defeitos por unidade”, cujos valores são dados na tabela abaixo,
obtém-se um gráfico de colunas da seguinte forma.
Xi Frequência
0 4
1 7
2 5
3 2
4 1
5 1
Total 20
Exemplo:
3 Gráfico em linhas
Sua construção requer a representação da variável tempo no eixo das abcissas (horizontal)
e a frequência no eixo das ordenadas (vertical). Utiliza-se, geralmente, para estudos de séries
temporais (cronológica). Seus objetivos são: em primeiro lugar descrever o comportamento
passado desses dados e em segundo lugar analisar este comportamento.
Exemplo:
4 Gráfico em setores
Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos
ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em
tantos setores quantas são as partes. Os setores são tais que suas áreas são, respectivamente,
proporcionais aos dados da tabela. Obtemos cada setor por meio de uma regra de três simples e
direta, lembrando que o total da tabela corresponde a 360º.
Obs: 1. O gráfico em setores só deve ser empregado quando há, no máximo, sete classificações.
2. Se a tabela já apresenta os dados em porcentagem, obtemos os respectivos valores em
graus multiplicando o valor percentual por 3,6.
1. Dados brutos. O conjunto dos dados numéricos obtidos após a crítica dos valores coletados
constitui-se nos dados brutos.
2. Rol. É o arranjo dos dados brutos em ordem de frequência crescente ou decrescente.
3. Amplitude total ou “range” (R). É a diferença entre o maior e o menor valor
observado.
4. Frequência absoluta (fi). É o número de vezes que o elemento aparece na amostra, ou o
número de elementos pertencentes a uma classe.
5. Distribuição de frequência. É o arranjo dos valores e suas respectivas frequências.
6. Número de classes (K). Não há uma fórmula exata para o cálculo do número de classes. São
dadas duas soluções.
a) K = 5 para n ≤ 25 e K ≅ n , para n > 25;
b) Fórmula de Sturges K ≅ 1 + 3,22 log n .
7. Amplitude das classes (h). h ≅ R ÷ K
Assim como no caso do número de classes (K), a amplitude das classes (h) deve ser aproximada
para o maior inteiro.
8. Limites das classes. Existem diversas maneiras de expressar os limites das classes.
a) a | b, a classe compreende valores de a, inclusive, até b, exclusive.
b) a | b, a classe compreende valores de a, exclusive, até b, inclusive.
c) a b, a classe compreende valores de a, exclusive, até b, exclusive.
d) a || b, a classe compreende valores de a, inclusive, até b, inclusive.
9. Ponto médio das classes (xi). É a média aritmética entre o limite superior e o limite inferior
da classe.
10. Frequência absoluta acumulada (Fac). É a soma das frequências dos valores inferiores ou
iguais ao valor dado.
fi
11. Frequência relativa (ri). É dada por ri = .
n
12. Frequência relativa acumulada (Ri). É o quociente entre a frequência acumulada da classe
Fac
e o total de elementos, Ri = .
n
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97
Solução:
Amplitude total (R): R = 97 – 33 = 64;
64
Amplitude das classes (h): h = = 9,14 . Para facilitar usaremos h = 10.
7
Classes fi Fac xi ri Ri
30 | 40 4 4 35 0,08 0,08
40 | 50 6 10 45 0,12 0,20
50 | 60 8 18 55 0,16 0,36
60 | 70 13 31 65 0,26 0,62
70 | 80 9 40 75 0,18 0,80
80 | 90 7 47 85 0,14 0,94
90 | 100 3 50 95 0,06 1,00
Total 50 - - 1,00 -
Tanto o histograma como os gráficos em colunas dão uma idéia da forma da distribuição
da variável sob consideração.
Um procedimento alternativo para resumir um conjunto de valores, com o objetivo de se
obter uma idéia da forma de sua distribuição, é o ramo e folhas (Tukey, 1977). Uma vantagem do
ramo e folhas sobre o histograma é que não perdemos informação sobre os dados em si.
Não existe uma regra fixa para construir o ramo e folhas, mas a idéia básica é dividir cada
observação em duas partes: a primeira (o ramo) é colocada à esquerda de uma linha vertical, a
segunda (a folha) é colocada à direita.
Vamos construir o ramo e folhas dos salários dos 36 empregados. Assim, para os salários 4,00 e
4,56, o 4 é o ramo e 00 e 56 são as folhas.
4 00 56
5 25 73
6 26 66 86
7 39 44 59
8 12 46 74 95
9 13 35 77 80
10 53 76
11 06 59
12 00 79
13 23 60 85
14 69 71
15 99
16 22 61
17 26
18 75
19 40
20
21
22
23 30
LISTA DE EXERCÍCIOS Nº 1
1. Classifique as variáveis Estado civil, Grau de instrução, Nº de filhos, Salário, Idade e Região
de procedência, quanto aos tipos de variáveis.
2. Faça uma tabela de distribuição de frequências e um gráfico de setores para a variável grau
de instrução. Comente os resultados.
5. As taxas médias geométricas de incremento anual (por 100 habitantes) dos 30 maiores
municípios do Brasil estão abaixo.
x i
x= i =1
, onde n é o número de elementos do conjunto.
n
x i
3 + 7 + 8 + 10 + 12 40
x= i =1
= = =8.
n 5 5
Sejam x1, x2, ... , xn, n valores da variável X e sejam f1, f2, ... , fn as respectivas
frequências. A média aritmética de X é dada por:
n
xi fi n
x= i =1
, onde n = f i .
n i =1
Exemplos:
xi 1 2 3 4
fi 1 3 5 1
xi fi xifi
1 1 1
2 3 6
3 5 15
4 1 4
Total 10 26
Então,
n
x f i i
26
x= i =1
= = 2,6 .
n 10
Então,
n
x f i i
268
x= i =1
= = 6,7.
n 40
Portanto, podemos afirmar que a renda média deste grupo de 40 famílias é de 6,7 salários
mínimos.
n .x + n .x + L + nk .xk n .x i i
xG = 1 1 2 2 = i =1
.
n1 + n2 + L + nk n i
i
1) 4, 5, 6, 7, 8 onde, n1 = 5 e x1 = 6;
2) 1, 2, 3 onde, n2 = 3 e x2 = 2;
3) 9, 10,11, 12, 13 onde, n3 = 5 e x3 = 11;
5 × 6 + 3 × 2 + 5 × 11 91
xG = = = 7.
5+3+5 13
1.6.4 Mediana
2º) Se n for par, a mediana será a média aritmética entre os elementos centrais, de ordem
n n
e +1.
2 2
a) 5, 7, 8, 10, 14.
n +1 5 +1
n = 5 (ímpar), então, a mediana será o elemento de ordem = = 3º.
2 2
Logo, Md = 8.
n= 6 (par), então, colocados os valores em ordem, a mediana será a média entre os elementos de
n 6 n
ordem = = 3º e + 1 = 4º .
2 2 2
Portanto, Md = 3.
b)
xi fi Fac
82 5 5
85 10 15
87 15 30 ← 21º e 22º
89 8 38
90 4 42
Total 42 -
n 42
n = 42, n é par, logo a mediana será a média entre os elementos de ordem = = 21º e
2 2
n 87 + 87
+ 1 = 22º , ou seja, Md = = 87.
2 2
O procedimento usado para o cálculo da mediana para dados agrupados é dado a seguir.
Md = lmd +
( n
2
− f ).h
, onde:
f Md
Exemplo: Determinar a mediana para a variável renda familiar usada no exemplo b do item
1.6.2.
Renda Familiar Número de
(Salário Mínimo) Famílias (fi) Fac
2 | 4 5 5
4 | 6 10 15
6 | 8 14 29
8 | 10 8 37
10 | 12 3 40
Total 40 -
n 40
1º passo: = = 20 ;
2 2
2º passo: pela frequência acumulada identifica-se a classe que contém a mediana, ou seja, 6 | 8
é a classe mediana.
3º passo: aplica-se a fórmula:
Md = lmd +
( n
2
− f ).h
= 6+
(20 − 15) × 2 = 6 + 0,71 = 6,71 .
f Md 14
Portanto, 50% dos elementos estão abaixo de Md = 6,71, ou seja, 50% das famílias ganham
menos que 6,71 salários mínimos.
1.6.6 Moda
Moda (Mo) é o valor que aparece mais vezes, isto é, o valor ao qual esteja associada à
frequência absoluta mais alta.
Um conjunto pode não apresentar moda, sendo então , denominado conjunto amodal,
caso em que todos os valores da variável ocorrem com a mesma intensidade. Por outro lado,
podemos ter conjuntos plurimodais, quando houver mais de um valor predominante.
Exemplos:
a) 2, 6, 8, 8, 8, 8, 10, 10, 12, 12, 18 → Mo = 8.
b) 4, 4, 5, 5, 6, 6 → Conjunto amodal.
d) 1, 2, 3, 4, 5 → Conjunto amodal.
A classe que apresenta maior frequência é denominada classe modal. Pela definição,
podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os
limites da classe modal. Existem diversas fórmulas para o cálculo da moda. Veremos duas delas.
1) Moda bruta
Uma idéia aproximada da moda e muito útil em problemas práticos é a moda bruta,
definida como o ponto médio da classe modal.
2) Fórmula de Czuber
Procedimento:
1º) Identifica-se a classe modal.
2º) Aplica-se a fórmula:
d1
Mo = l + h, onde:
d1 + d 2
Classes fi
2 | 4 5
4 | 6 10
6 | 8 14
8 | 10 8
10 | 12 3
Total 40
d1 (14 − 10) 4
Mo = l + h = 6+ ×2 = 6+ × 2 = 6,8 .
d1 + d 2 (14 − 10) + (14 − 8) 4+6
x = Md = Mo
Mo Md x
x Md Mo
De maneira geral, uma primeira idéia sobre qual delas escolher pode ser dada pelos
seguintes itens:
a) Escolha da média
i) Quando é necessário o tratamento matemático;
ii) Quando os dados têm distribuição aproximadamente simétrica;
iii) Quando for necessário obter posteriormente outros parâmetros que podem depender
da média, como o desvio padrão, a variância, etc.
b) Escolha da mediana
i) Quando há valores discrepantes que podem “distorcer” a média;
ii) Quando desejamos conhecer o ponto central exato da distribuição;
iii) Quando a distribuição dos dados é muito assimétrica.
c) Escolha da moda
i) Quando a medida de interesse é o ponto mais típico ou popular dos dados;
ii) Quando precisamos apenas de uma rápida idéia sobre a tendência central dos dados.
A mediana caracteriza um conjunto de dados devido à sua posição central. Mas ela tem
uma outra característica importante, pois divide o conjunto de dados em dois grupos com o
mesmo número de elementos. Existem outras medidas de posição com esta característica. São os
quartis, os decis, e os percentis que são chamadas de “separatrizes”.
1.6.8 Quartis
Os quartis dividem um conjunto de dados em quatro partes iguais. Assim:
Q1 = 1º quartil, deixa 25% dos elementos abaixo.
Q2 = 2º quartil, coincide com a mediana, deixa 50% dos elementos abaixo.
Q3 = 3º quartil, deixa 75% dos elementos abaixo.
Determinação de Q1:
1º Passo: calcula-se n/4.
2º Passo: identifica-se a classe Q1 pela frequência acumulada.
3º Passo: aplica-se a fórmula:
Q1 = lQ1 +
( n4 − f ).h .
f Q1
Determinação de Q3:
1º Passo: calcula-se 3n/4.
2º Passo: identifica-se a classe Q3 pela frequência acumulada.
3º Passo: aplica-se a fórmula:
Q3 = lQ3
(
+ 4
3n
− f ).h
.
f Q3
Exemplo: Determinar os quartis (Q1 e Q3) para a distribuição usada no exemplo b do item 1.6.2.
Renda Familiar Número de
(Salário Mínimo) Famílias (fi) Fac
2 | 4 5 5
4 | 6 10 15 (Q1)
6 | 8 14 29
8 | 10 8 37 (Q3)
10 | 12 3 40
Total 40 -
1º Passo: n = 40;
n 40 3n 3(40)
= = 10 (Q1); = = 30 (Q3);
4 4 4 4
2º Passo: pela frequência acumulada identifica-se a classe Q1 e a classe Q3.
3º Passo: aplicam-se as fórmulas:
Q1 = lQ1 +
(n4 − f ).h = 4 + (10 − 5).2 = 5 e
f Q1 10
Q3 = lQ3 +
(34n − f ).h = 8 + (30 − 29).2 = 8,25 .
f Q3 8
Então, 25% dos elementos estão abaixo de Q1 = 5, ou seja, 25% das famílias ganham
menos que 5 salários mínimos e 75% dos elementos estão abaixo de Q3 = 8,25, ou seja, 75% das
famílias ganham menos que 8,25 salários mínimos.
Obs: 50% dos elementos estão abaixo de Q2 = Md = 6,7, ou seja, 50% das famílias
ganham menos que 6,7 salários mínimos.
1.6.9 Decis
Os decis são valores que dividem um conjunto de dados em 10 partes iguais. O cálculo é
dado por:
i×n
1º Passo: calcula-se , onde i = 1, 2, 3, 4, 5, 6, 7, 8 e 9.
10
2º Passo: identifica-se a classe Di pela frequência acumulada.
3º Passo: aplica-se a fórmula:
Di = lDi +
(10in − f ).h .
f Di
1.6.10 Percentis
São medidas que dividem um conjunto de dados em 100 partes iguais. O cálculo é dado
por:
i×n
1º Passo: calcula-se , onde i = 1, 2, 3, ... , 98, 99.
100
2º Passo: identifica-se a classe Pi pela frequência acumulada.
3º Passo: aplica-se a fórmula:
Pi = lPi +
( in
100
− f ).h
.
f Pi
Exemplo: Determinar o decil 1 (D1) e o percentil 90 (P90) para a distribuição usada no exemplo
b do item 1.6.2.
Renda Familiar Número de
(Salário Mínimo) Famílias (fi) Fac
2 | 4 5 5
4 | 6 10 15
6 | 8 14 29
8 | 10 8 37
10 | 12 3 40
Total 40 -
1º Passo: n = 40;
in 1(40) in 90( 40)
= = 4 (D1); = = 36 (P90);
10 10 100 100
2º Passo: pela frequência acumulada identifica-se a classe D1 e a classe P90.
3º Passo: aplicam-se as fórmulas:
(
in
− f ).h (4 − 0).2 = 2 + 1,6 = 3,6
D1 = l D1 + =2+
10
e
f D1 5
( in
− f ).h (36 − 29).2 = 8 + 1,75 = 9,75 .
P90 = l P90 + =8+
100
f p90 8
Portanto, 10% das famílias ganham menos que 3,6 salários mínimos e 90% ganham
menos que 9,75 salários mínimos.
Obs. Md = Q2 = D5 = P50.
1.7.2 Variância
A variância pode ser definida como a soma dos quadrados dos desvios dividida pelo
número de elementos da amostra menos 1 (n – 1). Este valor é chamado de graus de liberdade.
É obtida pela fórmula:
1 n
s2 = ( x i − x )2 .
n − 1 i =1
1 ( x ) 2
s = x i −
2 2 i
.
n −1 i n
xi x i2
2 4
4 16
5 25
6 36
8 64
25 145
1 ( xi ) 1
2
(25) 2 1
s = xi − = 145 − = (20) = 5 .
2 2
n − 1 i n 4 5 4
1 ( x f ) 2
s = x i f i −
2 2 i i
.
n −1 i n
Obs. s2 indica a variância amostral. Se os dados são provenientes de uma população, usa-
se σ 2 para indicar a variância e no lugar de n – 1 usa-se n.
Exemplo. Determinar a variância e o desvio padrão para os dados da variável renda familiar.
268
A média, já obtida anteriormente, é dada por x = = 6,7 .
40
A variância,
s2 =
1
−
( xi fi )2 = 1 1992 − (268)2 = 1 (196,4) = 5,04 .
i i
2
x f
n −1 i n 40 − 1 40 39
s = s 2 = 5,04 = 2,24 .
Portanto, podemos afirmar que a renda média deste grupo de 40 famílias é de 6,7 salários
mínimos, com uma variação de 2,24 salários mínimos, medidas pelo desvio padrão.
s
CV = ⋅ 100 para dados referentes a uma amostra ou
x
σ
CV = ⋅ 100 para dados referentes a uma população.
x
Sua vantagem é caracterizar a dispersão dos dados em termos relativos ao seu valor médio.
Assim, uma pequena dispersão absoluta pode ser, na verdade, considerável quando comparada
com a ordem de grandeza dos valores da variável e vice-versa.
Grupo A: 1, 3 e 5;
Grupo B: 53, 55 e 57.
s 2
CV = (100) = (100) = 66,67 % .
x 3
s 2
CV = (100) = (100) = 3,64 % .
x 55
Um CV = 66,67 % indica uma dispersão dos dados em relação à média muito grande, ou
seja, a dispersão relativa é alta. Já um CV = 3,64 % indica que a dispersão dos dados em relação
à média é pequena.
x − Mo
As ( P ) = , em que, se As(P) = 0, a distribuição é simétrica;
s
se As(P) > 0, a distribuição é assimétrica positiva;
se As(P) < 0, a distribuição é assimétrica negativa.
Quando |As(P)| < 0,15, podemos considerar a distribuição como praticamente simétrica.
Por outro lado, costuma-se considerar a assimetria como moderada se 0,15 < |As(P)| < 1, e forte
se |As(P)| > 1.
x − Mo 6,7 − 6,8
As ( P) = = = −0,045 , portanto, a distribuição tem uma leve assimetria
s 2,24
negativa (praticamente simétrica).
Pode-se, também, verificar a assimetria dos dados pelo coeficiente de assimetria de Yule,
dado por:
Q1 + Q3 − 2Q2
As (Y ) = ;
Q3 − Q1
Exercício: Obtenha o coeficiente de assimetria de Yule para a variável renda familiar utilizada
anteriormente.
Uma distribuição cuja curva tem a forma da curva 1, tem seu coeficiente de curtose
C = 0,263 e é dita mesocúrtica. Se ela tem uma curva mais afilada, como a curva 2, ela é dita
leptocúrtica e tem C < 0,263. Se a curva é mais achatada, como a curva 3, ela é dita platicúrtica e
tem coeficiente de curtose C > 0,263.
Dentre os vários coeficientes de curtose disponíveis, tem-se o coeficiente de Keley,
definido com base nas separatrizes:
Q3 − Q1 dQ
C(K ) = = em que,
2(D9 − D1 ) D9 − D1
Q3 − Q1
dQ = é o desvio semi-quartil, uma medida de dispersão que, em geral, é pouco afetada
2
por valores extremos.
Q3 − Q1 8,25 − 5
C(K ) = = = 0,264 .
2(D9 − D1 ) 2(9,75 − 3,6 )
Portanto, a curva que descreve os dados tem uma tendência para a forma platicúrtica (C > 0,263).
Lembrando que esta distribuição é praticamente simétrica.
Vários são os procedimentos que adotam as separatrizes para descrever os dados. Dentre
eles, o resumo de cinco números que associa o limite inferior e superior do rol aos quartis,
fornecendo uma idéia bastante razoável da dispersão, da tendência central e da forma da
distribuição. O resumo de cinco números tem a seguinte forma:
Título
Md
Q1 Q3
l L
Pontos discrepantes
Q3 + 3dQ
Região de Alerta
Q3 + 2dQ
Q3
Md
Q1
Q1 - 2dQ
Região de Alerta
Q1 - 3dQ
Pontos discrepantes
Obs. As linhas tracejadas seguem, abaixo e acima da caixa, até encontrar l ou L, tendo como
limites Q1 - 2dQ e Q3 + 2dQ, respectivamente.
6,0 2,3 4,3 8,5 3,9 5,3 6,0 4,1 11,3 3,8
4,1 2,2 4,2 4,6 7,7 5,0 6,9 3,0 6,5 4,9
4,1 4,1 6,0 2,5 13,8 7,2 6,0 7,1 5,0 8,3
2,6 3,5 6,0 5,8 4,4 4,4 3,5 4,3 3,8 4,1
Como vamos utilizar as separatrizes, é de grande auxílio, a ordenação dos dados. Então, fazendo
o rol temos:
2,2 2,3 2,5 2,6 3,0 3,5 3,5 3,8 3,8 3,9
4,1 4,1 4,1 4,1 4,1 4,2 4,3 4,3 4,4 4,4
4,6 4,9 5,0 5,0 5,3 5,8 6,0 6,0 6,0 6,0
6,0 6,5 6,9 7,1 7,2 7,7 8,3 8,5 11,3 13,8
n 40 n
Cálculo da mediana: n é par, logo = = 20 e + 1 = 20 + 1 = 21 .
2 2 2
Portanto,
4,4 + 4,6
Md = = 4,5 .
2
Cálculo do Q1: o 1º quartil (dados não agrupados) é a média aritmética dos elementos de ordem
n 40 n
= = 10 e + 1 = 10 + 1 = 11 .
4 4 4
Portanto,
3,9 + 4,1
Q1 = = 4,0 .
2
3n 3(40) 3n
= = 30 e + 1 = 30 + 1 = 31 .
4 4 4
Portanto,
6,0 + 6,0
Q3 = = 6,0 .
2
Q3 − Q1 6,0 − 4,0
dQ = = = 1,0 .
2 2
Assim, o limite superior do rol, L = 13,8 parece ser um valor discrepante dos demais.
Q1 – 2dQ = 4 – 2(1) = 2
Q1 – 3dQ = 4 – 3(1) = 1 e
Q3 + 2dQ = 6 + 2(1) = 8
Q3 + 3dQ = 6 + 3(1) = 9
e devem ser vistos com cautela. Já os valores 11,3 e 13,8 que estão além do ponto crítico
Q3+3dQ são candidatos a valores discrepantes e devem ser estudados. Detalhes sobre o assunto
podem obtidos em Tukey (1977), entre outros.
LISTA DE EXERCÍCIOS Nº 2
1) Para cada distribuição, determine a média, a mediana e a moda.
a)
Xi 2 3 4 5 7 Resp. x = 3,95 ; Md = Mo = 4
fi 3 5 8 4 2
b)
Xi 77 173 181 275 279 x = 186,35 ; Md = 181; Mo = 77
fi 12 2 2 10 5
c)
Xi 12 13 15 17 x = 13,95 ; Md = 14; Mo = 15
Fac 5 10 18 20
PESOS 40 | 45 45 | 50 50 | 55 55 | 60 60 | 65 65 | 70
Nº de Alunos 4 10 15 8 5 3
3) Para a série 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9.
a) Obtenha a média aritmética e a variância populacional; (6,83; 1,47)
b) Construir a distribuição simples de frequência;
c) Obtenha a média aritmética, a variância e o desvio padrão populacional; (6,83, 1,47 e 1,21)
d) O coeficiente de variação. (17,72 %)
PONTOS 35 | 45 45 | 55 55 | 65 65 | 75 75 | 85 85 | 95
Nº de Alunos 1 3 8 3 3 2
__________________________
Estatística – Prof. Wilson Alves de Oliveira
32
6) Um fabricante de caixas de cartolina fabrica três tipos de caixa. Testa-se a resistência de cada
caixa, tomando-se uma amostra de 100 caixas e determinando-se a pressão necessária para
romper cada caixa. São os seguintes os resultados dos testes:
Tipos de Caixa A B C
Pressão média de ruptura (bária) 150 200 300
Desvio padrão das pressões (bária) 40 50 60
EQUIPE 1: 40 provas
tempo médio: 45 segundos
variância: 400 segundos ao quadrado
EQUIPE 2: tempo: 20 40 50 80
nº de provas: 10 15 30 5
Xi 5 8 13 18 25
fi 4 5 .... 3 1
9) Obtenha o resumo de cinco números e o gráfico de caixa para os dados, salários de 36 empregados
de uma companhia, utilizados na tabela 1 (lista de exercícios nº 1). Comente os resultados.
10) Obtenha o resumo de cinco números e o gráfico de caixa (box plot), identificando possíveis pontos
discrepantes para as seguintes observações: