Escolar Documentos
Profissional Documentos
Cultura Documentos
Castanhal/PA
2017
Prof. Carlos Alberto Jacomo
Unidade I – Análise Exploratória dos Dados 2
Índice
Introdução........................................................................................3
1.Tabelas Estatísticas…..............................…………………………4
2. Graficos…………………….............................……………………..5
3. Distribuição de Frequências..................................................10
Exercícios......................................................................................21
4. Medidas de Posição..................................................................24
Exercícios.......................................................................................53
Introdução
1. Tabelas Estatísticas
Note-se que as Tabelas não contém as bordas dos lados, caso contrário
não seriam Tabelas e passariam a chamar de Quadros.
Prof. Carlos Alberto Jacomo
Unidade I – Análise Exploratória dos Dados 5
2. Gráficos
2.1. Diagramas
250
200
150
100
50
0
2.2. Cartogramas
2.3. Pictograma
3. Distribuição de frequências
3.1. População
3.2. Amostra
1. Dados brutos
2. Rol
5. Distribuição de frequências
xi fi
1 1
3 3
4 2
6 2
7 6
10 3
12 5
Total 22
Classes fi
7 |-- 17 6
17 |-- 27 15
27 |-- 37 20
37 |-- 47 10
47 |-- 57 5
Total 56
xi fi Fi
1 1 1
3 3 4
4 2 6
6 2 8
7 6 14
10 3 17
12 5 22
Total 22
xi fi fri
1 1 1/22
3 3 3/22
4 2 2/22
6 2 2/22
7 6 6/22
10 3 3/22
12 5 5/22
Total 22 1
12. Histograma
Exemplo
Uma empresa fabrica e entrega seus produtos para várias lojas de
varejo e quer diminuir o número de devoluções. Para isto, investigou o número
de ocorrências geradoras de devolução da entrega no último semestre,
conforme apresentado na tabela abaixo:
Exemplo
33 – 35 – 35 – 39 – 41 – 41 – 42 – 45 – 47 – 48
50 – 52 – 53 – 54 – 55 – 55 – 57 – 59 – 60 – 60
61 – 64 – 65 – 65 – 65 – 66 – 66 – 66 – 67 – 68
69 – 71 – 73 – 73 – 74 – 74 – 76 – 77 – 77 – 78
80 – 81 – 84 – 85 – 85 – 88 – 89 – 91 – 94 – 97
Resolução:
- amplitude total (R):
R = 97 – 33 = 64
Classes fi Fi fri xi
30 |-- 40 4 4 0,08 35
40 |-- 50 6 10 0,12 45
50 |-- 60 8 18 0,16 55
60 |-- 70 13 31 0,26 65
70 |-- 80 9 40 0,18 75
80 |-- 90 7 47 0,14 85
90 |-- 100 3 50 0,06 95
Total 50 1
Exercícios
1 – Dada a amostra: 3, 4, 4, 5, 7, 6, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6, pede-
se:
a) Construir a distribuição de frequências;
b) Construir o gráfico das frequências;
c) Determinar as frequências relativas;
d) Determinar as frequências acumuladas;
e) Qual é a amplitude amostral;
f) Qual a porcentagem de elementos maiores que 5.
151 – 152 – 154 – 155 – 158 – 159 – 159 – 160 – 161 – 161
161 – 162 – 163 – 163 – 163 – 164 – 165 – 165 – 165 – 166
166 – 166 – 166 – 167 – 167 – 167 – 167 – 167 – 168 – 168
168 – 168 – 168 – 168 – 168 - -168 – 168 – 168 – 169 – 169
169 – 169 – 169 – 169 – 169 – 170 – 170 – 170 – 170 – 170
170 – 170 – 171 – 171 – 171 – 171 – 172 – 172 – 172 – 173
173 – 173 – 174 – 174 – 174 – 175 – 175 – 175 – 175 – 176
176 – 176 – 176 – 177 – 177 – 177 – 177 – 178 – 178 – 178
179 – 179 – 180 – 180 – 180 – 180 – 181 – 181 – 181 – 182
182 – 182 – 183 – 184 – 185 – 186 – 187 – 188 – 190 – 190
Pede-se determinar:
a) A amplitude amostral;
b) O número de classes;
c) A amplitude das classes;
d) Os limites das classes;
e) As frequências absolutas das classes;
f) As frequências relativas;
g) Os pontos médios das classes;
h) A frequência acumulada;
i) O histograma – polígono de frequência;
j) O gráfico de frequência acumulada.
Determinar:
a) O rol;
b) As distribuição de frequências (variável contínua). (Sugestão: iniciar por
0 e intervalo de classe 1,5);
c) O maior e o menor graus;
d) A amplitude total;
e) Qual a porcentagem dos alunos que tiveram nota menor do que 4;
f) Qual o limite superior da segunda classe;
g) Qual o ponto médio da quarta classe;
h) Qual o ponto médio da terceira classe;
i) Os gráficos (histograma e o gráfico das frequências acumuladas).
69 – 57 – 72 – 54 – 93 – 68 – 72 – 58 – 64 – 62
65 – 76 – 60 – 49 – 74 – 59 – 66 – 83 – 70 – 45
60 – 81 – 71 – 67 – 63 – 64 – 53 – 73 – 81 – 50
67 – 68 – 53 – 75 – 65 – 58 – 80 – 60 – 63 – 53
Valores fi Fi fri
1 4 0,08
2 4
3 16 0,16
4 7 0,14
5 5 28
6 38
7 7 45 0,14
8
4. Medidas de posição
Resolução:
N° de meninos fi
0 2
1 6
2 10
3 12
4 4
N° de meninos fi xifi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
Temos então:
Logo:
número de classes.
obs:
i Estaturas (cm) fi
1 150 |-- 154 4
2 154 |-- 158 9
3 158 |-- 162 11
4 162 |-- 166 8
5 166 |-- 170 5
6 170 |-- 174 3
40
i Estaturas (cm) fi
1 150 |-- 154 4 152 608
2 154 |-- 158 9 156 1404
3 158 |-- 162 11 160 1760
4 162 |-- 166 8 164 1312
5 166 |-- 170 5 168 840
6 170 |-- 174 3 172 516
40 6440
Logo:
A moda (Mo) é o valor que ocorre com maior frequência em uma série de
valores (conjunto de dados), isto é, é o valor mais frequente, mais típico ou
mais comum em uma distribuição. Por exemplo, o salário modal dos
empregados de uma indústria é o salário mais comum, isto é, o salário
recebido pelo maior número de empregados dessa indústria. Analogamente,
se, em determinada universidade, engenharia é o curso de maior procura, ele
também representa a moda.
Dados não-agrupados: Simplesmente procurar o valor que mais se
repete.
7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 , 13 , 15
Mo = 10
3 , 5 , 8 , 10 , 12 , 13
2,3,4,4,4,5,6,7,7,7,8,9
Mo = 4 e Mo = 7 (bimodal)
Dados agrupados:
N° de meninos fi
0 2
1 6
2 10
3 12
4 4
A moda é Mo = 3 meninos
em que:
é o limite inferior da classe modal;
L é o limite superior da classe modal
i Estaturas (cm) fi
1 150 |-- 154 4
2 154 |-- 158 9
3 158 |-- 162 11
4 162 |-- 166 8
5 166 |-- 170 5 classe modal
6 170 |-- 174 3
40
Resolução: para escolher a classe modal tem que visualizar a maior frequência
para posteriormente retirar os seguintes dados:
Então:
em que:
é o limite inferior da classe modal;
h é a amplitude da classe modal;
D1 = f – f(ant);
D2 = f – f(post);
sendo:
f a frequência simples da classe modal;
f(ant) a frequência simples da classe anterior à classe modal;
f(post) a frequência simples da classe posterior à classe modal;
Então:
D1 = f - f(ant) = 11 – 9 = 2, D2 = f – f(post) = 11 – 8 = 3
.4 =
Dados não-agrupados:
Isto quer dizer que, 50% dos valores estão até 10 ou 50% estão acima
de 10.
Dados agrupados:
N° de meninos fi
0 2
1 6
2 10
3 12
4 4
N° de meninos fi Fi
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
2º passo: calcular
Md = 2 meninos
Isto quer dizer que 50% das famílias de até 4 filhos tem-se pelo menos 2
meninos.
Exemplo:
xi fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Temos:
Logo:
2º passo) Calculamos ;
a equação:
em que:
Exemplo:
i Estaturas (cm) fi
1 150 |-- 154 4
2 154 |-- 158 9
3 158 |-- 162 11
4 162 |-- 166 8
5 166 |-- 170 5
6 170 |-- 174 3
40
Seguindo o roteiro:
1º passo)
i Estaturas (cm) fi Fi
1 150 |-- 154 4 4
2 154 |-- 158 9 13
3 158 |-- 162 11 24
4 162 |-- 166 8 32
5 166 |-- 170 5 37
6 170 |-- 174 3 40
40
2º passo)
3º passo)
i Estaturas (cm) fi Fi
1 150 |-- 154 4 4
2 154 |-- 158 9 13
3 158 |-- 162 11 24
4 162 |-- 166 8 32
5 166 |-- 170 5 37
6 170 |-- 174 3 40
40
classe mediana
50% dos alunos estão abaixo de 160,54 cm ou 50% dos alunos estão
acima de 160,54 cm.
Exemplo:
i Classes fi Fi
1 0 |-- 10 1 1
2 10 |-- 20 3 4
3 20 |-- 30 9 13
4 30 |-- 40 7 20
5 40 |-- 50 4 24
6 50 |-- 60 2 26
26
Temos:
Logo,
Md = L Md = 30
4.2. Separatrizes
Qi = quartis i = 1, 2, 3.
Di = decis i = 1, 2, 3, ..., 9.
Pi = percentis i = 1, 2, 3, ..., 99.
4.2.1. Os quartis
|____________|____________|____________|____________|
Q1 Q2 Q3
Determinação de Qi, i = 1, 2 e 3.
2º passo) Calculamos ;
empregamos a equação:
em que:
i Classes fi
1 7 |-- 17 6
2 17 |-- 27 15
3 27 |-- 37 20
4 37 |-- 47 10
5 47 |-- 57 5
56
Seguindo o roteiro:
1º passo)
i Classes fi Fi
1 7 |-- 17 6 6
2 17 |-- 27 15 21
3 27 |-- 37 20 41
4 37 |-- 47 10 51
5 47 |-- 57 5 56
56
2º passo)
3º passo)
i Classes fi Fi
1 7 |-- 17 6 6
2 17 |-- 27 15 21 classe Q1
3 27 |-- 37 20 41 classe Q2
4 37 |-- 47 10 51 classe Q3
5 47 |-- 57 5 56
56
Logo:
|____________|____________|____________|____________|
7 22,33 30,5 38 57
Isto é:
22,33 representa 25% dos dados;
30,5 representa 50% dos dados;
38 representa 75% dos dados.
4.2.2. Os decis
São os valores que dividem o conjunto de dados em 10 partes iguais.
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
|_____|_____|_____|_____|_____|_____|_____|_____|_____|_____|
D1 D2 D3 D4 D5 D6 D7 D8 D9
2º passo) Calculamos ;
em que:
4.2.3. Os percentis
|__|__|____|__|_____|_____|___|_____|_____|_____|_____|__|__|
P1 P2 ... P5 ... P98 P99
2º passo) Calculamos ;
em que:
é o limite inferior da classe do percentil;
F(ant) é a frequência acumulada da classe anterior à classe do percentil;
FPi é a frequência simples da classe do percentil;
h é a amplitude do intervalo da classe do percentil.
5. Medidas de dispersão ou de
variabilidade
dispersão
--------------------------
______________________|______________________
X: 70 , 70 , 70 , 70 , 70
Y: 68 , 69 , 70 , 71 , 72
Z: 5 , 15 , 50 , 120 , 160
RX = 70 – 70 = 0
RY = 72 – 68 = 4
RZ = 160 – 5 = 155
Assim,
X = (40 , 45 , 48 , 52 , 54 , 62 , 70)
Resolução:
xi xi2
40 1600
45 2025
48 2304
52 2704
54 2916
62 3844
70 4900
371 20293
Como n = 7, temos:
Dados agrupados:
Sem intervalos de classe
xi fi
0 2
1 6
2 12
3 7
4 3
30
Resolução:
i Estaturas (cm) fi
1 150 |-- 154 4
2 154 |-- 158 9
3 158 |-- 162 11
4 162 |-- 166 8
5 166 |-- 170 5
6 170 |-- 174 3
40
Resolução:
i Estaturas (cm) fi
1 150 |-- 154 4 152 608 92416
2 154 |-- 158 9 156 1404 219024
3 158 |-- 162 11 160 1760 281600
4 162 |-- 166 8 164 1312 215168
5 166 |-- 170 5 168 840 141120
6 170 |-- 174 3 172 516 88752
40 6440 1038080
Como n = 40 , temos:
Resolução:
- Para os homens:
- Para as mulheres:
1º coeficiente de Pearson: ;
2º coeficiente de Pearson: ;
Em que:
AS = 0 diz-se que a distribuição é simétrica
AS > 0 diz-se que a distribuição é assimétrica positiva (à direita)
AS < 0 diz-se que a distribuição é assimétrica negativa (à esquerda)
Salários Empregados
($1000,00)
30 |-- 50 80
50 |-- 100 50
100 |-- 150 30
Total 160
Resolução:
Em resumo:
Classes fi
3 |-- 8 5
8 |-- 13 15
13 |-- 18 20
18 |-- 23 10
Total 50
Resolução:
Classes fi Fi
3 |-- 8 5 5 (classe P10)
8 |-- 13 15 20 (classe Q1)
13 |-- 18 20 40 (classe Q3)
18 |-- 23 10 50 (classe P90)
Total 50
5.6. Box-Plot
Exercícios
Pesos (kg) fi
145 |-- 151 10
151 |-- 157 9
157 |-- 163 8
163 |-- 169 6
169 |-- 175 3
175 |-- 181 3
181 |-- 187 1
40
Determine:
a) A média;
b) A mediana;
c) A moda (Czuber);
d) 1º quartil;
e) 23º percentil;
f) O Box-plot
Pesos Nº de sacas
14,55 |-- 15,05 1
15,05 |-- 15,55 3
15,55 |-- 16,05 8
16,05 |-- 16,55 9
16,55 |-- 17,05 10
17,05 |--17,55 6
17,55 |-- 18,05 3
40
Pede-se:
a) A média da distribuição;
b) A mediana;
c) A moda (Czuber);
d) O septuagésimo quinto percentil;
e) O terceiro decil;
f) A variância e o desvio padrão.
Volume exportado Nº de
$ empresas
50000 |-- 60000 5
60000 |-- 70000 10
70000 |-- 80000 20
80000 |-- 90000 10
90000 |-- 100000 5
50
Pede-se:
a) A média;
b) A moda (Czuber);
c) A mediana;
d) 1º quartil;
e) 3º quartil;
f) 5º decil;
g) 75º percentil.
11 – Para a série 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9.
a) Construir a distribuição simples de frequência;
b) Calcular a amplitude;
c) Calcular a variância e o desvio padrão;
d) Calcular o coeficiente de variação.
a) Determine a média;
b) Determinar a variância e o desvio padrão;
c) Qual é o valor do coeficiente de variação;
d) A distribuição é simétrica?
e) A distribuição é mesocúrtica?