Você está na página 1de 57

Unidade I – Análise Exploratória dos Dados 1

UNIDADE I – Analise Exploratória dos Dados

Prof. Carlos Alberto Jacomo

Castanhal/PA
2017
Prof. Carlos Alberto Jacomo
Unidade I – Análise Exploratória dos Dados 2

Índice

Introdução........................................................................................3

1.Tabelas Estatísticas…..............................…………………………4

2. Graficos…………………….............................……………………..5

3. Distribuição de Frequências..................................................10

Exercícios......................................................................................21

4. Medidas de Posição..................................................................24

5. Medidas de Dispersão ou de Variabilidade............................42

Exercícios.......................................................................................53

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 3

Introdução

A Estatística é a ciência que fornece métodos para a coleta,


organização, descrição, análise e interpretação de dados e para utilização dos
mesmos na tomada de decisões.
A coleta, a organização e a descrição dos dados estão a cargo da
Estatística Descritiva, enquanto a análise e a interpretação desses dados ficam
a cargo da Estatística Indutiva ou Inferencial.
A Análise Exploratória dos Dados ou Estatística Descritiva é o ramo que
trata da organização, do resumo e da apresentação dos dados. Já a Estatística
Indutiva é o ramo que trata de tirar conclusões sobre uma população a partir de
uma amostra. A ferramenta básica no estudo da Estatística Indutiva é a
probabilidade.
Como o próprio nome sugere, estatística descritiva se constitui num
conjunto de técnicas que objetivam descrever, analisar e interpretar os dados
numéricos de uma população ou amostra.
Esse capítulo está organizado da seguinte modo: tabelas estatísticas,
gráficos, distribuição de frequências, medidas de posições, medidas de
dispersão, medidas de assimetria e medidas de curtose.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 4

1. Tabelas Estatísticas

Um dos objetivos da Estatística é sintetizar os valores de modo que


podemos ter uma visão global ou, em outras palavras, uma visualização
desses valores. Isso consegue, inicialmente, apresentando esses valores em
tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a
respeito do que está sendo estudado para futuramente poder tirar conclusões
do que está sendo analisado.
Resumidamente, uma tabela deve apresentar a seguinte estrutura;
- cabeçalho; corpo; rodapé.
O cabeçalho deve conter o suficiente para que sejam respondidas as
questões:
- O que está representado?
- Onde ocorreu?
- Quando ocorreu?
O corpo da tabela é representado por colunas e subcolunas dentro dos
quais são registrados os dados numéricos e informações.
O rodapé é reservado para observações pertinentes à tabela, bem como
para o registro e identificação da fonte dos dados.
Exemplos:

Note-se que as Tabelas não contém as bordas dos lados, caso contrário
não seriam Tabelas e passariam a chamar de Quadros.
Prof. Carlos Alberto Jacomo
Unidade I – Análise Exploratória dos Dados 5

2. Gráficos

O gráfico é uma forma de apresentação dos dados, cujo objetivo é o


produzir, no investigador ou no público em geral, uma impressão mais rápida e
viva do fenômeno em estudo, já que os gráficos falam mais rápido à
compreensão que os conjuntos de dados.
Os principais tipos de gráficos são: os diagramas, cartogramas e os
pictogramas.

2.1. Diagramas

Os diagramas são gráficos geométricos de, no máximo, duas


dimensões, para sua construção, em geral, fazendo o uso do sistema
cartesiano. Dentre os principais diagramas, destacamos:

2.1.1. Gráfico em colunas

Projeção da população brasileira


Ano População
2000 173,4
2010 195,5
2013 201
2020 212,1
2030 223,1
Fonte: IBGE

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 6

2.1.2. Gráfico em barras

É semelhante ao gráfico em colunas, porém os retângulos são dispostos


horizontalmente. Os dados do exemplo anterior:

2.1.3. Gráficos em setores

É a representação gráfica de uma série estatística, em um círculo, por


meio de setores. É utilizado principalmente quando se pretende comparar cada
valor da série com o total. Para construí-lo, divide-se o círculo em setores,
cujas áreas serão proporcionais aos valores da série. Essa divisão poderá ser
obtida pela solução da regra de três.

total _______ 360º


parte _______ xº
Exemplo:
Receita do município de Castanhal/PA
Anos Receita
(em R$ 1.000.000,00)
2011 90
2012 120
2013 150
Total 360
Fonte: Dados fictícios.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 7

- para 2011: 360 ____ 360º


90 ____ xº  xº = 90º

- para 2012: 360 ____ 360º


120 ____ xº  xº = 120º

- para 2013: 360 ____ 360º


150 ____ xº  xº = 150º

2.1.4. Gráficos em curvas ou em linhas

Vendas da Companhia Jácomo – 2009 a 2013


Ano Vendas (R$ 1.000,00)
2007 150
2008 180
2009 270
2010 190
2011 220
2012 270
2013 350
Fonte: Departamento de Marketing da Companhia

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 8

Vendas da Companhia Jácomo


400
350
300
Vendas (R$1.000,00)

250
200
150
100
50
0

2.2. Cartogramas

O cartograma é a representação sobre uma carta geográfica (mapa).


Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos
diretamente relacionados com áreas geográficas ou politicas. Exemplo.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 9

2.3. Pictograma

Os pictogramas são construídos a partir de figuras ou conjunto de


figuras representativas da intensidade ou das modalidades do fenômeno. São
gráficos muito frequentes em jornais e revistas, tendo como principal vantagem
o fato de despertar a atenção do público leigo.
Existem algumas regras básicas que regem a construção de
pictogramas:
a) Os símbolos devem ser autoexplicativos;
b) As diferentes quantidades devem expressar-se mediante maior ou
menor número de símbolos, e não mediante um aumento ou
diminuição do tamanho do símbolo básico;
c) Os gráficos devem proporcionar uma visão geral do fenômeno, e não
detalhes minuciosos;
d) Os pictogramas estabelecem comparações gerais, devendo ser
evitados, consequentemente, para interpretar afirmações ou dados
isolados.
Exemplos:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 10

3. Distribuição de frequências

As tabelas são fundamentais na Estatística Descritiva, então será


apresentado um estudo completo das distribuições de frequências. A seguir
serão descritos os procedimentos mais usuais na construção dessas tabelas.

3.1. População

É o conjunto de todos os resultados, respostas, medidas ou contagens


que são de interesse.

3.2. Amostra

É um subconjunto de uma população.

3.3. Variável discreta e variável contínua

A variável é discreta quando assume valores em pontos da reta do


conjunto dos números reais. Exemplo: número de habitantes, acidentes de
trânsito.
Por outro lado, quando a variável pode assumir teoricamente qualquer
valor em certo intervalo da reta real, ela será uma variável contínua. Exemplo:
temperatura, altura, peso.

3.4. Representação da amostra

1. Dados brutos

Conjunto de dados que foram coletados. Exemplo: 10 – 10 – 10 – 12 –


12- 12 – 12 – 12 – 6 – 6 – 7 – 7 – 7 – 7- 7 – 7 – 4 – 4 – 3 – 3 – 3 – 1.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 11

2. Rol

São os dados organizados de forma crescente ou decrescente.


Exemplo: 1 – 3 – 3 – 3 – 4 – 4 – 6 – 6 – 7 – 7 – 7 – 7 – 7 - 7 - 10 – 10 – 10 – 12
– 12 – 12 – 12 – 12.

3. Amplitude total ou “range” (R)

É a diferença entre o maior e o menor valor do conjunto de dados.


Exemplo: R = 12 – 1 = 11.

4. Frequência absoluta (fi)

É o número de vezes que o elemento aparece na amostra, ou o número


de elementos pertencentes a uma classe. Exemplo: f (7) = 6.

5. Distribuição de frequências

São os valores com suas respectivas frequências organizados na tabela.


Exemplo: variável discreta.

xi fi
1 1
3 3
4 2
6 2
7 6
10 3
12 5
Total 22

Exemplo: variável contínua.

Classes fi
7 |-- 17 6
17 |-- 27 15
27 |-- 37 20

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 12

37 |-- 47 10
47 |-- 57 5
Total 56

6. Número de classes (k)

Não há fórmula exata para o cálculo do número de classes.


a) k = 5 para n ≤ 25 e k , para n > 25.
b) Fórmula de Sturges k = 1 + 3,22 log n, em que n = tamanho da
amostra. Exemplo: Seja n = 64, então:
k= = 8 ou k = 1 + 3,22 log 64 7

7. Amplitude das classes (h)

Assim como no caso do número de classes (k), a amplitude das classes


(h) deve ser aproximada para o maior inteiro. Assim, se k = 5,3, usa-se k = 6 ou
h = 8,7, usa-se h = 9.

8. Limites das classes

Existem diversas maneiras de expressar os limites das classes. Eis


algumas:
a) 20 |--| 30: compreende todos os valores entre 20 e 30;
b) 20 |-- 30: compreende todos os valores de 20 a 30, excluindo o 30;
c) Limite aparente 20 – 30; limite real 19,5 – 29,5;
d) 20 --| 30: compreende todos os valores, excluindo o 20.

9. Pontos médios das classes (xi)

É a média aritmética entre o limite superior e o limite inferior da classe.


Exemplo: Se a classe for 20 |-- 30, teremos:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 13

O ponto médio da classe é 10.

10. Frequência absoluta acumulada (Fi)

É a soma das frequências dos valores inferiores ou iguais ap valor dado.


Exemplo:

xi fi Fi
1 1 1
3 3 4
4 2 6
6 2 8
7 6 14
10 3 17
12 5 22
Total 22

11. Frequência relativa (fri)

A frequência relativa de um valor é dada por , ou seja, é a

porcentagem daquele valor na amostra. Exemplo:

xi fi fri
1 1 1/22
3 3 3/22
4 2 2/22
6 2 2/22
7 6 6/22
10 3 3/22
12 5 5/22
Total 22 1

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 14

12. Histograma

É a representação gráfica de uma distribuição de frequências por meio


de retângulos justapostos. Exemplo:

13. Polígono de frequências

É a representação gráfica de uma distribuição por meio de um polígono.


Exemplo:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 15

14. Polígono de frequência acumulada

15. Diagrama de Pareto

A fonte teórica a respeito do Diagrama de Pareto foi do endereço


eletrônico http://www.blogdaqualidade.com.br/diagrama-de-pareto/ dos autores
Jeison Arenhart De Bastiani e Rosemary Martins

O Princípio de Pareto apresenta o conceito de que, na maioria


das situações, 80% das consequências são resultado de 20% das causas. Isso
pode ser muito útil para tratar não conformidades, identificar pontos de
melhoria e definir que planos de ação devem ser atacados primeiro no que diz
respeito a prioridade.
Ainda segundo a metodologia, os problemas referentes a qualidade de
produtos e processos, que resultam em perdas, podem ser classificados da
seguinte maneira:

Poucos vitais: representam poucos problemas que resultam em grandes


perdas;
Muitos triviais: representam muitos problemas que resultam em poucas
perdas.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 16

O Diagrama de Pareto apresenta um gráfico de barras que permite


determinar, por exemplo, quais problemas devem ser resolvidos primeiro. Por
meio das frequências das ocorrências, da maior para a menor, é possível
visualizar que, na maioria das vezes, há muitos problemas menores diante de
outros mais graves, que representam maior índice de preocupação e maiores
perdas para a organização.

Como fazer o Diagrama de Pareto


 Determine o tipo de perda/probema que você quer investigar;
 Especifique o aspecto de interesse do tipo de perda que você
quer investigar;
 Organize uma folha de verificação com as categorias do aspecto
que você decidiu investigar;
 Preencha a folha de verificação;
 Faça as contagens, organize as categorias por ordem
decrescente de frequência, agrupe aquelas que ocorrem com
baixa frequência sob denominação “outros” e calcule o total;
 Calcule as frequências relativas e as frequências acumuladas.

Exemplo
Uma empresa fabrica e entrega seus produtos para várias lojas de
varejo e quer diminuir o número de devoluções. Para isto, investigou o número
de ocorrências geradoras de devolução da entrega no último semestre,
conforme apresentado na tabela abaixo:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 17

Passos para Construção do Diagrama de Pareto


Primeiro passo: refazer a folha de verificação ordenando os valores por
ordem decrescente de grandeza.

Segundo passo: acrescentar mais uma coluna indicando os valores


acumulados.

Terceiro passo: acrescentar mais uma coluna onde serão colocados os


valores percentuais referentes a cada tipo de ocorrência.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 18

O cálculo é feito dividindo-se o número de ocorrências de um


determinado tipo pelo total de ocorrências no período.

Quarto passo: acumulam-se estes percentuais em uma última coluna.

Com estes dados pode ser construído o gráfico de Pareto, apresentado


a seguir:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 19

Conforme apresentado no gráfico acima, para diminuir o problema de


devolução de produtos será necessário criar um programa de ação para a
empresa diminuir os atrasos de entrega da fábrica e da transportadora. Com
isso, 53% do problema será resolvido.

Exemplo

Dado um rol de 50 notas (dadas em créditos), agrupar os elementos em


classe e construir os gráficos:

33 – 35 – 35 – 39 – 41 – 41 – 42 – 45 – 47 – 48
50 – 52 – 53 – 54 – 55 – 55 – 57 – 59 – 60 – 60
61 – 64 – 65 – 65 – 65 – 66 – 66 – 66 – 67 – 68
69 – 71 – 73 – 73 – 74 – 74 – 76 – 77 – 77 – 78
80 – 81 – 84 – 85 – 85 – 88 – 89 – 91 – 94 – 97

Resolução:
- amplitude total (R):

R = 97 – 33 = 64

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 20

- número de classes (k):

k 1 + 3,22 log 50 1 +3,22(1,7) 7

- amplitude de classe (h):

- limite das classes, frequências e pontos médios:

Para facilitar a contagem das frequências, inicia-se a primeira classe por


30. Todavia, poder-se-ia iniciar com 33. Assim a distribuição de frequência
será:

Classes fi Fi fri xi
30 |-- 40 4 4 0,08 35
40 |-- 50 6 10 0,12 45
50 |-- 60 8 18 0,16 55
60 |-- 70 13 31 0,26 65
70 |-- 80 9 40 0,18 75
80 |-- 90 7 47 0,14 85
90 |-- 100 3 50 0,06 95
Total 50 1

O histograma e polígono de frequência dados por:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 21

Exercícios
1 – Dada a amostra: 3, 4, 4, 5, 7, 6, 6, 7, 7, 4, 5, 5, 6, 6, 7, 5, 8, 5, 6, 6, pede-
se:
a) Construir a distribuição de frequências;
b) Construir o gráfico das frequências;
c) Determinar as frequências relativas;
d) Determinar as frequências acumuladas;
e) Qual é a amplitude amostral;
f) Qual a porcentagem de elementos maiores que 5.

2 – Considere os dados obtidos pelas medidas das alturas de 100 indivíduos


(dadas em cm):

151 – 152 – 154 – 155 – 158 – 159 – 159 – 160 – 161 – 161
161 – 162 – 163 – 163 – 163 – 164 – 165 – 165 – 165 – 166
166 – 166 – 166 – 167 – 167 – 167 – 167 – 167 – 168 – 168
168 – 168 – 168 – 168 – 168 - -168 – 168 – 168 – 169 – 169
169 – 169 – 169 – 169 – 169 – 170 – 170 – 170 – 170 – 170
170 – 170 – 171 – 171 – 171 – 171 – 172 – 172 – 172 – 173
173 – 173 – 174 – 174 – 174 – 175 – 175 – 175 – 175 – 176
176 – 176 – 176 – 177 – 177 – 177 – 177 – 178 – 178 – 178
179 – 179 – 180 – 180 – 180 – 180 – 181 – 181 – 181 – 182
182 – 182 – 183 – 184 – 185 – 186 – 187 – 188 – 190 – 190

Pede-se determinar:
a) A amplitude amostral;
b) O número de classes;
c) A amplitude das classes;
d) Os limites das classes;
e) As frequências absolutas das classes;
f) As frequências relativas;
g) Os pontos médios das classes;

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 22

h) A frequência acumulada;
i) O histograma – polígono de frequência;
j) O gráfico de frequência acumulada.

3 – As notas de 32 estudantes de uma classe estão descritas a seguir:

6,0 – 0,0 – 2,0 – 6,5 – 5,0 – 3,5 – 4,0 – 7,0


8,0 – 7,0 – 8,5 – 6,0 – 4,5 – 0,0 – 6,5 – 6,0
2,0 – 5,0 – 5,5 – 5,0 – 7,0 – 1,5 – 5,0 – 5,0
4,0 – 4,5 – 4,0 – 1,0 – 5,5 – 3,5 – 2,5 – 4,5

Determinar:
a) O rol;
b) As distribuição de frequências (variável contínua). (Sugestão: iniciar por
0 e intervalo de classe 1,5);
c) O maior e o menor graus;
d) A amplitude total;
e) Qual a porcentagem dos alunos que tiveram nota menor do que 4;
f) Qual o limite superior da segunda classe;
g) Qual o ponto médio da quarta classe;
h) Qual o ponto médio da terceira classe;
i) Os gráficos (histograma e o gráfico das frequências acumuladas).

4 – Os pesos de 40 alunos estão relacionados a seguir:

69 – 57 – 72 – 54 – 93 – 68 – 72 – 58 – 64 – 62
65 – 76 – 60 – 49 – 74 – 59 – 66 – 83 – 70 – 45
60 – 81 – 71 – 67 – 63 – 64 – 53 – 73 – 81 – 50
67 – 68 – 53 – 75 – 65 – 58 – 80 – 60 – 63 – 53

a) Construir a tabela de distribuição de frequência, dado log 40 = 1,6.


b) Construir os gráficos da distribuição.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 23

5 – Completar ao dados que faltam:

Valores fi Fi fri
1 4 0,08
2 4
3 16 0,16
4 7 0,14
5 5 28
6 38
7 7 45 0,14
8

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 24

4. Medidas de posição

4.1. Medidas de tendência central

Os pesquisadores em muitos campos de atividade têm empregado o


termo média para formular perguntas como: Qual é a média de acidentes em
uma determinada rodovia? Qual é a renda média dos graduados no ensino
médio e em uma universidade? Qual a nota média dos alunos do último
período de engenharia?
Uma maneira conveniente de descrever um grupo como um todo é achar
um número único que represente o que é médio, ou típico, daquele conjunto de
dados. Na maioria das pesquisas, esse valor é chamado medida de tendência
central, porque em geral ele está localizado mais para o meio, ou centro, de
uma distribuição, onde a maior parte dos dados tende a concentrar-se.
Abordaremos aqui apenas as três medidas mais conhecidas de
tendência central: a média, a moda e a mediana.

4.1.1. Média aritmética:

Existem vários tipos de medias como por exemplo, a harmônica, a


inversa, a quadrática, a geométrica, estudaremos somente a mais importante
que é a média aritmética.

Dados não-agrupados: é o quociente da divisão da soma dos valores da


variável pelo número deles dada pela equação:

sendo: a média aritmética;


os valores da variável;
n o número de valores.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 25

Exemplo: Foram registradas as seguintes medidas para o tempo de secagem,


em horas, de certa marca de tinta látex:

3,4 2,5 4,8 2,9 3,6


2,8 3,3 5,6 3,7 2,8
4,4 4,0 5,2 3,0 4,8

Qual é o tempo médio para a secagem da tinta?

Resolução:

Dados agrupados: são dados que estão organizados em frequências


simples (fi). São divididos em dados sem e com intervalos de classe.
Sem intervalos de classe: calcula-se a média aritmética
ponderada dada pela equação:

sendo: a média aritmética;


os valores da variável;
a frequência dos valores da variável;
número de classes.
obs:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 26

Exemplo: Consideremos a distribuição relativa a 34 famílias de quatro filhos,


tomando para a variável o número de filhos do sexo masculino.

N° de meninos fi
0 2
1 6
2 10
3 12
4 4

Resolução: o modo mais prático.

N° de meninos fi xifi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16

Temos então:

Logo:

As famílias de até 4 filhos tem em média 2 meninos.

Com intervalos de classe: calcula-se a média aritmética ponderada


dada pela equação:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 27

sendo: a média aritmética;

o ponto médio de cada classe;

a frequência dos valores da variável;

número de classes.

obs:

Exemplo: Dada a distribuição de frequências, qual é a estatura média dos


alunos de engenharia do 4º período?

i Estaturas (cm) fi
1 150 |-- 154 4
2 154 |-- 158 9
3 158 |-- 162 11
4 162 |-- 166 8
5 166 |-- 170 5
6 170 |-- 174 3
40

Resolução: o modo mais prático.

i Estaturas (cm) fi
1 150 |-- 154 4 152 608
2 154 |-- 158 9 156 1404
3 158 |-- 162 11 160 1760
4 162 |-- 166 8 164 1312
5 166 |-- 170 5 168 840
6 170 |-- 174 3 172 516
40 6440

Nesse caso temos:

Logo:

A estatura média é de 161 cm.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 28

4.1.2. Moda (Mo)

A moda (Mo) é o valor que ocorre com maior frequência em uma série de
valores (conjunto de dados), isto é, é o valor mais frequente, mais típico ou
mais comum em uma distribuição. Por exemplo, o salário modal dos
empregados de uma indústria é o salário mais comum, isto é, o salário
recebido pelo maior número de empregados dessa indústria. Analogamente,
se, em determinada universidade, engenharia é o curso de maior procura, ele
também representa a moda.
Dados não-agrupados: Simplesmente procurar o valor que mais se
repete.

Exemplo: calcule a moda no conjunto de dados a seguir.

7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 , 13 , 15

Mo = 10

Obs 1: Alguns conjuntos de dados podem não existir um valor modal,


portanto, é considerada amodal.

Exemplo: Calcule a moda no conjunto de dados a seguir:

3 , 5 , 8 , 10 , 12 , 13

Mo = não existe (amodal)

Obs 2: Alguns conjuntos de dados podem ter mais de um valor modal.

Exemplo: Calcule a moda no conjunto de dados a seguir:

2,3,4,4,4,5,6,7,7,7,8,9

Mo = 4 e Mo = 7 (bimodal)

Dados agrupados:

Sem intervalos de classe: Simplesmente procurar a maior


frequência e associa-la com a variável em estudo como no exemplo a seguir.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 29

Exemplo: Dado anteriormente.

N° de meninos fi
0 2
1 6
2 10
3 12
4 4

A moda é Mo = 3 meninos

Com intervalos de classe: A classe que apresenta a maior frequência é


denominada classe modal. Compreende-se que a moda está entre os limites
da classe modal.
O método mais simples para o cálculo da moda é denominado de moda
bruta.
Temos, então:

em que:
é o limite inferior da classe modal;
L é o limite superior da classe modal

Exemplo: Dado anteriormente.

i Estaturas (cm) fi
1 150 |-- 154 4
2 154 |-- 158 9
3 158 |-- 162 11
4 162 |-- 166 8
5 166 |-- 170 5 classe modal
6 170 |-- 174 3
40

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 30

Resolução: para escolher a classe modal tem que visualizar a maior frequência
para posteriormente retirar os seguintes dados:

Temos que a classe modal é i = 3, = 158 cm e L = 162 cm.

Então:

A estatura dos alunos que mais aparece no conjunto de dados é de 160


cm.

O método mais complexo para o cálculo da moda é a fórmula de Czuber.

em que:
é o limite inferior da classe modal;
h é a amplitude da classe modal;
D1 = f – f(ant);
D2 = f – f(post);
sendo:
f a frequência simples da classe modal;
f(ant) a frequência simples da classe anterior à classe modal;
f(post) a frequência simples da classe posterior à classe modal;

No exemplo anterior, temos:

= 158 cm, f = 11, f(ant) = 9, f(post) = 8, h = 4

Então:
D1 = f - f(ant) = 11 – 9 = 2, D2 = f – f(post) = 11 – 8 = 3

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 31

.4 =

A estatura dos alunos que mais aparece no conjunto de dados é de


159,6 cm.

Qual equação da moda usar: Moda bruta ou Fórmula de Czuber?

A moda bruta dá um valor aproximado de onde está o valor modal, a


fórmula de Czuber é um resultado mais exato pelo fato de estar levando em
consideração outros valores como a frequência simples, as frequências anterior
e posterior da frequência da classe modal, a amplitude de classe e o limite
inferior da classe modal. Geralmente, os valores calculados nessas duas
opções dão um resultado bem próximo, como dado no exemplo anterior, a
moda bruta foi de 160 cm e a fórmula de Czuber foi de 159,6 cm.

4.1.3. Mediana (Md)

A mediana é a terceira medida de tendência central e pode ser definida


como o valor que divide uma série ordenada de tal forma que pelo menos a
metade ou cinquenta por cento dos itens sejam iguais ou maiores do que ela, e
que haja pelo menos outra metade ou cinquenta por cento de itens maiores do
que ela. A mediana é considerada uma separatriz, por ser uma medida de
tendência central que divide a distribuição ou conjunto de dados em partes
iguais. Trata-se de uma medida muito utilizada na análise de dados
estatísticos, especialmente quando se atribui pouca importância aos calores
extremos da variável.

Dados não-agrupados:

Exemplo: número ímpar de termos.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 32

Dada uma série de valores, determinar a mediana.


5 , 13 , 10 , 2 , 18 , 15 , 6 , 16 , 9
1º passo: ordenar os valores:
2 , 5 , 6 , 9 , 10 , 13 , 15 , 16 , 18

2º passo: encontrar o elemento que está no centro:


Md = 10.

Isto quer dizer que, 50% dos valores estão até 10 ou 50% estão acima
de 10.

Exemplo: número par de termos.


2 , 6 , 7 , 10 , 12 , 13 , 18 , 21

Dados agrupados:

Sem intervalos de classe:

Exemplo: De novo os das famílias de até 2 filhos !!!

N° de meninos fi
0 2
1 6
2 10
3 12
4 4

1º passo: calcular as frequências acumuladas (F i)

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 33

N° de meninos fi Fi
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34

2º passo: calcular

A menor frequência acumulada que supera esse valor é 18, que


corresponde ao valor 2 da variável, sendo este o valor mediano. Logo:

Md = 2 meninos

Isto quer dizer que 50% das famílias de até 4 filhos tem-se pelo menos 2
meninos.

Obs: no caso de existir uma frequência acumulada (Fi), tal que:

A mediana será dada por:

Exemplo:

xi fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8

Temos:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 34

Logo:

Com intervalos de classe: para o cálculo da mediana com


intervalos de classe, iremos adotar o seguinte roteiro.

1º passo) Determinar as frequências acumuladas (F i);

2º passo) Calculamos ;

3º passo) Marcamos a classe correspondente à frequência acumulada

imediatamente superior à , classe mediana e, em seguida, empregamos

a equação:

em que:

é o limite inferior da classe mediana;

F(ant) é a frequência acumulada da classe anterior à classe mediana;

fmd é a frequência simples da classe mediana;

h é a amplitude do intervalo da classe mediana.

Exemplo:

i Estaturas (cm) fi
1 150 |-- 154 4
2 154 |-- 158 9
3 158 |-- 162 11
4 162 |-- 166 8
5 166 |-- 170 5
6 170 |-- 174 3
40

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 35

Seguindo o roteiro:

1º passo)

i Estaturas (cm) fi Fi
1 150 |-- 154 4 4
2 154 |-- 158 9 13
3 158 |-- 162 11 24
4 162 |-- 166 8 32
5 166 |-- 170 5 37
6 170 |-- 174 3 40
40

2º passo)

3º passo)

i Estaturas (cm) fi Fi
1 150 |-- 154 4 4
2 154 |-- 158 9 13
3 158 |-- 162 11 24
4 162 |-- 166 8 32
5 166 |-- 170 5 37
6 170 |-- 174 3 40
40

classe mediana

= 158; F(ant) = 13; h = 4; fmd = 11

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 36

50% dos alunos estão abaixo de 160,54 cm ou 50% dos alunos estão
acima de 160,54 cm.

Obs: no caso de existir uma frequência acumulada igual a , a


mediana será o limite superior da classe correspondente.

Exemplo:

i Classes fi Fi
1 0 |-- 10 1 1
2 10 |-- 20 3 4
3 20 |-- 30 9 13
4 30 |-- 40 7 20
5 40 |-- 50 4 24
6 50 |-- 60 2 26
26

Temos:

Logo,

Md = L  Md = 30

4.2. Separatrizes

A mediana caracteriza uma serie de valores devido à sua posição


central. No entanto, ela apresenta uma outra característica, tão importante
quanto a primeira: ela separa a série (conjunto de dados) em dois grupos que
apresentam o mesmo número de valores.
Assim, além das medidas de posição que estudamos, há outras que
consideradas individualmente não são medidas de tendência central, mas
estão ligadas à mediana relativamente à sua segunda característica, já que se
baseam em sua posição na série. Essas medidas, os quartis, os percentis e os

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 37

decis, são, juntamente com a mediana, conhecidas pelo nome genérico de


separatrizes.
Os quartis permitem dividir o conjunto de dados em quatro partes iguais
quanto ao número de elementos de cada uma; os decis em dez patês iguais e
os percentis em cem partes iguais.
Para simbolizar cada uma dessas medidas separatrizes, faremos:

Qi = quartis i = 1, 2, 3.
Di = decis i = 1, 2, 3, ..., 9.
Pi = percentis i = 1, 2, 3, ..., 99.

Assim, para dividir uma serie ordenada de valores em quatro partes


iguais, precisamos de três separatrizes (quartis); para dividi-la em dez, iremos
recorrer a nove separatrizes (decis); em cem, recorremos a noventa e nove
separatrizes (percentis).

4.2.1. Os quartis

Os quartis dividem um conjunto de dados (série de dados) em quatro


partes iguais.

0% 25% 50% 75% 100%

|____________|____________|____________|____________|
Q1 Q2 Q3

Q1 = 1º quartil, 25% dos dados;


Q2 = 2º quartil, coincide com a mediana, 50% dos dados;
Q3 = 3º quartil, 75% dos dados.

Determinação de Qi, i = 1, 2 e 3.

O cálculo dos quartis é o mesmo raciocínio para calcular a mediana.


1º passo) Determinar as frequências acumuladas (Fi);

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 38

2º passo) Calculamos ;

3º passo) Marcamos a classe correspondente à frequência acumulada

imediatamente superior à ,classe do quartil e, em seguida,

empregamos a equação:

em que:

é o limite inferior da classe do quartil;

F(ant) é a frequência acumulada da classe anterior à classe do quartil;

FQi é a frequência simples da classe do quartil;

h é a amplitude do intervalo da classe do quartil.

Exemplo: Dada a distribuição, determinar os quartis (Q1 e Q3) e


mediana.

i Classes fi
1 7 |-- 17 6
2 17 |-- 27 15
3 27 |-- 37 20
4 37 |-- 47 10
5 47 |-- 57 5
56

Seguindo o roteiro:

1º passo)

i Classes fi Fi
1 7 |-- 17 6 6
2 17 |-- 27 15 21
3 27 |-- 37 20 41
4 37 |-- 47 10 51
5 47 |-- 57 5 56
56

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 39

2º passo)

Q1: , Q2 = Md: , Q3:

3º passo)

i Classes fi Fi
1 7 |-- 17 6 6
2 17 |-- 27 15 21 classe Q1
3 27 |-- 37 20 41 classe Q2
4 37 |-- 47 10 51 classe Q3
5 47 |-- 57 5 56
56

Para Q1 temos: = 17; F(ant) = 6; h = 10; fQ1 = 15

Para Q2 temos: = 27; F(ant) = 21; h = 10; fQ1 = 20

Para Q3 temos: = 37; F(ant) = 41; h = 10; fQ1 = 10

Logo:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 40

Pode-se afirmar que:

0% 25% 50% 75% 100%

|____________|____________|____________|____________|
7 22,33 30,5 38 57

Isto é:
22,33 representa 25% dos dados;
30,5 representa 50% dos dados;
38 representa 75% dos dados.

4.2.2. Os decis
São os valores que dividem o conjunto de dados em 10 partes iguais.

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

|_____|_____|_____|_____|_____|_____|_____|_____|_____|_____|
D1 D2 D3 D4 D5 D6 D7 D8 D9

O procedimento é semelhante ao cálculo dos quartis.


1º passo) Determinar as frequências acumuladas (F i);

2º passo) Calculamos ;

3º passo) Marcamos a classe correspondente à frequência

acumulada imediatamente superior à ,classe do decil e, em

seguida, empregamos a equação:

em que:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 41

é o limite inferior da classe do decil;


F(ant) é a frequência acumulada da classe anterior à classe do decil;
FDi é a frequência simples da classe do decil;
h é a amplitude do intervalo da classe do decil.

4.2.3. Os percentis

São as medidas que dividem a série em 100 partes iguais.

0% 1% 2% ... 50% ... 98% 99%


100%

|__|__|____|__|_____|_____|___|_____|_____|_____|_____|__|__|
P1 P2 ... P5 ... P98 P99

O cálculo de um percentil é dado por:


1º passo) Determinar as frequências acumuladas (F i);

2º passo) Calculamos ;

3º passo) Marcamos a classe correspondente à frequência

acumulada imediatamente superior à ,classe do percentil e, em

seguida, empregamos a equação:

em que:
é o limite inferior da classe do percentil;
F(ant) é a frequência acumulada da classe anterior à classe do percentil;
FPi é a frequência simples da classe do percentil;
h é a amplitude do intervalo da classe do percentil.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 42

5. Medidas de dispersão ou de
variabilidade

Anteriormente vimos que a moda, a mediana e a média podem ser


usadas para sintetizar em um único número o que é médio ou típico de uma
distribuição. Quando empregada isoladamente, entretanto, qualquer medida de
tendência central dá apenas um quadro incompleto de um conjunto de dados,
podendo, assim, tanto esclarecer como confundir ou distorcer.
Essas medidas de dispersão (ou variabilidade) são medidas estatísticas
utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em
torno da média. Servem para medir a representatividade da média.

dispersão
--------------------------
______________________|______________________

Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z.

X: 70 , 70 , 70 , 70 , 70
Y: 68 , 69 , 70 , 71 , 72
Z: 5 , 15 , 50 , 120 , 160

Calculando a média aritmética de cada um desses conjuntos, obtemos:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 43

Pode-se concluir que o conjunto X é mais homogêneo que os conjuntos


Y e Z, já que todos os valores são iguais a média.
O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há
menor diversificação entre cada um de seus valores e a média representativa.
Dessas medidas, estudaremos a amplitude total, a variância, o desvio
padrão e o coeficiente de variação.

5.1. Amplitude total

É a diferença entre o maior e o menor dos valores do conjunto de dados.

Exemplo: Do exemplo anterior.

RX = 70 – 70 = 0
RY = 72 – 68 = 4
RZ = 160 – 5 = 155

5.2. Variância e desvio padrão

Como vimos, a amplitude total é instável, por se deixar influenciar pelos


valores extremos, que são, na sua maioria, devidos ao acaso.
A variância e o desvio padrão são medidas que fogem a essa falha, pois
levam em consideração a totalidade dos valores da variável em estudo, o que
faz delas índices de variabilidade bastante estáveis e, por isso mesmo, os mais
geralmente empregados.

Dados não-agrupados: A equação é dada a seguir:

Obs: para o cálculo da variância amostral substitui o n por (n-1).

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 44

De modo mais prático, a variância pode ser calculada através da


equação:

A unidade da variância é dada por unidades quadráticas, para facilitar


sua interpretação, outra medida de dispersão é utilizada denominada de desvio
padrão.

Assim,

Exemplo: Calcule o desvio padrão do conjunto de valores da variável X.

X = (40 , 45 , 48 , 52 , 54 , 62 , 70)

Resolução:

xi xi2
40 1600
45 2025
48 2304
52 2704
54 2916
62 3844
70 4900
371 20293

Como n = 7, temos:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 45

Dados agrupados:
Sem intervalos de classe

Exemplo: Calcule o desvio padrão dos dados a seguir.

xi fi
0 2
1 6
2 12
3 7
4 3
30

Resolução:

xi fi xi2 fixi fixi2


0 2 0 0 0
1 6 1 6 6
2 12 4 24 48
3 7 9 21 63
4 3 16 12 48
30 63 165

Como n = 30, temos:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 46

Com intervalos de classe

Exemplo: Calcule o desvio padrão dos dados a seguir.

i Estaturas (cm) fi
1 150 |-- 154 4
2 154 |-- 158 9
3 158 |-- 162 11
4 162 |-- 166 8
5 166 |-- 170 5
6 170 |-- 174 3
40

Resolução:

i Estaturas (cm) fi
1 150 |-- 154 4 152 608 92416
2 154 |-- 158 9 156 1404 219024
3 158 |-- 162 11 160 1760 281600
4 162 |-- 166 8 164 1312 215168
5 166 |-- 170 5 168 840 141120
6 170 |-- 174 3 172 516 88752
40 6440 1038080

Como n = 40 , temos:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 47

5.3. Coeficiente de variação

Trata-se de uma medida relativa de dispersão útil para a comparação


em termos relativos do grau de concentração em torno da média de conjuntos
de dados distintos. É dado por:

O coeficiente de variação é expresso em porcentagem.

Exemplo: Numa empresa, o salário médio dos homens é de $4000,00


com desvio padrão de $1500,00 e o das mulheres é em média de $3000,00
com desvio padrão de $1200,00. Calcule o coeficiente de variação.

Resolução:

- Para os homens:

- Para as mulheres:

Podemos concluir que os salários das mulheres apresentam mais


dispersão relativa que os dos homens.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 48

5.4. Medidas de assimetria

Denomina-se assimetria o grau de afastamento de uma distribuição da


unidade de simetria.
Numa distribuição simétrica, coincidem a média ( , a moda (Mo) e a
mediana (Md ou ) e os quartis ficam equidistantes da mediana, o que não
ocorre numa distribuição assimétrica.

Existem diversas equações para o cálculo do coeficiente de assimetria,


as mais usuais são:

1º coeficiente de Pearson: ;

2º coeficiente de Pearson: ;

Em que:
AS = 0 diz-se que a distribuição é simétrica
AS > 0 diz-se que a distribuição é assimétrica positiva (à direita)
AS < 0 diz-se que a distribuição é assimétrica negativa (à esquerda)

Exemplo: Dada a distribuição amostral. Calcular os dois coeficientes de


Pearson.

Salários Empregados
($1000,00)

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 49

30 |-- 50 80
50 |-- 100 50
100 |-- 150 30
Total 160

Resolução:

Classes fi xi xifi xi2fi Fi


30 |-- 50 80 40 3200 128000 80
50 |-- 100 50 75 3750 281250 130
100 |-- 150 30 125 3750 468750 160
Total 160 10700 878000

Como nos dois casos, AS > 0, diz-se que a distribuição é assimétrica


positiva.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 50

5.5. Medidas de curtose

Entende-se por curtose o grau de achatamento de uma distribuição.


Para medir o grau de curtose utilizaremos o coeficiente:

Com referência ao grau de achatamento da curva correspondente a


distribuição, podemos ter:

- curva leptocúrtica: alongada (K < 0,263)

- curva mesocúrtica: normal (K = 0,263)

- curva platicúrtica: achatada (K > 0,263)

Em resumo:

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 51

Exemplo: Dizer que tipo de curva corresponde à distribuição amostral.

Classes fi
3 |-- 8 5
8 |-- 13 15
13 |-- 18 20
18 |-- 23 10
Total 50

Resolução:
Classes fi Fi
3 |-- 8 5 5 (classe P10)
8 |-- 13 15 20 (classe Q1)
13 |-- 18 20 40 (classe Q3)
18 |-- 23 10 50 (classe P90)
Total 50

Portanto, K > 0,263, logo a curva correspondente é suavemente


platicúrtica.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 52

5.6. Box-Plot

O Diagrama de Caixas ou Desenho Esquemático mas conhecido como


Box-Plot e’ a forma de representar graficamente os dados da distribuição de
uma variável quantitativa em função dos seus parâmetros. Os cincos itens ou
valores: o menor valor (X1) , os quartis (Q1, Q2 e Q3) e o maior valor (Xn), são
importantes para se ter ideia da posição, dispersão e assimetria da distribuição
dos dados. Na sua construção são considerados os quartis e os limites da
distribuição, permitindo uma visualização do posicionamento da distribuição na
escala da variável conforme a figura abaixo.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 53

Exercícios

1 – Considerando os conjuntos de dados A = {3, 5, 2, 6, 5, 9, 5, 2, 8, 6} e B =


{20, 9, 7, 2, 12, 7, 20, 15, 7}, calcule:
a) A média;
b) A mediana;
c) A moda.

2 – Os salários-hora de cinco funcionários de uma companhia são (em R$): 75,


90, 83, 142, 88. Determine:
a) A média dos salários-hora;
b) O salário-hora mediano;
c) A variância e o desvio padrão.

3 – As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1;


7,2; 6,8; 8,7 e 7,2. Determine:
a) A nota média;
b) A nota mediana;
c) A nota modal.

4 – Dados os pesos de um determinado produto.

Pesos (kg) fi
145 |-- 151 10
151 |-- 157 9
157 |-- 163 8
163 |-- 169 6
169 |-- 175 3
175 |-- 181 3
181 |-- 187 1
40
Determine:
a) A média;
b) A mediana;
c) A moda (Czuber);

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 54

d) 1º quartil;
e) 23º percentil;
f) O Box-plot

5 – A tabela abaixo representa os salários pagos a 100 operários da empresa


GLT & Cia.
Nº de salários Nº de
mínimos operários fi
0 |-- 2 40
2 |-- 4 30
4 |-- 6 10
6 |-- 8 15
8 |-- 10 5
100
Determinar:
a) Salário médio;
b) Salário modal (Czuber);
c) Salário mediano;
d) A variância e o desvio padrão;

6 - Seja a distribuição das estaturas de 100 alunos de uma classe.

Estaturas (m) Nº de alunos fi


1,40 |-- 1,50 5
1,50 |-- 1,60 10
1,60 |-- 1,70 30
1,70 |-- 1,80 40
1,80 |-- 1,90 10
1,90 |-- 2,00 5
100
Determinar:
a) A estatura média;
b) A estatura modal (Czuber);
c) A estatura mediana;
d) Os limites onde estão compreendidos 50% das estaturas (1º e 3º
quartis);
e) A variância e o desvio padrão.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 55

7 – Dados os conjuntos de números: A = {100; 101; 102; 103; 104; 105} e B =


{0, 1, 2, 3, 4, 5}, podemos afirmar que:
a) A média de A é igual à de B multiplicada por 100;
b) A média de A é igual à média de B;
c) A média de A é igual à média de B dividida por 100;
d) A média de A é igual à média de B mais a constante 100;
e) Nenhuma das respostas acima.

8 – Um comerciante atacadista vende determinado produto em sacas que


deviam conter 16,50 kg. A pesagem de 40 sacas revelou os resultados
representados na tabela abaixo:

Pesos Nº de sacas
14,55 |-- 15,05 1
15,05 |-- 15,55 3
15,55 |-- 16,05 8
16,05 |-- 16,55 9
16,55 |-- 17,05 10
17,05 |--17,55 6
17,55 |-- 18,05 3
40
Pede-se:
a) A média da distribuição;
b) A mediana;
c) A moda (Czuber);
d) O septuagésimo quinto percentil;
e) O terceiro decil;
f) A variância e o desvio padrão.

9 – Dada a amostra: 2, 3, 4, 5, 7, 10, 12.


a) Qual é a amplitude total?
b) Calcule a variância e desvio padrão;
c) Calcule o coeficiente de variação.

10 – A tabela abaixo apresenta a distribuição das exportações de empresas


eletrônicas em 1972.

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 56

Volume exportado Nº de
$ empresas
50000 |-- 60000 5
60000 |-- 70000 10
70000 |-- 80000 20
80000 |-- 90000 10
90000 |-- 100000 5
50
Pede-se:
a) A média;
b) A moda (Czuber);
c) A mediana;
d) 1º quartil;
e) 3º quartil;
f) 5º decil;
g) 75º percentil.

11 – Para a série 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9.
a) Construir a distribuição simples de frequência;
b) Calcular a amplitude;
c) Calcular a variância e o desvio padrão;
d) Calcular o coeficiente de variação.

12 – Você está se candidatando a um emprego em duas empresas. A


companhia A oferece salário inicial em média de US$ 31000 e desvio padrão
de US$ 1000. A companhia B oferece salário inicial em média de US$ 31000 e
desvio padrão de US$ 5000. De qual companhia será mais provável obter uma
oferta de US$ 33000 ou mais?

13 – De acordo com o jornal Chemical Engineering, uma importante


propriedade de fibra é sua absorção de água. Uma amostra aleatória de 20
pedaços de fibra de algodão foi retirada e a absorção de cada pedaço foi
medida. Temos os seguintes valores de absorção:
18,71 – 21,41 – 20,72 – 21,81 – 19,29 – 22,43 – 20,17 – 23,71 – 19,44 – 20,50
18,92 – 20,33 – 23,00 – 22,85 – 19,25 – 21,77 - 22,11 – 19,77 – 18,04 – 21,12

Prof. Carlos Alberto Jacomo


Unidade I – Análise Exploratória dos Dados 57

a) Calcule a média e mediana amostrais para os valores de absorção


dados.
b) Calcule a variância e o desvio padrão.

14 – Abaixo temos a distribuição de frequência dos pesos de uma amostra de


45 alunos:
Peso (em kg) Nº de alunos
40 |-- 45 4
45 |-- 50 10
50 |-- 55 15
55 |-- 60 8
60 |-- 65 5
65 |-- 70 3
45

a) Determine a média;
b) Determinar a variância e o desvio padrão;
c) Qual é o valor do coeficiente de variação;
d) A distribuição é simétrica?
e) A distribuição é mesocúrtica?

15 – É dada a distribuição dos salários semanais de 100 funcionários:

Salário por semana Nº de


($) empregados
500 |-- 1000 26
1000 |-- 1500 43
1500 |-- 2000 17
2000 |-- 2500 9
2500 |-- 3000 5
100

a) Calcule a variância e o desvio padrão;


b) A distribuição é assimétrica?
c) A distribuição é leptocúrtica?

Prof. Carlos Alberto Jacomo

Você também pode gostar