Você está na página 1de 89

Fundamentos De Estatística

Profª Priscila Savulski Ferreira de Miranda


Aula 1
Profª Priscila Savulski Ferreira de Miranda - DAMAT
• Página pessoal
www.paginapessoal.utfpr.edu.br/psferreira
• E-mail:
psferreira@utfpr.edu.br
• Atendimento
Sala 5 – PROFMAT – Bloco V3
Segunda-feira 14:20-14:50.
Panorama Histórico
• Antiguidade: nº de habitantes, nascimentos,
impostos, etc.
• Idade média: Informações tributárias e bélicas
• Século XVI: primeiras análises sistemáticas de fatos
sociais
• Século XVIII: as análises adquiriram feições
científicas. Godofredo Achenwall batizou essa
ciência de estatística.
• Atualmente: organização, direção e controle no
geral.
Estatística
• Técnicas que permite organizar, descrever, analisar e
interpretar dados provenientes de experimentos ou
estudos realizados em um determinado conjunto de
interesse.
Estatística
• Técnicas que permite organizar, descrever, analisar e
interpretar dados provenientes de experimentos ou
estudos realizados em um determinado conjunto de
interesse.
• 3 áreas:
• Estatística Descritiva: descrever e resumir dados
• Probabilidade: estudo de incertezas oriundas de fenômenos de
caráter aleatório
• Inferênica Estatística: informações e conclusões obtidas a partir
de um subconjunto de valores. Usada, geralmente quando não
temos acesso ao conjunto todo.
Estatística
• Definir o problema
• Planejamento da obtenção dos dados
• Coleta dos dados
• Organização dos dados
• Seriação
• Análise e interpretação dos dados
• Conclusões e resoluções para o problema
• População: Grande conjunto de dados que contém
a característica que temos interesse.
• População: Grande conjunto de dados que contém
a característica que temos interesse.
• Amostra: subconjunto da população.
• População: Grande conjunto de dados que contém
a característica que temos interesse.
• Amostra: subconjunto da população.
Teoria da amostra

• Amostra aleatória: seleção ao acaso (com ou sem


reposição)
Teoria da amostra

• Amostra estratificada:
informações adicionais a
respeito da população.
População é dividida em estratos
homogêneos.
Teoria da amostra

• Amostra Sistemática: uma lista de referência.


Exemplo: de 3 em 3.
Teoria da amostra

• Amostra Sistemática: uma lista de referência.


Exemplo: de 3 em 3.
Dados
Identificação 1 2 3 4 5 6
Turma A A B B C C
Gênero F M F M M F
Idade 17 18 17 18 17 19
Altura 1,6 1,75 1,63 1,8 1,72 1,47
Peso 60,5 75 55 93 81 50
Filhos 2 1 2 3 2 1
Fuma N S N N S N
Opinião sala de aula
R ruim, M média, B boa, N B M B R R M
não sabe.
Incômodo ao cigarro
N nada, P pouco, M muito N P P M M M
Classificação dos dados
• Dados brutos: todas as informações coletadas
58 90 66 50 62 86 95 40 2 4

• ROL: organização do mesmo em ordem crescente


ou decrescente
2 4 40 50 58 62 62 86 90 95

Tona possível analisar as variações dos dados.


• Variáveis: informações coletadas
• Ex. Variável altura -> assume valores em metros
• 𝑛: número de observações(frequência) por variável
Variáveis
• Variável quantitativa: variáveis numéricas

• Contínua: pertence a um intervalo dos Reais

• Discreta: números inteiros


Variáveis
• Variável qualitativa: não numérica (atributos ou
qualidades)

• Ordinal: ordenação, intensidade crescente

• Nominais: sem ordem natural


Variáveis
• Nota: Uma variável contínua pode ser considerada
discreta
• Idade: anos, dias, horas
• Devido a precisão de instrumentos, podemos ter
limitações de casas decimais, e uma variável
contínua pode se tornar discreta
• Podemos associar códigos numéricos para passar
informações computacionais
1 (F) e 2 (M), mas não a torna quantitativa.
• Sempre levar em conta a natureza da variável.
Elementos de uma distribuição
• Amplitude total:
diferença entre o menor e maior valor observado

𝐴 𝑇 = 1,8 − 1,47 = 0,33

• Frequência simples ou absoluta (𝑛𝑖 ):


Número de repetições de um valor individual 𝑖.

𝑛𝐹 =3
𝑛𝑀 =3
Elementos de uma distribuição
• Classe:
cada um dos grupos de valores em que se subdivide a
amplitude total
• Limite da classe: 1,5 1,6 -> [1,5,1,6)
• Amplitude da classe 𝐴𝑐 : 0,1
• Ponto médio: 1,55
• Recomendado para variável contínua. Altura 𝒏𝒊
• Representação por classes: 1,5 1,6 1
1,6 1,7 2
1,7 1,8 3
• Frequência simples ou absoluta (𝑛𝑖 ):
Número de repetições na classe 𝑖.
Elementos de uma distribuição
• Quantidade de classes:
• Regra de Sturges: 𝑘 = 1 + 3,3 log 𝑛
• Se o número de observações for 𝑛 = 500,
𝑘 = 1 + 3,3 log 500 = 9,906601 ~ 10
• Se o número de observações for 𝑛 = 50,
𝑘 = 1 + 3,3 log 50 = 6,606601 ~ 7

• Truman L. Kelley:
𝒏 5 10 25 50 100 200 500 1000
𝒌 2 4 6 8 10 12 15 15
Frequências
Realiza a contagem dos fatos -> número de ocorrências
• Frequência simples ou absoluta:
• 𝑛𝑖 - número de repetições da observação 𝑖 ou na classe 𝑖
• Frequência total:
• 𝑛 – número total de observações
• Frequência relativa:
• Proporção do número de repetições da observação 𝑖 ou na classe
𝑖 em relação ao número total de observações
𝑛𝑖
𝑓𝑖 =
𝑛
Frequências
Realiza a contagem dos fatos -> número de ocorrências
• Frequência simples ou absoluta:
• 𝑛𝑖 - número de repetições da observação 𝑖 ou na classe 𝑖
• Frequência total:
• 𝑛 – número total de observações
• Frequência relativa:
• Proporção do número de repetições da observação 𝑖 ou na classe
𝑖 em relação ao número total de observações Gênero 𝒏𝒊 𝒇𝒊
𝑛𝑖
𝑓𝑖 = F 3 0,5
𝑛
M 3 0,5
total 𝒏=6 1
Frequências:

𝑛𝑖 - frequência do valor 𝑖
𝑛 – frequência total Gênero 𝒏𝒊 𝒇𝒊
𝑛𝑖
𝑓𝑖 - frequência relativa 𝑓𝑖 =
𝑛
Frequências:

𝑛𝑖 - frequência do valor 𝑖
𝑛 – frequência total Gênero 𝒏𝒊 𝒇𝒊
𝑛𝑖
𝑓𝑖 - frequência relativa 𝑓𝑖 = B 2 1/3
𝑛
M 2 1/3
R 2 1/3
N 0 0
total 𝑛=6 1
Frequências:

𝑛𝑖 - frequência do valor 𝑖
𝑛 – frequência total Gênero 𝒏𝒊 𝒇𝒊 𝒇𝒊 (%)
𝑛𝑖
𝑓𝑖 - frequência relativa 𝑓𝑖 = B 2 1/3 ≈33%
𝑛
M 2 1/3 ≈33%
• 𝑓𝑖 .100 é a porcentagem de R 2 1/3 ≈33%
ocorrências 𝑖 N 0 0
total 𝑛=6 1
Frequências
80% da turma tem idade até 18 anos
• Frequência absoluta acumulada (𝑛𝑎𝑐 ):
Soma de todas as frequências absolutas menores ou iguais ao valor considerado

Idade 𝒏𝒊 𝒏𝒂𝒄
17 3 3
18 2 5
19 1 6
total 𝑛=6
Frequências
80% da turma tem idade até 18 anos
• Frequência absoluta acumulada (𝑛𝑎𝑐 ):
Soma de todas as frequências absolutas menores ou iguais ao valor considerado
• Frequência relativa acumulada (𝑓𝑎𝑐 ):
Soma de todas as frequências relativas menores ou iguais ao valor considerado
Idade 𝒏𝒊 𝒏𝒂𝒄
17 3 3
18 2 5
19 1 6
total 𝑛=6
Frequências
80% da turma tem idade até 18 anos
• Frequência absoluta acumulada (𝑛𝑎𝑐 ):
Soma de todas as frequências absolutas menores ou iguais ao valor considerado
• Frequência relativa acumulada (𝑓𝑎𝑐 ):
Soma de todas as frequências relativas menores ou iguais ao valor considerado
Idade 𝒏𝒊 𝒏𝒂𝒄 𝒇𝒊 𝒇𝒂𝒄𝒊 𝒇𝒂𝒄 (%)
17 3 3 1/2 𝟏/𝟐 50%
18 2 5 1/3 𝟓/𝟔 83%
• Utilizada para definir margens 19 1 6 1/6 1 100%
• 83% tem idade até 18 anos total 𝑛=6 1
Tabela de frequência
• Exemplo:

Altura 𝒏𝒊 𝒇𝒊

1,5 1,6 1 1/6

1,6 1,7 2 1/3

1,7 1,8 3 1/2

total 𝑛=6 1
Tabela de frequência
• Exemplo:

Altura 𝒏𝒊 𝒏𝒂𝒄 𝒇𝒊 𝒇𝒂𝒄 𝒇𝒂𝒄 (%)

1,5 1,6 1 1 1/6 1/6 ≈17%

1,6 1,7 2 3 1/3 1/2 55%

1,7 1,8 3 6 1/2 1 100%

total 𝑛=6 1
Tabela de frequência por classes
1. Lista de dados brutos que podem ou não ser transformados
em rol
2. Encontrar a amplitude total 𝐴 𝑇
3. Determinar o número de classes 𝑘
4. Determinar a amplitude do intervalo da classe
5. Determinar os limites das classes, escolhendo,
preferencialmente, números inteiros
6. Construir a tabela de frequências
Apresentação gráfica
• Complemento da apresentação tabular
• Ideia preliminar da dispersão e concentração dos dados
• Utilizar uma escala adequada e correta
Gráfico em disco ou pizza

0,17
17%

0,5
50% nada

pouco
0,33
33%
muito
• Frequência relativa
Gráfico em disco ou pizza

Incômodo ao cigarro
• Se adapta bem a variáveis
0,17 qualitativas
nada

pouco • A proporção é fundamental para


0,5
evitar falsas impressões e
muito
conclusões equivocadas
0,33
Gráfico de barras ou coluna (variável x frequência)

3,5

2,5

1,5

0,5

0
17 anos 18 anos 19 anos

• Se adapta melhor a variáveis discretas e qualitativas ordinais


Gráfico histograma
• Utilizado para classes
• Retângulos justapostos

4
Densidade

0
1,5 1,6 1,7 1,8
Altura (m)
Gráfico histograma
• Utilizado para classes
• Retângulos justapostos
• A área do retângulo tem que ser proporcional a frequência da
𝑓
classe. Densidade 𝑖
𝐴𝑐
6

4 Altura 𝒏𝒊 𝒇𝒊
Densidade

3 0,5 1,5 1,6 1 1/6


Ex. =5 1,6 1,7 2 1/3
2 0,1
1 1,7 1,8 3 1/2
0 total 𝑛=6 1
1,5 1,6 1,7 1,8
Altura (m)
No Histograma pode-se usar a frequência ou porcentagem.
No entanto, quando as classes possuem tamanhos
diferentes a densidade evita que o gráfico fique distorcido.
0,05 0,5
44 % 44 %

0,04 0,4

Frequência
Densidade

0,03 0,3

0,02 0,2
16 % 16 % 16 % 16 %
12% 12% 12 %
0,01 12 % 0,1

0 0
40 50 60 70 80 90 100 40 50 60 70 80 90 100
Idade (anos) Idade (anos)
Gráfico Poligonal Característica
• Contorno do Histograma
0,05
44 %

0,04

Densidade
0,03

0,02
16 % 16 %
12%
0,01 12 %

0
40 50 60 70 80 90 100
Idade (anos)
Gráfico Polígono de Frequências
• Unindo por linhas retas os pontos médios das bases superiores
dos retângulos do histograma
• Eixo pode ser a frequência absoluta, relativa ou a densidade.
Gráfico Polígono de Frequências Acumuladas
- Ogiva de Galton
• Apresentação gráfica das tabelas de frequências acumuladas
• Pode ser utilizado para representar as frequências acumuladas
100 96 100
“abaixo de” ou “acima de” 88

Frequência acumulada (%)


90
80 76
0,5
0,44 70
60
0,4 60 60%
Frequência

50
0,3
40
0,2 0,16 0,16
0,12 30
0,1 0,08 20 16
0,04
10
0
40 50 60 70 80 90 100 0
Idade (anos) 40 50 60 70 80 90 100
Idade (anos)
Medidas de
tendência central
• Os gráficos de frequências sumarizam os dados
• Medidas visam a tendência de os dados
observados se agruparem em torno de valores
centrais
Medidas de tendência central
Auxiliar no estudo do fenômeno em questão.
Alguns tipos de medidas:

• Média Aritmética
• Média Geométrica
• Média Harmônica
• Mediana
• Moda
Média aritmética simples
𝑛𝑥
1 𝑖
𝑥= , 𝑖 = 1, … , 𝑛,
𝑛
𝑥𝑖 , os valores da variável
Média aritmética simples
𝑛𝑥
1 𝑖
𝑥= , 𝑖 = 1, … , 𝑛,
𝑛
𝑥𝑖 , os valores da variável

Sabendo o consumo mensal de energia elétrica de


uma residência, determine o consumo médio.

Mês 1 2 3 4 5 6 7 8 9 10 11 12
Consumo [KWh] 30 68 71 106 101 77 103 97 105 95 100 115
Média aritmética simples
𝑛𝑥
1 𝑖
𝑥= , 𝑖 = 1, … , 𝑛,
𝑛
𝑥𝑖 = valor do consumo no mês 𝑖

Mês 1 2 3 4 5 6 7 8 9 10 11 12
Consumo [KWh] 30 68 71 106 101 77 103 97 105 95 100 115

𝑥 = 89.
Média aritmética simples -
propriedades
• Se cada valor observado é acrescido de uma
constante 𝑎, a média é acrescida de 𝑎.
𝑛
1 (𝑥𝑖 + 𝑎)
= 𝑥 + 𝑎.
𝑛
• Se cada valor observado é multiplicado por uma
constante 𝑎, a média é multiplicada por 𝑎.
𝑛
1 𝑎𝑥𝑖
= 𝑎𝑥 .
𝑛
Média aritmética ponderada
Os valores observados possuem pesos diferentes
𝑛𝑥 𝑝
1 𝑖 𝑖
𝑥𝑝 = 𝑛𝑝 , 𝑖 = 1, … , 𝑛,
1 𝑖
𝑝𝑖 o peso ou ponderação da variável 𝑥𝑖
Média aritmética ponderada
𝑛𝑥 𝑝
1 𝑖 𝑖
𝑥𝑝 = 𝑛𝑝 , 𝑖 = 1, … , 𝑛,
1 𝑖
𝑝𝑖 o peso ou ponderação da variável 𝑥𝑖
• Sabendo que um estudante alcançou as notas de 5, 7, 9 e
10, calcule a média aritmética e a ponderada, sabendo
que a sequência de pesos de cada prova é 1, 2, 2, 1.
Média aritmética ponderada
𝑛𝑥 𝑝
1 𝑖 𝑖
𝑥𝑝 = 𝑛𝑝 , 𝑖 = 1, … , 𝑛,
1 𝑖
𝑝𝑖 o peso ou ponderação da variável 𝑥𝑖
• Sabendo que um estudante alcançou as notas de 5, 7, 9 e
10, calcule a média aritmética e a ponderada, sabendo
que a sequência de pesos de cada prova é 1, 2, 2, 1.

5+7+9+10 5.1+7.2+9.2+10.1
𝑥= = 7,75 𝑥𝑝 = = 7,83
4 1+2+2+1
Média aritmética ponderada
𝑛𝑥 𝑝
1 𝑖 𝑖
𝑥𝑝 = 𝑛𝑝 , 𝑖 = 1, … , 𝑛,
1 𝑖
𝑝𝑖 podem representar o número de ocorrências 𝑛𝑖 de 𝑥𝑖
Calcule a média geométrica ponderada dos dados
1.2+3.4+9.2+27.1
𝑥𝑝 = =6,4
𝒙𝒊 𝒏𝒊 2+4+2+1
1 2
3 4
9 2
27 1
Média geométrica

• n-ésima raíz do produto de todos os valores observados


𝑛 𝑛 𝑛
𝑥𝑔 = 𝑖=1 𝑥𝑖 = 𝑥1 𝑥2 𝑥3 … 𝑥𝑛
Média geométrica
𝑛
𝑛
𝑛
𝑥𝑔 = 𝑥𝑖 = 𝑥1 𝑥2 𝑥3 … 𝑥𝑛
𝑖=1

Calcule a média geométrica do conjunto X={1,4,16,64}.


Média geométrica
𝑛
𝑛
𝑛
𝑥𝑔 = 𝑥𝑖 = 𝑥1 𝑥2 𝑥3 … 𝑥𝑛
𝑖=1

Calcule a média geométrica do conjunto X={1,4,16,64}.

4
𝑥𝑔 = 1.4.16.64 =8
Média geométrica
Taxas de variação.
• Suponhamos que um capital de R$500 foi investido em
2015. Após um ano de aplicação, essa importância
acendeu a R$650. Reaplicando esta última quantia, ao
final de mais um ano seu montante se tornou R$ 910.
Calcule a taxa média geométrica de aumento de capital.
Média geométrica
Taxas de variação.
• Suponhamos que um capital de R$500 foi investido em
2015. Após um ano de aplicação, essa importância
acendeu a R$650. Reaplicando esta última quantia, ao
final de mais um ano seu montante se tornou R$ 910.
Calcule a taxa média geométrica de aumento de capital.
Período Taxa
2015 – 2016 650
= 1,3
500
2016 - 2017 910
= 1,4
650
Média geométrica
Taxas de variação.
• Suponhamos que um capital de R$500 foi investido em
2015. Após um ano de aplicação, essa importância
acendeu a R$650. Reaplicando esta última quantia, ao
final de mais um ano seu montante se tornou R$ 910.
Calcule a taxa média geométrica de aumento de capital.
Período Taxa
1,3.1,4=1,3491
2015 – 2016 650
= 1,3
500 Logo a taxa média geométrica de
2016 - 2017 910
650
= 1,4 aumento em 2 anos foi de 34,91%.
Média geométrica ponderada
• Podemos utilizar, por exemplo, quando o conjunto de
números estão dispostos em uma tabela de frequência
𝑘𝑛
1 𝑖 𝑛1 𝑛2 𝑛𝑘
𝑥𝑔𝑝 = 𝑥1 𝑥2 … 𝑥𝑘

• Calcule a média geométrica ponderada dos dados


𝒙𝒊 𝒏𝒊
1 2
9
3 4 𝑥𝑔𝑝 = 12 34 92 271 = 3,829554
9 2
27 1
Média harmônica
Inverso da média aritmética dos inversos:
𝑛
𝑥ℎ =
𝑛 1
𝑖=1 𝑥
𝑖

Calcule a média harmônica do conjunto X={10, 60, 360}.

3
𝑥ℎ = 1 1 1 = 25,12
+ +
10 60 360
Média harmônica ponderada
Inverso da média aritmética dos inversos:
𝑛
𝑥ℎ =
𝑘 1
𝑖=1 𝑛𝑖 𝑥
𝑖

Uma pessoa gastou R$120 em camisetas de R$30 e R$100


em camisetas de R$50. Qual o preço médio gasto em
camisas.
• Variável é o preço e o peso a quantidade gasta
220
𝑥ℎ = = 36,67
1 1
120 + 100
30 50
Propriedade das médias
• 𝑥ℎ ≤ 𝑥𝑔 ≤ 𝑥
• Calcule a média aritmética, harmônica e geométrica dos
conjuntos
X={2, 4, 6, 8, 10} :
𝑥ℎ = 4,38 ≤ 𝑥𝑔 = 5,21 ≤ 𝑥 = 6
Y={10, 10, 10} :
𝑦ℎ = 10 ≤ 𝑦𝑔 = 10 ≤ 𝑦 = 10
W={10,1; 10,1; 10,2; 10,4; 10,5} :
𝑤ℎ = 10,2574 ≤ 𝑤𝑔 = 10,2587 ≤ 𝑤 = 10,2600
Moda (Mo)
• Dado mais frequente de um conjunto.

Moda de idade é 17 anos.

• Amodal, Bimodal, etc

Bimodal em questão de gênero.


Mediana (𝑥)
• O conjunto precisa ser ordenado ou um rol.
• Divide o conjunto ao meio
• 50% dos dados obtidos são maiores ou menores
que a mediana
Mediana (𝑥) – não agrupados em classe
𝑛+1
• n ímpar: observação 𝑥𝑗 que fica no meio 𝑗 =
2

• n par: média dos dois dados centrais


Mediana (𝑥) – não agrupados em classe
𝑛+1
• n ímpar: observação 𝑥𝑗 que fica no meio 𝑗 =
2
X={1, 5, 3, 7, 9} -> XROL={ 1, 3, 5, 7 ,9}
5+1
n=5 → 𝑗= =3 → 𝑥 = 𝑥3 = 5
2

• n par: média dos dois dados centrais


X={1, 2, 6, 7, 3, 5, 6, 0} -> XROL={0, 1, 2, 3, 5, 6, 6, 7}
𝑥4 +𝑥5
n=8 → 𝑥= =4
2
Mediana (𝑥) – não agrupados em classe
𝑛+1
• n ímpar: observação 𝑥𝑗 que fica no meio 𝑗 =
2
X={1, 5, 3, 7, 9} -> XROL={ 1, 3, 5, 7 ,9}
5+1
n=5 → 𝑗= =3 → 𝑥 = 𝑥3 = 5
2

• n par: média dos dois dados centrais


X={1, 2, 6, 7, 3, 5, 6, 0} -> XROL={0, 1, 2, 3, 5, 6, 6, 7}
𝑥4 +𝑥5
n=8 → 𝑥= =4
2
Mediana (𝑥) – agrupados em classe
• Mediana 𝑥 : divide o • Até 60 anos temos 60%
conjunto ao meio das observações.
Ex. Precisamos determinar
um retângulo com área
de 34%:

𝑥 − 50 60 − 50
=
0,34 0,44
𝑥 =57,73 anos.
Moda, Mediana e Média
• Os preços de um determinado eletrodoméstico
foram coletados por uma amostragem. Calcule a
média, mediana e a moda dos valores
• ROL: 420 440 440 470 480 500 840
• Moda: R$ 440
• Mediana: R$ 470
• Média: R$512, 86
Quartis – Decis - Centis
• Um rol é dividido em mais do que dois subgrupos
(como na mediana)
• Quartis – divide a distribuição em 4 partes
• Decis – divide a distribuição em 10 partes
• Centis – divide a distribuição em 100 partes
Quartis
• Precisamos de 3 separatriz 𝑄1 , 𝑄2 e 𝑄3
• Suponha que um vendedor de livros guarde os
livros de cada representante em caixas separadas e
está interessados em estudar o número de livros
por representante. Após uma seleção 20 caixas
foram contadas e o rol dos resultados foi
{22, 29, 33, 35, 35, 37, 38, 43, 43, 44, 48, 48,
52, 53 , 55, 57, 61, 62, 67, 69}
Quartis
{22, 29, 33, 35, 35, 37, 38, 43, 43, 44, | 48, 48, 52, 53 , 55, 57, 61, 62, 67, 69}
𝑥10 +𝑥11 44+48
1. n = 20 → 𝑥= = = 46 = 𝑄2
2 2
Quartis
{22, 29, 33, 35, 35, 37, 38, 43, 43, 44, | 48, 48, 52, 53 , 55, 57, 61, 62, 67, 69}
𝑥10 +𝑥11 44+48
1. n = 20 → 𝑥= = = 46 = 𝑄2
2 2
Quartis
{22, 29, 33, 35, 35, | 37, 38, 43, 43, 44, | 48, 48, 52, 53 , 55, 57, 61, 62, 67, 69}
𝑥10 +𝑥11 44+48
1. n = 20 → 𝑥= = = 46 = 𝑄2
2 2
2. Cada lado possui 10 elementos
𝑥5 +𝑥6 35+37
n = 10 → 𝑥= = = 36 = 𝑄1
2 2
Quartis
{22, 29, 33, 35, 35, | 37, 38, 43, 43, 44, | 48, 48, 52, 53 , 55, | 57, 61, 62, 67, 69}
𝑥10 +𝑥11 44+48
1. n = 20 → 𝑥= = = 46 = 𝑄2
2 2
2. Cada lado possui 10 elementos
𝑥5 +𝑥6 35+37
n = 10 → 𝑥 = = = 36 = 𝑄1
2 2
𝑥15 +𝑥16 55+57
n = 10 → 𝑥 = = = 56 = 𝑄3
2 2
Gráfico box-plot
• Gráfico que envolve os quartis
• Permite visualizar: distribuição dos dados,
variabilidade, assimetria e ocorrência de valores
atípicos. 60

50

40

30

20

10

0
Gráfico box-plot
• Gráfico que envolve os quartis
• Permite visualizar: distribuição dos dados,
variabilidade, assimetria e ocorrência de valores
atípicos. 60

50

40

30
𝑄1
20

10

0
Gráfico box-plot
• Gráfico que envolve os quartis
• Permite visualizar: distribuição dos dados,
variabilidade, assimetria e ocorrência de valores
atípicos. 60

50
𝑄3
40

30
𝑄1
20

10

0
Gráfico box-plot
• Gráfico que envolve os quartis
• Permite visualizar: distribuição dos dados,
variabilidade, assimetria e ocorrência de valores
atípicos. 60

50
𝑄3
40
Intervalo interquartil 𝐼𝑄
30
𝑄1
20

10 Note que I𝑄 contém 50%


0 das observações
Gráfico box-plot
• Gráfico que envolve os quartis
• Permite visualizar: distribuição dos dados,
variabilidade, assimetria e ocorrência de valores
atípicos. 60

50
Alguns autores consideram
𝑄3 um conjunto para os dados
40 “bem comportados” entre
30 [max min xi, 𝑄1 − 1,5 𝐼𝑄 ;
𝑄1 min{max xi, 𝑄3 + 1,5𝐼𝑄}]
20
Pontos fora deste intervalo
10 são considerados atípitcos
outliers.
0
Gráfico box-plot
• Gráfico que envolve os quartis
• Permite visualizar: distribuição dos dados,
variabilidade, assimetria e ocorrência de valores
atípicos. 60

50
Alguns autores consideram
𝑄3 um conjunto para os dados
40 “bem comportados” entre
30 [max min xi, 𝑄1 − 1,5 𝐼𝑄 ;
𝑄1 min{max xi, 𝑄3 + 1,5𝐼𝑄}]
20
Pontos fora deste intervalo
10 são considerados atípitcos
outliers.
0
Gráfico box-plot
• Gráfico que envolve os quartis
• Permite visualizar: distribuição dos dados,
variabilidade, assimetria e ocorrência de valores
atípicos. 60
Maior valor observado
50
𝑄3
40

30
𝑄1
20

10 Menor valor observado


0
Gráfico box-plot
• Gráfico que envolve os quartis
• Permite visualizar: distribuição dos dados,
variabilidade, assimetria e ocorrência de valores
atípicos. 60
Maior valor observado
50
𝑄3
40
Mediana
30
𝑄1
20

10 Menor valor observado


0
Gráfico box-plot
• Gráfico que envolve os quartis
• Permite visualizar: distribuição dos dados,
variabilidade, assimetria e ocorrência de valores
atípicos. 60
Maior valor observado
50
𝑄3
40
Mediana Média
30
𝑄1
20

10 Menor valor observado


0
Gráfico box-plot
• Vamos construir o gráfico para os dados das 20
caixas. {22, 29, 33, 35, 35, | 37, 38, 43, 43, 44, | 48, 48, 52, 53
, 55, | 57, 61, 62, 67, 69}
• Intervalo interquartil: 𝐼𝑄 = 𝑄3 - 𝑄1 = 56-36 = 20
• Pontos de corte:
• inferior 𝑄1 - 1,5.IQ = 36-1,5.20 = 6
• Superior 𝑄2 +1,5.IQ = 56+1,5.20 = 86
• Observações fora do intervalo [6,86] seriam extremos
• Logo o intervalo é [22,69]
Gráfico box-plot
• Vamos construir o gráfico para os dados das 20
caixas. {22, 29, 33, 35, 35, | 37, 38, 43, 43, 44, | 48, 48, 52, 53
, 55, | 57, 61, 62, 67, 69}
• 𝐼𝑄 = 𝑄3 - 𝑄1 = 56-36 = 20
• Pontos de corte: [22,69]
Gráfico box-plot – dispersão dos dados
• Uma indústria produz uma peça automotiva cujo valor de
referência é 75cm. Após verificar lotes com peças fora de
especificação, enviaram duas equipes de trabalhadores (A e B)
para um treinamento. Para verificar a eficiência do treinamento,
foram selecionadas 10 peças produzidas pelas equipes A e B e 10
peças produzidas pelas equipes C e D que não participaram do
treinamento. A A B B C C D D
75,27 74,93 74,94 74,75 75,93 73,34 75,98 76,75
75,33 74,72 75,25 74,65 76,95 74,04 75,61 76,78
74,58 74,53 75,44 74,94 75,47 75 74,2 74,74
75,01 75,32 74,62 74,92 73,6 76,18 76,44 72,58
75,71 75,05 75,35 75,46 74,85 75,33 76,84 72,86
Gráfico box-plot – dispersão dos dados
• A e B possuem
menos
variabilidade.
• D produz peças
com maior
variabilidade
• B produz peças
com a menor
variabilidade
• Referência:
• http://www.portalaction.com.br/estatistica-
basica/31-boxplot

Você também pode gostar