Aula Estatistica Descritiva

Estatística Descritiva
Prof. Janser Moura Pereira

janser@famat.ufu.br
Descrição e apresentação de dados
Estatística Descritiva:
Coleta → Sumário → Análise
Inferência Estatística:
Generalizações (Amostra → População)
Características Importantes:
• A natureza ou forma da distribuição dos dados, como forma

de sino, uniforme ou assimétrica;
• Um valor representativo, como uma média;
• Uma medida de dispersão ou variação.

Classificação das variáveis
Variáveis Qualitativas
• qualitativa ordinal → possível ordenação
•qualitativa nominal → não há possibilidade de
ordenação
Variáveis Quantitativas
• quantitativa discreta: contagem
• quantitativa contínua: mensuração

Resumo dos dados com tabelas de frequencias
• Dados Brutos
Tabela 1 – Marcas de carros populares predominantes em 25 cidade do
triângulo.
Pálio Corsa Uno Gol Corsa
Uno Gol Uno Pálio Uno
Pálio Uno Gol Corsa Gol
Ka Gol Uno Uno Gol
Gol Corsa Gol Uno Uno
• Dados Elaborados - Rol
Tabela 2 – Marcas de carros populares predominantes em 25 cidade do
triângulo.
Uno Uno Gol Gol Corsa
Uno Uno Gol Gol Pálio
Uno Uno Gol Corsa Pálio
Uno Uno Gol Corsa Pálio
Uno Gol Gol Corsa Ka
Distribuição de Frequencia
Tabela 3 – Distribuição das marcas de carros populares em 25 cidades do triângulo.
Marca Frequencia
Corsa 4
Gol 8
Ka 1
Pálio 3
Uno 9
Σ 25
Tabela 4 – Dist. de freq. das marcas de carros populares em 25 cidades do triângulo.

Marca fi fr fp(%)
Corsa 4 4/25 = 0,16 16
Gol 8 8/25 = 0,32 32
Ka 1 1/25 = 0,04 4
Pálio 3 3/25 = 0,12 12
Uno 9 9/25 =0,36 36
Σ 25 1,00 100
Tabela 5 – Dados brutos referentes ao número de ovos danificados de uma cidade
distante para Lavras (30 embalagens, de uma dúzia cada).
0 0 1 1 1
3 0 0 0 0
2 3 3 0 0
1 5 4 1 2
2 1 1 1 0
0 0 0 1 0
Tabela 6 – Dist. freq. referentes ao número de ovos danificados de uma cidade distante
para Lavras (30 embalagens, de uma dúzia cada).
Nº ovos quebrados - xi fi fr fp(%)
0 13 13/30 = 0,44 44
1 9 9/30 = 0,30 30
2 3 3/30 = 0,10 10
3 3 3/30 = 0,10 10
4 1 1/30 = 0,03 3
5 1 1/30 = 0,03 3
Σ 30 1,00 100
Distribuição de Frequencia para dados contínuos ou
discretos
Elementos de uma distribuição de freqüência
i. Organizar (ordenar): dados brutos → dados elaborados
ii. Cálculo da amplitude total (A): A = X ( n ) − X (1)
iii. Cálculo do número de classes: Adotar um critério
iv. Cálculo de amplitude de classe (C): C = A ( k − 1)

C
v. Cálculo do limite inferior da primeira classe: LI1ª = X (1) −
2
vi. Calcular as classes.
Determinando o número de classes - k
Critérios:
 k = n , n ≤ 100
i) Critério de Oliveira (1994): 
 k = 5.log( n), n > 100
A3 n
ii) Critério de Scott(1979): k= S
3, 49
iii) Critério de Sturges: k = 1 + 3, 3.log(n)

Tabela 7- Dados da produção de grãos em g/planta obtidos numa amostra de
n = 20 plantas de feijão da geração F2 do cruzamento das cultivares Flor de
Maio e Carioca
1,38 4,14 6,23 12,13 17,12
3,65 4,54 6,79 12,56 19,68
3,78 5,64 8,21 13,19 21,26
3,87 5,67 9,79 15,60 24,57
Tabela 8 – Dist. de freq. da produção de grãos em g/planta obtidos numa

amostra de n = 20 plantas de feijão da geração F2 do cruzamento das
cultivares Flor de Maio e Carioca.
Classes de pesos Xi fi fr fp (%)
-2,485├5,245 1,38 6 0,30 30
5,245├12,975 9,11 8 0,40 40
12,975├20,705 16,84 4 0,20 20
20,705├28,435 24,57 2 0,10 10
Σ 20 1,00 100
Exercícios
1- Na Tabela 9, temos as anotações das estaturas de 40 alunos do sexo

masculino.
Tabela 9 - Estaturas de alunos universitários do sexo masculino (m), em

ordem crescente.
1,58 1,68 1,70 1,71 1,74 1,75 1,79 1,80 1,83 1,86
1,62 1,69 1,70 1,71 1,74 1,76 1,80 1,81 1,83 1,87
1,64 1,69 1,70 1,72 1,75 1,77 1,80 1,81 1,84 1,94
1,68 1,70 1,71 1,73 1,75 1,77 1,80 1,83 1,85 1,94
Construa uma tabela com a distribuição de frequencia absoluta, relativa e

percentual referente às estaturas de alunos universitários do sexo masculino.
Utilizar o critério de Oliveira.
Exercícios
2 - Na Tabela 10, temos dados brutos referentes à dureza de 30 peças de
alumínio.
Tabela 10 - Dados brutos referentes à dureza de 30 peças de alumínio.

53,0 70,2 84,3 69,5 77,8 87,5 53,4 82,5 67,3 54,1
70,5 71,4 95,4 51,1 74,4 55,7 63,5 85,8 53,5 64,3
82,7 78,5 55,7 69,1 72,3 59,5 55,3 73,0 52,4 50,7
Construa uma tabela com a distribuição de frequencia absoluta, relativa e

percentual referente à dureza de 30 peças de alumínio. Utilizar o critério de
Oliveira.
Medidas de Posição – Medidas de Tendência Central
• Média
– Média populacional → µ (mi)
– Média amostral → X (X barra)
• Mediana
– Mediana populacional → µd
– Mediana amostral → Md
• Moda
– Moda populacional → µo
– Moda amostral → Mo
Média para dados não agrupados
N
∑X
i =1
i
X1 + X 2 + ⋯ + X N
– Média populacional: µ= =
N N
∑X i
X1 + X 2 + ⋯ + X n
– Média amostral: X= i =1
=
n n
Exemplo: Sabendo-se que o número de peças defeituosas observados

em amostras retiradas diariamente da linha de produção, durante
uma semana foi de 10, 14, 13, 15, 16, 18 e 12 peças, têm, para
número médio de peças defeituosas da semana:
n 7
∑X
i =1
i ∑X
i =1
i
X 1 + X 2 + ⋯ + X 7 10 + 14 + 13 + 15 + 16 + 18 + 12
X= = = =
n 7 7 7
98
X= = 14 peças/dia
7
Média para dados agrupados
k k
– Média populacional: µ = ∑ X i fi N ou µ = ∑ X i f i N
i =1 i =1
k k
– Média amostral: X = ∑ X i f i n ou X = ∑ X i f i n
i =1 i =1
Exemplo: Número de gols por partida (variável discreta).
7
Nº. de gols por partida ( X i ) fi X i fi ∑X f
i i
X 1 f1 + X 2 f 2 + ⋯ X 7 f 7
0 7 0 X= i =1
=
1 12 12 60 60
2 16 32 0 + 12 + ⋯ + 12
3 12 36 X=
60
4 9 36
5 2 10 138
X= = 2, 3 gols por partida
6 2 12 60
Σ 60 138
Média para dados agrupados
Exemplo: Coeficiente de atrito cinético (variável contínua)
Classes de Coeficiente de Atrito Cinético fi Xi X i fi

0,15 ├ 0,35 5 0,25 1,25
0,35 ├ 0,55 10 0,45 4,50
0,55 ├ 0,75 8 0,65 5,20
0,75 ├ 0,95 17 0,85 14,45
Σ 40 - 25,40
4
∑fX
i =1
i i
f1 X 1 + f 2 X 2 + f3 X 3 + f 4 X 4
X= =
40 40
5 * 0, 25 + 10 * 0, 45 + 8 * 0, 65 + 17 * 0, 85
X=
40
25, 40
X= = 0, 635.
40
Mediana para dados não agrupados
X  n  + X  n+ 2 
n 2  2 
   
Se n é par: E = ⇒ Md =
2 2
n +1
Se n é ímpar: E = ⇒ Md = X  n +1
2 
 2 

Exemplo: Considere a seguinte amostra de dados: 9, 9, 8, 11, 12, 13, 13, 14.
X  n  + X  n+2  X  8  + X  8+2 
n 8  
2
 
 2 
 
2
 
 2 
X ( 4 ) + X (5 ) 11 + 12
E = = = 4 ⇒ Md = = = = = 11, 5
2 2 2 2 2 2
Exemplo: Considere a seguinte amostra de dados: 9, 9, 8, 11, 12, 13, 13.
n +1 7 +1
E= = = 4 ⇒ Md = X  n+1 = X  7 +1 = X ( 4) = 11
2 2 
 2 
 
 2 

Mediana para dados agrupados
• Se a variável é discreta: o procedimento é o mesmo.
Exemplo para variável discreta: Número de gols por partida.
nº. de gols por partida ( X i ) fi Fi
0 7 7
E = n 2 = 60 2 = 30
1 12 19 X  n  + X  n+2 
2 16 35  
2
 
 2 
X (30 ) + X ( 31)
3 12 47 Md = =
2 2
4 9 56
5 2 58 2+2 4
Md = = = 2 gols por partida
6 2 60 2 2
Σ 60 -
• Se a variável é contínua: o procedimento (estimador) muda.
n 
 − F ( anterior ) 
2
Md = LI Md +  ×h
Md
f i Md
Mediana para dados agrupados
Exemplo para variável contínua: Coeficiente de atrito cinético.
Classes de Coeficiente de Atrito Cinético fi Fi

0,15 ├ 0,35 5 5
0,35 ├ 0,55 10 15
0,55 ├ 0,75 8 23
0,75 ├ 0,95 17 40
Σ 40 -
E = n 2 = 40 2 = 20
n   40 
 − F( anterior )  × h  − 15  × 0, 20
2 2
Md = LI Md +  = 0, 55 +  
f i Md 8
( 5 ) × 0, 20 1
Md = 0, 55 + + = 0, 55 + = 0, 55 + 0,125 = 0, 675.
8 8
Moda para dados não agrupados
Exemplo: Considere a seguinte amostra: 8, 9, 9, 11, 13, 13, 13, 14. O valor
que mais se repete é o 13, que aparece três vezes, portanto a moda é Mo =
13 (unimodal).
Observação:
Pode haver mais de uma moda em uma série.
Exemplo: A série: 8, 9, 9, 11, 12, 13, 13, 14 então, os valores 9 e 13 ocorrem
com maior frequencia que os demais. Esta série apresenta duas modas,
sendo dita bimodal.
É possível encontrar séries de dados nas quais nenhum valor apareça mais
do que os outros.
Exemplo: A série 8, 9, 10, 11, 13, 14 então, esta série é dita amodal.
Moda para dados agrupados
• Se a variável é discreta
discreta:: observa a maior frequencia (muito simples).
Exemplo: Número de circuitos defeituosos por sistema, observados em
uma amostra de 19 sistemas.
nº. de circuitos defeituosos ( X i ) f i A maior freqüência foi a da
1 10 primeira “classe”, cujo valor é 1
2 7 circuito defeituoso por sistema ,
3 1
4 1 por isso a moda da distribuição é
Σ 19 Mo = 1 circuito defeituoso/sistema.
• Se a variável é contínua
contínua:: o estimador muda.
∆1
Mo = LI Mo + × h Mo
∆1 + ∆ 2
Moda para dados agrupados
Exemplo para variável contínua: Coeficiente de atrito cinético.
Classes de Coeficiente de Atrito Cinético fi

0,15 ├ 0,35 5
0,35 ├ 0,55 10
0,55 ├ 0,75 8
0,75 ├ 0,95 17
Σ 40
∆1 (17 − 8)
Mo = LI Mo + × h Mo = 0, 75 + × 0, 20
∆1 + ∆ 2 (17 − 8) + (17 − 0)
(9) 9 1, 8
Mo = 0, 75 + × 0, 20 = 0, 75 + × 0, 20 = 0, 75 +
(9) + (17) 26 26
Mo = 0, 75 + 0, 0692 = 0, 8192
ASSIMETRIA
Assimetria: significa desvio ou afastamento da simetria, (grau de
deformação de uma curva).
# Simétrica, se a média e a moda coincidem.
# Assimétrica à esquerda ou negativa, se a média é
menor que a moda.
# Assimétrica à direita ou positiva, se a média é maior
que a moda.
Natureza da distribuição dos dados
freq freq.
Assimétrica Assimétrica
à esquerda à direita
ou negativa ou positiva
Média Moda
Moda Média
Mediana Mediana
freq.
Simétrica
Moda = Média = Mediana

Medidas de Dispersão
Informação Incompleta das Medidas de Posição (“Deficiência”)

Sintetiza toda informação da distribuição dos dados em uma única estimativa
pontual, ou seja, não se tem noção sobre a variabilidade (dispersão) dos
dados.
Situação: Escolher uma entre as três marcas de lâmpadas (A, B e C),

levando em consideração o tempo médio de vida. Dado que o tempo médio
de vida das três marcas de lâmpadas são iguais a 6 meses.
A B C
X A = 6 meses X B = 6 meses X C = 6 meses
Medidas de Dispersão
• Amplitude → A
• Variância
– Variância populacional → σ2
– Variância amostral → S2
• Desvio Padrão
– Desvio Padrão Populacional → σ
– Desvio Padrão Amostral → S
• Coeficiente de Variação → CV
• Erro Padrão da Média
– Erro Padrão da Média Populacional → σX
– Erro Padrão da Média Amostral → SX
Amplitude para dados agrupados e não agrupados
A = maior valor - menor valor = X(n) – X(1) = X k − X 1

Exemplo 1: Dados da amostra de tempo de vida de pneus: 40.000; 40.500;
35.600; 39.300; 37.200; 39.700; 35.000; 32.300 km.
Logo, o tempo de vida do pneu apresenta uma amplitude A = 40.500 – 32.300
= 8.200 km, ou seja, o tempo de vida do pneu varia entre 32.300 e 40.500.
Exemplo 2: Amplitude do coeficiente de atrito cinético

Classes de Coeficiente de Atrito Cinético fi Xi
0,15 ├ 0,35 5 0,25
0,35 ├ 0,55 10 0,45
0,55 ├ 0,75 8 0,65
0,75 ├ 0,95 17 0,85
Σ 40 -
Logo, o coeficiente de atrito cinético apresenta uma amplitude A = 0,85 – 0,25

= 0,60 . Isto é, o coeficiente de atrito cinético varia entre 0,25 e 0,85.
Variância para dados não agrupados
Variância Populacional
N   N  
2
N
∑( Xi − µ ) ∑ ∑
2
N  Xi   Xi
ou σ 2 =  ∑ X i2 −  i =1   , em que µ = i =1
1
σ2 = i =1
N N  i =1 N  N
 
 
Variância Amostral
n   n
 
2
n
∑( Xi − X ) ∑ ∑
2
 n  Xi   Xi
1   i =1   , em que X = i =1
S2 = i =1
n −1
ou S 2 = ∑ i
n − 1  i =1
X 2
−
n  n
 
 
Desvio Padrão para dados não agrupados
Desvio Padrão Populacional
N   N  
2
N
∑( Xi − µ )
2
 ∑ Xi 
1  N 2  i =1   ∑ Xi
σ= i =1
N
ou σ = ∑
N  i =1
Xi −
N 
, em que µ = i =1
N
 
 
Desvio Padrão Amostral
n   n  
2
n
∑( X ∑ ∑
2
i −X)  n  Xi   Xi
X i2 −  i =1   , em que X = i =1
1 
S= i =1
n −1
ou S = ∑
n − 1  i =1 n  n
 
 
Variância e Desvio Padrão para dados não agrupados
Exemplo: Considere os dados referentes ao tempo de vida de uma marca de

pneu: 40.000; 40.500; 35.600; 39.300; 37.200; 39.700; 35.000; 32.300 km.
Determine a variância e o desvio padrão.
n n
∑( X ∑X
2
−X)
Situação 1: Estimador não simplificado
i i
2 i =1 i =1
S = , em que X =
n −1 n
n
∑X
i =1
i
40.000 + 40.500 + ⋯ + 32.300
X= = = 37.450 km
n 8
8
2
∑( Xi − X ) ( 40.000 − 37.450 )
2 2
+ ( 40.500 − 37.450 ) + ⋯ + ( 32.300 − 37.450 )
2
S2 = i =1
=
n −1 8 −1
60.300.000
S2 = = 8.614.285, 714 km 2
7
S = 8.614.285, 714 = 2.935, 0103 km

Variância e Desvio Padrão para dados não agrupados
Exemplo: Considere os dados referentes ao tempo de vida de uma marca de

pneu: 40.000; 40.500; 35.600; 39.300; 37.200; 39.700; 35.000; 32.300 km.
Determine a variância e o desvio padrão.
  n
 
2
1 
 n  ∑ Xi  
 i =1  
Situação 2: Estimador simplificado S 2
= ∑ i
n − 1  i =1
X 2
−
n 
 
 
2
2 1  2 2 2 ( 40 . 000 + 40 .500 + ⋯ + 32 .300 ) 
S = ( 40.000 + 40.500 + ⋯ + 32.300 ) − 
8 − 1  8 
2
2 1 10 ( 299.600 )  1
S = 1,128032 * 10 −  = 1,128032 * 1010 − 1,122002 * 1010 
7  8  7
1
S2 = [60.300.000] = 8.614.285, 714 km2
7
S = 8.614.285, 714 = 2.935, 0103 km

Variância para dados agrupados
Variância Amostral para variável contínua
  k  
2
 k  ∑ X i fi  
X i2 f i −  i =1  
1 
S2 = ∑
n − 1  i =1 n 
 
 
Variância Amostral para variável discreta
  k
 
2
 k  ∑ X i fi  
1  X 2 f −  i =1  
S2 = ∑ i i
n − 1  i =1 n 
 
 
Desvio Padrão para dados agrupados
Desvio Padrão Amostral para variável contínua
  k
 
2

1  k 2  ∑ X i fi  
 i =1  
S= ∑ i i
n − 1  i =1
X f −
n 
 
 
Desvio Padrão Amostral para variável discreta
  k  
2
 k  ∑ X i fi  
X i2 fi −  i =1  
1 
S= ∑
n − 1  i =1 n 
 
 
Variância e Desvio Padrão para dados agrupados
Exemplo: Coeficiente de atrito cinético (variável contínua)
0,15 ├ 0,35 5 0,25
0,35 ├ 0,55 10 0,45
0,55 ├ 0,75 8 0,65
0,75 ├ 0,95 17 0,85
Σ 40 -
2
  k  
 k  ∑ X i fi  
1 
S2 = ∑ X i2 f i −  i =1  
n − 1  i =1 n 
 
 
2
2 1  2 2 ( 0, 25 * 5 + ⋯ + 0, 85 * 17 ) 
S = ( 0, 25 * 5 + ⋯ + 0, 85 * 17 ) − 
40 − 1  40 
2
2 1  ( 25, 4 )  1
S = 18 − = [18 − 16,129] = 0, 0480
39  40  39
S = 0, 0480 = 0, 2190
Variância e Desvio padrão para dados agrupados
Exemplo: Número de ovos danificados (variável discreta)
Número de ovos quebrados ( X i ) fi
0 13
1 9
2 3
3 3
4 1
5 1
Σ 30
2
  k  
 k  ∑ X i fi  
1  X 2 f −  i =1  
S2 = ∑
n − 1  i =1
i i
n 
 
 
2
2 1  2 2 2 ( 0 * 13 + 1* 9 + ⋯ + 5 * 1) 
S = ( 0 * 13 + 1 * 9 + ⋯ + 5 * 1) − 
30 − 1  30 
2
1  ( 33 )  1
2
S = 89 − = [89 − 36, 3] = 1, 8172 ( ovos danificados )2
29  30  29
S 2 = 1, 8172 = 1, 3480 ovos danificados

Coeficiente de Variação
σ
Coeficiente de Variação Populacional CV = 100%
µ
S
Coeficiente de Variação Amostral CV = 100%
X
Erro Padrão da Média

σ σ2
Erro Padrão da Média Populacional σX = =
n n
S S2
Erro Padrão da Média Amostral SX = =
n n
Coeficiente de Variação
• Conjunto de dados com diferentes unidades de medidas;

• Mesma unidade de medida mas, com médias de magnitudes distintas.
Exemplo: Qual das lâmpadas possui maior uniformidade de tempo de vida?
X A = 4, 0 meses, S A = 0, 8 meses, X B = 8, 0 meses e S B = 1, 2 meses
SA 0, 8 SB 1, 2
CVA = x100 = x100 = 20% CVB = x100 = x100 = 15%
XA 4, 0 XB 8, 0
A lâmpada B é a mais uniforme, pois possui um menor CV que a lâmpada A .

Representação Gráfica
Gráfico para variáveis qualitativas:
Gráfico em barras horizontais ou verticais;
Gráfico em setores (“pizza”).
Gráfico para variáveis quantitativas:
Histograma;
Polígono de Frequencia.
Ilustração gráfica
Exemplo: Nível de instrução no setor de orçamento de uma companhia.
Grau de instrução fi fr fp.(%)
Fundamental 12 0,3333 33,33
Médio 18 0,5000 50,00
Superior 6 0,1667 16,67
Total 36 1,00 100,00
24
18
Frequencia
12
0
Fundamental Médio Superior
Grau de Instrução
Figura 1 - Gráfico em barras verticais para a variável grau de instrução.

Exemplo: Nível de instrução no setor de orçamento de uma companhia.
Grau de instrução fi fr fp.(%)
Fundamental 12 0,3333 33,33
Médio 18 0,5000 50,00
Superior 6 0,1667 16,67
Total 36 1,00 100,00
6; 16,7%
12; 33,3%
18; 50,0%
Fundamental Médio Superior
Figura 2 - Gráfico em setores para a variável grau de instrução.

Exemplo: Produção de grãos em g/planta.
Classes de pesos Xi fi fr fp (%)
-2,485├5,245 1,38 6 0,30 30
5,245├12,975 9,11 8 0,40 40
12,975├20,705 16,84 4 0,20 20
20,705├28,435 24,57 2 0,10 10
Σ 20 1,00 100
Figura 3 - Histograma e Polígono de Frequencia para a variável Produção (g/planta).

Marca Frequencia
Corsa 4 Gráfico de "Pizza"
Gol 8 4
Ka 1 9 16% Corsa
Pálio 3 36% Gol
Uno 9 Ka
Σ 25 8 Pálio
3 32% Uno
1
12% 4%
Figura 4 – Gráfico de pizza para a variável marca de
carros populares predominantes em 25 cidade
do triângulo.
Gráfico de Barras
8
Marca Frequencia 7
Corsa 4 6
Gol 8
Frequencia
5
Ka 1
4
Pálio 3
3
Uno 9
2
Σ 25
1
0
Corsa Gol Ka Pálio Uno
Marcas ou modelos predominantes
Figura 5 – Gráfico de barras para a variável marca de

do triângulo.
Gráfico de Barras
Marca Frequencia
Corsa 4
Gol 8
4
Ka 1
3
Pálio 3
Uno 9
1
Σ 25
Corsa Gol Ka Pálio Uno

Marcas de carros
Figura 6 – Gráfico de barras para a variável marca de

do triângulo.
0,15 ├ 0,35 5 0,25
0,35 ├ 0,55 10 0,45
0,55 ├ 0,75 8 0,65
0,75 ├ 0,95 17 0,85
Σ 40 -
Histograma
16
14
12
Frequencias
10
8
6
4
2
0
0,25 0,45 0,65 0,85
Coeficiente de atrito cinético
Figura 7 – Histograma para a variável coeficiente de atrito cinético de uma amostra

de 40 pneus.
0,15 ├ 0,35 5 0,25
0,35 ├ 0,55 10 0,45
0,55 ├ 0,75 8 0,65
0,75 ├ 0,95 17 0,85
Σ 40 -
Histograma
17
10
8
0,25 0,45 0,65 0,85

Coeficiente de atrito cinético
Figura 8 – Histograma para a variável coeficiente de atrito cinético de uma amostra
de 40 pneus.

Aula Estatistica Descritiva

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Aula Estatistica Descritiva

Enviado por

Direitos autorais:

Formatos disponíveis

Estatística Descritiva

Prof. Janser Moura Pereira

• A natureza ou forma da distribuição dos dados, como forma

• Um valor representativo, como uma média;

• Uma medida de dispersão ou variação.

• quantitativa discreta: contagem

• quantitativa contínua: mensuração

Tabela 4 – Dist. de freq. das marcas de carros populares em 25 cidades do triângulo.

Elementos de uma distribuição de freqüência

i. Organizar (ordenar): dados brutos → dados elaborados

ii. Cálculo da amplitude total (A): A = X ( n ) − X (1)

iii. Cálculo do número de classes: Adotar um critério

iv. Cálculo de amplitude de classe (C): C = A ( k − 1)

iii) Critério de Sturges: k = 1 + 3, 3.log(n)

Tabela 8 – Dist. de freq. da produção de grãos em g/planta obtidos numa

1- Na Tabela 9, temos as anotações das estaturas de 40 alunos do sexo

Tabela 9 - Estaturas de alunos universitários do sexo masculino (m), em

Construa uma tabela com a distribuição de frequencia absoluta, relativa e

Tabela 10 - Dados brutos referentes à dureza de 30 peças de alumínio.

Construa uma tabela com a distribuição de frequencia absoluta, relativa e

– Média amostral → X (X barra)

Exemplo: Sabendo-se que o número de peças defeituosas observados

Exemplo: Número de gols por partida (variável discreta).

Exemplo: Coeficiente de atrito cinético (variável contínua)

Classes de Coeficiente de Atrito Cinético fi Xi X i fi

Exemplo: Considere a seguinte amostra de dados: 9, 9, 8, 11, 12, 13, 13.

• Se a variável é contínua: o procedimento (estimador) muda.

Exemplo para variável contínua: Coeficiente de atrito cinético.

Classes de Coeficiente de Atrito Cinético fi Fi

Classes de Coeficiente de Atrito Cinético fi

Moda = Média = Mediana

Informação Incompleta das Medidas de Posição (“Deficiência”)

Situação: Escolher uma entre as três marcas de lâmpadas (A, B e C),

A = maior valor - menor valor = X(n) – X(1) = X k − X 1

Exemplo 2: Amplitude do coeficiente de atrito cinético

Logo, o coeficiente de atrito cinético apresenta uma amplitude A = 0,85 – 0,25

Desvio Padrão Populacional

Desvio Padrão Amostral

Exemplo: Considere os dados referentes ao tempo de vida de uma marca de

S = 8.614.285, 714 = 2.935, 0103 km

Exemplo: Considere os dados referentes ao tempo de vida de uma marca de

S = 8.614.285, 714 = 2.935, 0103 km

Variância Amostral para variável discreta

Desvio Padrão Amostral para variável discreta

S 2 = 1, 8172 = 1, 3480 ovos danificados

Erro Padrão da Média

• Conjunto de dados com diferentes unidades de medidas;

Exemplo: Qual das lâmpadas possui maior uniformidade de tempo de vida?

X A = 4, 0 meses, S A = 0, 8 meses, X B = 8, 0 meses e S B = 1, 2 meses

A lâmpada B é a mais uniforme, pois possui um menor CV que a lâmpada A .

Gráfico para variáveis qualitativas:

Gráfico em barras horizontais ou verticais;

Gráfico em setores (“pizza”).

Gráfico para variáveis quantitativas:

Figura 1 - Gráfico em barras verticais para a variável grau de instrução.

Fundamental Médio Superior

Figura 2 - Gráfico em setores para a variável grau de instrução.

Figura 3 - Histograma e Polígono de Frequencia para a variável Produção (g/planta).

Pálio 3 36% Gol

Figura 5 – Gráfico de barras para a variável marca de

Corsa Gol Ka Pálio Uno

Figura 6 – Gráfico de barras para a variável marca de

Figura 7 – Histograma para a variável coeficiente de atrito cinético de uma amostra

0,25 0,45 0,65 0,85