Você está na página 1de 22

A Estatística é a ciência

que trata:
• da recolha
INTRODUÇ
INTRODUÇÃO À • tratamento
ESTATÍ
ESTATÍSTICA
• síntese
DESCRITIVA
• apresentação

… da informação

Rui Carvalho Oliveira


roliv@ist.utl.pt
Introdução à Estatística Descritiva Rui Carvalho Oliveira

A Estatística é a menos exacta das Ciências Exactas! A incerteza (como nível de conhecimento) não é atributo da
situação decisional mas sim do estado de conhecimento
Incertezas... Incertezas... (do decisor) acerca dessa situação
Só incertezas!
 A Estatística é uma Ciência Exacta Descrever a Medir os efeitos Decidir (com
níveis de
situação da incerteza risco assumidos)
 Instrumento de
 modelação da incerteza Grandes Pequenas Pequenos
alterações alterações efeitos
 apoio à decisão
Reduzir a Grandes
incerteza efeitos

 Redução da incerteza
- Reprocessamento da informação disponível
- Aquisição de nova informação

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

1
1) "A pluviosidade diária média durante os três últimos meses foi de
A Estatística é uma ciência para ignorantes ! 13 mm."
2) "Atendendo à pluviosidade registada durante os três últimos meses,
este vai ser um ano de seca."

 Representação da variabilidade 1) Afirmação descritiva, sumarizando a informação disponível


de resultados quando não é 2) Afirmação que transcende o observado, partindo deste para
conhecida “explicação” dessa inferir sobre o futuro
variabilidade
Amostra População

 Utilizada em todos os domínios  Estatística Descritiva  Inferência Estatística


para os quais o conhecimento dos  Sumarizar  Generalizar (inferir sobre a
fenómenos não é suficiente para  Descrever a amostra população a partir da
produzir modelos explicativos informação da amostra)
 Quantificar e controlar erros
 Regular a recolha de
informação adicional
Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva Estatística Descritiva

 Estatística Descritiva: recolha, organização, apresentação, análise e


interpretação de conjuntos de dados  Descrição de resultados das observações:

(observações que constituem uma amostra


Variáveis
extraída de uma fonte, que se designa por população)

 Tratamento e descrição de dados: representações sintéticas visando


i) simplificar e tornar mais atraente a apresentação Categorias Quantidades
ii) facilitar a leitura e interpretação

Nominal Ordinal Discretas Contínuas


 Transformar dados em informação (contagem) (Medição)

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

2
Estatística Descritiva
Estatística Descritiva
Apresentação de dados: representações gráficas
 Tratamento e apresentação de resultados das observações:
 Gráficos de barras:
 É habitual sintetizar e apresentar os dados recolhidos através de
Tabelas (de frequência) e Gráficos
Taxa de Saída Precoce - Ensino Secundário
50,0%
44,0%
Exemplo: dados sobre estado civil (amostra de 150 indivíduos) 40,0%
38,7%
36,1% 35,7%
32,6% 33,2%
29,4%
Gráfico de barras 30,0%
24,8% 26,3%
23,8%
60%
52% 20,0%
50%

40% 10,0%
33%

30%
0,0%
20%
Portugal Grande Porto Coimbra Sintra Lisboa Loures Odivelas Amadora Oeiras
11%
10% Lisboa
3%

0%
Solteiro Casado Viúvo Divorciado

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva Estatística Descritiva


Apresentação de dados: representações gráficas
Apresentação de dados: representações gráficas

 Gráficos de barras (acumulado):  Gráficos de sectores circulares

Repartição modal do tráfego de mercadorias – 1998


(ton.km em %) 13%
100%
21%
80% Pré-escolar
22%
60% 1º Ciclo E.B.

40% 2º Ciclo E.B.


3º Ciclo E.B.
20% 14%
Secundário
0%
PECO
Rep. Checa

UE 15
Eslovénia

Polónia

Estónia
Letónia
Roménia
Eslováquia

Hungria

Portugal
Lituânia

Bulgária

30%

Repartição de alunos por nível e ciclo de ensino


Rodoviário Ferroviário Fluvial Pipeline

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

3
Estatística Descritiva Estatística Descritiva
Apresentação de dados: representações gráficas
 Uso (e abuso) de gráficos (pictogramas)
 Gráficos de “bolhas”
1,20
m2 de Plataforma
Logística por

1,00
Habitante Hungria:
10,23 km2
• Kennedy: 94 c
• Johnson: 83 c
• Nixon: 64 c
0,80
Eslovénia: • Carter: 44 c
Estónia: 0,88 km
2
1,24 km2

0,60 Convenção: poder de compra


Lituânia:
1,72 km2
proporcional ao “comprimento” da nota
0,40
Polónia: 1,27 km2
Letónia: 0,40 km2
representada
Eslováquia: 0,11 km2
Rep.Checa: 1,68 km2
0,20

Portugal: 1,29 km
2 m2 de Plataforma Logística por 2 de Superfície Nacional
0,00 km
0,0 20,0 40,0 60,0 80,0 100,0 120,0

Nota: dimensão da “bolhas” proporcional à área total de Plataformas Logísticas (em Portugal e
países do Alargamento -PECO)

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva - Distribuições de frequência Estatística Descritiva - Distribuições de frequência


Observações (nº de acidentes ao longo de 16 semanas):
 Amostra: conjunto de observações (valores numéricos) de uma grandeza
Semana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Exemplo: observações do nº de acidentes ao longo de 16 semanas: Nº de acidentes 16 15 19 16 17 18 15 16 17 16 17 15 16 17 16 18

Semana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Nº de Frequência simples


acidentes Absoluta Relativa
Nº de acidentes 16 15 19 16 17 18 15 16 17 16 17 15 16 17 16 18
15 3 0,19
16 6 0,38
 Variabilidade (aleatória, logo inexplicável e imprevisível) é inerente a
muitos fenómenos 17 4 0,25
18 2 0,13
19 1 0,06
 Distribuição de frequências: caracterização e descrição
sintética do comportamento de uma variável aleatória tirando partido  Frequência simples (para um dado valor x da grandeza em estudo):
de observações (numéricas) dessa grandeza (amostra)
• Absoluta (f’): número de vezes que o valor x foi observado

• Relativa (f): quociente entre o número de vezes que o valor x foi


observado e o número total de observações
Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

4
Estatística Descritiva - Distribuições de frequência Estatística Descritiva - Distribuições de frequência
Observações (nº de acidentes ao longo de 16 semanas): Observações (nº de acidentes ao longo de 16 semanas):

Semana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Semana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Nº de acidentes 16 15 19 16 17 18 15 16 17 16 17 15 16 17 16 18 Nº de acidentes 16 15 19 16 17 18 15 16 17 16 17 15 16 17 16 18

Nº de Frequência simples Frequência acumulada


Frequência simples acidentes Absoluta Relativa Absoluta Relativa
Nº de
acidentes Absoluta Relativa 15 3 0,19 3 0,19
Histograma de Frequências Simples
15 3 0,19 16 6 0,38 9 0,56

16 6 0,38 0,40 17 4 0,25 13 0,81

17 4 0,25 18 2 0,13 15 0,94


0,30 19 1 0,06 16 1,00
18 2 0,13
19 1 0,06 0,20
Frequência acumulada (para um dado valor x da grandeza em estudo):
0,10 • Absoluta (F’): número de vezes que o se observou um valor
. menor ou igual a x
0,00
15 16 17 18 19 • Relativa (F): quociente entre a frequência acumulada absoluta
e o número total de observações
Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva - Distribuições de frequência Estatística Descritiva - Distribuições de frequência


Observações (nº de acidentes ao longo de 16 semanas) Amostra: medições do tempo de realização de uma tarefa (100 observações)
Nº de Frequência simples Frequência acumulada 386 370 371 374 377 435 383 383 422 418
acidentes Absoluta Relativa Absoluta Relativa 363 388 390 391 392 412 395 395 408 408
396 397 397 397 398 404 403 402 401 400
15 3 0,19 3 0,19 404 405 405 406 407 396 411 409 394 394
16 6 0,38 9 0,56 412 414 415 416 416 385 428 424 382 381
413 414 406 416 407 384 426 423 381 380
17 4 0,25 13 0,81 404 405 415 398 416 396 410 409 394 393
396 397 397 407 399 403 402 402 400 399
18 2 0,13 15 0,94
387 389 390 391 393 411 395 395 408 407
19 1 0,06 16 1,00 369 371 373 376 379 429 383 382 420 417

Histograma de Frequências Acumuladas Observações ordenadas


363 369 370 371 371 373 374 376 377 379
1,00
380 381 381 382 382 383 383 383 384 385
0,80 386 387 388 389 390 390 391 391 392 393
393 394 394 394 395 395 395 395 396 396
0,60
396 396 397 397 397 397 397 398 398 399
0,40 399 400 400 401 402 402 402 403 403 404
404 404 405 405 405 406 406 407 407 407
0,20
407 408 408 408 409 409 410 411 411 412
0,00 412 413 414 414 415 415 416 416 416 416
14 15 16 17 18 19 20 21 417 418 420 422 423 424 426 428 429 435

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

5
Limites das classes Freq.ia simples Freq.ia acumulada
Estatística Descritiva - Distribuições de frequência Estatística Descritiva
Inferior Superior Absoluta Relativa Absoluta Relativa
Observações ordenadas Distribuições de 360 370 2 0,02 2 0,02
363 369 370 371 371 373 374 376 377 379 frequência 370 380 8 0,08 10 0,10
380 381 381 382 382 383 383 383 384 385
380 390 14 0,14 24 0,24
386 387 388 389 390 390 391 391 392 393
393 394 394 394 395 395 395 395 396 396 390 400 27 0,27 51 0,51
396 396 397 397 397 397 397 398 398 399 400 410 25 0,25 76 0,76
399 400 400 401 402 402 402 403 403 404 410 420 16 0,16 92 0,92
404 404 405 405 405 406 406 407 407 407
407 408 408 408 409 409 410 411 411 412 420 430 7 0,07 99 0,99
412 413 414 414 415 415 416 416 416 416 430 440 1 0,01 100 1,00
417 418 420 422 423 424 426 428 429 435

Limites das classes Freq.ia simples Freq.ia acumulada Histograma de Frequências Acumuladas Histograma de Frequências Simples

Tratamento de dados: Inferior Superior Absoluta Relativa Absoluta Relativa


1,00 0.30
360 369.9 2 0,02 2 0,02
8 classes de amplitude 10 0,80
0.25
370 379.9 8 0,08 10 0,10
(abertas à direita) 0.20
380 389.9 14 0,14 24 0,24 0,60
0.15
Muitas vezes (nomeadamente 390 399.9 27 0,27 51 0,51 0,40
0.10
quando a grandeza é contínua) as 400 409.9 25 0,25 76 0,76 0,20
frequências são apuradas não para 0.05
410 419.9 16 0,16 92 0,92
valores singulares da grandeza mas 0,00 0.00
sim para intervalos de variação 420 429.9 7 0,07 99 0,99 355 365 375 385 395 405 415 425 435 445 355 365 375 385 395 405 415 425 435 445
(classes) 430 439.9 1 0,01 100 1,00
Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva - Histogramas Estatística Descritiva - Histogramas

Amplitude: 1 nº classes: 71 Amplitude: 3 nº classes: 25


Amplitude: 5 nº classes: 15 Amplitude: 10 nº classes: 8
Média: 398,74 desvio padrão: 14,77 Média: 398,73 desvio padrão: 14,79
Média: 398,70 desvio padrão: 14,88 Média: 399,6 desvio padrão: 14,52

Amplitude: 5 nº classes: 15 Amplitude: 10 nº classes: 8 Amplitude: 15 nº classes: 5 Amplitude: 25 nº classes: 3


Média: 398,70 desvio padrão: 14,88 Média: 399,6 desvio padrão: 14,52 Média: 399,00 desvio padrão: 15,44 Média: 398,75 desvio padrão: 16,01

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

6
Limites das classes Freq.ia simples Freq.ia acumulada
Estatística Estatística
1.00 Inferior Superior Absoluta Relativa Absoluta Relativa
Descritiva 360 370 2 0,02 2 0,02
Descritiva
0.90

370 380 8 0,08 10 0,10


0.80
75 % 380 390 14 0,14 24 0,24
0.70 Quartil de 50% está
390 400 27 0,27 51 0,51 entre 390 e 400
0.60
400 410 25 0,25 76 0,76
50 % 0.50 410 420 16 0,16 92 0,92
0.40 420 430 7 0,07 99 0,99

0.30
430 440 1 0,01 100 1,00
25 % 0,6
0.20

 Quartis 0.10 0,5

valores da variável que 0.00 0,4


dividem a distribuição 360 370 380 390 400 410 420 430 440 450
0,5 – 0,24 0,51- 0,24
Interpolação linear:
de frequências em 4 0,3
partes iguais Quartil de 25% : Quartil de 75% : q 50% = 390 + 10 x 0,5 - 0,24 0,2
q25%= 390.4 q75%= 409.6 0,51 - 0,24
Mediana =
0,1
Quartil de 50% :
385 390 395 400 405
q50% = 399.6 Quartil de 50% : q50% = 399.6
Introdução à Estatística Descritiva Rui Carvalho Oliveira 10

Estatística Descritiva – Medidas de tendência não central Estatística Descritiva – Medidas de tendência não central
Frequências Frequências Frequências Frequências
Tamanho absolutas absolutas Tamanho absolutas relativas
dos sapatos dos sapatos
 Quartis: valores da variável que Simples Acum. Simples Acum. Simples Acum. Simples Acum.
dividem a distribuição de frequências 35 30 30 0,7% 0,7% 35 30 30 0,7% 0,7%
em 4 partes iguais 35 1/2 40 70 0,9% 1,5% • Decis: valores da variável que 35 1/2 40 70 0,9% 1,5%
36 50 120 1,1% 2,6% dividem a distribuição de 36 50 120 1,1% 2,6%
36 1/2 150 270 3,3% 5,9% frequências em 10 partes iguais 36 1/2 150 270 3,3% 5,9%
 Q1 (quartil de 25%) – valor da variável
para o qual a frequência acumulada 37 300 570 6,5% 12,4% 37 300 570 6,5% 12,4%
atinge 25% 37 1/2 600 1170 13,0% 25,4% 37 1/2 600 1170 13,0% 25,4%
Q1 = 37 ½
38 950 2120 20,6% 46,0% 38 950 2120 20,6% 46,0%
• Percentil (ou quantil) de α %:
 Q2 (quartil de 50%) – idem, para 50% 38 1/2 820 2940 17,8% 63,8% valor da variável para o qual a 38 1/2 820 2940 17,8% 63,8%
Q2 = 38 ½ 39 750 3690 16,3% 80,1% frequência acumulada atinge α% 39 750 3690 16,3% 80,1%
39 1/2 440 4130 9,5% 89,6% 39 1/2 440 4130 9,5% 89,6%
 Q3 (quartil de 75%) – idem, para 75% 40 250 4380 5,4% 95,0% 40 250 4380 5,4% 95,0%
Q3 = 39
40 1/2 150 4530 3,3% 98,3% 40 1/2 150 4530 3,3% 98,3%
41 40 4570 0,9% 99,2% 41 40 4570 0,9% 99,2%
41 1/2 39 4609 0,8% 100,0% 41 1/2 39 4609 0,8% 100,0%

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

7
Estatística Descritiva - Diagramas de “caixa e bigodes” Exemplo: selecção de fornecedor de baterias
Dados: distribuição da duração (vida útil, em horas) das baterias
Vida útil (hoas) Frequências relativas Vida útil (horas) Frequências relativas

de [ a[ Simples Acum. de [ a[ Simples Acum.

100 120 1,6% 1,6% 100 110 0,2% 0,2%


305.1 120 140 7,8% 9,4% 110 120 0,6% 0,8%

140 160 15,8% 25,2% 120 130 0,6% 1,4%

160 180 19,6% 44,8% 130 140 1,6% 3,0%

180 200 16,4% 61,2% 140 150 2,2% 5,2%

200 220 9,8% 71,0% 150 160 4,2% 9,4%


Fornecedor 220 240 8,6% 79,6% 160 170 8,0% 17,4% Fornecedor
301.3 A 240 260 5,8% 85,4% 170 180 11,2% 28,6% B
260 280 4,2% 89,6% 180 190 10,6% 39,2%

280 300 2,8% 92,4% 190 200 12,2% 51,4%


Média=201h 200 210 12,4% 63,8% Média= 199h
300 320 2,6% 95,0%
D. padrão= 60h D. padrão=30h
299.8 320 340 1,4% 96,4% 210 220 11,6% 75,4%

340 360 1,2% 97,6% 220 230 10,0% 85,4%


298.9 360 380 0,8% 98,4% 230 240 5,2% 90,6%

380 400 0,6% 99,0% 240 250 5,2% 95,8%

400 420 0,4% 99,4% 250 260 2,6% 98,4%


297.5 260 270 1,2% 99,6%
420 440 0,4% 99,8%
440 460 0,2% 100,0% 270 280 0,2% 99,8%
280 290 0,2% 100,0%
Introdução à Estatística Descritiva Rui Carvalho Oliveira

Exemplo: selecção de fornecedor de baterias Exemplo: selecção de fornecedor de baterias


a) Política de manutenção: substituição da bateria cada 200 horas. Risco de falha? b) Risco de falha: max. de 10%. Intervalo de tempo entre substituições?
Vida útil (hoas) Frequências relativas Vida útil (horas) Frequências relativas Vida útil (hoas) Frequências relativas Vida útil (horas) Frequências relativas

de [ a[ Simples Acum. de [ a[ Simples Acum. de [ a[ Simples Acum. de [ a[ Simples Acum.

100 120 1,6% 1,6% 100 110 0,2% 0,2% 100 120 1,6% 1,6% 100 110 0,2% 0,2%

120 140 7,8% 9,4% 110 120 0,6% 0,8% 120 140 7,8% 9,4% 110 120 0,6% 0,8%

140 160 15,8% 25,2% 120 130 0,6% 1,4% 140 160 15,8% 25,2% 120 130 0,6% 1,4%

160 180 19,6% 44,8% 130 140 1,6% 3,0% 160 180 19,6% 44,8% 130 140 1,6% 3,0%

180 200 16,4% 61,2% 140 150 2,2% 5,2% 180 200 16,4% 61,2% 140 150 2,2% 5,2%

200 220 9,8% 71,0% 150 160 4,2% 9,4% 200 220 9,8% 71,0% 150 160 4,2% 9,4%
Fornecedor 220 240 8,6% 79,6% 160 170 8,0% 17,4% Fornecedor Fornecedor 220 240 8,6% 79,6% 160 170 8,0% 17,4% Fornecedor
A 240 260 5,8% 85,4% 170 180 11,2% 28,6% B A 240 260 5,8% 85,4% 170 180 11,2% 28,6% B
260 280 4,2% 89,6% 180 190 10,6% 39,2% 260 280 4,2% 89,6% 180 190 10,6% 39,2%

280 300 2,8% 92,4% 190 200 12,2% 51,4% 280 300 2,8% 92,4% 190 200 12,2% 51,4%
Risco de falha = Risco de falha = Intervalo = Intervalo =
300 320 2,6% 95,0% 200 210 12,4% 63,8% 300 320 2,6% 95,0% 200 210 12,4% 63,8%
61.2 % 210 220 11,6% 75,4%
51.4% 140 horas 210 220 11,6% 75,4%
160 horas
320 340 1,4% 96,4% 320 340 1,4% 96,4%
340 360 1,2% 97,6% 220 230 10,0% 85,4% 340 360 1,2% 97,6% 220 230 10,0% 85,4%

360 380 0,8% 98,4% 230 240 5,2% 90,6% 360 380 0,8% 98,4% 230 240 5,2% 90,6%

380 400 0,6% 99,0% 240 250 5,2% 95,8% 380 400 0,6% 99,0% 240 250 5,2% 95,8%

400 420 0,4% 99,4% 250 260 2,6% 98,4% 400 420 0,4% 99,4% 250 260 2,6% 98,4%

420 440 0,4% 99,8% 260 270 1,2% 99,6% 420 440 0,4% 99,8% 260 270 1,2% 99,6%

440 460 0,2% 100,0% 270 280 0,2% 99,8% 440 460 0,2% 100,0% 270 280 0,2% 99,8%
280 290 0,2% 100,0% 280 290 0,2% 100,0%

8
Exemplo: selecção de fornecedor de baterias
c) Baterias “Muito Boas”: duram pelo menos 260 horas. Síntese de Informação
Vida útil (hoas) Frequências relativas Vida útil (horas) Frequências relativas

de [ a[ Simples Acum. de [ a[ Simples Acum.

100 120 1,6% 1,6% 100 110 0,2% 0,2%


110 120 0,6% 0,8%
120 140 7,8% 9,4%
120 130 0,6% 1,4%
Parâmetros: números singulares que evidenciam determinadas
140 160 15,8% 25,2%
130 140 1,6% 3,0%
propriedades das distribuições de frequência
160 180 19,6% 44,8%
180 200 16,4% 61,2% 140 150 2,2% 5,2%

200 220 9,8% 71,0% 150 160 4,2% 9,4%


Fornecedor 220 240 8,6% 79,6% 160 170 8,0% 17,4% Fornecedor i. Medidas de tendência central (localização do “centro da
A 240 260 5,8% 85,4% 170 180 11,2% 28,6% B distribuição”);
260 280 4,2% 89,6% 180 190 10,6% 39,2%

280 300 2,8% 92,4% 190 200 12,2% 51,4% ii. Medidas de dispersão (grau de variação dos valores em torno
% de baterias % de baterias do ponto central);
300 320 2,6% 95,0% 200 210 12,4% 63,8%
“muito boas” = “muito boas” =
320 340 1,4% 96,4% 210 220 11,6% 75,4%
1-0.854 1-0.984 iii. Medidas de assimetria (grau de simetria em relação ao ponto
340 360 1,2% 97,6% 220 230 10,0% 85,4%
14.6% 1.6% central).
360 380 0,8% 98,4% 230 240 5,2% 90,6%

380 400 0,6% 99,0% 240 250 5,2% 95,8%

400 420 0,4% 99,4% 250 260 2,6% 98,4%

420 440 0,4% 99,8% 260 270 1,2% 99,6%

440 460 0,2% 100,0% 270 280 0,2% 99,8%


280 290 0,2% 100,0%
Introdução à Estatística Descritiva Rui Carvalho Oliveira

Medidas de tendência central - Média Medidas de tendência central - Média


Semana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Semana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Nº de acidentes 16 15 19 16 17 18 15 16 17 16 17 15 16 17 16 18 Nº de acidentes 16 15 19 16 17 18 15 16 17 16 17 15 16 17 16 18

Frequência simples Frequência acumulada


Nº de acidentes
Absoluta Relativa Absoluta Relativa
Média = X = (16 + 15 + 19 + 16 + 17 + 18 + 15 + 16 + 17 + 16 + 17 + 15 + 16 + 17 + 16 + 18) / 16 = 16.5
15 3 0,1875 3 0,19
16 6 0,375 9 0,56
17 4 0,25 13 0,81
(usando dados originais, sem tratamento)
18 2 0,125 15 0,94
n n – número de observações
1

19 1 0,0625 16 1,00
X= Xi Xi – valor da i-ésima observação
Média = X = (16 + 15 + 19 + 16 + 17 + 18 + 15 + 16 + 17 + 16 + 17 + 15 + 16 + 17 + 16 + 18) / 16 = 16.5 n i=1 (nº de acidentes na semana i, neste exemplo)
(usando dados originais, sem tratamento)

X = (3 x 15 + 6 x 16 + 4 x 17 + 2 x 18 + 1 x 19) / 16
(usando frequências absolutas, após tratamento estatístico dos dados)

X = (0.1875 x 15 + 0.375 x 16 + 0.25 x 17 + 0.125 x 18 + 0.0625 x 19)


(usando frequências relativas, após tratamento estatístico dos dados)

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

9
Medidas de tendência central - Média Medidas de tendência central - Média

Semana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Cálculo da média para dados tratados (usando frequências relativas de ocorrência)
Nº de acidentes 16 15 19 16 17 18 15 16 17 16 17 15 16 17 16 18
c c – número de classes
Nº de acidentes
Frequência simples
Absoluta Relativa
Frequência acumulada
Absoluta Relativa
X= ∑f
k =1
k ⋅ Xk fk – frequência relativa da k-ésima classe
Xk – valor (médio) da k-ésima classe
15 3 0,1875 3 0,19
16 6 0,375 9 0,56 Limites das classes Marca da Freq.ia simples Freq.ia acumulada
17 4 0,25 13 0,81 Inferior Superior classe Absoluta Relativa Absoluta Relativa
18 2 0,125 15 0,94 360 370 365 2 0,02 2 0,02
370 380 375 8 0,08 10 0,1
19 1 0,0625 16 1,00
380 390 385 14 0,14 24 0,24
X = (0.1875 x 15 + 0.375 x 16 + 0.25 x 17 + 0.125 x 18 + 0.0625 x 19) 390 400 395 27 0,27 51 0,51
400 410 405 25 0,25 76 0,76
410 420 415 16 0,16 92 0,92
(usando frequências relativas, após tratamento estatístico dos dados)
420 430 425 7 0,07 99 0,99
c – número de classes 430 440 435 1 0,01 100 1
c
X = ∑ f k ⋅ Xk fk – frequência relativa da k-ésima classe Média = 0.02 x 365 + 0.08 x 375 + 0.14 x 385 + 0.27 x 395 + 0.25 x 405 +
k =1 Xk – valor (médio) da k-ésima classe + 0.16 x 415 + 0.07 x 425 + 0.01 x 435 = 399.6
Nota: quando classes contêm mais do que um valor da grandeza, esta expressão produz uma aproximação (Nota: Média = 399.17 para dados originais, não tratados)
Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva – Medidas de centralidade Medidas de tendência central - Mediana

A média corresponde ao Distribuição de salários numa organização com 25 colaboradores:


“centro de gravidade” da
Nº de Frequência Frequência
distribuição de frequências Salário
colaboradores relativa (%) acumulada
600 12 48% 48%
800 1 4% 52%  Média: X = 2400
1.200 5 20% 72%
2.000 3 12% 84%
5.000 2 8% 92%
10.000 1 4% 96%
20.000 1 4% 100%

 Mediana (Med): valor da grandeza tal que há um número igual de


observações abaixo e acima desse valor mediano (divide a distribuição
de frequência em duas partes iguais)

Med = 800

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

10
Medidas de tendência central - Mediana Medidas de tendência central - Moda
Notas: Nº de Frequência Frequência
Salário
1) Quando o nº de observações é par, há dois valores medianos, convencionando-se que a colaboradores relativa (%) acumulada
mediana é a média aritmética desses dois valores 600 12 48% 48%
800 1 4% 52%
Dados : 5 ; 8 ; 14 ; 21 Med = (8+14)/2 = 11 1.200 5 20% 72%
2.000 3 12% 84%
2) Para dados agrupados em classes, pode falar-se de “classe mediana” que corresponde
à primeira classe para a qual a frequência acumulada é igual ou superior a 50% 5.000 2 8% 92%
10.000 1 4% 96%
Limites das classes Freq.ia simples Freq.ia acumulada 20.000 1 4% 100%
Inferior Superior Absoluta Relativa Absoluta Relativa
360 370 2 0,02 2 0,02
370 380 8 0,08 10 0,10 Moda (Mod): corresponde ao valor da grandeza com maior frequência de
380 390 14 0,14 24 0,24
ocorrência
390 400 27 0,27 51 0,51 Classe mediana Mod = 600
400 410 25 0,25 76 0,76
410 420 16 0,16 92 0,92
Nota: para dados tratados (agrupados em classes), pode falar-se de “classe modal”
420 430 7 0,07 99 0,99
430 440 1 0,01 100 1,00

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

Medidas de tendência central Medidas de tendência central


 Propriedades da Média (X)
 Propriedades da moda (Mod):
∑ (X i − X) = 0
n
→ Soma dos desvios (em relação à média) é nula
i =1 (desvios positivos “compensam” desvios negativos) • É aplicável a todos os tipos de dados (qualitativos ou quantitativos), mesmo
quando estes são puramente nominais.
( X 1 − X ) + ( X 2 − X ) + ... + ( X n − X ) = 0
• Quando os dados são quantitativos e estão classificados em classes (ou são
X corresponde ao “centro da gravidade” dos valores observados qualitativos), usa-se o termo classe (ou categoria) modal.
Requer dados quantitativos
• Pode haver mais de uma moda ou classe (ou categoria) modal
 Propriedades da Mediana :

 Mediana corresponde a um “centro posicional”, quando as observações


são ordenadas do menor para o maior valor, não interessando o valor
numérico de cada observação mas apenas a sua posição nessa
ordenação.

 É, portanto, aplicável a dados qualitativos (sem métrica), desde que


expressos numa escala ordinal.
Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

11
Comparação das medidas de tendência central Comparação das medidas de tendência central
Média requer dados quantitativos, enquanto a mediana pode ser aplicada a
dados qualitativos ordinais e a moda é até aplicável a simples categorias Nº de Frequência Frequência Nº de Freq. Freq.
Salário Salário
colaboradores relativa (%) acumulada colabor. Relat. (%) Acumul.
600 12 48% 48% 600 12 48% 48%
Média é sensível aos valores numéricos das observações, sendo afectada por
alterações dos casos extremos, o que não sucede com a mediana: 800 1 4% 52% 800 1 4% 52%
1.200 5 20% 72% 1.200 5 20% 72%

X = 73 X = 248 2.000 3 12% 84% 2.000 3 12% 84%


57 ; 69 ; 72 ; 81 ; 86 → 57 ; 69 ; 72 ; 81 ; 961 →
Med = 72 Med = 72 5.000 2 8% 92% 3.000 2 8% 92%
10.000 1 4% 96% 4.000 1 4% 96%

No caso de distribuições muito assimétricas, a média é “puxada” para o lado em 20.000 1 4% 100% 5.000 1 4% 100%
que a “cauda” da distribuição é mais estendida (com valores extremos mais Média = 1400 Mediana=800 Moda=600
Média = 2400 Mediana=800 Moda=600
afastados dos “casos típicos” ou mais frequentes), podendo dar indicações
enganadoras quanto à localização do “centro” da distribuição.
 Média é sensível aos valores (numéricos) das observações, particularmente
a “casos extremos”
 Média usa toda a informação disponível (nomeadamente, de carácter numérico),
enquanto que à mediana apenas importa a posição relativa das observações.  O mesmo não sucede com a mediana (desde que o “valor central” na
ordenação das observações não sofra alteração)
 Mediana é mais sensível aos resultados amostrais, apresentando maiores
variações de amostra para amostra

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

Estatística Descritiva – Medidas de dispersão Estatística Descritiva – Medidas de dispersão

Domínio (diferença entre o máximo e o mínimo das observações) 1 n


∑ ( Χi − Χ)
2
Crítica: demasiado sensível a valores extremos VARIÂNCIA: desvio quadrático médio S2 =
(e eventualmente “atípicos”)
n i=1

Nº de ordem -> 1º 2º 3º ……. 495º 496º 497º 498º 499º 500º


a) Observações → 6 24 37 49 64
Observações -> 18 41 63 ……. 335 338 352 380 385 421
Desvio → -30 -12 +1 +13 +28
Desvio quadrático → 900 144 1 169 784
 Diferença inter-quartílica : diferença entre os quartis de 75% (q75%)
e de 25% (q25%) Média: Χ = (6+24+37+49+64) / 5 = 36
Corresponde a ignorar os valores mais altos (25%) e mais baixos (25%) 900 + 144 + 1 +169 + 784
Variância: S2 = = 399.6
5
q75% = 274
Desvio padrão: S = 399.6 = 20
q25% = 142
Desvio padrão 20
Coeficiente de variação: = = 0.556
Média 36
Introdução à Estatística Descritiva Rui Carvalho Oliveira

12
Estatística Descritiva – Medidas de dispersão Desvio Padrão …aproximadamente 95% das
observações estão no
 Para uma distribuição intervalo [X − 2S , X + 2S ]
b) Observação → 111 114 117 118 120
normal…
Desvio → -5 -2 +1 +2 +4 95%
Desvio quadrático → 25 4 1 4 16
…aproximadamente 68% das
observações estão no
Média: Χ = (111+114+117+118+120) / 5 = 116
[
intervalo X − S , X + S ]
25+4 +1+4 +16
Variância: S2 = = 10
5 68% …aproximadamente 99% das observações
[ [
X − 3S , X + 3S
estão no intervalo X − 3S , X + 3S
] ]
Desvio padrão: S = 10 = 3.16 99%

Desvio padrão 3.16


Coeficiente de variação: = = 0.027
Média 116

X
Introdução à Estatística Descritiva Rui Carvalho Oliveira 6S

Estatística Descritiva – medidas de dispersão Medidas de dispersão - Variância


Semana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Número de trabalhadores Nº de acidentes 16 15 19 16 17 18 15 16 17 16 17 15 16 17 16 18
Salário
mensal Empresa A Empresa B Empresa C
Média = X = 16.5
50 13 7
80 70 49 32 (usando dados originais, sem tratamento)
120 30 68 92
n – número de observações
160 20 20 12 1 n
∑ ( Χ i − Χ)
2
200 10 13 4 S2 = Xi – valor da i-ésima observação
n i=1 (nº de acidentes na semana i, neste exemplo)
350 5 2
500 2 1
Média 119 119 119
Variância
Desvio padrão
5498
74
1290
36
2536
50 [
S 2 = (16 − 16.5) + (15 − 16.5) + (19 − 16.5) + ... + (18 − 16.5)
2 2 2 2
] / 16
Coeficiente de variação 0.62 0.3 0.42

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

13
Medidas de dispersão - Variância Medidas de dispersão - Variância
Semana 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Nº de acidentes 16 15 19 16 17 18 15 16 17 16 17 15 16 17 16 18 • Variância (desvio quadrático médio): cálculo para dados agrupados

( )
c 2
Frequência simples Frequência acumulada S2 = ∑ f Χ 'i − Χ
Nº de acidentes i
Absoluta Relativa Absoluta Relativa
i=1
Média =
15 3 0,1875 3 0,19 marca da classe
16 6 0,375 9 0,56 X = 16.5 frequência relativa da classe
17 4 0,25 13 0,81
Limites das classes Marca da Freq.ia simples Freq.ia acumulada
18 2 0,125 15 0,94
Inferior Superior classe Absoluta Relativa Absoluta Relativa
19 1 0,0625 16 1,00 360 370 365 2 0,02 2 0,02
370 380 375 8 0,08 10 0,1
S2 = 0.1875 x (15-16.5)2 + 0.375 x (16-16.5)2 + 0.25 x (17-16.5)2 + 380 390 385 14 0,14 24 0,24
390 400 395 27 0,27 51 0,51 Média= 399.6
+ 0.125 x (18-16.5)2 + 0.0625 x (19-16.5)2 400 410 405 25 0,25 76 0,76
410 420 415 16 0,16 92 0,92
(usando frequências relativas, após tratamento estatístico dos dados) 420 430 425 7 0,07 99 0,99
430 440 435 1 0,01 100 1
c – número de classes
c 2 Variância: S2 = 0.02 (365-399.6)2 + 0.08 (375-399.6)2 + 0.14 (385-399.6)2 +
S2 = ∑ f  Χ ' − Χ  fi – frequência relativa da i-ésima classe
i=1 i  i  + ... + 0.07 (425-399.6)2 + 0.01 (435-399.6)2 = 210.84
Xi – valor (médio) da i-ésima classe
Desvio padrão: S = 14.52 (Nota: S= 14.82 para dados originais, não tratados)
Nota: quando classes contêm mais do que um valor da grandeza, esta expressão produz uma aproximação
Introdução à Estatística Descritiva Rui Carvalho Oliveira

Comparação de Medidas de Assimetria


Média 199,7 distribuições de
Desvio padrão 58,6 frequência  Coeficientes de assimetria de Pearson:

( )
Mínimo 101,0
X − Mod. 3 X - Med.
Máximo 300,0 Ap1 = Ap 2 =
s s
Ap < 0 – distribuição com
assimetria esquerda
(ou negativa)
Média 199,0
Ap = 0 – distribuição
Desvio padrão 56,9 simétrica
Mínimo 18,0 Ap > 0 - distribuição com
Máximo 385,0 assimetria direita
(ou positiva)

Média
Median  Coeficiente assimetria
Média 202,5
a 3
Desvio padrão 60,6 Moda
1 n
 Xi − X 
Mínimo 114,0 C1 = ∑  
Máximo 491,0
n i =1  s 

Introdução à Estatística Descritiva Rui Carvalho Oliveira

14
Estatística Descritiva - Distribuições de frequência e parâmetros de síntese Estatística Descritiva - Distribuições de frequência e parâmetros de síntese
Nº de Freq.ia Freq.ia 40% Nº de Freq.ia Freq.ia 40%
Salário Salário
colab. relativa acumulada 35% colab. relativa acumulada 35%

500 1 4% 4% 30% 500 1 4% 4% 30%

1.000 2 8% 12% 25% 1.000 2 8% 12% 25%

1.500 5 20% 32% 20% 1.500 5 20% 32% 20%

15% 15%
2.000 9 36% 68% 2.000 9 36% 68%
10% 10%
2.500 5 20% 88% 2.500 5 20% 88%
5% 5%
3.000 2 8% 96% 3.000 2 8% 96%
0% 0%
3.500 1 4% 100% 500 1.000 1.500 2.000 2.500 3.000 3.500 3.500 1 4% 100% 500 1.000 1.500 2.000 2.500 3.000 3.500

Média = Mediana = Moda = 2000 Desvio padrão = 663 Coef. assimetria = 0 Média = Mediana = Moda = 2000 Desvio padrão = 663 Coef. assimetria = 0
Nº de Freq.ia Freq.ia 35% Nº de Freq.ia Freq.ia 35%
Salário Salário
colab. relativa acumulada colab. relativa acumulada 30%
30%
500 8 32% 32% 500 1 4% 4%
25% 25%
1.000 6 24% 56% 1.000 1 4% 8%
20% 20%
1.500 4 16% 72% 1.500 2 8% 16%
15% 15%
2.000 3 12% 84% 2.000 3 12% 28% 10%
10%
2.500 2 8% 92% 2.500 4 16% 44% 5%
5%
3.000 1 4% 96% 3.000 6 24% 68% 0%
3.500 1 4% 100% 0%
3.500 8 32% 100% 500 1.000 1.500 2.000 2.500 3.000 3.500
500 1.000 1.500 2.000 2.500 3.000 3.500
Média=1340 Mediana=1000 Moda=500 Desvio padrão=845 Coef. assimetria= 0.91 Média=2660 Mediana=3000 Moda=3500 Desvio padrão=845 Coef. assimetria= - 0.91
Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação Distribuições de frequência – exemplo de aplicação


Dimensionamento de uma frota de veículos: distribuição do nº de pedidos diários Dimensionamento de uma frota de veículos
(requisições de veículos)
 Nº de veículos da frota própria = 4
Frequência
Nº de Frequência simples
acumulada Frequência com que a frota própria é insuficiente para satisfazer todos os
pedidos
Absoluta Relativa Absoluta Relativa Histograma de Frequências Simples pedidos (rotura)?
0 3 0,03 3 0,03 0,20
Freq (Rotura) = Freq (Nº de pedidos > 4) =
Nº de Frequência Frequência
1 6 0,07 9 0,10 0,15 pedidos simples acumulada = Freq (X > 4) =
2 12 0,13 21 0,23 0 0,033 0,033 = 1 - Freq (X ≤ 4) =
0,10
3 18 0,20 39 0,42 1 0,065 0,098
= 1 - 0.598 = 40%
4 16 0,17 55 0,60 0,05 2 0,130 0,228
3 0,196 0,424
5 14 0,15 69 0,75 0,00
4 0,174 0,598
0 1 2 3 4 5 6 7 8 9 10 11
6 9 0,10 78 0,85 5 0,152 0,750
7 5 0,05 83 0,90 6 0,098 0,848
8 4 0,04 87 0,95 7 0,054 0,902
Média = 4,2 pedidos/dia 8 0,043 0,946
9 3 0,03 90 0,98
9 0,033 0,978
10 1 0,01 91 0,99 10 0,011 0,989
Variância = 4,7
11 1 0,01 92 1,00 11 0,011 1,000

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

15
Distribuições de frequência – exemplo de aplicação Distribuições de frequência – exemplo de aplicação
Dimensionamento de uma frota de veículos Dimensionamento de uma frota de veículos
 Quantos veículos deveria ter a frota própria para que  Nº de veículos da frota própria = 4
esta possa satisfazer todos os pedidos em 95% dos dias?
Em média, quantos veículos são utilizados (por dia)?
N – nº de veículos da frota própria
Nº de Frequência Frequência Veículos
Nº de Frequência Frequência Freq (Nº de pedidos ≤ N) = 95% pedidos simples acumulada usados
pedidos simples acumulada 0 0,033 0,033 0 Y – nº de veículos utilizados
0 0,033 0,033 1 0,065 0,098 1
1 0,065 0,098 N=8 2 0,130 0,228 2 Média = 0x0.033 + 1x0.065 + 2x0.13 +
2 0,130 0,228 3 0,196 0,424 3
3 0,196 0,424 4 0,174 0,598 4 + 3x0.196 +4x(1-0.424)
Freq (X ≤ 8) = 0,946
4 0,174 0,598 5 0,152 0,750 4 = 3.2
5 0,152 0,750 6 0,098 0,848 4
6 0,098 0,848 7 0,054 0,902 4
7 0,054 0,902 8 0,043 0,946 4
8 0,043 0,946 9 0,033 0,978 4 Taxa de utilização = 3.2 / 4 = 80.4%
9 0,033 0,978 10 0,011 0,989 4
10 0,011 0,989 11 0,011 1,000 4
11 0,011 1,000
Média = 4,2 pedidos/dia
Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação Distribuições de frequência – exemplo de aplicação


Dimensionamento de uma frota de veículos Dimensionamento de uma frota de veículos

 Nº de veículos da frota própria = 4  Nº de veículos da frota própria = 8


(Resolvendo como para
Em média, quantos pedidos não são satisfeitos (por dia)? frota de 4 veículos)
Nº de Frequência Frequência Pedidos Nº de Frequência Frequência Veículos Pedidos
pedidos simples acumulada não sat. pedidos simples acumulada usados não sat.
Z – nº de pedidos não satisfeitos 0 0,033 0,033 0 0 Taxa de utilização = 4.1 / 8
0 0,033 0,033 0
1 0,065 0,098 0 1 0,065 0,098 1 0 = 51.5%
Média = 0x0.598 + 1x0.152 + 2x0.098 + 2 0,130 0,228 2 0
2 0,130 0,228 0
3 0,196 0,424 0 + 3x0.054 + … + 7x0,011 3 0,196 0,424 3 0
4 0,174 0,598 0 4 0,174 0,598 4 0 Pedidos satisfeitos =
= 0.99
5 0,152 0,750 1 5 0,152 0,750 5 0 = 4.2 – 0.09 = 4.11
6 0,098 0,848 2 6 0,098 0,848 6 0
7 0,054 0,902 3 Pedidos satisfeitos = 4.2 – 0.99 = 3.21 7 0,054 0,902 7 0
8 0,043 0,946 4 8 0,043 0,946 8 0 Nível de serviço =
9 0,033 0,978 5 9 0,033 0,978 8 1
= 4.11 / 4.2 = 97.9%
10 0,011 0,989 6 Nível de serviço = 3.21 / 4.2 = 76.4% 10 0,011 0,989 8 2
11 0,011 1,000 8 3 (% de pedidos satisfeitos pela
11 0,011 1,000 7 (% de pedidos satisfeitos pela frota própria) 4,2 Médias 4,1 0,09 frota própria)
Média = 4,2 pedidos/dia
Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

16
Distribuições de frequência – exemplo de aplicação Distribuições de frequência – exemplo de aplicação
Dimensionamento de uma frota de veículos Dimensionamento de uma frota de veículos

 Comparação de alternativas de frota própria (4 ou 8 veículos)  Comparação de alternativas de frota própria


Indicadores de desempenho Frota Custo Nº veic. Custo Custo Risco Nível Taxa
Frota Risco Veículos Taxa Pedidos não Nível (nº veic.) frota alugados aluguer total rotura serviço utilização
(nº veic.) rotura usados utilização satisfeitos serviço 4 4.000 0,9891 9.891 13.891 40% 76% 80,4%
4 40% 3.2 80,4% 0,99 76,5% 5 5.000 0,5870 5.870 10.870 25% 86% 72,4%
8 5% 4.1 51,5% 0,09 97,9% 6 6.000 0,3370 3.370 9.370 15% 92% 64,5%
7 7.000 0,1848 1.848 8.848 10% 96% 57,5%
8 8.000 0,0870 870 8.870 5% 98% 51,5%
 Quando há rotura (frota insuficiente), recorre-se a veículos alugados 9 9.000 0,0326 326 9.326 2% 99% 46,4%
 Aluguer de um veículo custa 10 000 dobrões/dia 10 10.000 0,0109 109 10.109 1% 100% 42,0%
11 11.000 0,0000 0 11.000 0% 100% 38,2%
 Custo de um veículo da frota própria: 1 000 dobrões/dia

 Custo total = custo da frota própria + custo de alugueres


= 1000 x Nº veículos da frota própria + 10 000 x Nº veículos alugados
 4 veículos: Custo médio diário: 4x1000 + 0.99x10 000 = 13 900 dobrões
 8 veículos: Custo médio diário: 8x1000 + 0.09x10 000 = 8 900 dobrões

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação Distribuições de frequência – exemplo de aplicação (caso 2)


Dimensionamento de uma frota de veículos Dimensionamento de uma frota de veículos: distribuição do nº de pedidos diários

 Comparação de alternativas de frota própria Nº de Freq. simples Freq. acumulada


pedidos Absoluta Relativa Absoluta Relativa
0 15 0,16 15 0,16 Histograma de Frequências Simples
14.000 1 13 0,14 28 0,30
0,20
2 12 0,13 40 0,43
12.000
3 8 0,09 48 0,52 0,15
10.000 4 6 0,07 54 0,59
5 6 0,07 60 0,65 0,10
Custos

8.000
6 6 0,07 66 0,72
6.000 Custo frota 7 6 0,07 72 0,78 0,05

Custo aluguer 8 5 0,05 77 0,84


4.000 9 5 0,05 82 0,89 0,00
Custo total 0 1 2 3 4 5 6 7 8 9 10 11

2.000 10 5 0,05 87 0,95


11 5 0,05 92 1,00
0
3 4 5 6 7 8 9 10 11 12
Média = 4,2 pedidos/dia
Nº de veículos (frota)
 Para risco de rotura de 5%  Nº de veículos = 10
Variância = 9.4

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

17
Distribuições de frequência – exemplo de aplicação (caso 2) Distribuições de frequência – exemplo de aplicação (caso 2)
Dimensionamento de uma frota de veículos (caso 2) Dimensionamento de uma frota de veículos

 Comparação de alternativas de frota própria  Comparação de alternativas de frota própria


20.000
Frota Custo Nº veic. Custo Custo Risco Nível Taxa
18.000
(nº veic.) frota alugados aluguer total rotura serviço utilização 16.000

Custos médios
4 4.000 1,5870 15.870 19.870 41% 62% 64,4% 14.000
5 5.000 1,1739 11.739 16.739 35% 72% 59,8% 12.000
6 6.000 0,8261 8.261 14.261 28% 80% 55,6% 10.000
Custo frota
8.000
7 7.000 0,5435 5.435 12.435 22% 87% 51,7% Custo aluguer
6.000
8 8.000 0,3261 3.261 11.261 16% 92% 48,0% Custo total
4.000
9 9.000 0,1630 1.630 10.630 11% 96% 44,4% 2.000
10 10.000 0,0543 543 10.543 5% 99% 41,1% 0
11 11.000 0,0000 0 11.000 0% 100% 37,8% 3 4 5 6 7 8 9 10 11 12
Nº de veículos (frota)

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuições de frequência – exemplo de aplicação Distribuições “empíricas” vs modelos “teóricos”


Caso 1 Caso 2
Histograma de Frequências Simples Histograma de Frequências Simples
Distribuição “empírica” (frequências observadas) – Média = 4.2
0,20 0,20 Distribuição “teórica” - Poisson (λ = 4.2)
0,15 0,15

Frequência eλ λ x
0,10 0,10 Nº de
pedidos
Frequência simples
acumulada
Probabilidade
p( x) =
0,05 0,05 Absoluta Relativa Absoluta Relativa simples acum. x!
0 3 0,033 3 0,033 0,015 0,015
0,00 0,00
0 1 2 3 4 5 6 7 8 9 10 11 0 1 2 3 4 5 6 7 8 9 10 11 1 6 0,065 9 0,098 0,063 0,078
Média = 4,2 pedidos/dia Média = 4,2 pedidos/dia 2 12 0,130 21 0,228 0,132 0,209
Variância = 4,7 Variância = 9.4 3 18 0,196 39 0,424 0,185 0,394
20.000
14.000 4 16 0,174 55 0,598 0,194 0,589
18.000
12.000
16.000 5 14 0,152 69 0,750 0,164 0,752
Custos médios

10.000 14.000
12.000 6 9 0,098 78 0,848 0,115 0,867
Custos

8.000
10.000
6.000 Custo frota Custo frota 7 5 0,054 83 0,902 0,069 0,936
8.000
Custo aluguer Custo aluguer
4.000 6.000
Custo total
8 4 0,043 87 0,946 0,036 0,972
Custo total
4.000
2.000
2.000 9 3 0,033 90 0,978 0,017 0,989
0 0
3 4 5 6 7 8 9 10 11 12 3 4 5 6 7 8 9 10 11 12
10 1 0,011 91 0,989 0,007 0,996
Nº de veículos (frota) Nº de veículos (frota) 11 1 0,011 92 1,000 0,003 0,999

Frota óptima= 10 veículos 12 0 0,000 92 1,000 0,001 1,000


Frota óptima= 7 veículos
13 0 0,000 92 1,000 0,000 1,000
Introdução à Estatística Descritiva Rui Carvalho Oliveira

18
Distribuições “empíricas” vs modelos “teóricos” Distribuição “empírica” (frequências observadas)
Distribuição “teórica” - Normal (400, 14.5)
Distribuição “empírica” (frequências observadas) – Média = 4.2
eλ λ x
Distribuição “teórica” - Poisson (λ = 4.2) p( x) = Limite das classes Freq.ia simples Freq.ia acumulada Probabilidades
x! Inferior Superior Absoluta Relativa Absoluta Relativa Simples Acum.
360 370 2 0,02 2 0,02 0,019 0,019
370 380 8 0,08 10 0,10 0,064 0,083
0,200 380 390 14 0,14 24 0,24 0,160 0,243
390 400 27 0,27 51 0,51 0,254 0,497
Observado 400 410 25 0,25 76 0,76 0,255 0,753
0,150 410 420 16 0,16 92 0,92 0,162 0,915
Poisson
420 430 7 0,07 99 0,99 0,065 0,980
430 440 1 0,01 100 1,00 0,020 1,000
0,100
0,30

Observado
0,25 Normal

Distribuições
0,050 0,20
“empíricas”
0,15
vs
0,000 0,10
modelos
0 1 2 3 4 5 6 7 8 9 10 11 12 13 0,05
“teóricos”
0,00
365 375 385 395 405 415 425 435

Introdução à Estatística Descritiva Rui Carvalho Oliveira

Modelos “teóricos” - Distribuição normal (de Gauss) Modelos “teóricos” - Distribuição normal (de Gauss)
Densidade de probabilidade: Efeito da alteração da média (localização do “centro” da distribuição)
2
1  x−µ 
−  
f ( x) =
1
e 2  σ 
σ 2Π

E [X ]
µµ–=média → média
= E  (X
σ 2– desvio
σ − µ )2  → var iância
padrão
   
Média = 10 Média = 15
 Distribuição simétrica
 centrada na média
 50% dos valores abaixo da
média e 50% acima da mesma
 Moda = mediana = média Efeito da alteração
da variância
 Maiores probabilidades na (grau de dispersão)
vizinhança da média, decaindo à
medida que os valores se vão
µ (média) afastando da média (quer para
esquerda, quer para a direita)

Introdução à Estatística Descritiva Rui Carvalho Oliveira

19
Distribuição normal (de Gauss) Distribuição normal (de Gauss) X ~ Normal (100, 5)
Y ~ Normal (100, 30)
 Cerca de 68% das probabilidades concentram-se no intervalo  Cerca de 95.5% das probabilidades
(média – desvio padrão) ; (média + desvio padrão) concentram-se no intervalo
(média – 2 d. padrão) ; (média + 2 d. padrão)

Exemplo 1: P [90 ≤ X ≤ 110 ] ≈ 95.5%


X ~ Normal (Média=100, Desvio padrão=5)
P [40 ≤ Y ≤ 160] ≈ 95.5%
X ~ Normal (100, 5)
P [95 ≤ X ≤ 105] ≈ 68%
 Cerca de 99.7% das probabilidades
concentram-se no intervalo
(média – 3 d. padrão) ; (média + 3 d. padrão)
Exemplo 2:

Y ~ Normal (100, 30) P [85 ≤ X ≤ 115] ≈ 99.7%


P [70 ≤ Y ≤ 130] ≈ 68%
P [10 ≤ Y ≤ 190] ≈ 99.7%
Maior dispersão Intervalo mais largo

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

Distribuição normal padrão (ou reduzida, ou standardizada) Teorema do Limite Central (TLC)

X −µ
X ~ Normal (µ , σ ) →
 Seja Y uma variável que resulta da soma de n variáveis (Xi) independentes e
Z= Padronização
σ da variável X com idêntica distribuição:
Y = X 1 + X 2 + ... + X n
Z [–Zvariável
E ] = 0 normal padrão
• média nula  À medida que n cresce, a distribuição de Y tende
VAR•[Z ] = 1 unitária
variância assimptóticamente para a distribuição normal (qualquer que seja a
distribuição dos Xi )
X ~ Normal (100, 15)
Normal (µ y , σ y )
n

 130 − 100  Y = ∑ Xi n


→
→∞
P[ X ≤ 130] = P  Z ≤ = P[Z ≤ 2] i =1
 15 
= ∅ (2) ≈ 0.977 Média de Y = soma das médias das variáveis Xi
Variância de Y = soma das variâncias das variáveis Xi
Função cumulativa da lei normal padrão
(estão disponíveis tabelas)

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

20
TLC - População Uniforme TLC - População Uniforme

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

TLC - População Exponencial TLC - População Exponencial

Introdução à Estatística Descritiva Rui Carvalho Oliveira Introdução à Estatística Descritiva Rui Carvalho Oliveira

21
Teorema do Limite Central (TLC)

 A distribuição da soma de n variáveis aleatórias (independentes e


identicamente distribuídas) tende para a distribuição normal à
medida que n cresce (qualquer que seja a distribuição das parcelas!)

 Note-se que:

1. Rapidez da convergência depende da distribuição dos Xi, sendo


necessárias menos parcelas se esta distribuição for simétrica. Por
exemplo:

 Se Xi ~ Uniforme, a aproximação normal será "razoável" se n ≥ 12

 Se Xi ~ exponencial negativa (muito assimétrica), poderão ser necessárias


algumas dezenas de parcelas para a aproximação à normal ser "aceitável“

2. Convergência para a normal verifica-se mesmo quando as parcelas (Xi)


não têm a mesma distribuição!

Introdução à Estatística Descritiva Rui Carvalho Oliveira

22

Você também pode gostar