Você está na página 1de 158

ESTATÍSTICA

DESCRITIVA

O que é Estatística?

Poder-se-ia sintetizar como sendo a

ciência dos dados. Historicamente surgiu a partir de dois fenômenos

distintos: a necessidade de dados

censitários e o desenvolvimento da teoria do cálculo das probabilidades.

ALGUNS CONCEITOS ESTATÍSTICOS IMPORTANTES

ESTATÍSTICA DESCRITIVA Sugere

a organização, sumarização e descrição de um conjunto de dados. Com a construção de gráficos, tabelas,

e com o cálculo de medidas com base

em uma coleção de dados numéricos.

por exemplo, com as idades dos

alunos, poderemos melhor compreender o comportamento da

variável expressa no conjunto de dados

sob análise.

ALGUNS CONCEITOS ESTATÍSTICOS IMPORTANTES

ESTATÍSTICA INFERENCIAL Pode-

se definir como sendo os métodos que

tornam possível a estimação de

características de uma população

baseadas nos dados amostrais.

ALGUNS CONCEITOS ESTATÍSTICOS IMPORTANTES

POPULAÇÃO É a totalidade de

itens, objetos ou pessoas sob consideração.

AMOSTRA É uma parte da população que é selecionada para

análise.

SUPONHA A SEGUINTE

TABELA

   

VENDAS

PREÇO DA AÇÃO

EMPRESA

BOLSA

DE

SÍMBOLO

DO

ANUAIS

(R$)

VALORES

PAINEL

(milhões

de

 

reais)

VALORES PAINEL (milhões de   reais) Petrobrás ON Peb 215,70 11,5 Ford PN Fd
VALORES PAINEL (milhões de   reais) Petrobrás ON Peb 215,70 11,5 Ford PN Fd
VALORES PAINEL (milhões de   reais) Petrobrás ON Peb 215,70 11,5 Ford PN Fd
VALORES PAINEL (milhões de   reais) Petrobrás ON Peb 215,70 11,5 Ford PN Fd
VALORES PAINEL (milhões de   reais) Petrobrás ON Peb 215,70 11,5 Ford PN Fd
VALORES PAINEL (milhões de   reais) Petrobrás ON Peb 215,70 11,5 Ford PN Fd

Petrobrás

ON

Peb

215,70

11,5

Ford

PN

Fd

107,5

9,2

Arisco

PP

Ar

23,7

3,5

Microsoft

ON

Mft

89,9

9,8

Ar 23,7 3,5 Microsoft ON Mft 89,9 9,8 Intel PN Itl 323,8 8,7 Cosipa PP Cpa
Ar 23,7 3,5 Microsoft ON Mft 89,9 9,8 Intel PN Itl 323,8 8,7 Cosipa PP Cpa
Ar 23,7 3,5 Microsoft ON Mft 89,9 9,8 Intel PN Itl 323,8 8,7 Cosipa PP Cpa
Ar 23,7 3,5 Microsoft ON Mft 89,9 9,8 Intel PN Itl 323,8 8,7 Cosipa PP Cpa
Ar 23,7 3,5 Microsoft ON Mft 89,9 9,8 Intel PN Itl 323,8 8,7 Cosipa PP Cpa
Ar 23,7 3,5 Microsoft ON Mft 89,9 9,8 Intel PN Itl 323,8 8,7 Cosipa PP Cpa
Ar 23,7 3,5 Microsoft ON Mft 89,9 9,8 Intel PN Itl 323,8 8,7 Cosipa PP Cpa
Ar 23,7 3,5 Microsoft ON Mft 89,9 9,8 Intel PN Itl 323,8 8,7 Cosipa PP Cpa
Ar 23,7 3,5 Microsoft ON Mft 89,9 9,8 Intel PN Itl 323,8 8,7 Cosipa PP Cpa

Intel

PN

Itl

323,8

8,7

Cosipa

PP

Cpa

157,2

12,7

89,9 9,8 Intel PN Itl 323,8 8,7 Cosipa PP Cpa 157,2 12,7 Açominas ON Mas 79,3

Açominas

ON

Mas

79,3

6,6

ELEMENTOS São as entidades sobre os quais os dados são coletados,

por exemplo, na tabela anterior, cada

empresa é um elemento.

VARIÁVEL É uma característica de

interesse para os elementos (quatro variáveis na tabela anterior).

VARIÁVEL QUALITATIVA Bolsa de

valores constitui uma variável qualitativa. O símbolo do painel

eletrônico também constitui uma

variável qualitativa.

VARIÁVEL QUANTITATIVA Vendas

anuais denotam uma variável desse

tipo.

DADOS QUANTITATIVOS Indicam

quantidade, ex: 215,70 milhões de

reais.

DADOS QUALITATIVOS Podem ser numéricos ou não, por exemplo,

podemos especificar que um significa

uma ação comercializada na Bolsa de valores de SP.

DESCRIÇÃO GRÁFICA DE

VARIÁVEIS QUALITATIVAS

Coluna, Pizza e Barra são os gráficos

mais comuns para a descrição de dados oriundos de variáveis

qualitativas.

Preço das ações de três

empresas em um determinado ano (R$)

Petrobrás 1° Trim 20,4

Petrobrás

1° Trim

20,4

Petrobrás 1° Trim 20,4 Açominas 30,6 Arisco 45,9

Açominas

30,6

Arisco

45,9

Petrobrás 1° Trim 20,4 Açominas 30,6 Arisco 45,9
1° Trim 20,4 Açominas 30,6 Arisco 45,9 2°Trim 27,4 3° Trim 90,0 4° Trim 20,4 38,6

2°Trim

27,4

3° Trim

90,0

4° Trim

20,4

30,6 Arisco 45,9 2°Trim 27,4 3° Trim 90,0 4° Trim 20,4 38,6 34,6 31,6 46,9 45,0

38,6

34,6

31,6

46,9

45,0

43,9

38,6 34,6 31,6 46,9 45,0 43,9

COLUNA

COLUNA Prof. Dr. Hercules de Souza 13 13

PIZZA

Petrobrás

PIZZA Petrobrás Prof. Dr. Hercules de Souza 14 14

BARRA

BARRA Prof. Dr. Hercules de Souza 15 15

EXEMPLOS DE

APRESENTAÇÕES DE

DADOS

Exemplo: Características do eleitor nordestino. (Veja

16/08/2006)

Prof. Dr. Hercules de Souza

1717

Compensação salarial em relação ao nível de instrução (Veja 06/09/2006)

Prof. Dr. Hercules de Souza
Prof. Dr. Hercules de Souza

1919

Prof. Dr. Hercules de Souza 2020
Prof. Dr. Hercules de Souza 2020
Prof. Dr. Hercules de Souza 2020

Prof. Dr. Hercules de Souza

2020

DESCRIÇÃO GRÁFICA DE VARIÁVEIS QUANTITATIVAS

TABELA 1

7,2

4,9

10,7

10,4

6,4

4,8

4,7

4,6

6,0

5,4

4,8

4,7

8,3

3,9

4,8

8,3

6,4

6,6

4,5

8,0

3,6

2,4

8,5

8,8

7,7

4,9

8,6

12,0

4,9

7,0

11,0

4,9

3,9

4,9

4,4

4,9

4,9

8,0

3,6

7,4

7,9

4,9

5,8

3,9

11,6

10,3

3,4

3,9

5,0

3,9

8,0

3,5

4,9

5,8

4,1

3,9

3,5

4,8

5,9

3,6

Ao arranjo dos dados numéricos brutos

da tabela anterior em ordem crescente (poderia ser decrescente) chama-se de

ROL, e denomina-se como

AMPLITUDE TOTAL dos dados como sendo a diferença entre o maior e o

menor número do ROL.

ROL CRESCENTE

da TABELA 1

2,4

3,4

3,5

3,5

3,6

3,6

3,6

3,9

3,9

3,9

3,9

3,9

3,9

4,1

4,4

4,5

4,6

4,7

4,7

4,8

4,8

4,8

4,8

4,9

4,9

4,9

4,9

4,9

4,9

4,9

4,9

4,9

5,0

5,4

5,8

5,8

5,9

6,0

6,4

6,4

6,6

7,0

7,2

7,4

7,7

7,9

8,0

8,0

8,0

8,3

8,3

8,5

8,6

8,8

10,3

10,4

10,7

11,0

11,6

12,0

Descrição dos dados inicialmente a partir

da chamada:DISPOSIÇÃO

RAMO-E-FOLHA

2

4

3

969694995956

4

9876878599994999918

5

48089

6

4046

7

27049

8

33058600

9

10

743

11

06

12

0

DISTRIBUIÇÃO DE

FREQÜÊNCIA

É um sumário tabular de dados que

mostra a freqüência de observações em cada uma das diversas classes não

sobrepostas.

DISTRIBUIÇÃO DE

FREQÜÊNCIA

Freqüência absoluta de cada classe Total

de elementos em cada classe.

Freqüência relativa Para um conjunto de dados com N observações, a freqüência

relativa de cada classe é como segue:

Freqüência relativa = freqüência absoluta da classe/N

A freqüência percentual de uma classe é a freqüência relativa multiplicada por 100.

Exemplo: Empresas

(número de funcionários)

Empresa

Frequência abs.

Frequência rel.

Frequência Perc.

Empresa 01

380

0,38

38,00 %

Empresa 02

160

0,16

16,00 %

Empresa 03

100

0,10

10,00 %

Empresa 04

260

0,26

26,00 %

Empresa 05

100

0,10

10,00 %

Total

1000

1,00

100,00 %

Prof. Dr. Hercules de Souza 28
Prof. Dr. Hercules de Souza 28

Para a construção de uma distribuição de

frequência são necessários alguns cálculos

iniciais:

1. Amplitude total (R) = maior valor da amostra menos o menor valor da amostra.

2. Número de classes São formadas especificando-se os intervalos que serão usados para agrupar as observações no conjunto de dados.

Número de Classes (Fórmula de

Sturges): k 1+3,33log n (n = número

de elementos que se deseja

representar).

3. Tamanho do intervalo de cada classe (h): (pode ser representado por

intervalo fechado, aberto ou misto)

h R/k

Com isso é possível construir um histograma, que é uma representação

gráfica de frequência por meio de

retângulos justapostos ou um gráfico

denominado polígono.

O histograma pode ser de freqüências

absolutas, de freqüências relativas ou

de freqüências percentual ou um polígono de freqüência que seria a

ligação, através de retas, do ponto

médio de cada retângulo.

Prof. Dr. Hercules de Souza

3434

EXEMPLO PARA ELABORAÇÃO

DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

2,1 4,8 3,3 3,5

2,1

4,8

3,3

3,5

2,1 4,8 3,3 3,5 5,5 10,4 4,8 5,8

5,5

10,4

4,8

5,8

2,1 4,8 3,3 3,5 5,5 10,4 4,8 5,8
4,8 3,3 3,5 5,5 10,4 4,8 5,8 5,3 5,5 5,9 6,6 7,5 6,0 2,8 3,6 7,8

5,3

5,5

5,9

6,6

7,5

6,0

2,8

3,6

7,8

10,5

4,5

4,8

2,8 3,6 7,8 10,5 4,5 4,8
5,5 10,4 4,8 5,8 5,3 5,5 5,9 6,6 7,5 6,0 2,8 3,6 7,8 10,5 4,5 4,8

ROL CRESCENTE

ROL CRESCENTE Prof. Dr. Hercules de Souza 36

Número de classes:

k = 1+3,33 log20=5,33 ~ 6 classes

Amplitude: R = 10,5 -2,1= 8,4

Largura da classe:

h ~ R/k = 8,4/(1+3,33 log20)= 1,58 ~ 1,6

OBSERVAÇÃO:

O número de classes e a largura das mesmas deve ser tal que todos os

elementos da amostra estejam contidos

nessas classes e a última classe deve

conter pelo menos um elemento.

Prof. Dr. Hercules de Souza 39
Prof. Dr. Hercules de Souza 39
Prof. Dr. Hercules de Souza 40
Prof. Dr. Hercules de Souza 41

Faça uma distribuição de freqüência absoluta, relativa, percentual e

percentual acumulada e em

seguida construa um histograma

de freqüência absoluta e um

polígono com os dados da

TABELA 1

ROL CRESCENTE

da TABELA 1

2,4

3,4

3,5

3,5

3,6

3,6

3,6

3,9

3,9

3,9

3,9

3,9

3,9

4,1

4,4

4,5

4,6

4,7

4,7

4,8

4,8

4,8

4,8

4,9

4,9

4,9

4,9

4,9

4,9

4,9

4,9

4,9

5,0

5,4

5,8

5,8

5,9

6,0

6,4

6,4

6,6

7,0

7,2

7,4

7,7

7,9

8,0

8,0

8,0

8,3

8,3

8,5

8,6

8,8

10,3

10,4

10,7

11,0

11,6

12,0

Gráfico de ogiva

Os gráficos chamados de ogivas

correspondem a um polígono de freqüências acumuladas, nas quais

estas freqüências são localizadas sobre

perpendiculares levantadas nos limites inferiores ou superiores das classes,

dependendo se a ogiva representar as

freqüências acumuladas.

Minutos gastos ao telefone

102

124

108

86

103

82

71

104

112

118

87

95

103

116

85

122

87

100

105

97

107

67

78

125

109

99

105

99

101

92

Fazendo uma distribuição de

freqüência com 5 classes, teremos:

Classe

Ponto

médio

Freqüência

relativa

6778

72,5

0,10

7990

84,5

0,17

91102

96,5

0,27

103114

108,5

0,30

115126

120,5

0,17

Freqüência

cumulativa

3

8

16

25

30

Freqüência cumulativa

Gráfico de ogiva e um gráfico de freqüência cumulativa que mostra o número de valores, em um conjunto de dados, que são iguais ou inferiores a um dado valor x .

30

20

10

0

30 25 16 8 3 0 66,5 78,5 90,5 102,5 114,5 126,5
30
25
16
8
3
0
66,5
78,5
90,5
102,5
114,5
126,5

minutos

SETE FERRAMENTAS DA

QUALIDADE

1.

Diagrama de causa-efeito (espinha de peixe ou Ishikawa);

2.

Diagrama de Pareto;

3.

Histogramas;

4.

Folhas de verificação;

5.

Gráficos de dispersão;

6.

Fluxogramas;

7.

Cartas de controle.

Diagrama de causa-efeito

(espinha de peixe ou Ishikawa)

Fonte: Internet

Diagrama de causa-efeito (espinha de peixe ou Ishikawa) Fonte: Internet Prof. Dr. Hercules de Souza 49

DIAGRAMA DE PARETO

O diagrama de Pareto é uma

homenagem ao engenheiro, economista, filósofo e sociólogo italiano

Vilfredo Frederico Samaso Pareto

(1848 1923).

DIAGRAMA DE PARETO

Também conhecido como diagrama

ABC,80-20, é um gráfico de barras que ordena as frequências das ocorrências,

da maior para a menor, permitindo a

priorização dos problemas, procurando

levar a cabo o princípio de Pareto.

PRINCÍPIO DE PARETO

Afirma que para muitos fenômenos, 80%

das consequências advêm de 20% das causas. A lei foi sugerida por Joseph

Moses Juran, (1904-2008) que deu o

nome em honra ao economista italiano

Vilfredo Pareto.

Prof. Dr. Hercules de Souza 53

DIAGRAMA DE PARETO

Considere uma amostra com 23 elementos: 2, 2, 4, 4, 4, 4, 4, 6, 6, 6, 6,

6, 6, 6, 6, 6, 8, 8, 8, 8, 8, 10, 10.

Classe Freqüência 2 ├ 4 2

Classe

Freqüência

2 ├ 4

2

Classe Freqüência 2 ├ 4 2 4├ 6 5 6├ 8 9 8├10 5 10├ 12

4├ 6

5

6├ 8

9

8├10

5

10├ 12

2

6 5 6├ 8 9 8├10 5 10├ 12 2 % cumulativo 8,70% Classe 6├ 8
6 5 6├ 8 9 8├10 5 10├ 12 2 % cumulativo 8,70% Classe 6├ 8
6 5 6├ 8 9 8├10 5 10├ 12 2 % cumulativo 8,70% Classe 6├ 8
6 5 6├ 8 9 8├10 5 10├ 12 2 % cumulativo 8,70% Classe 6├ 8

%

cumulativo

8,70%

Classe

6├ 8

Freqüência

%

cumulativo

9 39,13%

Classe 6├ 8 Freqüência % cumulativo 9 39,13% 30,43% 4├ 6 5 60,87% 69,57% 8├ 10
Classe 6├ 8 Freqüência % cumulativo 9 39,13% 30,43% 4├ 6 5 60,87% 69,57% 8├ 10
Classe 6├ 8 Freqüência % cumulativo 9 39,13% 30,43% 4├ 6 5 60,87% 69,57% 8├ 10

30,43%

4├ 6

5

60,87%

69,57%

8├ 10

5

82,61%

91,30%

2├ 4

2

91,30%

100,00%

10├ 12

2

100,00%

60,87% 69,57% 8├ 10 5 82,61% 91,30% 2├ 4 2 91,30% 100,00% 10├ 12 2 100,00%

Como fazer um diagrama de

Pareto no Excel?

1º Passo: Construção da tabela: 1ª

coluna a descrição do problema ou causa, na 2ª coluna teremos os valores

absolutos de cada problema e na 3ª

coluna o percentual acumulado.

Como fazer um diagrama de

Pareto no Excel?

2º Passo: Definição do tipo gráfico: a)

Selecione os valores na tabela. b) Clique no ícone assistente de gráfico. c)

Na pasta “tipos personalizados”

selecione o gráfico “Lins – Cols. em 2

eixos” e clique em avançar. Na próxima

janela clique em avançar novamente.

Como fazer um diagrama de

Pareto no Excel?

3º Passo: Opções iniciais: a) Na pasta

título digite o título do gráfico. b) No espaço “Eixo dos valores (x)” digite o

título para os problemas ou causas. c)

No espaço “Eixo dos valores (y)” digite

o título para os valores absolutos.

Como fazer um diagrama de

Pareto no Excel?

4º Passo: Na pasta Rótulos de dados marque a opção “Mostrar rótulo”. Na

pasta Legenda desative a opção

“Mostrar legenda”. Clique em avançar e concluir.

Prof. Dr. Hercules de Souza 6060

Prof. Dr. Hercules de Souza

6060

Exemplo da utilização de um

diagrama de Pareto para tipos de defeitos que ocorreram no

processo de produção de placas de

circuito impresso.

Fonte: Internet

Prof. Dr. Hercules de Souza 6262

Prof. Dr. Hercules de Souza

6262

Exemplo da utilização de um diagrama de Pareto para tipos de defeitos que ocorreram em caixas de marcha de

veículos no processo de produção.

Fonte: Internet

Prof. Dr. Hercules de Souza 64

FATORES DE MORTANDADE NO TRÂNSITO DE BRASÍLIA (fonte: Detran - DF 2001)

Atropelamento de pedestre

163

Colisão

122

Capotamento

36

Choque com objeto fixo

43

Queda

17

Atropelamento de animal

01

Demais tipos

04

Total

386

Prof. Dr. Hercules de Souza 66
Prof. Dr. Hercules de Souza 67

Motivos dos atrasos em cirurgias marcadas

Fonte: balancedscorecard.blogspot.com

Motivos dos atrasos em cirurgias marcadas Fonte: balancedscorecard.blogspot.com 6 8 Prof. Dr. Hercules de Souza

68

Prof. Dr. Hercules de Souza

Governo do Estado de São Paulo elaborou um relatório baseado nos dados do PROCON em 2010. Uma das

informações levantadas foi a

participação das “Áreas de Assuntos”

nas reclamações procedentes recebidas em 2010.

Sistema de atendimento ao cliente da

livraria virtual

Sistema de atendimento ao cliente da livraria virtual

MEDIDAS DE

TENDÊNCIA

CENTRAL OU DE

POSIÇÃO

Prof. Dr. Hercules de Souza 73

São medidas que possibilitam representar

um conjunto de dados relativos à observação de determinado fenômeno

de forma resumida. Estas medidas nos

orientam quanto à posição da distribuição no eixo dos números reais,

possibilitam comparações de conjuntos de dados. Enfim, representam os fenômenos pelos seus valores médios.

(

Média

aritmética

(

Média

ponderada )

(

Média

geométrica)

(

Média

harmônica)

ou

média

amostral )

n


w x

i

i

i 1

x

mg

mh

n

i 1

n
n

w

i

 

F1

 

F2

Fn

x

x

 



x

1

2

n

n

n

i 1

F

i

x
i

_

x

n

i 1

x F

i

i

n

EXERCÍCIO

Dada a seguinte distribuição: Calcule a

média aritmética ou média amostral.

X 1 2 3 4 i F 1 3 5 1 i
X
1
2 3
4
i
F
1
3 5
1
i

EXERCÍCIO

Sejam X1, X2, X3,

,Xn,

valores de X

associados às freqüências absolutas

F1, F2, F3,

Fn.

Calcule as médias geométricas para as tabelas a seguir:

X i

F i

1

8

2

3

6

5

5

3

X

i

3

6

12

24

48

EXERCÍCIO

Sejam X1, X2, X3,

,Xn,

valores de X

associados às freqüências absolutas

F1, F2, F3,

Fn,

respectivamente.

Calcule a média harmônica e

geométrica para a mostra: 2, 2, 2, 5,

5, 5, 5, 8, 8.

Utilizando uma calculadora científica

padrão Casio, HP ou similar

Antes de iniciar qualquer inserção de

dados na calculadora é interessante limpar a memória. No caso da Casio o

procedimento é o seguinte:

SHIFT

MODE

ALL

=

Inserindo os dados na

calculadora

1- selecione em MODE a opção SD.

2- Insira o ponto médio de cada classe seguido de ponto e vírgula (;) e a

frequência absoluta da mesma classe,

em seguida tecle M+.

Siga esse procedimento até finalizar

com a última classe.

Prof. Dr. Hercules de Souza 82

Observação: Como é vital a correta inserção dos dados de ponto médio e frequência absolutas na

calculadora, é recomendável

verificar se não houve nenhuma inserção errada.

Como visto, a média aritmética amostral pode

ser calculada pela expressão:

X

x F

i

i

n

O somatório do numerador da expressão acima pode ser obtido clicando a tecla SHIFT e em seguida a tecla 1. No display da calculadora

aparecerão 3 opções:

Escolha a opção 2 e em seguida divida

por n

x

1

2

x

2

n

3

A média aritmética amostral também

pode ser obtida diretamente seguindo o

seguinte procedimento:

Teclar SHIFT e em seguida a tecla 2.

Deverá aparecer no display da calculadora 3 opções:

2 Desvio padrão populacional:

3 Desvio padrão amostral:

1-

Média aritmética amostral:

X

n

n

ou

1

S

n

MEDIANA

É uma medida de posição que divide a

amostra ou a população em duas partes iguais.

CÁLCULO DA MEDIANA PARA

UMA VARIÁVEL DISCRETA

Se o número n de elementos for ímpar, a

mediana será o elemento central, de ordem (n+1)/2. Se o número n de

elementos for par, a mediana será a

média entre os elementos centrais de

ordem n/2 e n/2 +1.

EXEMPLO

X

i

F

i

1

1

2

3

3

5

4

2

F ac

1

4

9

11

=11

Como existem 11 elementos a mediana pode ser calculada por (n+1)/2, logo (11+1)/2=6º elemento. Nesse caso a mediana será o número 3.

X

i

F

i

82

5

85

10

87

15

89

8

90

4

F ac

5

15

30

38

42

=42

EXEMPLO

Como existem 42 elementos a mediana pode ser calculada:

42/2 = 21º elemento e 42/2 +1=22º elemento. O 21º elemento

é o 87 e o 22º também, logo a mediana será (87+87)/2=87.

CÁLCULO DA MEDIANA PARA

UMA VARIÁVEL CONTÍNUA

Calcule a ordem N/2. Como a variável

é contínua não se preocupe se n é par ou ímpar.

Pela freqüência acumulada (Fac)

identifique a classe que contém à mediana (classe Md).

1- Utilize a equação:

Mediana

L


md

L md = limite inferior da classe Md;

N = tamanho da amostra;

N

2

f

h

F

md

f = soma das freqüências anteriores à classe Md;

h = amplitude da classe Md;

F md = freqüência da classe Md.

EXEMPLO

Classes

F

i

35├45

5

45├55

12

55├65

18

65├75

14

75├85

6

85├95

3

F ac

5

17

35

49

55

58

=58

Mediana

55

29

17

10

18

61,67

MODA

É o valor que mais se repete

na distribuição.

Para distribuições simples (sem agrupamento em classes), a identificação da moda se

faz simplesmente pela observação do elemento que apresenta maior freqüência.

X

i

20

F

i

2

25

28

9

10

21

30

4

5

Nesse caso a moda é 28

Para dados agrupados em classes pode-se utilizar a fórmula de Czuber:

1-

Identificar a classe modal, ou seja, aquela que possui a maior freqüência.

2-

Aplica-se a fórmula:

Moda

lim.inf

 h

1



1

2

lim. Inf = limite inferior da classe modal.

1 = diferença entre a freqüência da classe modal e a imediatamente anterior.

2 = diferença entre a freqüência da classe modal e a imediatamente posterior.

h = amplitude da classe.

EXERCÍCIO: Calcule a moda da

seguinte distribuição:

1-

2-

Classes

Classes

F

i

0├ 1

3

1├ 2

2├ 3

10

17

3├ 4

4├ 5

8

5

 43
43

A classe modal é a 3ª

Moda

2

 

7

1

7

9

2,44

Utilize os dados da TABELA 1

para calcular: a média, a moda,

e a mediana amostrais.

Separatrizes

A principal característica das

medidas separatrizes consiste na

separação da série em partes iguais

que apresentam o mesmo número

de valores.

Separatrizes

AS PRINCIPAIS SÃO OS

QUARTIS, DECIS E PERCENTIS.

Quartis

Os quartis são valores de um conjunto

de dados ordenados, que os dividem em quatro partes iguais. É necessário, portanto, três quartis (Q 1 , Q 2 e Q 3 ) para dividir um conjunto de dados ordenados em quatro partes iguais.

Quartis

Q 1 : deixa 25% dos elementos abaixo dele.

Q 2 : deixa 50% dos elementos abaixo dele e coincide com a mediana.

Q 3 : deixa 75% dos elementos abaixo dele.

Quartis

A fórmula para o caso da mediana (Q 2 ) pode ser adaptada para o cálculo de Q 1 (n/4) e Q 3 (3n/4).

Decis e percentis

Identicamente para o caso do cálculo

dos quartis, os decis e os percentis podem ser obtidos pela adaptação da

equação para o cálculo da mediana, o

que muda é:

D 1 = n/10, D 2 = 2n/10

D

9 = 9n/10

P 1 = n/100, P 2 = 2n/100

P 99 = 99n/100

Utilize os dados da TABELA 1 para calcular:

Q 1 , Q 2 , Q 3 , D 4 , D 7 , P 20 , P 60 .

BOX-PLOT

Visto as chamadas medidas de posição

de dados estatísticos, vamos retornar a uma representação gráfica da síntese

desses dados chamada de Box-plot. É

um tipo gráfico muito utilizado, representando a dispersão dos dados,

a mediana e os quartis.

Exemplo: a seguinte amostra de dados colocados fora de ordem:

200 11 - 2,5 - 5 5 - 5,5 3 - 3,5 3 - 0,4 - 3,2 5 3 - 3,2 - 7,4 - 6

0,4 - 2,5 - 3 - 3 - 3 - 3,2 - 3,2 - 3,5 - 5 - 5 - 5 - 5,5 - 6 - 7,4 - 11 - 200

•25% dos dados estão abaixo de 3, assim, o Primeiro Quartil é Q 1 =3;

•50% dos dados estão abaixo de 4,25, assim, o Segundo Quartil, (Q 2 ) que também é a

Mediana é Q 2 =M=4,25;

•75% dos dados estão abaixo de 5,75, assim, o Terceiro Quartil é Q 3 =5,75

Assim sendo podemos sumarizar esses dados simplesmente fornecendo

apenas 5 valores:

valor mínimo = 0,4,

Q1=3,

mediana = 4,25,

Q3=5,75

Valor máximo = 200

Suponha os dados

sumarizados por sexo

Sexo

Q1

F

1,60

Sexo Q1 F 1,60 M 1,72

M

1,72

Sexo Q1 F 1,60 M 1,72 1,62 1,75 1,90 1,82 Min 1,52 Mediana 1,66 Max 1,79

1,62

1,75

1,90

1,82

Min

1,52

Mediana

1,66

Max

1,79

Q3

1,70

2 1,9 1,8 1,7 1,6 1,5 1,4 1,3 1,2 F M
2
1,9
1,8
1,7
1,6
1,5
1,4
1,3
1,2
F
M

Utilize os dados da TABELA 1

para construir um Box-plot.

MEDIDAS DE

DISPERSÃO

As medidas de variabilidade mais

conhecidas são:

Amplitude total;

Desvio simples;

Desvio médio; Variância;

Desvio padrão;

Coeficiente de variação

de Pearson (CVP).

Amplitude total

É a diferença entre o maior e o menor valor de uma distribuição.

Amplitude = Maior Valor Menor Valor

Desvio simples

È a diferença entre cada valor da amostra

e a sua média aritmética.

a diferença entre cada valor da amostra e a sua média aritmética. di  x 

di x x

Desvio médio

Corresponde a média aritmética dos

valores absolutos dos desvios simples.

DM

di

n

Variância

Trata-se da média aritmética dos quadrados dos desvios. Pode ser

calculada tanto para uma amostra

quanto para uma população.

Desvio padrão

Baseia-se nos desvios dos elementos amostrais ou populacionais em torno da média aritmética. Ou seja, corresponde à raiz quadrada da variância.

O desvio padrão é definido desta forma de maneira a dar-nos uma

medida da dispersão que:

1. Seja um número não-negativo;

2. Use a mesma unidade de medida dos dados fornecidos inicialmente.

(

D.P.

populacion al )



(

Variância

populacion al

n

i 1

(x

 )
i

2

n

( D.P.

amostral )



2

( Variância

amostral )

S

( Var p / dados

amos.

agrup.)

S

2

n

(x

i 1

i

_

x)

2

F

i

n 1

ou

2

S

n

i

1

_

(x x)
i

2

n 1

S

2

1

n 1

n

i 1

x

2

i

F

i

n

i 1

x F

i

i

2

n

Porque o desvio padrão costuma ser

mais apropriado que o desvio médio?

O cálculo do desvio médio considera

apenas o módulo da diferença entre o valor e sua média, enquanto que o desvio padrão considera o dobro dessa

diferença. Isso faz com que o desvio

padrão tenha uma sensibilidade maior e capte melhor a variação dos números

em relação a sua média.

Observe as amostras abaixo:

1.

(-1,5; -1,5; 0; 1,5; 1,5) Média= 0; DM = 1,2 e DP = 1,5000

2.

(-2; -1; 0; 1; 2)

Média= 0; DM = 1,2 e DP = 1,5811

3.

(-2,5; -0,5; 0; 0,5; 2,5) Média= 0; DM = 1,2 e DP = 1,8028

As amostras são diferentes, mas o desvio médio é sempre o mesmo; enquanto que o desvio padrão varia de amostra para amostra e apresenta um valor maior naquela cujos números estão mais distantes

da média.

Exemplo

Calcular o desvio padrão e a variância

para a seguinte amostra de dados não agrupados: S 2 = 10,267, S = 3,204

5

7

10

9

11

12

15

6

8

13

Obtendo o desvio padrão

amostral

Após a inserção dos dados, como feito para o

cálculo da média aritmética amostral.

Teclar SHIFT e em seguida a tecla 2.

Deverá aparecer no display da calculadora 3 opções:

1- Média aritmética;

2 Desvio padrão populacional;

3 Desvio padrão amostral.

Coeficiente de variação de Pearson

É uma medida útil para a comparação entre séries distintas, mesmo quando essas se referem a fenômenos distintos inclusive com unidades de medidas diferentes.

CVP

Desvio

Padrão

Média

100

Exemplo

Considere a tabela abaixo que contem a média

do comprimento e a massa de determinada peça.

Média

Desvio Padrão

Comprimento

(cm)

8,0

2,0

Massa (g)

50,0

10,0

Qual das duas medidas possuem maior

homogeneidade? Essa resposta pode ser respondida pelo cálculo do Coeficiente de variação de Pearson.

CVP (comprimento) = (2,0 x 100)/8 = 25% CVP (massa) = (10,0 x 100)/50 = 20 %

Logo a massa por possuir menor CVP apresenta menor grau de dispersão

Exemplo

Classe

Ponto médio

Freqüência

X

i F i

X

i 2 F i

0 ├ 10

5

2

10

 

50

10

├ 20

15

1

15

225

20

├ 30

25

5

125

3125

30

├ 40

35

8

280

9800

40

├ 50

45

4

180

8100

   

n=20

Σ=610

Σ=21300

Prof. Dr. Hercules de Souza

128128

X

2
S

S

2

30,5

1

19

21300

141,84

610

2

20

S 11,91

CV

11,91 100

30,5

39,05 %

Utilize os dados da TABELA 1

para calcular: A variância, o

desvio padrão amostrais e o coeficiente de variação.

Outlier

O que é? É uma observação que apresenta um grande afastamento das demais da série [1] (que esta "fora" dela), ou que é inconsistente.

TEOREMA DE TCHEBYCHEV

Pafnuti Lvovitch Tchebychev, matemático

russo que realizou vários trabalhos, no século XIX na área de probabilidade e Estatística, dentre eles esse famoso teorema.

Esse teorema diz que muitas vezes é

interessante descobrirmos, utilizando a média e o desvio padrão, a posição relativa

de uma observação com relação a uma

amostra.

O Teorema de Tchebychev permite

fazer observações sobre o percentual dos dados que estão dentro de um

número específico de desvios padrões

da média.

Para qualquer distribuição amostral com

média e desvio padrão S, tem-se:

(X S) - O intervalo contém, no mínimo

68% de todas as observações

amostrais.

(X 2S) O intervalo contém, no mínimo 75% de todas as observações amostrais.

(X 3S) O intervalo contém, no mínimo 89% de todas as observações

amostrais.

ASSIMETRIA

Assimetria é o grau de desvio, ou

afastamento de uma distribuição da unidade de simetria.

Se uma distribuição é simétrica então:

média = mediana = moda

X

Se a distribuição é assimétrica positiva então:

moda < Mediana < Média

X

Se a distribuição é assimétrica negativa

então:

médiaX < Mediana < Moda.

Simétrica Assimétrica negativa Assimétrica positiva Prof. Dr. Hercules de Souza 138

Simétrica

Simétrica Assimétrica negativa Assimétrica positiva Prof. Dr. Hercules de Souza 138

Assimétrica negativa

Assimétrica positiva

Existem várias fórmulas para o cálculo do

coeficiente de assimetria, dentre elas, temos:

1º Coeficiente de Pearson:

AS

x

Mo

ou

AS

x

Mo

s

2º Coeficiente de Pearson (Bowley):

AS

Q

1

Q

3

2M

d

Q

3

Q

1

Se:

AS = 0 diz-se que a distribuição é simétrica;

AS > 0 diz-se que a distribuição é assimétrica positiva (à direita);

AS < 0 diz-se que a distribuição é assimétrica negativa (à esquerda);

CURTOSE

Curtose é o grau de achatamento de

uma distribuição, pode ser denominada leptocúrtica (delgada), platicúrtica

(achatada) ou mesocúrtica (nem

delgada nem achatada).

Curva Leptocúrtica Curva Mesocúrtica Curva Platicúrtica Prof. Dr. Hercules de Souza 142142

Curva Leptocúrtica

Curva Mesocúrtica

Curva Platicúrtica

Prof. Dr. Hercules de Souza

142142

Índice Percentílico de Curtose:

Encontra-se este índice usando a seguinte fórmula:

C

Q

3

Q

1

2 D

9

D

1

Se C<0,263 A distribuição é LEPTOCÚRTICA;

Se C=0,263 A distribuição é MESOCÚRTICA;

Se C>0,263 A distribuição é PLATICÚRTICA.

OBSERVAÇÃO

O software Excel apresenta-se como uma

poderosa ferramenta de análise estatística, permitindo ao seu usuário uma análise das várias medidas estatísticas, vistas nesta

apostila.

Para tanto basta que o usuário selecione a opção Análise de Dados no menu

Ferramentas do Excel, e analise as várias

possibilidades estatísticas ali existentes.

EXERCÍCIOS

1. Suponha a idade de 50 funcionários de uma empresa, construa um histograma e

um

polígono de freqüências absolutas. Calcule a média amostral, moda,

mediana, desvio padrão, Q 1 , Q 3, P 60 e D 3. Faça um diagrama de Pareto e um

Box -plot,

interpretando

o

seu

signif icado.

Interprete

o

Teorema

de

Tchebychev.

 

18

20

20

21

22

24

25

25

26

27

 

29

29

30

30

31

31

32

33

34

35

36

36

37

37

37

37

38