Você está na página 1de 180

ESTATÍSTICA

SUMÁRIO

ESTATÍSTICA DESCRITIVA

1

1.1 Variável Aleatória

 

2

1.2 Tipos de Escalas e Variáveis

4

1.3 Tabelas

 

5

1.3.1 Normas para apresentação de tabelas

5

1.3.2 Tabelas de distribuição de frequências

6

1.3.2.1 Variável Discreta

6

1.3.2.2 Variável Contínua

8

1.4

Gráficos

9

1.4.1 Representação Gráfica

9

1.4.2 Histograma de Frequências

9

1.4.3 Diagrama de Ramo e Folhas (Stem and Leaf Plot)

10

1.4.4 Gráfico de Boxplot ou da Caixa

11

1.4.5 Gráfico de Linhas

12

1.5

Medidas de Localização, Variabilidade e Forma da Distribuição

12

1.5.1

Tendência Central

13

1.5.1.1 Esperança matemática ou média aritmética

13

1.5.1.2 Mediana

 

15

1.5.1.3 Moda

18

1.5.2

Medidas de Posição (ou Separatrizes)

20

1.5.2.1

Quartil

 

20

1.5.3

Medidas de Dispersão

22

1.5.3.1 Amplitude Total

22

1.5.3.2 Amplitude Interquartil

23

1.5.3.3 Desvio Médio

 

23

1.5.3.4 Variância e Desvio Padrão

24

1.5.3.5 Coeficiente de Variação

27

1.5.4

Forma da Distribuição

27

1.5.4.1 Coeficiente do momento de assimetria

27

1.5.4.2 Coeficiente do momento de curtose

28

Lista de Exercícios no. 1 Estatística Descritiva

31

ELEMENTOS DE PROBABILIDADES

34

2.1 Experimento Aleatório (E)

34

2.2 Espaço Amostral (S)

34

2.3 Evento

 

34

2.3.1 Evento Complementar

35

2.3.2 Eventos Independentes

35

2.3.3 Eventos

Mutuamente Exclusivos

36

2.4 Definição Clássica de Probabilidade

37

2.5 Definição Axiomática de Probabilidade

37

2.6 Probabilidade Condicional

37

2.7 Teorema da Probabilidade Total

38

2.8 Teorema de Bayes

39

Lista de Exercícios no. 2 - Probabilidades

40

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADES

43

3.1 Definições

 

43

3.2 Distribuições de Probabilidades Discretas

46

3.2.1 Distribuição binomial

46

3.2.2 Distribuição de Poisson

48

3.2.3 Distribuição Hipergeométrica

50

ii

SUMÁRIO

Lista de Exercícios no. 3 Distribuições de Probabilidades Discretas VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADES

4.1

4.2 Distribuições de Probabilidades Continuas

4.2.1 Distribuição Exponencial

4.2.2 Distribuição normal ou Gaussiana

4.3.2.1 Distribuição normal padronizada ou reduzida

4.3.3 Distribuição

4.3.4 Distribuição “ t ” de Student

4.3.5 Distribuição F de Snedecor

Lista de Exercícios no. 4 Distribuições de Probabilidades Contínuas

Definições

2

( qui-quadrado)

NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS

5.1

5.2 Amostragem Probabilística

5.2.1 Amostragem Aleatória Simples (AAS)

5.2.2 Amostragem Sistemática

5.2.3 Amostragem Estratificada

5.3 Distribuições Amostrais

5.3.1 Distribuição Amostral de Médias

5.3.2 Distribuição Amostral de Proporções

5.3.3 Distribuição Amostral da Variância

Introdução

ESTIMAÇÃO DE PARÂMETROS

6.1

6.2 Estimador e Estimativa

6.3 Qualidades de um Estimador

6.4 Estimação por Pontos

6.4.1 Estimador da Média Populacional

6.4.2 Estimador da Variância Populacional

6.4.3 Estimador do Desvio Padrão Populacional

6.4.4 Estimador da Proporção Populacional

6.5 Estimação por Intervalo

6.5.1 Intervalo de Confiança para Média populacional

6.5.2 Intervalo de Confiança para Diferença entre Duas Médias Populacionais 1 e 2

6.5.3 Intervalo de Confiança para a Variância Populacional

6.5.4 Intervalo de Confiança para o Desvio Padrão Populacional

6.5.5 Intervalo de Confiança para Proporção Populacional

6.6 Dimensionamento da Amostra

6.6.1 Estimação da Média Populacional

6.6.2 Estimação da Proporção Populacional

Lista de Exercícios no. 5 - Intervalos de Confiança

Introdução

TESTES DE HIPÓTESES

7.1 Etapas para Testes de Hipóteses

7.1.1 Nível de Significância

7.1.2 Erro Estatístico

7.2 Testes Estatísticos Paramétricos

7.2.1 Teste para a Média Populacional

7.2.1.1 Quando a variância populacional

7.2.1.2 Quando a variância populacional

7.2.2 Teste para a Proporção Populacional

2

2

é

é

Conhecida

desconhecida

7.2.3 Teste para a Variância Populacional

7.2.4 Teste para a Diferença entre Duas Médias Populacionais

7.2.4.1 Quando as variâncias populacionais

7.2.4.2 Quando as variâncias populacionais

7.2.5 Duas Amostras Emparelhadas

7.2.6 Teste para Igualdade de Duas Variâncias

1 1   2 2

2

e

2

e

2

são Conhecidas são Desconhecidas

2

SACHIKO ARAKI LIRA

52

54

54

56

56

57

59

61

62

63

64

66

66

66

66

67

68

68

68

72

72

74

74

74

74

75

75

75

76

76

76

76

80

84

85

86

87

87

88

89

92

92

92

93

93

93

93

95

96

98

100

100

102

106

107

iii

Lista de Exercícios no. 6 Testes de Hipóteses TESTES DE ADERÊNCIA

8.1 Teste Qui-quadrado de Aderência

8.2 Teste de Lilliefors

Lista de Exercícios no. 7 Testes de Aderência ANÁLISE DA VARIÂNCIA

9.1 Fundamentos da ANOVA

9.2 Análise da Variância a um Critério de Classificação

9.3 Comparações Múltiplas entre Médias

9.3.1 Teste de Scheffé

Lista de Exercícios no. 8 Análise da Variância

ANÁLISE DE CORRELAÇÃO E REGRESSÃ0 SIMPLES

10.1

10.2 Diagrama de Dispersão

10.3 Análise de Correlação

10.3.1 Coeficiente de Correlação Linear de Pearson

10.3.1.1 Teste de Hipóteses para Coeficiente de Correlação

10.4 Análise de Regressão Linear Simples

10.4.1 Estimação dos Parâmetros

10.4.2 Testes de Hipóteses na Regressão Linear 10.4.2.1Teste t

10.4.2.2 Análise da Variância

10.4.3 Coeficiente de Determinação ou Explicação

10.5 Ajuste de Curva Geométrica (ou Função Potência)

10.5.1 Estimativa dos Coeficientes

10.5.2 Testes de Hipóteses

10.5.2.1 Análise da Variância

10.5.3 Coeficiente de Determinação ou Explicação

10.6 Ajuste de Função Exponencial

10.6.1 Estimativa dos Coeficientes

10.6.2 Testes de Hipóteses

10.6.2.1 Análise da Variância

Introdução

10.6.3. Coeficiente de Determinação ou Explicação Lista de Exercícios no. 9 Análise de Correlação e Regressão ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA

11.1 Regressão Linear com 2 Variáveis Independentes

11.1.1 Estimativas dos Coeficientes de Regressão

1.1.2 Teste para Verificar a Existência de Regressão

11.1.3 Cálculo do Coeficiente de Determinação ou Explicação

Lista de Exercícios no. 10 Análise de regressão Linear Múltipla

BIBLIOGRAFIA TABELA A1.1 ÁREAS SOB A CURVA NORMAL TABELA A1.2 ÁREAS SOB A CURVA NORMAL TABELA A2 - DISTRIBUIÇÃO „t ‟ DE STUDENT

TABELA A3 - DISTRIBUIÇÃO DE

TABELA A4 - DISTRIBUIÇÃO „F‟ DE SNEDECOR (Nível de Significância 1%) TABELA A5 - DISTRIBUIÇÃO „F‟ DE SNEDECOR (Nível de Significância de 5%) TABELA A6 - DISTRIBUIÇÃO „F‟ DE SNEDECOR (Nível de Significância de 10%) TABELA A7 - VALORES CRÍTICOS (dc ) PARA TESTE DE LILLIERFORS

2

110

113

113

117

119

121

121

123

128

128

131

133

133

133

134

134

136

137

138

141

141

141

144

147

148

149

149

150

152

153

154

154

154

158

160

160

161

161

161

166

168

169

170

171

172

173

174

175

176

iv

SUMÁRIO

ESTATÍSTICA DESCRITIVA

INTRODUÇÃO

Estatística é a ciência que trata da coleta, organização, descrição, análise e interpretação dos dados experimentais. O diagrama abaixo mostra o contexto em que se situa o estudo completo da Estatística, aqui subdividido em Estatística Descritiva e Estatística Indutiva (ou Inferência Estatística).

Estatística Cálculo das Amostragem Descritiva Probabilidade Estatística Indutiva FIGURA 1 - ESQUEMA GERAL DA
Estatística
Cálculo das
Amostragem
Descritiva
Probabilidade
Estatística
Indutiva
FIGURA 1 - ESQUEMA GERAL DA ESTATÍSTICA
FONTE: COSTA NETO (1994), p. 04.

A Estatística Descritiva é a parte que trata da organização e descrição de dados, através dos

cálculos de médias, variâncias, estudo de gráficos, tabelas etc.

A Teoria das Probabilidades permite-nos modelar os fenômenos aleatórios, ou seja, aqueles em

que está presente a incerteza. É uma ferramenta fundamental para a inferência estatística.

A Estatística Indutiva compreende um conjunto de técnicas baseadas em probabilidades, que a

partir de dados amostrais, permite-nos tirar conclusões sobre a população de interesse.

A Amostragem é o ponto de partida para um estudo estatístico. O estudo de qualquer fenômeno, seja ele natural, social, econômico ou biológico, exige a coleta e a análise de dados estatísticos. A coleta de dados é, pois, a fase inicial de qualquer pesquisa.

A População é o conjunto de todas as observações potenciais sobre determinado fenômeno. O

conjunto de dados efetivamente observados, ou extraídos, constitui uma amostra da população.

É a partir do dado amostral, que se desenvolvem os estudos, com o objetivo de se fazer

inferências sobre a população.

SACHIKO ARAKI LIRA

1

1 ESTATÍSTICA DESCRITIVA

O objetivo da estatística descritiva é organizar os dados e apresentá-los de forma a possibilitar a visualização das informações subjacentes (que não são observáveis). As técnicas estatísticas e gráficas, disponíveis para a análise exploratória de dados, podem ser aplicadas a qualquer conjunto de dados, sejam para dados populacionais ou amostrais.

O parâmetro é uma medida numérica que descreve de forma reduzida alguma característica de uma população ou universo. É habitualmente representado por letras gregas. Por exemplo: μ (média), σ (desvio padrão), ρ (coeficiente de correlação). O parâmetro normalmente é desconhecido e, deseja-se estimar através de dados amostrais.

Estatística ou medida amostral é uma medida numérica que descreve alguma característica de

uma amostra. É habitualmente representada por letras latinas. Por exemplo: X (média), S (desvio padrão), r (coeficiente de correlação).

Em resumo, a análise exploratória de dados permite organizar os dados através de tabelas, gráficos e medidas de localização e dispersão, procurando mostrar um padrão ou comportamento de um conjunto de dados.

1.1 VARIÁVEL ALEATÓRIA

Variável aleatória é aquela cujo valor numérico não é conhecido antes da sua observação. Esta tem uma distribuição de probabilidades associada, o que permite calcular a probabilidade de ocorrência de certos valores.

Geralmente, utilizam-se letras maiúsculas (X, Y, Z para designar as variáveis aleatórias, e

minúsculas (x, y, z

uma variável aleatória é descrito por sua distribuição de probabilidade.

para indicar particulares valores dessas variáveis. O comportamento de

)

)

Exemplo: Suponha que em um lote de 10 parafusos, 2 são defeituosos. A variável aleatória X=número de parafusos defeituosos, na escolha de 3 parafusos com reposição, pode assumir os seguintes valores:

X(s)

0,se s

1, se s

2, se

s

3, se

s

PPP

DPP ou s

DDP ous

PDP ou s

PPD

DPD ous

PDD

DDD

sendo P=perfeito e D=defeituoso.

DISTRIBUIÇÃO DE PROBABILIDADES DA VARIÁVEL ALEATÓRIA X

X x

P(X x)

 

0
1 2 3 (2/10) (8 3 3   10) (8 (8 10) 10) 3 3  

0 1 2 3 (2/10) (8 3 3   10) (8 (8 10) 10) 3
0 1 2 3 (2/10) (8 3 3   10) (8 (8 10) 10) 3
0 1 2 3 (2/10) (8 3 3   10) (8 (8 10) 10) 3

2

0,512 0,008 (2 (2 10) 10)

0 1 2 3 (2/10) (8 3 3   10) (8 (8 10) 10) 3
0 1 2 3 (2/10) (8 3 3   10) (8 (8 10) 10) 3

2

 

0,096 0,384

2

ESTATÍSTICA DESCRITIVA

A função de distribuição ou função de distribuição acumulada da v. a X é definida por FX(x) PX( X x) ,x R , ou seja, é definida como sendo a probabilidade de X assumir um valor

menor ou igual a x. Para o exemplo tem-se:

FUNÇÃO

ALEATÓRIA X

DE

DISTRIBUIÇÃO

ACUMULADA

DA

VARIÁVEL

X x

 

P(X x)

 

F (x)

X

0 (8 10)

0 (8 10)

3

 

0,512

0,512 0,008 (2 (2 10) 10)

2

 0,512 0,008  (2 (2 10) 10) 2 2 1 2 3 (2/10) 3 3
 0,512 0,008  (2 (2 10) 10) 2 2 1 2 3 (2/10) 3 3

2

1 2 3 (2/10) 3 3   (8 (8 10) 10) 3

 0,512 0,008  (2 (2 10) 10) 2 2 1 2 3 (2/10) 3 3
 0,512 0,008  (2 (2 10) 10) 2 2 1 2 3 (2/10) 3 3

 

0,096 0,384

0,896

0,992

1,000

1.1.1 ARREDONDAMENTO DE NÚMEROS

1. Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica inalterado o último

número que permanecer.

Exemplo: seja o número 48,231, ao arredondar para 2 casas decimais ficará 48,23.

2. Quando o primeiro algarismo a ser abandonado for 6, 7, 8 ou 9, aumenta-se de uma unidade

o último algarismo a permanecer.

Exemplo: o número 23,077, ao arredondar para 2 casas decimais ficará 23,08.

3. Quando o primeiro algarismo a ser abandonado for 5, haverá duas formas:

a) como regra geral, aumenta-se de uma unidade o último algarismo a permanecer.

Exemplo: 12,5253 ficará 12,53.

b) se ao 5 só seguirem zeros, o último algarismo a ser conservado só será aumentado se for

ímpar.

Exemplo: 24,7750 passa a ser 24,78

24,7650 passa a ser 24,76.

Exemplos: arredondar os números dados para 2 casa decimais.

17,44452 ficará 17,44;

179,5673 ficará 179,57;

87,4931 ficará 87,49;

4,5652 ficará 4,57;

4,5650 ficará 4,56;

4,575 ficará 4,58.

SACHIKO ARAKI LIRA

3

4.

Quando houver parcelas e total, e ocorrer diferença no arredondamento, deve-se fazer

correção na parcela (ou parcelas) onde o erro relativo for menor.

Exemplo:

2,4

para

2

13,4

14

16,1

16

-----

----

31,9

32

1.2 TIPOS DE ESCALAS E VARIÁVEIS

Uma variável pode se apresentar das seguintes formas, quanto aos valores assumidos:

1. o Escala nominal: é aquela que permite o agrupamento da unidade de observação (unidade da

pesquisa) de acordo com uma classificação qualitativa em categorias definidas, ou seja, consiste

simplesmente em nomear ou rotular, não sendo possível estabelecer graduação ou ordenamento.

Ao se trabalhar com essa escala, cada unidade de observação deve ser classificada em uma e

somente uma categoria, isto é, deve ser mutuamente excludente.

Por exemplo, seja X, a variável, estado de uma peça de automóvel. Neste caso, a variável X

assume as categorias “perfeita” e “defeituosa”, sendo denominada dicotômica. Quando assume

mais de duas categorias é denominada politômica. Não tem significado aritmético ou de

quantificação, não se faz cálculos, apenas a contagem.

2. o Escala ordinal: permite o agrupamento da unidade de observação de acordo com uma ordem de classificação. A escala ordinal fornece informações sobre a ordenação das categorias, mas não indica a grandeza das diferenças entre os valores.

Exemplo: Seja X a variável que indica a qualidade de um determinado produto. Tem-se então: A (indicando melhor qualidade), B (qualidade intermediária) e C (pior qualidade).

3.º Escala intervalar: é uma escala ordinal em que a distância entre as categorias é sempre a mesma. As escalas para medir temperaturas como a Fahrenheit e a Centígrada são exemplos de escalas de intervalo. Não se pode afirmar que 40 graus é duas vezes mais quente que uma temperatura de 20 graus, embora se possa dizer que a diferença entre 20 graus e 40 graus é a mesma que entre 75 graus e 95 graus.

4.º Escala de razão: quando uma escala tem todas as características de uma escala intervalar e

o zero absoluto representa o ponto de origem, é chamada escala de razão. Sempre que possível,

é preferível utilizar a medida de escala de razão, pois a partir desta pode-se transformar em escala intervalar, ordinal ou nominal, não ocorrendo o inverso.

De acordo com o nível de mensuração, a variável pode ser classificada em qualitativa ou quantitativa. Variável qualitativa é aquela cujo nível de mensuração é nominal ou ordinal, enquanto a quantitativa é aquela em que o nível de mensuração é intervalar ou de razão.

4

ESTATÍSTICA DESCRITIVA

A variável quantitativa pode ser ainda discreta ou contínua, sendo a primeira resultante de contagem, assumindo somente valores inteiros, e a última de medições, assumindo qualquer valor no campo dos números reais. Apresentam-se, a seguir, os conceitos de variáveis quantitativas discretas e contínuas.

Variável aleatória discreta: uma variável aleatória X é discreta se o conjunto de valores possíveis de X for finito ou infinito numerável.

Variável aleatória contínua: a variável aleatória X é chamada de contínua quando o seu contradomínio é um conjunto infinito.

Variável

Qualitativa o seu contradomínio é um conjunto infinito. Variável Nominal Ordinal Quantitativa Discreta Contínua FIGURA 2 -

Nominal é um conjunto infinito. Variável Qualitativa Ordinal Quantitativa Discreta Contínua FIGURA 2 - TIPOS DE

Ordinalé um conjunto infinito. Variável Qualitativa Nominal Quantitativa Discreta Contínua FIGURA 2 - TIPOS DE

Quantitativaum conjunto infinito. Variável Qualitativa Nominal Ordinal Discreta Contínua FIGURA 2 - TIPOS DE VARIÁVEIS Exemplo

Discreta infinito. Variável Qualitativa Nominal Ordinal Quantitativa Contínua FIGURA 2 - TIPOS DE VARIÁVEIS Exemplo de

ContínuaVariável Qualitativa Nominal Ordinal Quantitativa Discreta FIGURA 2 - TIPOS DE VARIÁVEIS Exemplo de aplicação :

FIGURA 2 - TIPOS DE VARIÁVEIS

Exemplo de aplicação: Seja uma população de peças produzidas em um determinado processo. É possível ter as seguintes situações:

VARIÁVEL

TIPO

Estado: Conforme ou Não-conforme

Qualitativa Nominal

Qualidade: 1ª., 2ª. ou 3ª. categoria

Qualitativa Ordinal

Número de peças conformes

Quantitativa Discreta

Comprimento das peças

Quantitativa Contínua

1.3 TABELAS

1.3.1 NORMAS PARA APRESENTAÇÃO DE TABELAS

Uma tabela deve apresentar os dados de forma resumida, oferecendo uma visão geral do comportamento do fenômeno analisado.

Uma tabela é constituída dos seguintes elementos:

1 - Título: é a indicação que precede a tabela e contém a identificação de três fatores do fenômeno.

a) A data a qual se refere;

b)

o local onde ocorreu o evento;

c)

o fenômeno que é descrito.

2

- Cabeçalho: é a parte superior da tabela que especifica o conteúdo das colunas.

3

- Corpo da tabela: é o espaço que contém as informações sobre o fenômeno observado.

4 - Fonte: é a indicação da entidade responsável pelo levantamento dos dados.

1.3.2 TABELAS DE DISTRIBUIÇÃO DE FREQUÊNCIAS

Serão apresentados alguns conceitos importantes para a construção de tabelas de frequências.

Dados brutos:

organizados.

É

o

conjunto de

dados numéricos

obtidos

e

que

ainda

não foram

Rol: É o arranjo dos dados brutos em ordem crescente (ou decrescente).

Amplitude (At): É a diferença entre o maior e o menor dos valores observados.

Frequência absoluta ( fi ): É o número de vezes que um elemento aparece no conjunto de

dados:

k

i 1

f

i

n onde n é o número total de observações e k é o número de valores diferentes

observados.

f

Frequência Relativa ( fr ):

r

f

i

n

e

k

1

i

f

r

1

Frequência Absoluta Acumulada ( fac ): É a soma da frequência absoluta do valor i assumida

pela variável com todas as frequências absolutas anteriores.

1.3.2.1 VARIÁVEL DISCRETA

Quando uma variável quantitativa discreta assume poucos valores, pode-se considerar que cada valor seja uma classe e que existe uma ordem natural nessas classes.

Exemplo: Os dados que seguem apresentam os resultados da inspeção diária de todas as unidades de computadores produzidos durante os últimos 10 dias. O número de unidades não -

conformes são: 4 - 7 - 5 - 8 - 6 - 6 - 4 - 5 - 8 - 7

6

ESTATÍSTICA DESCRITIVA

TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS DO NÚMERO DE UNIDADES NÃO CONFORMES DE COMPUTADORES PRODUZIDOS DURANTE 10 DIAS

NÚMERO DE DEFEITOS

FREQUÊNCIA

4

2

5

2

6

2

7

2

8

2

FONTE: MONTEGOMERY, D. C.

NOTA: A produção diária é de 100 computadores.

Número de Classes (k)

Quando se tratar de uma variável quantitativa discreta que pode assumir um grande número de valores distintos, a construção da tabela de frequências e de gráficos considerando cada valor como uma categoria fica inviável. A solução é agrupar os valores em classes ao elaborar a tabela.

Segundo Bussab e Morettin, a escolha dos intervalos dependerá do conhecimento que o pesquisador tem sobre os dados. Assim, a definição do número de intervalos ou classes é arbitrária. Mas, vale lembrar que, quando se utiliza um pequeno número de inte rvalos pode-se perder informações, e ao contrário, com um grande número de intervalos pode-se prejudicar o resumo dos dados.

Existem duas soluções para a definição do número de intervalos bastante utillizadas, que são:

1) Se o número de elementos (n) for menor que 25 então o número de classes (k) é igual a 5; se n for maior que 25, então o número de classes é aproximadamente a raiz quadrada positiva de n. Ou seja:

Para

n 25, k = 5

Para

n > 25, k =

n
n

2) Fórmula de Sturges para número de classes: k 13,3log(n) .

Amplitude total ou “range(At): É a diferença entre o maior e o menor valor observados no conjunto de dados.

At Xmáx Xmin

Amplitude dos intervalos ou das classes (h): É a divisão da amplitude total (At) pelo número de intervalos (k).

At

Ou seja: h k

1.3.2.2 VARIÁVEL CONTÍNUA

Quando a variável quantitativa em estudo é contínua, que assume muitos valores distintos, o agrupamento dos dados em classes será sempre necessário, na construção das tabelas de frequências.

Exemplo 1: A tabela abaixo apresenta as medidas de uma dimensão de uma peça produzida por um processo de usinagem. Construir a tabela de distribuição de frequências em classes.

102,8 - 136,4 - 110,1 - 115,9

- 118,5 - 149,3 - 125,3 - 144,8 - 129,7 - 132,7

135,0 108,2 - 138,1 - 138,6 - 139,6 - 144,4 - 125,9 - 145,2 - 145,7 120,4

ROL:

102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7

135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3

At Xmáx Xmin 149,3 102,8 46,50

k 5

h

A

t

46,50

k

5

9,3

10

TABELA DE DISTRIBUIÇÃO DE FREQUENCIAS DAS MEDIDAS DE UMA DIMENSÃO DE UMA PEÇA PRODUZIDA POR UM PROCESSO DE USINAGEM

INTERVALO DE

CLASSES

fi

fr

fac

102,8 |--- 112,8

3

0,15

3

112,8 |--- 122,8

3

0,15

6

122,8 |--- 132,8

4

0,20

10

132,8 |--- 142,8

5

0,25

15

142,8 |--- 152,8

5

0,25

20

TOTAL

20

1,00

FONTE: Elaborada pelo autor.

Exemplo 2: O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos), sendo feita 30 determinações:

45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 - 34 - 45

41 - 57 - 38 - 46 - 46 - 58 - 57 - 36 - 58 - 35 - 31 - 59 - 44 - 57 - 35

8

ESTATÍSTICA DESCRITIVA

ROL:

31

- 34 - 35 - 35 - 36 - 37 - 38 - 39 - 39 - 40 - 41 -41 - 43 - 44 - 45

45

- 45 - 45 - 46 - 46 - 48 - 49 - 51 - 53 - 57- 57 - 57 - 58 - 58 59

At Xmáx Xmin 59 3128,0

k 13,3log(30) 5,87 6

h

A

t

k

28

6

4,7

5

(fórmula de Sturges)

TABELA DE DISTRIBUIÇÃO DE FREQUENCIAS DO TEMPO NECESSÁRIO PARA SE REALIZAR CERTA OPERAÇÃO INDUSTRIAL

INTERVALO DE

CLASSES

fi

fr

fac

1.4 GRÁFICOS

31

|---- 36

4

0,13

4

36

|---- 41

6

0,20

10

41

|---- 46

8

0,27

18

46

|---- 51

4

0,13

22

51

|---- 56

2

0,07

24

56

|---- 61

6

0,20

30

TOTAL

30

1,00

FONTE: Elaborada pelo autor.

1.4.1 REPRESENTAÇÃO GRÁFICA

O objetivo do gráfico é passar para o leitor uma visão clara do comportamento do fenômeno em estudo, uma vez que os gráficos transmitem informação mais imediata do que uma tabela.

A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais:

a) Simplicidade: O gráfico deve ser destituído de detalhes de importância secundária.

b) Clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos do

fenômeno em estudo.

c) Veracidade: o gráfico deve ser a verdadeira expressão do fenômeno em estudo.

1.4.2 HISTOGRAMA DE FREQUÊNCIAS

Este é um gráfico usado para apresentar dados organizados em intervalos de classes, utilizado principalmente para representar a distribuição de variáveis contínuas.

SACHIKO ARAKI LIRA

9

HISTOGRAMA DE FREQUÊNCIAS

Freq.

10 9 8 7 6 5 4 3 2 1 0 76 105 134 163
10
9
8
7
6
5
4
3
2
1
0
76
105
134
163
192
221
250

Classes

1.4.3 DIAGRAMA DE RAMO E FOLHAS (STEM AND LEAF PLOT)

Este diagrama é muito útil para uma primeira análise dos dados.

Passos para construir um diagrama de ramo e folha:

1. ordenar os valores para encontrar o valor mínimo e máximo dos dados;

2. dividir cada número xi em duas partes: um ramo, consistindo em um ou mais dígitos iniciais, e

uma folha, consistindo nos dígitos restantes ;

3. listar os valores do ramo em uma coluna vertical;

4. a partir dai colocam-se os valores na folha . O valor zero, significa que há informação e que é

um número inteiro. Já, quando naquele valor inteiro não existe observações, não colocar nada, deixar em branco;

5. escrever as unidades para o ramo e folhas no gráfico.

Considerando os dados do exemplo 1: Os dados referem-se às medidas de uma dimensão de uma peça produzida por um processo de usinagem.

102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7

135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3

RAMO

FOLHA

FREQ.

10 2 8

2

11 0 5 8

3

12 0 5 5 9

4

13 2 5 6 8 8 9

6

14 4 4 5 5 9

5

10

ESTATÍSTICA DESCRITIVA

Considerando os dados do exemplo 2, tem-se: O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos):

31

- 34 - 35 - 35 - 36 - 37 - 38 - 39 - 39 - 40 - 41 -41 -

43 - 44 - 45

45

- 45 - 45 - 46 - 46 - 48 - 49 - 51 - 53 - 57- 57 - 57 - 58 - 58 59

RAMO

FOLHA

FREQ.

3 1 4 5 5 6 7 8 9 9

9

4 0 1 1 3 4 5 5 5 5 6 6 8 9

13

5 1 3 7 7 7 8 8 9

8

1.4.4 GRÁFICO DE BOXPLOT OU DA CAIXA

*

O

O

*

Valores extremos: valores maiores que 3 compri- mentos da caixa, a partir do Quartil 3

Outliers: valores maiores que 1,5 comprimentos da caixa, a partir do Quartil 3

maiores que 1,5 comprimentos da caixa, a partir do Quartil 3 Maior valor que não é

Maior valor que não é outlier

caixa, a partir do Quartil 3 Maior valor que não é outlier Quartil 3 Quartil 2

Quartil 3caixa, a partir do Quartil 3 Maior valor que não é outlier Quartil 2 = mediana

Quartil 2 = medianado Quartil 3 Maior valor que não é outlier Quartil 3 Quartil 1 Menor valor que

Quartil 1valor que não é outlier Quartil 3 Quartil 2 = mediana Menor valor que não é

que não é outlier Quartil 3 Quartil 2 = mediana Quartil 1 Menor valor que não

Menor valor que não é outlier

2 = mediana Quartil 1 Menor valor que não é outlier Outliers : valores menores que

Outliers: valores menores que 1,5 comprimentos da caixa, a partir do Quartil 1

Valores extremos: valores menores que 3 compri- mentos da caixa, a partir do Quartil 1

Comprimento da caixa = amplitude interquartílica = Q 3 - Q 1

A linha central do retângulo (“caixa”) representa a mediana da distribuição. As bordas superior e inferior do retângulo representam os quartis 1 e 3, respectivamente. Logo, a altura deste retângulo é chamada de amplitude interquartílica (IQ). Os traços horizontais ao final das linhas verticais são traçados sobre o último ponto (de um lado ou de outro) que não é considerado um outlier.

Não há um consenso sobre a definição de um outlier. Porém, no caso do boxplot em geral, a maior parte das definições considera que pontos acima do valor do 3º quartil somado a 1,5 vezes

SACHIKO ARAKI LIRA

11

a IQ ou os pontos abaixo do valor do 1º quartil diminuído de 1,5 vezes a IQ, são considerados outliers.

1.4.5 GRÁFICO DE LINHAS

O gráfico de linhas é indicado para representar séries temporais ou sequência temporal, que é

um conjunto de dados em que as observações são registradas na ordem em que elas ocorrem.

Este tipo de gráfico é importante para a análise do controle de processo de produção e de

séries temporais.

A seguir, o gráfico de controle de média das medidas dos diâmetros internos (mm) de anéis de

pistão de motores de automóveis, de 25 amostras, cujos tamanhos de amostras variam entre 3

e 5.

25 amostras, cujos tamanhos de amostras variam entre 3 e 5. 1.5 M EDIDAS DE D

1.5

MEDIDAS

DE

DISTRIBUIÇÃO

LOCALIZAÇÃO,

VARIABILIDADE

E

FORMA

DA

Estimador ou estatística é uma função dos valores da amostra, ou seja, é uma variável aleatória, pois depende dos elementos selecionados para compor a amostra.

Ao analisarmos a distribuição de frequências de uma variável quantitativa, proveniente de uma amostra, deve-se, verificar basicamente três características:

Localização;

Variabilidade ou Dispersão;

Forma.

12

ESTATÍSTICA DESCRITIVA

1.5.1 TENDÊNCIA CENTRAL

As medidas de tendência central fazem parte, juntamente com as de posição, das chamadas medidas de localização, e indicam onde se concentra a maioria dos dados.

1.5.1.1 ESPERANÇA MATEMÁTICA OU MÉDIA ARITMÉTICA

A esperança matemática ou média aritmética de uma variável aleatória X é o centro de gravidade do conjunto de dados, e é definida como a soma de todos os valores da variável dividida pelo número de observações.

a) Para dados simples

A esperança matemática ou média aritmética populacional é dada pela expressão:

E( X)

1

N

N

i 1

x

i

A média aritmética amostral é obtida através da seguinte expressão:

1 X   n x n i i  1
1
X 
n
x
n
i
i  1

b) Para dados agrupados em classes

E( X)

k

1

i

x f

i

i

N

(população)

onde: k é o número de classes;

xi é o ponto médio das classes.

k

 x f i i X  i  1
x f
i
i
X 
i
1

n

(amostra)

onde: k é o número de classes;

xi é o ponto médio das classes.

Propriedades da Esperança Matemática

1. E( XK) E(X)K , sendo k=constante e X v.a.

2. E( X.K) kE(X) E( XY) E(X)E(Y)

3. Sejam X e Y variáveis aleatórias. Então:

4. Sejam X e Y variáveis aleatórias independentes. Então:

E( X.Y) E(X).E(Y)

SACHIKO ARAKI LIRA

13

5.

E( X X) 0

v.a. centrada

A média e os valores extremos: a média apresenta um grave problema, ela é fortemente influenciada pelos valores extremos. Por esta razão, deve-se fazer uma análise cuidadosa dos dados.

Exemplos de aplicação:

1) Suponha que um engenheiro esteja projetando um conector de náilon para ser usado em uma aplicação automotiva. O engenheiro estabelece como especificação do projeto uma espessura de 3/32 polegadas, mas está inseguro acerca do efeito dessa decisão na força da remoção do conector.

Oito unidades do protótipo são produzidas e suas forças de remoção são medidas (em libras-pé):

12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1. A média da força de remoção será:

1 X   n x n i i  1  12,6 8
1
X 
n
x
n
i
i  1
12,6
8

12,9

13,4

12,3

13,6

13,5

12,6

13,1

104

8

2) Considere a seguinte distribuição:

13,0

libras-força

TABELA DE DISTRIBUIÇÃO DE FREQUENCIAS DO TEMPO NECESSÁRIO PARA SE REALIZAR CERTA OPERAÇÃO INDUSTRIAL

INTERVALO DE

CLASSES

fi

fr

fac

31

|---- 36

4

0,13

4

36

|---- 41

6

0,20

10

41

|---- 46

8

0,27

18

46

|---- 51

4

0,13

22

51

|---- 56

2

0,07

24

56

|---- 61

6

0,20

30

TOTAL

30

1,00

FONTE: Elaborada pelo autor.

Calcular o tempo médio necessário para realizar a operação industrial.

Solução:

INTERVALO DE

CLASSES

fi

xi

xifi

14

31

|---- 36

4

33,5

134,0

36

|---- 41

6

38,5

231,0

41

|---- 46

8

43,5

348,0

46

|---- 51

4

48,5

194,0

51

|---- 56

2

53,5

107,0

56

|---- 61

6

58,5

351,0

TOTAL

30

1365,0

ESTATÍSTICA DESCRITIVA

k

x f

i

X

i

1

i

1365

n 30

45,50

3) Seja a distribuição de frequências a seguir. Calcular a média das medidas da dimensão das

peças.

TABELA DE DISTRIBUIÇÃO DE FREQUENCIAS DAS MEDIDAS DE UMA DIMENSÃO DE UMA PEÇA PRODUZIDA POR UM PROCESSO DE USINAGEM

INTERVALO DE

CLASSES

fi

fr

fac

102,8 |--- 112,8

3

0,15

3

112,8 |--- 122,8

3

0,15

6

122,8 |--- 132,8

4

0,20

10

132,8 |--- 142,8

5

0,25

15

142,8 |--- 152,8

5

0,25

20

TOTAL

20

1,00

FONTE: Elaborada pelo autor.

INTERVALO DE

CLASSES

fi

xi

xifi

102,8 |--- 112,8

3

112,8 |--- 122,8

3

122,8 |--- 132,8

4

132,8 |--- 142,8

5

142,8 |--- 152,8

5

TOTAL

20

107,8

323,4

117,8

353,4

127,8

511,2

137,8

689,0

147,8

739,0

2616,0

k

x f

i

X

i

1

i

2616

n 20

130,8

1.5.1.2 MEDIANA

A mediana é o valor que ocupa a posição central do conjunto de observações de uma variável, dividindo o conjunto em duas partes iguais, sendo que 50% dos dados tomam valores menores ou iguais ao valor da mediana e os 50% restantes, acima do seu valor.

SACHIKO ARAKI LIRA

15

a) Para dados simples

Etapas para a obtenção da mediana:

1. ordenar os dados em ordem crescente (pode ser também na ordem decrescente, mas não é

comum e pode atrapalhar na hora de calcular as medidas de posição)

2. o lugar ou posição que a mediana ocupa é:

PosM

e

2

(n

1)

4

1

3. o valor da mediana é o valor da variável que ocupa o lugar PosM e .

A mediana é independente dos valores extremos, porque ela só leva em consideração os valores de posição central.

Exemplo de aplicação:

1) Considerando-se as forças de remoção, medidas em uma amostra de oito unidades do protótipo

(em libras-força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1.

Rol: 12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6

PosM

e

2

(8

1)

4

 

1

4,5

A mediana é a média aritmética dos valores que ocupam a posição 4 e 5. Logo,

M e

12,9

13,1

2

13,0

2) Os dados que seguem são os resultados da inspeção diária de todas as unidades de computadores produzidos durante os últimos 10 dias. O número de unidades não-conformes são:

4 - 7 - 5 - 8 - 6 - 6 - 4 - 5 - 8 - 7

Calcular a mediana.

Rol: 4 - 4 - 5 - 5 - 6 - 6 - 7 - 7 - 8 - 8

PosM M e

e

6

2

6

2

(10

1)

6

4

 

1

5,5

b) Dados agrupados em classes

(n 2)  fac M  L   h e i f i
(n 2)

fac
M
L
 h
e
i
f
i

16

ESTATÍSTICA DESCRITIVA

onde:

Li é o limite inferior da classe que contém a mediana;

n é o número de elementos do conjunto de dados; 'fac é a freqüência acumulada da classe anterior a que contém a mediana;

fi é a freqüência simples da classe que contém a mediana;

h é o intervalo ou amplitude da classe que contém a mediana.

1) Seja a distribuição de frequências a seguir. Calcular a mediana das medidas da dimensão

das peças.

INTERVALO DE

CLASSES

fi

102,8 |--- 112,8

3

112,8 |--- 122,8

3

122,8 |--- 132,8

4

132,8 |--- 142,8

5

142,8 |--- 152,8

5

TOTAL

20

Solução:

1) O passo inicial é calcular

n

2 2

20

10

;

2) Calcular as frequências acumuladas ( fac ).

INTERVALO DE

fi

fac

CLASSES

102,8 |--- 112,8

3

3

112,8 |--- 122,8

3

6

122,8 |--- 132,8

4

10

132,8 |--- 142,8

5

15

142,8 |--- 152,8

5

20

TOTAL

20

(n 2)  fac M  L   h e i f i (20
(n 2)

fac
M
L
 h
e
i
f
i
(20 2)
6
M
122,8
e
4

10

132,8

SACHIKO ARAKI LIRA

17

2) Considerando a distribuição a seguir, calcular a mediana.

INTERVALO DE

CLASSES

fi

 

31

|---- 36

4

36

|---- 41

6

41

|---- 46

8

46

|---- 51

4

51

|---- 56

2

56

|---- 61

6

TOTAL

 

30

Solução:

 

INTERVALO DE

fi

fac

CLASSES

30 n   15 2 2 (n 2)  fac M  L 
30
n 
 15
2
2
(n 2)

fac
M
L
e
i
f
i
(15)
10
M
41
e
8

h

5

1.5.1.3 MODA

a) Para dados simples

31 |---- 36

36

41

46

51

56

|---- 46

|---- 41

|---- 51

|---- 56

|---- 61

TOTAL

4

4

6

10

8

18

4

22

2

14

6

30

30

44,125

A moda, representada por Mo , é o valor que apresenta maior frequência. Ela pode não existir

(distribuição amodal), ter somente um valor (unimodal) ou pode ter dois ou mais (bimodal ou multimodal), principalmente quando a variável assume muitos valores.

Exemplo:

1) Considerando-se as forças de remoção, medidas em uma amostra de oito unidades do protótipo

(em libras-força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1.

Para o exemplo tem-se que a moda é igual a 12,6 libras-força.

18

ESTATÍSTICA DESCRITIVA

b) Dados agrupados em classes

Mo 3Me 2X

onde:

( moda de Pearson)

Me é a mediana da distribuição de dados;

X é a média da distribuição de dados.

1) Dada a distribuição de freqüências a seguir, calcular a moda.

INTERVALO DE

CLASSES

fi

31

|---- 36

4

36

|---- 41

6

41

|---- 46

8

46

|---- 51

4

51

|---- 56

2

56

|---- 61

6

TOTAL

30

Solução:

Tem-se que a média e a mediana da distribuição são, respectivamente:

X 45,50

Me 44,125

Logo, a moda será: Mo 3Me 2X 344,125245,50 41,375

2) Seja a distribuição de frequências a seguir. Calcular a moda das medidas da dimensão das peças.

INTERVALO DE

CLASSES

fi

102,8 |--- 112,8

3

112,8 |--- 122,8

3

122,8 |--- 132,8

4

132,8 |--- 142,8

5

142,8 |--- 152,8

5

TOTAL

20

Solução:

Tem-se que a média e a mediana da distribuição são, respectivamente:

SACHIKO ARAKI LIRA

19

X 130,8

M

e

122,8

(20 2)  6
(20 2)
6

4

10

132,8

Mo 3Me 2X 3132,8 2130,8 136,8

1.5.2 MEDIDAS DE POSIÇÃO (OU SEPARATRIZES)

As separatrizes mais conhecidas são os quartis e os percentis. Os quartis dividem o conjunto de dados em quatro partes iguais e os percentis, em cem partes iguais. A cada quartil correspondem 25% do conjunto de dados e a percentil, 1%.

Da mesma forma que para a mediana, as posições das separatrizes, para dados ordenados em ordem crescente.

1.5.2.1 QUARTIL

São três medidas (Q1, Q2 e Q3 ) que dividem o conjunto de dados em 4 partes iguais, sendo

que a cada quartil correspondem 25% dos dados.

a) Para dados simples

PosQ

i

 

i

(n

1)

4

1

,

i 1,2,3

Exemplo 1: Os dados a seguir são diâmetros (em cm) de peças de automóveis:

12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0

Calcular os quartis.

PosQ

PosQ

PosQ

1

2

3

 

1

(9

1)

4

 

1

3,0

2

3

(9

1)

(9

4

1)

4

1

1

5,0

7,0

(3 º elemento) , logo Q1 12,6

(5 º elemento) , logo

(7 º elemento) , logo

Q3 Q2   13,5 13,1

Exemplo 2: Os dados abaixo são as medidas de uma dimensão de uma peça produzida por um processo de usinagem.

102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7

135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 144,4 - 144,8 - 145,2 - 145,7 - 149,3

Calcular os quartis (1,2 e 3) .

20

ESTATÍSTICA DESCRITIVA

PosQ

1

 

1

(20

1)

4

 

1

5,75

(5,75 º elemento) ,

logo Q1 118,5 (120,4 118,5)* 0,75 119,925

PosQ

2

2

(20

1)

4

1

10,5

(10,5 º elemento) ,

logo Q2 132,7 (135,0 132,7)* 0,5 133,85

PosQ

3

3

(20

1)

4

1

15,25

(15,25 º elemento) ,

logo Q3 139,6 (144,4 139,6)* 0,25 140,80

b) Para dados agrupados em classes

PosQ

i

Q

i

L

i

onde:

i

n

4

,

i 1,2,3

(PosQ )

i



fac

f

i

h

n é o número de elementos do conjunto de dados; Li é o limite inferior da classe que contém o quartil;

'fac é a freqüência acumulada da classe anterior a que contém o quartil; fi é a freqüência simples da classe que contém o quartil;

h é o intervalo ou amplitude da classe que contém a mediana.

Exemplos:

1) Seja a distribuição de frequências a seguir. Calcular os quartis 1,2 e 3, das medidas da

dimensão das peças.

INTERVALO DE

fi

fac

CLASSES

102,8 |--- 112,8

3

3

112,8 |--- 122,8

3

6

122,8 |--- 132,8

4

10

132,8 |--- 142,8

5

15

142,8 |--- 152,8

5

20

TOTAL

20

Solução:

a)

PosQ

1

1

20

4

5

SACHIKO ARAKI LIRA

21

5

3

20

4

10

3

10

6

15

Q1

PosQ

Q2

PosQ

Q

3

112,8

2

122,8

2

3

132,8

3

10

119,47

4

20

4

15

10

5

10

132,80

10

142,80

2) Dada a distribuição de freqüências a seguir, calcular os quartis 1,2 e 3.

INTERVALO DE

CLASSES

fi

31

|---- 36

4

36

|---- 41

6

41

|---- 46

8

46

|---- 51

4

51

|---- 56

2

56

|---- 61

6

TOTAL

30

1.5.3 MEDIDAS DE DISPERSÃO

Para descrever adequadamente a distribuição de freqüências de uma variável quantitativa, além da informação do valor representativo da variável (tendência central), é necessário dizer também o quanto estes valores variam, ou seja, o quanto eles são dispersos. Somente a informação sobre a tendência central de um conjunto de dados não consegue representá-lo adequadamente. As medidas de dispersão medem o grau de variabilidade ou dispersão dos dados.

1.5.3.1 AMPLITUDE TOTAL

A amplitude total mede a distância entre o valor máximo e mínimo. Ela é uma estatística rudimentar, pois embora forneça uma noção de dispersão, não diz qual é sua natureza.

At Xmáx Xmin

Exemplo de aplicação:

Exemplo 1: Os dados a seguir são diâmetros (em cm) de peças de automóveis:

12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0

Tem-se que:

22

ESTATÍSTICA DESCRITIVA

At Xmáx Xmin 15,0 12,3 2,7

1.5.3.2 AMPLITUDE INTERQUARTIL

A amplitude interquartil, ou comprimento da caixa, é a distância entre o primeiro e terceiro quartil. É muito útil para detectar valores extremos, e é usado no diagrama de Boxplot.

IQ Q3 Q1

Exemplo: considerando o dados referentes aos diâmetros (em cm) de peças de automóveis e os quartis correspondentes, já calculados anteriormente, calcular a amplitude interquartil.

PosQ

PosQ

1

3

 

1

(9

1)

4

 

1

3,0

3

(9

1)

4

1

 

7,0

IQ 13,5 12,6 0,9

(3 º elemento) , logo Q1 12,6

(7 º elemento) , logo Q3 13,5

Para a construção do gráfico Box plot, tem-se:

limite limite inferior sup erior   Q1 Q3 1,5IQ 1,5IQ limite limite inferior sup erior   12,6 13,5 1,50,9 1,50,9   11,25 14,85

Para o exemplo em questão:

Existe um valor outlier, que é 15,0.

1.5.3.3 DESVIO MÉDIO

a) Para dados simples

O desvio médio é a média dos valores absolutos dos desvios. É calculada através da

expressão: n  x  X i DM  i  1
expressão:
n
x
X
i
DM 
i
1

n

Exemplo de aplicação:

Os dados a seguir são diâmetros (em cm) de peças de automóveis:

12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0. Tem-se que: X 13,22

SACHIKO ARAKI LIRA

23

QUADRO 3 - VALORES DA VARIÁVEL X E DESVIOS ABSOLUTOS EM RELAÇÃO À MÉDIA

xi

x i  X

xi X

12,3

0,92

12,6

0,62

12,6

0,62

12,9

0,32

13,1

0,12

13,4

0,18

13,5

0,28

13,6

0,38

15,0

1,78

5,22

DM

n  x  X i 5,22 i  1 
n
x
 X
i
5,22
i
 1

n 9

0,58

b) Para dados agrupados em classes

DM

k  x  X f i i i  1
k
x
 X
f
i
i
i
 1

n

Dada a distribuição de freqüências a seguir, calcular o desvio médio. Sabe-se que

X 45,50.

INTERVALO DE

CLASSES

fi

xi

x i  X

xi X

x i  X

x i X

f

i

31

|---- 36

4

33,5

12,0

36

|---- 41

6

38,5

7,0

41

|---- 46

8

43,5

2,0

46

|---- 51

4

48,5

3,0

51

|---- 56

2

53,5

8,0

56

|---- 61

6

58,5

13,0

TOTAL

30

48

42

16

12

16

78

212

DM

k  x i f  X i 212 i  1 
k
x i f
X
i
212
i
 1

n 30

7,0667

7,07

1.5.3.4 VARIÂNCIA E DESVIO PADRÃO

2 , é obtida elevando-se os desvios

em relação à media ao quadrado. Quando se extrai a raiz quadrada da variância, tem-se o desvio padrão.

A variância da variável aleatória, representada por V(X) ou

Propriedades da Variância

1. V(k) 0 , onde k=constante

24

ESTATÍSTICA DESCRITIVA

2. V(kX)

2

k V(X)

, onde k=constante e X v.a.

3. Sejam X e Y v.a. independentes. Então:

V(X Y) V(X) V(Y) onde: COV(X,Y) V(X V(X   Y) Y)    V(X) V(X) E(XY)   V(Y) V(Y) E(X)E(Y)   2COV(X,Y) 2COV(X,Y)

4.

Sejam X e Y v.a. não independentes (ou dependentes). Então:

(covariância)

a) Para dados simples

A variância e o desvio padrão populacional são obtidas pelas expressões:

  2 1 N   2
 
2 1
N
 
2

N

i 1

x

i

2

(variância)

(desvio padrão)

A variância e o desvio padrão amostral são obtidas pelas expressões:

2 1  n S  x n  1 i  1 S 
2 1
 n
S
x
n  1
i  1
S 
S
2

i

X

2

(variância)

(desvio padrão)

Exemplo de aplicação: Considerando o exemplo tem-se:

QUADRO 4 - VALORES DA VARIÁVEL X E DESVIOS SIMPLES E QUADRÁTICOS EM RELAÇÃO À MÉDIA

Xi

xi X

xi X

2

12,3

-0,92

0,8464

12,6

-0,62

0,3844

12,6

-0,62

0,3844

12,9

-0,32

0,1024

13,1

-0,12

0,0144

13,4

0,18

0,0324

13,5

0,28

0,0784

13,6

0,38

0,1444

15,0

1,78

3,1684

5,1556

S

2

1

n

1

n

1

i

x

i

S 0,80

X

2

5,1556 9 1

0,6445

b) Para dados agrupados em classes

A variância e o desvio padrão populacional são obtidas pelas expressões:

SACHIKO ARAKI LIRA

25

 k  x    2 f i i 2 i  
 k 
x
 
2 f
i
i
2 i
1
 k</