Você está na página 1de 174

ESTATÍSTICA APLICADA

Notas de aula

O presente material foi elaborado com o objetivo de facilitar as atividades em sala de aula,
seguindo a bibliografia apresentada no final do texto. Esclarece-se que o material, não
substitui a bibliografia apresentada, portanto, é necessário consultar os livros recomendados.

Profa. Sachiko A. Lira


.

2022
ii

SUMÁRIO

Introdução .................................................................................................................................... 6
1 ESTATÍSTICA DESCRITIVA .................................................................................................... 7
1.1 Variável Aleatória ................................................................................................................ 7
1.2 Tipos de Escalas e Variáveis............................................................................................... 8
1.3 Variáveis Aleatórias Qualitativas e Quantitativas ................................................................. 9
1.4 Arredondamento de Números ........................................................................................... 10
1.5 Tabelas ............................................................................................................................. 10
1.5.1 Elementos essenciais de uma tabela ............................................................................. 10
1.5.2 Tabelas de distribuição de frequências........................................................................... 11
1.5.2.1 Variável Aleatória Discreta .................................................................................. 11
1.5.2.2 Variável Aleatória Contínua ................................................................................ 12
1.6 Gráficos ............................................................................................................................. 13
1.6.1 Representação Gráfica ................................................................................................... 13
1.6.1.1 Elementos componentes dos gráficos................................................................. 14
1.6.2 Histograma de Frequências ............................................................................................ 14
1.6.3 Diagrama de Ramo e Folhas (Stem and Leaf Plot)......................................................... 15
LISTA DE EXERCÍCIOS 01 .................................................................................................... 16
1.7 Medidas de tendência central, Variabilidade e Forma da Distribuição ............................... 17
1.7.1 Medidas de Tendência Central ....................................................................................... 17
1.7.1.1 Esperança matemática ou média aritmética........................................................ 17
1.7.1.2 Mediana .............................................................................................................. 19
1.7.1.3 Moda................................................................................................................... 22
1.7.2 Separatrizes ................................................................................................................... 23
1.7.2.1 Quartil ................................................................................................................. 23
1.7.3 Medidas de variabilidade ou Dispersão .......................................................................... 26
1.7.3.1 Amplitude Total ................................................................................................... 26
1.7.3.2 Amplitude Interquartil .......................................................................................... 27
1.7.3.3 Variância e Desvio Padrão.................................................................................. 27
1.7.3.4 Coeficiente de Variação ...................................................................................... 29
1.7.4 Forma da Distribuição .................................................................................................... 30
1.7.4.1 Coeficiente do momento de assimetria ............................................................... 30
1.7.4.2 Coeficiente do momento de curtose .................................................................... 32
LISTA DE EXERCÍCIOS 02 .................................................................................................... 34
2 ELEMENTOS DE PROBABILIDADES .................................................................................... 37
2.1 Experimento Aleatório (E)................................................................................................. 37
2.2 Espaço Amostral (S).......................................................................................................... 37
2.3 Evento ............................................................................................................................... 37
2.3.1 Evento Complementar .................................................................................................... 38
2.3.2 Eventos Independentes .................................................................................................. 38
2.3.3 Eventos Mutuamente Exclusivos .................................................................................... 38
2.4 Definição Clássica de Probabilidade ................................................................................. 39
2.5 Definição Axiomática de Probabilidade ............................................................................. 40
2.6 Probabilidade Condicional ................................................................................................. 40
2.7 Teorema da Probabilidade Total ....................................................................................... 41
2.8 Teorema de Bayes ............................................................................................................ 42
LISTA DE EXERCÍCIOS 03 .................................................................................................... 43
3 VARIÁVEIS ALEATÓRIAS DISCRETAS E DISTRIBUIÇÕES DE PROBABILIDADES ........... 45
3.1 Definições ......................................................................................................................... 45
3.2 Distribuições de Probabilidades para V. A. Discretas ........................................................ 47
3.2.1 Distribuição binomial ...................................................................................................... 47
iii

3.2.2 Distribuição de Poisson .................................................................................................. 49


3.2.3 Distribuição Hipergeométrica .......................................................................................... 50
LISTA DE EXERCÍCIOS 04 .................................................................................................... 52
4 VARIÁVEIS ALEATÓRIAS CONTÍNUAS E DISTRIBUIÇÕES DE PROBABILIDADES ........... 54
4.1 Definições ......................................................................................................................... 54
4.2 Distribuições de Probabilidades para V. A. Contínuas ....................................................... 55
4.2.1 Distribuição normal ou Gaussiana .................................................................................. 55
4.2.1.1 Distribuição normal padronizada ou reduzida ..................................................... 57
4.2.2 Distribuição Exponencial ................................................................................................ 59
4.2.3 Distribuição de Weibull ................................................................................................... 60
4.2.4 Outras Distribuições de Probabilidades Contínua ........................................................... 62
4.2.4.1 Distribuição 𝝌𝟐 ( qui-quadrado) .......................................................................... 62
4.2.4.2 Distribuição “ t ” de Student ................................................................................ 62
4.2.4.3 Distribuição F de Snedecor ................................................................................. 63
LISTA DE EXERCÍCIOS 05 .................................................................................................... 64
5 NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS........................................... 66
5.1 Introdução ......................................................................................................................... 66
5.2 Amostragem Probabilística ................................................................................................ 66
5.2.1 Amostragem Aleatória Simples (AAS) ............................................................................ 66
5.2.2 Amostragem Sistemática ................................................................................................ 67
5.2.3 Amostragem Estratificada............................................................................................... 67
5.3 Distribuições Amostrais ..................................................................................................... 68
5.3.1 Distribuição Amostral de Médias .................................................................................... 68
5.3.1.1Teorema Central do Limite................................................................................... 71
5.3.2 Distribuição Amostral de Proporções .............................................................................. 72
6 ESTIMAÇÃO DE PARÂMETROS ........................................................................................... 74
6.1 Introdução ......................................................................................................................... 74
6.2 Estimador e Estimativa ...................................................................................................... 74
6.3 Qualidades de um Estimador ............................................................................................ 74
6.4 Estimação por Pontos ....................................................................................................... 76
6.4.1 Estimador da Média Populacional .................................................................................. 76
6.4.2 Estimador da Variância Populacional ............................................................................. 76
6.4.3 Estimador do Desvio Padrão Populacional ..................................................................... 76
6.4.4 Estimador da Proporção Populacional ............................................................................ 76
6.5 Estimação por Intervalo ..................................................................................................... 76
6.5.1 Intervalo de Confiança para Média populacional ............................................................ 77
6.5.2 Intervalo de Confiança para Proporção Populacional ..................................................... 80
6.5.3 Intervalo de Confiança para Diferença entre Duas Médias Populacionais 𝜇1 e 𝜇2 ......... 81
6.6 Dimensionamento da Amostra .......................................................................................... 85
6.6.1 Estimação da Média Populacional .................................................................................. 85
6.6.2 Estimação da Proporção Populacional ........................................................................... 86
LISTA DE EXERCÍCIOS 06 .................................................................................................... 87
7 TESTES DE HIPÓTESES ....................................................................................................... 90
7.1 Etapas para Testes de Hipóteses ...................................................................................... 90
7.1.1 Nível de Significância ..................................................................................................... 90
7.1.2 Erro Estatístico ............................................................................................................... 90
7.2 Testes Estatísticos Paramétricos....................................................................................... 91
7.2.1 Teste para a Média Populacional ................................................................................... 91
7.2.1.1 Quando a variância populacional 𝜎 2 é Conhecida .............................................. 91
P-valor ou valor-p .................................................................................................................... 92
Poder do Teste Estatístico ...................................................................................................... 93
7.2.1.2 Quando a variância populacional 𝜎 2 é desconhecida.......................................... 95
7.2.2 Teste para a Proporção Populacional ............................................................................. 97
7.2.3 Teste para a Diferença entre Duas Médias Populacionais .............................................. 98
7.2.3.1 Quando as variâncias populacionais 𝜎12 e 𝜎22 são Conhecidas ............................ 98
iv

7.2.3.2 Quando as variâncias populacionais 𝜎12 e 𝜎22 são Desconhecidas .................... 100
7.2.4 Teste para Igualdade de Duas Variâncias Populacionais ............................................. 103
LISTA DE EXERCÍCIOS 07 .................................................................................................. 106
8 ANÁLISE DA VARIÂNCIA ..................................................................................................... 108
8.1 Fundamentos da ANOVA ................................................................................................ 108
8.2 Análise da Variância a um Critério de Classificação ........................................................ 110
8.3 Comparações Múltiplas entre Médias .............................................................................. 114
8.3.1 Teste de Scheffé .......................................................................................................... 114
LISTA DE EXERCÍCIOS 08 .................................................................................................. 117
9 ANÁLISE DE CORRELAÇÃO E REGRESSÃO SIMPLES .................................................... 119
9.1 Introdução ....................................................................................................................... 119
9.2 Diagrama de Dispersão ................................................................................................... 119
9.3 Análise de Correlação ..................................................................................................... 119
9.3.1 Coeficiente de Correlação Linear de Pearson .............................................................. 119
9.3.1.1 Teste de Hipóteses para Coeficiente de Correlação ......................................... 122
9.4 Análise de Regressão Linear Simples ............................................................................. 122
9.4.1 Estimação dos Parâmetros........................................................................................... 123
9.4.2 Testes de Hipóteses na Regressão .............................................................................. 126
9.4.2.1 Análise da Variância ......................................................................................... 126
9.4.3 Coeficiente de Determinação ou Explicação................................................................. 128
9.5 Ajuste de Função Exponencial ........................................................................................ 128
9.5.1 Estimativa dos Coeficientes .......................................................................................... 128
9.5.2 Testes de Hipóteses na Regressão .............................................................................. 129
9.5.2.1 Análise da Variância ......................................................................................... 129
9.5.3. Coeficiente de Determinação ou Explicação................................................................ 130
LISTA DE EXERCÍCIOS 09 .................................................................................................. 133
10 CONTROLE ESTATÍSTICO DE QUALIDADE ..................................................................... 135
10.1 Gráficos de Controle...................................................................................................... 135
10.2 Gráfico de Controle para Variáveis ................................................................................ 138
10.2.1 Gráfico de Controle de 𝑋̅ ............................................................................................ 138
10.2.2 Gráfico de Controle de 𝑅 ............................................................................................ 139
10.3 Gráfico de Controle para Atributos ................................................................................ 143
10.3.1 Gráfico de Controle para Fração de Não Conformes (Gráfico p) ................................ 143
LISTA DE EXERCÍCIOS 10 .................................................................................................. 146
BIBLIOGRAFIA ........................................................................................................................ 149
APÊNDICE 1 – MÉTODOS DE OBTENÇÃO DE ESTIMADORES ....................................... 150
1 Método dos Momentos .......................................................................................................... 151
2 Método da Máxima Verossimilhança ..................................................................................... 151
3 Método dos Mínimos Quadrados........................................................................................... 152
APÊNDICE 2 - TESTES DE ADERÊNCIA ............................................................................... 155
1 Teste do Qui-quadrado ......................................................................................................... 155
1.1 Teste de Aderência para a Distribuição de Poisson......................................................... 156
1.2 Teste de Aderência para a Distribuição Binomial ............................................................ 158
APÊNDICE 3 - VERIFICAÇÃO DA NORMALIDADE DOS DADOS .......................................... 160
1 Gráfico para verificar normalidade ...................................................................................... 161
1.1 Gráfico normal probabilístico (QQ-normal) ...................................................................... 161
2 Testes para verificar a normalidade.................................................................................... 162
2.1 Teste de Lilliefors (Kolmogorov-Smirnov com correção de Liliefors) ................................ 162
2.2 Teste de Shapiro-Wilk ..................................................................................................... 163
TABELA A1.1 – ÁREAS SOB A CURVA NORMAL ............................................................... 166
TABELA A1.2 – ÁREAS SOB A CURVA NORMAL ............................................................... 167
TABELA A2 - DISTRIBUIÇÃO ‘t’ DE STUDENT .................................................................... 168
TABELA A3 – DISTRIBUIÇÃO 𝜒 2 ......................................................................................... 169
v

TABELA A4 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR ............................................................... 170


TABELA A5 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR ............................................................... 171
TABELA A6 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR ............................................................... 172
TABELA A7 - VALORES CRÍTICOS ( dc ) PARA TESTE DE LILLIERFORS ....................... 173
TABELA 8 – COEFICIENTES 𝑎𝑛 − 𝑖 + 1 PARA O TESTE DE NORMALIDADE 𝑤 DE ... 174
SHAPIRO-WILK .................................................................................................................... 174
6

Introdução

Estatística é a ciência que se preocupa com as técnicas de coleta, organização, descrição,


análise e interpretação dos dados (experimentais ou observacionais). A figura 1, a seguir, mostra
o contexto em que se situa o estudo completo da Estatística, aqui subdividido em Estatística
Descritiva e Estatística Indutiva (ou Inferência Estatística).

FIGURA 1 - ESQUEMA GERAL DA ESTATÍSTICA

Estatística Amostragem Cálculo das


Descritiva Probabilidade
s

Estatística
Indutiva

FONTE: COSTA NETO (1994, p.4).

A Estatística Descritiva é responsável pela organização e descrição de dados, através dos


cálculos de médias, variâncias, estudo de gráficos, tabelas etc.

A Teoria das Probabilidades permite modelar os fenômenos aleatórios, ou seja, aqueles em que
está presente a incerteza. É uma ferramenta fundamental para a inferência estatística.
A Estatística Indutiva compreende um conjunto de técnicas baseadas em probabilidades, que a
partir de dados amostrais, permite-nos tirar conclusões sobre a população de interesse.
A Amostragem é o ponto de partida para um estudo estatístico. O estudo de qualquer fenômeno,
exige a coleta e a análise de dados estatísticos. A coleta de dados é, pois, a fase inicial de
qualquer pesquisa.
A População é o conjunto de todas as observações potenciais sobre determinado fenômeno. O
conjunto de dados efetivamente observados, ou extraídos, constitui uma amostra da população.
É a partir do dado amostral, que se desenvolvem os estudos, com o objetivo de se fazer
inferências sobre a população.
7

1 ESTATÍSTICA DESCRITIVA

A Estatística Descritiva é a área da Estatística responsável pela organização e descrição


de dados, através de cálculos de médias, variâncias, tabelas e gráficos.
As técnicas estatísticas e gráficas permitem fazer uma análise exploratória de dados, ou
seja, resumir suas principais características e podem ser aplicadas aos dados populacionais ou
amostrais.
O parâmetro é uma medida numérica que descreve de forma reduzida alguma
característica de uma população ou universo. É normalmente representado por letras gregas. Por
exemplo: μ (média), σ (desvio padrão), ρ (coeficiente de correlação). O parâmetro normalmente é
desconhecido e, deseja-se estimar através de dados amostrais.
Estatística ou medida amostral é uma medida numérica que descreve alguma
característica de uma amostra. É normalmente representada por letras latinas. Por exemplo: X
(média), S (desvio padrão), r (coeficiente de correlação).
Em resumo, a análise exploratória de dados permite organizar os dados através de tabelas,
gráficos e medidas de localização e dispersão, procurando mostrar um padrão ou comportamento
de um conjunto de dados.

1.1 VARIÁVEL ALEATÓRIA


Variável aleatória é aquela cujo valor numérico não é conhecido antes da sua observação.
Esta tem uma distribuição de probabilidades associada, o que permite calcular a probabilidade de
ocorrência de certos valores.
Geralmente, utilizam-se letras maiúsculas (X, Y, Z...) para designar as variáveis aleatórias,
e minúsculas (x, y, z...) para indicar particulares valores dessas variáveis. O comportamento de
uma variável aleatória é descrito por sua distribuição de probabilidades.
Exemplo: Suponha que em um lote de 10 parafusos, 2 são defeituosos. A variável aleatória
X=número de parafusos defeituosos, na escolha de 3 parafusos com reposição, pode assumir os
seguintes valores:

0, 𝑠𝑒 𝑠 = 𝑃𝑃𝑃
1, 𝑠𝑒 𝑠 = 𝐷𝑃𝑃 𝑜𝑢 𝑠 = 𝑃𝐷𝑃 𝑜𝑢 𝑠 = 𝑃𝑃𝐷
𝑋(𝑠) = {
2, 𝑠𝑒 𝑠 = 𝐷𝐷𝑃 𝑜𝑢 𝑠 = 𝐷𝑃𝐷 𝑜𝑢 𝑠 = 𝑃𝐷𝐷
3, 𝑠𝑒 𝑠 = 𝐷𝐷𝐷
sendo P=perfeito e D=defeituoso.

A distribuição de probabilidades é apresentada no QUADRO1.

QUADRO 1 - DISTRIBUIÇÃO DE PROBABILIDADES


DA VARIÁVEL ALEATÓRIA X
𝑋=𝑥 𝑃(𝑋 = 𝑥)
0 3
(8⁄10) = 0,512
1 2
3 × (8⁄10) × (2⁄10) = 0,384
2 3 × (8⁄10) × (2⁄10)2 = 0,096
3 (2⁄10)3 = 0,008
8

A função de repartição ou função de distribuição acumulada da v. a X é definida como


sendo a probabilidade de X assumir um valor menor ou igual a x [𝐹𝑋 (𝑥) = 𝑃𝑋 (𝑋 ≤ 𝑥), 𝑥 ∈ 𝑅].
Como exemplo, tem-se o QUADRO 2.

QUADRO 2 - FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA DA


VARIÁVEL ALEATÓRIA X
𝑋=𝑥 𝑃(𝑋 = 𝑥) 𝐹𝑋 (𝑥)
3
0 (8⁄10) = 0,512 0,512
2
1 3 × (8⁄10) × (2⁄10) = 0,384 0,896
2 3 × (8⁄10) × (2⁄10 )2 = 0,096 0,992
3 (2⁄10 )3 = 0,008 1,000

1.2 TIPOS DE ESCALAS E VARIÁVEIS

Uma variável pode se apresentar das seguintes formas, quanto aos valores assumidos:

1.o Escala nominal: o nível nominal de mensuração é caracterizado por dados que consistem em
nomes, rótulos ou categorias apenas.
Por exemplo, seja X, a variável “cor” dos automóveis vendidos durante um determinado
mês. Neste caso, a variável X assume as categorias “prata”, “branco”, “preto”, etc., sendo
denominada politômica. Quando assume somente duas categorias é denominada dicotômica.
Exemplo: situação das lâmpadas (perfeita ou defeituosa).
Outros exemplos:
a) autoveículos segundo categorias (veículos leves, caminhões e ônibus);
b) cor dos olhos;
c) automóvel segundo fabricante.
2.o Escala ordinal: dados a nível ordinal são mais informativos do que dados nominais. Quando a
ordenação é importante, os dados coletados são chamados ordinais.
Por exemplo, seja X a variável que indica a categoria de consumo de energia elétrica de
determinado eletrodoméstico. Tem-se então: A (mais eficiente) até G (menos eficiente).
Outros exemplos:
a) Qualidade de um determinado produto.(A - melhor qualidade, B - qualidade intermediária)
e C - pior qualidade);
b) escolaridade;
c) grupos etários.
3.º Escala intervalar: o nível intervalar de mensuração é como o nível ordinal, com a propriedade
adicional de que a diferença entre quaisquer dois valores de dados é significativa. No entanto, os
dados nesse nível não têm um ponto inicial zero natural (quando o nada da quantidade está
presente).
Exemplo: As escalas para medir temperaturas como a Fahrenheit e a Celsius são
exemplos de escalas intervalar. Não se pode afirmar que 40oC é duas vezes mais quente que
uma temperatura de 20oC, embora se possa dizer que a diferença entre 20oC e 40oC é a mesma
que entre 75oC e 95oC. No entanto, não há um ponto inicial natural. O valor 0oC, pode parecer um
ponto inicial, mas é arbitrário e não significa ausência total de calor.
9

Outro exemplos:
a) Os anos 1000, 2000, 1400, 1900. O tempo não começa no ano 0, de modo que o ano 0
é arbitrário e não um ponto inicial zero natural que represente nenhum tempo;
b) quociente de inteligência.

4.º Escala de razão: o nível de mensuração de razão possui todas as propriedades da escalas
nominal, ordinal e intervalar, mais a propriedade adicional de possuir um zero absoluto
(verdadeiro) no ponto de origem.
Exemplo: consumo de energia elétrica (KWh/mês) de determinado eletrodoméstico.
Outros exemplos:
a) Velocidade de um automóvel;
b) peso e altura de um equipamento;
c) nível auditivo (em decibéis).

1.3 VARIÁVEIS ALEATÓRIAS QUALITATIVAS E QUANTITATIVAS

De acordo com o nível de mensuração, a variável pode ser classificada em qualitativa ou


quantitativa. Variável qualitativa é aquela cujo nível de mensuração é nominal ou ordinal,
enquanto a quantitativa é aquela em que o nível de mensuração é intervalar ou de razão.
A variável quantitativa pode ser ainda discreta ou contínua, sendo a primeira resultante de
contagem, assumindo somente valores inteiros, e a última de medições, assumindo qualquer valor
no intervalo dos números reais.
A figura 2 apresenta os tipos de variáveis de forma resumida.

FIGURA 2 - TIPOS DE VARIÁVEIS

Nominal
Qualitativa
Ordinal
Variável

Discreta

Quantitativa
Contínua

FONTE: A autora

Exemplo de aplicação: Seja uma população de peças produzidas em um determinado processo.


É possível ter as seguintes situações conforme QUADRO 3:

QUADRO 3 – CLASSIFICAÇÃO DAS VARIÁVEIS SEGUNDO TIPO


VARIÁVEIS TIPO
Estado: Conforme ou Não-conforme Qualitativa nominal
Qualidade: 1ª., 2ª. ou 3ª. categoria Qualitativa ordinal
Número de peças conformes Quantitativa discreta
Comprimento das peças Quantitativa contínua

FONTE: A autora
10

1.4 ARREDONDAMENTO DE NÚMEROS

1. Quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, fica inalterado o último


número que permanecer.
Exemplo: seja o número 48,231, ao arredondar para 2 casas decimais ficará 48,23.
2. Quando o primeiro algarismo a ser abandonado for 6, 7, 8 ou 9, aumenta-se de uma unidade
o último algarismo a permanecer.
Exemplo: o número 23,077, ao arredondar para 2 casas decimais ficará 23,08.
3. Quando o primeiro algarismo a ser abandonado for 5, haverá duas formas:
a) como regra geral, aumenta-se de uma unidade o último algarismo a permanecer.
Exemplo: 12,5253 ficará 12,53.
b) se ao 5 só seguirem zeros, o último algarismo a ser conservado só será aumentado se for
ímpar.
Exemplo: 24,7750 passa a ser 24,78
24,7650 passa a ser 24,76.
4. Quando houver parcelas e total, e ocorrer diferença no arredondamento, deve-se fazer
correção na parcela (ou parcelas) onde o erro relativo for menor.
Exemplo:
2,4 para 2
13,4 14
16,1 16
----- ----
31,9 32

1.5 TABELAS

1.5.1 Elementos essenciais de uma tabela

Uma tabela deve apresentar os dados de forma resumida, oferecendo uma visão geral do
comportamento do fenômeno analisado.
Uma tabela é constituída dos seguintes elementos:

1 - Título: é a indicação que precede a tabela e contém a identificação de três fatores do


fenômeno.
a) A data a qual se refere;
b) o local onde ocorreu o evento;
c) o fenômeno que é descrito.
2 - Cabeçalho: é a parte superior da tabela que especifica o conteúdo das colunas.

3 - Corpo da tabela: é o espaço que contém as informações sobre o fenômeno observado.


4 - Fonte: é a indicação da entidade responsável pelo levantamento dos dados.
Para obter mais informações consultar o manual de normalização de documentos
científicos de acordo com as normas da ABNT (AMADEU, et al. 2015), no seguinte endereço
eletrônico: https://acervodigital.ufpr.br/handle/1884/45654
11

1.5.2 Tabelas de distribuição de frequências

Serão apresentados alguns conceitos importantes para a construção de tabelas de


distribuições de frequências.
• Dados brutos: É o conjunto de dados numéricos obtidos e que ainda não foram organizados.

• Rol: É o arranjo dos dados brutos em ordem crescente (ou decrescente).

• Amplitude (At): diferença entre o maior e o menor dos valores observados.

• Frequência absoluta (𝑓𝑖 ): número de vezes que um elemento aparece no conjunto de dados.
∑𝑘𝑖=1 𝑓𝑖 = 𝑛 onde 𝑛 é o número total de observações e 𝑘 é o número de valores diferentes
observados.
• Frequência Relativa (𝑓𝑟 ): razão entre a frequência absoluta do valor i e total de frequências.
𝑓𝑖
𝑓𝑟𝑖 = e ∑𝑘𝑖=1 𝑓𝑟𝑖 = 1
𝑛

• Frequência Absoluta Acumulada (𝑓𝑎𝑐 ): soma da frequência absoluta do valor 𝑖 assumida pela
variável com todas as frequências absolutas anteriores.

1.5.2.1 Variável Aleatória Discreta


Quando uma variável quantitativa discreta assume poucos valores, pode-se considerar que
cada valor seja uma classe e que existe uma ordem natural nessas classes.

Exemplo: Os dados que seguem apresentam os resultados da inspeção diária de todas as


unidades de computadores produzidos durante os últimos 10 dias. O número de unidades não-
conformes são: 4 - 7 - 5 - 8 - 6 - 6 - 4 - 5 - 8 - 7
TABELA 1 - DISTRIBUIÇÃO DE FREQUÊNCIAS DO NÚMERO DE
UNIDADES NÃO CONFORMES DE COMPUTADORES
INSPECIONADOS DURANTE 10 DIAS
NÚMERO DE DEFEITOS NÚMERO DE DIAS (Freq.)
4 2
5 2
6 2
7 2
8 2
FONTE: Adaptado de MONTGOMERY (2009).
NOTA: O número médio diário de computadores inspecionados
é 100.
• Número de Classes (k)

Quando se tratar de uma variável quantitativa discreta que pode assumir um grande
número de valores distintos, a construção da tabela de frequências e de gráficos considerando
cada valor como uma categoria fica inviável. A solução é agrupar os valores em classes ao
elaborar a tabela.

Segundo Bussab e Morettin (2002), a escolha do número de classes dependerá do


conhecimento que o pesquisador tem sobre os dados. Assim, a definição do número de classes
é arbitrária. Mas, vale lembrar que, quando se utiliza um pequeno número de classes pode-se
12

perder informações, e ao contrário, com um grande número de classes pode-se prejudicar o


resumo dos dados.
Existem duas soluções para a definição do número de classes bastante utilizadas que são:
1) Se o número de elementos (n) for menor ou igual a 25 então o número de classes (k) é
igual a 5; se n for maior que 25, então o número de classes é aproximadamente a raiz quadrada
positiva de n. Ou seja:
Para n  25, k = 5
Para n > 25, 𝑘 ≅ √𝑛

2) Fórmula de Sturges para número de classes: 𝑘 ≅ 1 + 3,3 × log (𝑛).

É necessário ainda calcular:

▪ Amplitude total ou “range” (At): É a diferença entre o maior e o menor valor observados no
conjunto de dados.

𝐴𝑡 = 𝑋𝑚á𝑥 − 𝑋𝑚𝑖𝑛

▪ Amplitude ou intervalo das classes (h): É a divisão da amplitude total (At) pelo número de
classes (k).

Ou seja:
𝐴𝑡
ℎ≅
𝑘

1.5.2.2 Variável Aleatória Contínua

Quando a variável quantitativa em estudo é contínua, que assume muitos valores distintos,
o agrupamento dos dados em classes será sempre necessário, na construção das tabelas de
distribuições de frequências.

Exemplo 1: A seguir, são apresentadas as medidas (mm) de uma dimensão de uma peça
produzida por um processo de usinagem. Construir a tabela de distribuição de frequências em
classes.

102,8 - 136,4 - 110,1 - 115,9 - 118,5 - 149,3 - 125,3 - 144,8 - 129,7 - 132,7
135,0 – 108,2 - 138,1 - 138,6 - 139,6 - 140,4 - 125,9 - 145,2 - 145,7 – 120,4

ROL:
102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7
135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 140,4 - 144,8 - 145,2 - 145,7 - 149,3

𝐴𝑡 = 𝑋𝑚á𝑥 − 𝑋𝑚𝑖𝑛 = 149,3 − 102,8 = 46,50

𝑘=5
𝐴𝑡 46,50
ℎ≅ = = 9,3 ≅ 10
𝑘 5
13

TABELA 2 - DISTRIBUIÇÃO DE FREQUÊNCIAS DAS MEDIDAS


DE UMA DIMENSÃO DE PEÇAS PRODUZIDAS
POR UM PROCESSO DE USINAGEM
INTERVALO DAS
CLASSES (mm) 𝑓𝑖 𝑓𝑟 𝑓𝑎𝑐
102,8 |--- 112,8 3 0,15 3
112,8 |--- 122,8 3 0,15 6
122,8 |--- 132,8 4 0,20 10
132,8 |--- 142,8 6 0,30 16
142,8 |--- 152,8 4 0,20 20
TOTAL 20 1,00
FONTE: Elaborada pela autora.

Exemplo 2: O tempo necessário para se realizar certa operação industrial foi cronometrado (em
segundos), sendo feita 30 determinações:

45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 - 34 - 45

41 - 57 - 38 - 46 - 46 - 58 - 57 - 36 - 58 - 35 - 31 - 59 - 44 - 57 - 35
ROL:

31 - 34 - 35 - 35 - 36 - 37 - 38 - 39 - 39 - 40 - 41 -41 - 43 - 44 - 45

45 - 45 - 45 - 46 - 46 - 48 - 49 - 51 - 53 - 57- 57 - 57 - 58 - 58 – 59

𝐴𝑡 = 𝑋𝑚á𝑥 − 𝑋𝑚𝑖𝑛 = 59 − 31 = 28,0

𝑘 ≅ 1 + 3,3 × log(30) = 5,87 ≅ 6 (fórmula de Sturges)


𝐴𝑡 28
ℎ≅ = = 4,7 ≅ 5
𝑘 6
TABELA 3 - DISTRIBUIÇÃO DE FREQUÊNCIAS DO TEMPO
NECESSÁRIO PARA REALIZAÇAO DE CERTA
OPERAÇÃO INDUSTRIAL
INTERVALO DAS
𝑓𝑖 𝑓𝑟 𝑓𝑎𝑐
CLASSES (s)
31 |---- 36 4 0,13 4
36 |---- 41 6 0,20 10
41 |---- 46 8 0,27 18
46 |---- 51 4 0,13 22
51 |---- 56 2 0,07 24
56 |---- 61 6 0,20 30
TOTAL 30 1,00
FONTE: Elaborada pela autora.

1.6 GRÁFICOS

1.6.1 Representação Gráfica

O objetivo do gráfico é passar para o leitor uma visão clara do comportamento do fenômeno
em estudo, uma vez que os gráficos transmitem informação mais imediata do que uma tabela.
A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais,
apresentados a seguir:
14

a) Simplicidade: O gráfico deve ser destituído de detalhes de importância secundária.

b) Clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos do
fenômeno em estudo.
c) Veracidade: o gráfico deve ser a verdadeira expressão do fenômeno em estudo.

1.6.1.1 Elementos componentes dos gráficos

a) Referência: elemento de identificação ordenada do gráfico, isto é, o número de ordem


do gráfico no trabalho. Ex.: GRÁFICO 1;
b) título: deve conter informações como: o que, onde e quando os dados ocorreram,
preferencialmente, na ordem citada;
c) escala: determina os pontos de referência para dados apresentados no gráfico. A
amplitude dos valores definirá o número de divisões nas escalas vertical e horizontal;
Recomenda-se utilizar para a altura do gráfico, a proporção correspondente à
aproximadamente 60% da medida utilizada para a largura;
d) fonte: indicação da entidade responsável pelo levantamento dos dados;
e) nota: informações de natureza geral sobre o gráfico.

1.6.2 Histograma de Frequências


Este é um gráfico usado para apresentar dados organizados em classes (intervalos),
utilizado principalmente para representar a distribuição de frequências de variáveis contínuas.

Dada a distribuição de frequências de medidas (mm) de uma dimensão de peças


produzidas por um processo de usinagem, construir o histograma frequências.

INTERVALO DAS
CLASSES (mm) 𝑓𝑖

102,8 |--- 112,8 3


112,8 |--- 122,8 3
122,8 |--- 132,8 4
132,8 |--- 142,8 6
142,8 |--- 152,8 4
TOTAL 20

Para definir a largura do histograma, considerar o número de intervalo das classes (𝑘 = 5)


mais dois espaços, sendo um antes do primeiro intervalo e outro, depois do último intervalo. Se
utilizar 1 cm para intervalo de classes e para os espaços, a largura do gráfico será de 7 cm.
Levando em consideração a recomendação de 𝒂𝒍𝒕𝒖𝒓𝒂 ≅ 𝟎, 𝟔𝟎 × 𝒍𝒂𝒓𝒈𝒖𝒓𝒂, define-se a altura em
6 cm. A partir daí, define-se a escala do gráfico.
15

GRÁFICO 1 – HISTOGRAMA DE FREQUÊNCIAS DE MEDIDA DE UMA


DIMENSÃO DE PEÇAS

1.6.3 Diagrama de Ramo e Folhas (Stem and Leaf Plot)


Este diagrama é muito útil para uma primeira análise dos dados.
Passos para construir um diagrama de ramo e folhas:
1. ordenar os valores para encontrar o valor mínimo e máximo dos dados;
2. dividir cada número x i em duas partes: um ramo, consistindo em um ou mais dígitos
iniciais, e uma folha, consistindo nos dígitos restantes;
3. listar os valores do ramo em uma coluna vertical;
4. a partir daí colocam-se os valores na folha. O valor zero, significa que há informação e
que é um número inteiro. Já, quando naquele valor inteiro não existe observação, não colocar
nada, deixar em branco;
5. escrever as unidades para o ramo e folhas no gráfico.
Considerando os dados do exemplo 1, referentes as medidas (mm) de uma dimensão de
peças produzidas por um processo de usinagem, tem-se:
102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7
135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 140,4 - 144,8 - 145,2 - 145,7 - 149,3

GRÁFICO 2 – DIAGRAMA DE RAMO E FOLHAS DE MEDI-


DAS DE UMA DIMENSÃO DAS PEÇAS

RAMO FOLHA FREQ.


10 28 2
11 058 3
12 0559 4
13 256889 6
14 04559 5

FONTE: Elaborado pela autora.


NOTA: Medidas em mm.
16

Considerando os dados do exemplo 2, tem-se: O tempo necessário para se realizar certa


operação industrial foi cronometrado (em segundos):
31 - 34 - 35 - 35 - 36 - 37 - 38 - 39 - 39 - 40 - 41 -41 - 43 - 44 - 45
45 - 45 - 45 - 46 - 46 - 48 - 49 - 51 - 53 - 57- 57 - 57 - 58 - 58 – 59

GRÁFICO 3A – DIAGRAMA DE RAMO E FOLHAS DO TEMPO PARA


REALIZAÇÃO DE CERTA OPERAÇÃO INDUSTRIAL

RAMO FOLHA FREQ.

3 145567899 9
4 0113455556689 13
5 13777889 8

FONTE: Elaborado pela autora.


NOTA: Tempo em segundos.

Observe que no ramo 4 existem muitas folhas, neste caso, recomenda-se dividir em duas
linhas, como apresentado a seguir.

GRÁFICO 3B - DIAGRAMA DE RAMO E FOLHAS DO TEMPO PARA


REALIZAÇÃO DE CERTA OPERAÇÃO INDUSTRIAL

RAMO FOLHA FREQ.


3o 1 4 2
3* 5 5 6 7 8 9 9 7
4o 0 1 1 3 4 5
4* 5 5 5 5 6 6 8 9 8
5o 1 3 2
5* 7 7 7 8 8 9 6

FONTE: Elaborado pela autora.


NOTA: Tempo em segundos.

LISTA DE EXERCÍCIOS 01

1. Conceitue:
a) População ou Universo;
b) Amostra;
c) Parâmetro;
d) Estatística ou medida amostral;
e) Variável aleatória discreta e exemplifique;
f) Variável aleatória contínua e exemplifique.
2. Uma importante característica de qualidade da água é a concentração de material sólido
suspenso. Em seguida são apresentadas 30 medidas de sólidos suspensos de um certo lago.
42,4 - 65,7 - 29,8 - 58,7 - 52,1 - 55,8 - 57,0 - 68,7 - 67,3 - 67,3 - 54,3 - 54,0 - 73,1 - 81,3 - 59,9
56,9 - 62,2 - 69,9 - 66,9 - 59,0 - 56,3 - 43,3 - 57,4 - 45,3 - 80,1 - 49,7 - 42,8 - 42,4 - 59,6 - 65,8

a) construir a distribuição de frequências em classes (usar 𝑘 = 6);


b) calcular as frequências relativa e acumulada;
c) construir o histograma de frequências;
d) construir o diagrama de ramo e folhas.
17

3. O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos),
sendo feita 40 medições:
45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 – 34 - 45 - 35
41 - 57 - 38 - 46 - 46 - 58 - 57 - 36 - 58 - 35 - 31 - 59 - 44 - 57 - 45 - 44
38 - 43 - 33 - 56 - 47 - 48 - 44 - 49

a) construir a distribuição de frequências em classes (usar 𝑘 = 7);


b) calcular as frequências relativa e acumulada;
c) construir o histograma de frequências;
d) construir o diagrama de ramo e folhas.

1.7 MEDIDAS DE TENDÊNCIA CENTRAL, VARIABILIDADE E FORMA DA DISTRIBUIÇÃO

Ao analisar a distribuição de frequências de uma variável quantitativa, deve-se verificar


três características:
▪ Tendência central;
▪ Variabilidade ou Dispersão;

▪ Forma.

1.7.1 Medidas de Tendência Central


As medidas de tendência central ou de posição, indicam onde se concentra a maioria dos
dados.

1.7.1.1 Esperança matemática ou média aritmética


A esperança matemática ou média aritmética de uma variável aleatória X é o centro de
gravidade do conjunto de dados, e é definida como a soma de todos os valores da variável dividida
pelo número de observações.

a) Para dados simples

A esperança matemática ou média aritmética populacional é dada pela expressão:


𝑁
1
𝐸(𝑋) = 𝜇 = ∑ 𝑥𝑖
𝑁
𝑖=1

A média aritmética amostral é obtida através da seguinte expressão:


𝑛
1
𝑋̅ = ∑ 𝑥𝑖
𝑛
𝑖=1

b) Para dados agrupados em classes


A esperança matemática ou média aritmética populacional é dada pela expressão:

∑𝑘𝑖=1 𝑥𝑖 𝑓𝑖
𝐸(𝑋) = 𝜇 =
𝑁
onde: k é o número de classes;
𝑥𝑖 é o ponto médio das classes.
18

A média aritmética amostral é obtida através da seguinte expressão:

∑𝑘𝑖=1 𝑥𝑖 𝑓𝑖
𝑋̅ =
𝑛
onde: k é o número de classes (intervalos);
𝑥𝑖 é o ponto médio das classes.

Propriedades da Esperança Matemática

1. 𝐸(𝑋 ± 𝐾) = 𝐸(𝑋) ± 𝐾 , sendo k=constante e X v.a.


2. 𝐸(𝑘 × 𝑋) = 𝑘 × 𝐸(𝑋)

3. Sejam X e Y variáveis aleatórias. Então:


𝐸(𝑋 ± 𝑌) = 𝐸(𝑋) ± 𝐸(𝑌)

4. Sejam X e Y variáveis aleatórias independentes. Então:


𝐸(𝑋 × 𝑌) = 𝐸(𝑋) × 𝐸(𝑌)
5. 𝐸(𝑋 − 𝑋̅) = 0 v.a. centrada

A média e os valores extremos: a média apresenta um grave problema, ela é fortemente


influenciada pelos valores extremos. Por esta razão, deve-se fazer uma análise cuidadosa dos
dados.

Exemplos de aplicação

1) Suponha que um engenheiro esteja projetando um conector de náilon para ser usado em uma
aplicação automotiva. O engenheiro estabelece como especificação do projeto uma espessura de
3/32 polegadas, mas está inseguro acerca do efeito dessa decisão na força da remoção do
conector.
Oito unidades do protótipo são produzidas e suas forças de remoção são medidas (em libras-força):
12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1. A média da força de remoção será:

1 104
𝑋̅ = [12,6 + 12,9 + 13,4 + 13,6 + 13,5 + 12,6 + 13,1] = = 13,0
8 8
A média da força de remoção é 𝑋̅ = 13,0 libras-força

2) Considere a distribuição de frequência a seguir:


TABELA 4 - DISTRIBUIÇÃO DE FREQUENCIAS DO TEMPO
NECESSÁRIO PARA REALIZAÇÃO DE CERTA
OPERAÇÃO INDUSTRIAL
INTERVALO DAS
𝑓𝑖 𝑓𝑟 𝑓𝑎𝑐
CLASSES (s)
31 |---- 36 4 0,13 4
36 |---- 41 6 0,20 10
41 |---- 46 8 0,27 18
46 |---- 51 4 0,13 22
51 |---- 56 2 0,07 24
56 |---- 61 6 0,20 30
TOTAL 30 1,00
FONTE: Elaborada pela autora.
19

Calcular o tempo médio necessário para realizar a operação industrial.

Solução:
INTERVALO DAS
𝑓𝑖 𝑥𝑖 𝑥𝑖 𝑓𝑖
CLASSES (s)

31 |---- 36 4 33,5 134,0


36 |---- 41 6 38,5 231,0
41 |---- 46 8 43,5 348,0
46 |---- 51 4 48,5 194,0
51 |---- 56 2 53,5 107,0
56 |---- 61 6 58,5 351,0
TOTAL 30 1365,0

∑𝑛𝑖=1 𝑥𝑖 𝑓𝑖 1365
𝑋̅ = = = 45,40 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠
𝑛 30

1.7.1.2 Mediana
A mediana é o valor que ocupa a posição central do conjunto de observações de uma
variável, dividindo o conjunto em duas partes iguais, sendo que 50% dos dados assumem valores
menores ou igual ao valor da mediana e os 50% restantes, acima do seu valor.

a) Para dados simples

Etapas para a obtenção da mediana:


1. ordenar os dados em ordem crescente (pode ser também na ordem decrescente, mas
não é comum e pode atrapalhar na hora de calcular as medidas de posição);
2. Calcular o lugar ou posição que a mediana ocupa é:
(𝑛 − 1) (𝑛 − 1)
𝑃𝑜𝑠𝑀𝑒 = 2 × +1 = +1
4 2
3. o valor da mediana é o valor da variável que ocupa o lugar PosM e .

NOTA: A mediana é independente dos valores extremos, porque ela só leva em consideração os
valores de posição central.

Exemplos de aplicação:
1) Considerando-se as forças de remoção, medidas em uma amostra de oito unidades do protótipo
(em libras-força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1.

Rol: 12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6


(𝑛 − 1) (8 − 1)
𝑃𝑜𝑠𝑀𝑒 = +1= + 1 = 4,5
2 2
A mediana é a média aritmética dos valores que ocupam a posição 4 e 5. Logo,

12,9 + 13,1
𝑀𝑒 = = 13,0
2

A mediana é igual a 13,0 libras-força.


20

2) Os dados que seguem são os resultados da inspeção diária de todas as unidades de computadores
produzidos durante os últimos 10 dias. O número de unidades não conformes são:

4-7-5-8-6-6-4-5-8-7

Calcular a mediana.

Rol: 4 - 4 - 5 - 5 - 6 - 6 - 7 - 7 - 8 - 8

(𝑛 − 1) (10 − 1)
𝑃𝑜𝑠𝑀𝑒 = +1= + 1 = 5,5
2 2
6+6
𝑀𝑒 = = 6 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑛ã𝑜 𝑐𝑜𝑛𝑓𝑜𝑟𝑚𝑒𝑠
2
b) Dados agrupados em classes

(𝑛/2) − ′𝑓𝒂𝒄
𝑀𝑒 = 𝐿𝑖 + ×ℎ
𝑓𝒊
onde:
𝐿𝑖 é o limite inferior da classe que contém a mediana;
𝑛 é o número de elementos do conjunto de dados;
′𝑓𝑎𝑐 é a frequência acumulada da classe anterior a que contém a mediana;
𝑓𝒊 é a frequência simples da classe que contém a mediana;
ℎ é o intervalo ou amplitude da classe que contém a mediana.

1) Seja a distribuição de frequências a seguir. Calcular a mediana das medidas de uma dimensão
das peças.

TABELA 6 – DISTRIBUIÇÃO DE FREQUÊNCIAS


DAS MEDIDAS DE UMA DIMENSÃO
DAS PEÇAS
INTERVALO DAS
𝑓𝑖
CLASSES (mm)
102,8 |--- 112,8 3
112,8 |--- 122,8 3
122,8 |--- 132,8 4
132,8 |--- 142,8 6
142,8 |--- 152,8 4
TOTAL 20

Solução:

1) O passo inicial é calcular

𝑛 20
= = 10
2 2
2) Calcular as frequências acumuladas (𝑓𝑎𝑐 )
21

INTERVALO DAS
𝑓𝑖 𝑓𝑎𝑐
CLASSES (mm)
102,8 |--- 112,8 3 3
112,8 |--- 122,8 3 6
122,8 |--- 132,8 4 10
132,8 |--- 142,8 6 16
142,8 |--- 152,8 4 20
TOTAL 20

(𝑛/2) − ′𝑓𝒂𝒄
𝑀𝑒 = 𝐿𝑖 +
𝑓𝒊
10 − 6
𝑀𝑒 = 122,8 + × 10 = 132,8 𝑚𝑚
4

2) Considerando a distribuição a seguir, calcular a mediana.


TABELA 7 – DISTRIBUIÇÃO DE FREQUÊNCIAS DO
TEMPO GASTO PARA REALIZAÇÃO DA
OPERAÇÃO INDUSTRIAL
INTERVALO DAS
𝑓𝑖
CLASSES (s)
31 |---- 36 4
36 |---- 41 6
41 |---- 46 8
46 |---- 51 4
51 |---- 56 2
56 |---- 61 6
TOTAL 30

Solução:
INTERVALO DAS
𝑓𝑖 𝑓𝑎𝑐
CLASSES (s)
31 |---- 36 4 4
36 |---- 41 6 10
41 |---- 46 8 18
46 |---- 51 4 22
51 |---- 56 2 24
56 |---- 61 6 30
TOTAL 30
𝑛 30
= = 15
2 2
(𝑛/2) − ′𝑓𝒂𝒄
𝑀𝑒 = 𝐿𝑖 +
𝑓𝒊

15 − 10
𝑀𝑒 = 41 + × 5 = 44,125 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠
8
22

1.7.1.3 Moda

a) Para dados simples

A moda, representada por Mo , é o valor que apresenta maior frequência. Ela pode não
existir (distribuição amodal), ter somente um valor (unimodal) ou pode ter dois ou mais (bimodal
ou multimodal), principalmente quando a variável assume muitos valores.

Exemplo:
1) Considerando-se as forças de remoção, medidas em uma amostra de oito unidades do protótipo
(em libras-força): 12,6 - 12,9 - 13,4 - 12,3 - 13,6 - 13,5 - 12,6 - 13,1.

Para o exemplo tem-se que a moda é igual a 12,6 libras-força e é unimodal.


b) Dados agrupados em classes

Moda de Pearson

𝑀𝑜 = 3 × 𝑀𝑒 − 2 × 𝑋̅

onde:
𝑀𝑒 é a mediana da distribuição de dados;
𝑋̅ é a média da distribuição de dados.
Moda de Czuber

𝑑1
𝑀𝑜 = 𝐿𝑖 + ×ℎ
𝑑1 + 𝑑2
Onde:
𝑑1 é a diferença entre a frequência da classe modal e a frequência da classe vizinha anterior;
𝑑2 é a diferença entre a frequência da classe modal e a frequência da classe vizinha posterior.

Exemplos:
1) Dada a distribuição de frequências a seguir, calcular a moda.

TABELA 8 – DISTRIBUIÇÃO DE FREQUÊNCIAS DO


TEMPO GASTO PARA REALIZAÇÃO DA
OPERAÇÃO INDUSTRIAL
INTERVALO DAS
𝑓𝑖
CLASSES (s)
31 |---- 36 4
36 |---- 41 6
41 |---- 46 8
46 |---- 51 4
51 |---- 56 2
56 |---- 61 6
TOTAL 30

Solução
Tem-se que, a média e a mediana, da distribuição são, respectivamente:
23

𝑋̅ = 45,50 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠
𝑀𝑒 = 44,125 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠

Logo, pelo método de Pearson, a moda será:


𝑀𝑜 = 3 × 44,125 − 2 × 45,50 = 41,375 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠

Aplicando o método de Czuber tem-se:


2
𝑀𝑜 = 41 + 2+4 × 5 = 42,667 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠

2) Seja a distribuição de frequências a seguir. Calcular a moda das medidas de uma dimensão
das peças.
TABELA 9 – DISTRIBUIÇÃO DE FREQUÊNCIAS
DAS MEDIDAS DE UMA DIMENSÃO
DAS PEÇAS
INTERVALO DAS
𝑓𝑖
CLASSES (mm)
102,8 |--- 112,8 3
112,8 |--- 122,8 3
122,8 |--- 132,8 4
132,8 |--- 142,8 6
142,8 |--- 152,8 4
TOTAL 20

Solução

Tem-se que a média e a mediana da distribuição são, respectivamente:


𝑋̅ = 130,3 𝑚𝑚
𝑀𝑒 = 132,8 𝑚𝑚

Logo, a moda de Pearson, será:


𝑀𝑜 = 3 × 132,8 − 2 × 130,3 = 137,8 𝑚𝑚

Aplicando o método de Czuber tem-se:


2
𝑀𝑜 = 132,8 + 2+2 × 10 = 137,8 𝑚𝑚

1.7.2 Separatrizes

As separatrizes ou medida de ordenação, mais conhecidas são os quartis e os percentis.


Os quartis dividem o conjunto de dados em quatro partes iguais e os percentis, em cem partes
iguais. A cada quartil correspondem 25% do conjunto de dados e a percentil, 1%.
Da mesma forma que para a mediana, localizar as posições das separatrizes,
considerando os dados ordenados.

1.7.2.1 Quartil
São três medidas (𝑄1 , 𝑄2 , 𝑄3 ) que dividem o conjunto de dados em 4 partes iguais, sendo
que a cada quartil correspondem 25% dos dados.
24

a) Para dados simples

(𝑛−1)
𝑃𝑜𝑠𝑄𝑖 = 𝑖 × 4
+ 1, 𝑖 = 1,2,3

Exemplo 1: Os dados a seguir são diâmetros (em cm) de peças de automóveis:

12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0

Calcular os quartis.
(9−1)
𝑃𝑜𝑠𝑄1 = 1 × 4
+ 1 = 3 (3º. elemento) , logo 𝑄1 = 12,6 𝑐𝑚
(9−1)
𝑃𝑜𝑠𝑄2 = 2 × + 1 = 5 (5º. elemento) , logo 𝑄2 = 13,1 𝑐𝑚
4
(9−1)
𝑃𝑜𝑠𝑄3 = 3 × 4
+ 1 = 7 (7º. elemento) , logo 𝑄3 = 13,5 𝑐𝑚

Exemplo 2: Os dados abaixo são as medidas (mm) de uma dimensão de peças produzidas por
um processo de usinagem.
102,8 - 108,2 - 110,1 - 115,9 - 118,5 - 120,4 - 125,3 - 125,9 - 129,7 - 132,7
135,0 - 136,4 - 138,1 - 138,6 - 139,6 - 140,4 - 144,8 - 145,2 - 145,7 - 149,3

Calcular os quartis (1,2 e 3) .


(20−1)
𝑃𝑜𝑠𝑄1 = 1 × +1 = 5,75 (5,75º. elemento)
4

Logo, 𝑄1 = 118,5 + (120,4 − 118,5) × 0,75 = 119,925 𝑚𝑚

(20−1)
𝑃𝑜𝑠𝑄2 = 2 × 4
+ 1 = 10,5 (10,5º. elemento)

Logo, 𝑄2 = 132,7 + (135,0 − 132,7) × 0,5 = 133,85 𝑚𝑚

(20−1)
𝑃𝑜𝑠𝑄3 = 3 × 4
+ 1 = 15,25 (15,25º. elemento)

Logo 𝑄3 = 139,6 + (140,4 − 139,6) × 0,25 = 139,80 𝑚𝑚

b) Para dados agrupados em classes

𝑛
𝑃𝑜𝑠𝑄𝑖 = 𝑖 × , i=1,2,3
4

(𝑃𝑜𝑠𝑄𝑖 ) − ′𝑓𝒂𝒄
𝑄𝑖 = 𝐿𝑖 + ×ℎ
𝑓𝒊

onde:
n é o número de elementos do conjunto de dados;
𝐿𝑖 é o limite inferior da classe que contém o quartil;
′𝑓𝒂𝒄 é a freqüência acumulada da classe anterior a que contém o quartil;
𝑓𝒊 é a freqüência simples da classe que contém o quartil;
h é o intervalo ou amplitude da classe que contém a mediana.
25

Exemplos:

1) Seja a distribuição de frequências a seguir. Calcular os quartis 1,2 e 3, das medidas de uma
dimensão das peças.
TABELA 10 – DISTRIBUIÇÃO DE FREQUÊNCIAS
DAS MEDIDAS DE UMA DIMENSÃO
DAS PEÇAS
INTERVALO DAS 𝑓𝑎𝑐
𝑓𝑖
CLASSES (mm)
102,8 |--- 112,8 3 3 1º. ao 3º.
112,8 |--- 122,8 3 6 4º. ao 6º.
122,8 |--- 132,8 4 10 7º. ao 10º.
132,8 |--- 142,8 6 16 11º. ao 16º.
142,8 |--- 152,8 4 20 17º. ao 20º.
TOTAL 20

Calcular a posição (localização) dos quartis:


20
𝑃𝑜𝑠𝑄1 = 1 × =5
4
20
𝑃𝑜𝑠𝑄2 = 2 × = 10
4
20
𝑃𝑜𝑠𝑄3 = 3 × = 15
4

Localizar os elementos na tabela, utilizando as frequências acumuladas.


5−3
𝑄1 = 112,8 + 3
× 10 = 119,47 mm
10−6
𝑄2 = 112,8 + 4
× 10 = 132,80 mm
15−10
𝑄3 = 132,8 + × 10 = 141,13 mm
6

2) Dada a distribuição de frequências a seguir, calcular os quartis 1,2 e 3.

TABELA 11 – DISTRIBUIÇÃO DE FREQUÊN-


CIAS DO TEMPO PARA REALI-
ZAÇÃO DA OPERAÇÃO INDUS-
TRIAL
INTERVALO DAS
𝑓𝑖
CLASSES (s)
31 |---- 36 4
36 |---- 41 6
41 |---- 46 8
46 |---- 51 4
51 |---- 56 2
56 |---- 61 6
TOTAL 30

Calcular a posição (localização) dos quartis:


𝑛
𝑃𝑜𝑠𝑄𝑖 = 𝑖 ×
4
26
30
𝑃𝑜𝑠𝑄1 = 1 × = 7,5
4
30
𝑃𝑜𝑠𝑄2 = 2 × = 15
4

30
𝑃𝑜𝑠𝑄3 = 3 × = 22,5
4

Localizar os elementos na tabela, utilizando as frequências acumuladas.

INTERVALO DAS
𝑓𝑖 𝑓𝑎𝑐
CLASSES (s)
31 |---- 36 4 4 1º. ao 4º.
36 |---- 41 6 10 5º. ao 10º.
41 |---- 46 8 18 11º. ao 18º.
46 |---- 51 4 22 19º. ao 22º.
51 |---- 56 2 24 23º. ao 24º.
56 |---- 61 6 30 25º. Ao 30º.
TOTAL 30

Cálculo do 𝑄1 :
7,5−4
𝑄1 = 36 + ×5 = 38,91667 ≅ 38,92 segundos
6

Cálculo do 𝑄2 :
15−10
𝑄2 = 41 + 8
×5 = 44,1250 ≅ 44,12 segundos

Cálculo do 𝑄3 :
22,5−22
𝑄3 = 51 + 2
× 5 = 52,25 segundos

1.7.3 Medidas de variabilidade ou Dispersão

Para descrever adequadamente a distribuição de frequências de uma variável quantitativa,


além da informação do valor representativo da variável (tendência central), é necessário dizer
também o quanto estes valores variam, ou seja, o quanto eles são dispersos. Somente a
informação sobre a tendência central de um conjunto de dados não consegue representá-lo
adequadamente. As medidas de dispersão medem o grau de variabilidade ou dispersão dos
dados.

1.7.3.1 Amplitude Total


A amplitude total mede a distância entre o valor máximo e mínimo. Ela é uma estatística
rudimentar, pois embora forneça uma noção de dispersão, não diz qual é sua natureza.

𝐴𝑡 = 𝑋𝑚á𝑥 − 𝑋𝑚𝑖𝑛

Exemplo de aplicação:

Exemplo 1: Os dados a seguir são diâmetros (em cm) de peças de automóveis:


12,3 - 12,6 - 12,6 - 12,9 - 13,1 - 13,4 - 13,5 - 13,6 - 15,0
27

Tem-se que:
𝐴𝑡 = 𝑋𝑚á𝑥 − 𝑋𝑚𝑖𝑛 = 15,0 − 12,3 = 2,7 𝑐𝑚

1.7.3.2 Amplitude Interquartil


A amplitude interquartil, ou comprimento da caixa, é a distância entre o primeiro e terceiro
quartil. É muito útil para detectar valores atípicos ou outliers, e é usado no diagrama de caixa (box
plot).
𝐼𝑄 = 𝑄3 − 𝑄1

Exemplo: considerando os dados referentes aos diâmetros (em cm) de peças de automóveis e
os quartis correspondentes, já calculados anteriormente, calcular a amplitude interquartil.
(9−1)
𝑃𝑜𝑠𝑄1 = 1 × 4
+1 = 3 (3º. elemento) , logo 𝑄1 = 12,6 𝑐𝑚
(9−1)
𝑃𝑜𝑠𝑄2 = 2 × 4
+ 1 = 5 (5º. elemento) , logo 𝑄2 = 13,1 𝑐𝑚
(9−1)
𝑃𝑜𝑠𝑄3 = 3 × 4
+ 1 = 7 (7º. elemento) , logo 𝑄3 = 13,5 𝑐𝑚

𝐼𝑄 = 13,5 − 12,6 = 0,9 𝑐𝑚

Para a construção do diagrama de caixa (box plot), tem-se:


𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 𝑄1 − 1,5 × 𝐼𝑄
𝑙𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 𝑄3 + 1,5 × 𝐼𝑄
Para o exemplo em questão:
𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 12,6 − 1,5 × 0,9 = 11,25
𝑙𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 13,5 + 1,5 × 0,9 = 14,85
Existe um valor outlier superior, que é 15,0 cm.

15,0 é outlier
superior

13,6
13,5

13,1

12,6
12,3

1.7.3.3 Variância e Desvio Padrão


A variância da variável aleatória, é obtida elevando-se os desvios em relação à média ao
quadrado. Quando se extrai a raiz quadrada da variância, tem-se o desvio padrão.
28

Propriedades da Variância

1. 𝑉(𝑘) = 0, onde k=constante


2. 𝑉(𝑘. 𝑋) = 𝑘 2 𝑉(𝑋) , onde k=constante e X v.a.
3. Sejam X e Y v.a. independentes. Então:
𝑉(𝑋 ± 𝑌) = 𝑉(𝑋) + 𝑉(𝑌)
4. Sejam X e Y v.a. não independentes (ou dependentes). Então:
𝑉(𝑋 + 𝑌) = 𝑉(𝑋) + 𝑉(𝑌) + 2𝐶𝑂𝑉(𝑋, 𝑌)
𝑉(𝑋 − 𝑌) = 𝑉(𝑋) + 𝑉(𝑌) − 2𝐶𝑂𝑉(𝑋, 𝑌)
onde: 𝐶𝑂𝑉(𝑋, 𝑌) = 𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌) (covariância)

a) Para dados simples

A variância e o desvio padrão populacional são obtidos pelas expressões:


1 𝑁
𝜎2 = ∑ (𝑥 − 𝜇)2 (variância)
𝑁 𝑖=1 𝑖

𝜎 = √𝜎 2 (desvio padrão)

A variância e o desvio padrão amostral são obtidos pelas expressões:


1
𝑆 2 = 𝑛−1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)2 (variância)

𝑆 = √𝑆 2 (desvio padrão)

b) Para dados agrupados em classes

A variância e o desvio padrão populacional são obtidos pelas expressões:

∑𝑘𝑖=1(𝑥𝑖 − 𝜇)2 𝑓𝑖 ∑𝑘𝑖=1(𝑥𝑖 − 𝜇)2 𝑓𝑖


𝜎2 = = (variância)
∑𝑘𝑖=1 𝑓𝑖 𝑁

𝜎 = √𝜎 2 (desvio padrão)

A variância e o desvio padrão amostral são obtidos pelas expressões:

2
∑𝑘𝑖=1(𝑥𝑖 − 𝑋̅)2 𝑓𝑖 ∑𝑘𝑖=1(𝑥𝑖 − 𝑋̅)2 𝑓𝑖
𝑆 = = (variância)
∑𝑘𝑖=1 𝑓𝑖 − 1 𝑛−1

𝑆 = √𝑆 2 (desvio padrão)

REGRA EMPÍRICA:

Se os dados têm uma distribuição aproximadamente normal (segue uma distribuição


aproximadamente normal), a regra que segue, conhecida como regra empírica, pode ser usada
(GUTTMAN e GUPTA, 2017):
𝜇 ± 1𝜎 : compreende aproximadamente 68% das observações
𝜇 ± 2𝜎 : compreende aproximadamente 95% das observações
𝜇 ± 3𝜎 : compreende aproximadamente 99,7% das observações
29

Exemplos de aplicação

1) Considerando os dados referentes aos diâmetros (em cm) de peças de automóveis e


𝑋̅ = 13,22, calcular a variância e o desvio padrão.

QUADRO 5 - VALORES DA VARIÁVEL X E DESVIOS


SIMPLES E QUADRÁTICOS EM RELA-
ÇÃO À MÉDIA
𝑥𝑖 (𝑥𝑖 − 𝑋̅) (𝑥𝑖 − 𝑋̅)2
12,3 -0,92 0,8464
12,6 -0,62 0,3844
12,6 -0,62 0,3844
12,9 -0,32 0,1024
13,1 -0,12 0,0144
13,4 0,18 0,0324
13,5 0,28 0,0784
13,6 0,38 0,1444
15,0 1,78 3,1684
 5,1556

1 1
𝑆 2 = 𝑛−1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)2 = 9−1 × 5,1556 = 0,6445 𝑐𝑚2

𝑆 = √0,6445 = 0,80 𝑐𝑚

2) Seja a distribuição de frequências a seguir. Calcular a variância e o desvio padrão.

Dado: 𝑋̅ = 130,3 mm

INTERVALO DAS
𝑓𝑖 𝑥𝑖 (𝑥𝑖 − 𝑋̅) (𝑥𝑖 − 𝑋̅)2 (𝑥𝑖 − 𝑋̅ )2 𝑓𝑖
CLASSES (mm)
102,8 |--- 112,8 3 107,8 -22,5 506,25 1.518,75
112,8 |--- 122,8 3 117,8 -12,5 156,25 468,75
122,8 |--- 132,8 4 127,8 -2,5 6,25 25,00
132,8 |--- 142,8 6 137,8 7,5 56,25 337,50
142,8 |--- 152,8 4 147,8 17,5 306,25 1.225,00
TOTAL 20 3.575,00

∑𝑘𝑖=1(𝑥𝑖 − 𝑋̅)2 𝑓𝑖 3.575,00


𝑆2 = = = 188,1579 𝑚𝑚2
𝑛−1 20 − 1
𝑆 = 13,72 𝑚𝑚

1.7.3.4 Coeficiente de Variação


É uma medida de dispersão relativa. É definido como o quociente entre o desvio padrão e
a média, multiplicado por 100, para expressar porcentagem.
Em algumas situações é desejável comparar o grau de dispersão de dois conjuntos de
dados com unidades de medidas diferentes. Neste caso, deve-se usar o coeficiente de variação
(CV), que é uma medida de dispersão relativa, e ela não é afetada pelas unidades de medida da
variável. Ou ainda, quando as médias dos dois conjuntos de dados são muito distintas, neste caso
faz-se necessário utilizar uma medida de dispersão relativa.
30

Quanto menor coeficiente de variação, mais representativa dos dados observados é a


média aritmética.

σ
CV = × 100 coeficiente de variação populacional
μ

𝑆
𝐶𝑉 = × 100 coeficiente de variação amostral
𝑋̅

Exemplo de aplicação: Para o exemplo tem-se:

Dados: 𝑋̅ = 130,3 𝑚𝑚 ; 𝑆 = 13,72 𝑚𝑚


13,72
𝐶𝑉 = × 100 = 10,53%
130,3

REGRA EMPÍRICA:
Regra empírica para interpretações do Coeficiente de variação (MARTINS; DOMINGUES, 2019).
• Se 𝐶𝑉 < 15%, há pequena dispersão dos dados e a representatividade da média como
medida de tendência central é boa;
• Se 15 ≤ 𝐶𝑉 < 30%, há média dispersão dos dados e a representatividade da média como
medida de tendência central é regular;
• Se 𝐶𝑉 ≥ 30%, há elevada dispersão dos dados e a representatividade da média como
medida de tendência central é ruim.

1.7.4 Forma da Distribuição


A distribuição de frequências de uma variável pode ter várias formas, mas existem três
formas básicas, apresentadas através de histogramas e suas respectivas ogivas, que são gráficos
específicos para distribuições de frequências.
A distribuição é simétrica, quando as observações estão igualmente distribuídas em torno
de um valor mais frequente (metade acima e metade abaixo). Já, a assimetria de uma distribuição
pode ocorrer de duas formas:

 assimetria positiva;
 assimetria negativa.
Em alguns casos, apenas o conhecimento da forma da distribuição de frequências de uma
variável já nos fornece uma boa informação sobre o comportamento dessa variável.

1.7.4.1 Coeficiente do momento de assimetria


1 𝑘 ̅ 3

𝑎3 = 𝑛 𝑖=1(𝑥𝑖 − 𝑋) 𝑓𝑖
3/2
1
[𝑛 ∑𝑘𝑖=1(𝑥𝑖 − 𝑋̅ )2 𝑓𝑖 ]

onde:
31

𝑛: número de observações na amostra;


𝑘: número de classes;
𝑥𝑖 : ponto médio da classe i;
𝑓𝑖 : frequência simples da classe i;
𝑋̅: média aritmética.

É possível classificar a distribuição quanto a assimetria de acordo com os seguintes


critérios:

Simétrica: 𝑎3 = 0
Assimétrica negativa: 𝑎3 < 0
Assimétrica positiva: 𝑎3 > 0

FIGURA 3 – CLASSIFICAÇÃO DA DISTRIBUIÇÃO SEGUNDO FORMA

FONTE: Adaptado de SPIEGEL et al. (2013).

Quando o tamanho da amostra for grande, o histograma de frequências é um indicador


confiável para indicar a forma da distribuição, isto é, da população de onde a amostra foi retirada
(MONTGOMERY; RANGER (2009)).

Assimetria positiva: observações com valores menores são mais frequentes (deslocada para a
direita);
Assimetria negativa: observações com valores maiores são mais frequentes (deslocada para a
esquerda);

Simétrica: as observações estão igualmente distribuídas em torno de um valor mais frequente


(metade abaixo e metade acima).
O histograma apresentada a seguir, mostra uma distribuição de frequências ligeiramente
assimétrica negativa, onde tem-se que observações com valores maiores são mais frequentes.
32

1.7.4.2 Coeficiente do momento de curtose

A medida de curtose é o grau de achatamento da distribuição, é um indicador da forma


desta distribuição. O coeficiente momento de curtose é definido como sendo:

1 𝑘
∑𝑖=1(𝑥𝑖 − 𝑋̅)4 𝑓𝑖
𝑎4 = 𝑛
2
1
[𝑛 ∑𝑘𝑖=1(𝑥𝑖 − 𝑋̅ )2 𝑓𝑖 ]

onde:
𝑛: número de observações na amostra;
𝑘: número de classes;
𝑥𝑖 : ponto médio da classe i;
𝑓𝑖 : frequência simples da classe i;
𝑋̅: média aritmética.

Se 𝑎4 < 3, a distribuição é platicúrtica e esta apresenta uma curva de frequência mais


aberta, com os dados fracamente concentrados em torno de seu centro.
Se 𝑎4 = 3 , a distribuição é mesocúrtica e os dados estão razoavelmente concentrados
em torno de seu centro.
Se 𝑎4 > 3 , a distribuição é leptocúrtica e esta apresenta uma curva de frequência
bastante fechada, com os dados fortemente concentrados em torno de seu centro.

A curtose ou achatamento é mais uma medida com a finalidade de complementar a


caracterização da dispersão em uma distribuição. Esta medida quantifica a concentração ou
dispersão dos valores de um conjunto de dados em relação às medidas de tendência central em
uma distribuição de frequências. Uma distribuição é classificada quanto ao grau de achatamento
como apresentada na figura 3.
33

FIGURA 4 - CLASSIFICAÇÃO DAS DISTRIBUIÇÕES QUANTO A CURTOSE

FONTE: COSTA NETO (1994).

Exemplo 1: Para a distribuição de frequências das medidas (mm) de uma dimensão das peças,
apresentadas a seguir, e as estatísticas já calculadas anteriormente, calcular os coeficientes de
assimetria e curtose.
INTERVALO DAS
𝑓𝑖
CLASSES (mm)
102,8 |--- 112,8 3
112,8 |--- 122,8 3
122,8 |--- 132,8 4
132,8 |--- 142,8 6
142,8 |--- 152,8 4
TOTAL 20

Solução:

INTERVALO DAS
𝑓𝑖 𝑥𝑖 (𝑥𝑖 − 𝑋̅) (𝑥𝑖 − 𝑋̅)𝑓𝑖 (𝑥𝑖 − 𝑋̅ )2 𝑓𝑖 (𝑥𝑖 − 𝑋̅)3 𝑓𝑖 (𝑥𝑖 − 𝑋̅)4 𝑓𝑖
CLASSES (mm)
102,8 |--- 112,8 3 107,8 -22,5 -67,5 1.518,75 - 34.171,88 768.867,19
112,8 |--- 122,8 3 117,8 -12,5 -37,5 468,75 - 5.859,38 73.242,19
122,8 |--- 132,8 4 127,8 -2,5 -10,0 25,00 - 62,50 156,25
132,8 |--- 142,8 5 137,8 7,5 45,0 337,50 2.531,25 18.984,38
142,8 |--- 152,8 5 147,8 17,5 70,0 1.225,00 21.437,50 375.156,25
TOTAL 20 3.575,00 -16.125,00 1.236.406,25
1 𝑘 ̅ 3 1

𝑎3 = 𝑛 𝑖=1(𝑥𝑖 − 𝑋) 𝑓𝑖 = 20 × (−16.125,00)
= −0,3374
3/2 3/2
1 1
[𝑛 ∑𝑘𝑖=1(𝑥𝑖 − 𝑋̅ )2 𝑓𝑖 ] [20 × 3.575,00]

A distribuição apresenta assimetria negativa moderada.

Na prática, só tem sentido calcular o coeficiente do momento de curtose para


distribuições simétricas.
1 𝑘 1
∑𝑖=1(𝑥𝑖 − 𝑋̅)4 𝑓𝑖 × 1.236.406,25
𝑎4 = 𝑛 = 20
2 2 = 1,9348
1 𝑘 ̅ 2 1
[𝑛 ∑𝑖=1(𝑥𝑖 − 𝑋 ) 𝑓𝑖 ] [20 × 3.575,00]

A distribuição é platicúrtica.
34

Exemplo 2: Dada a distribuição de frequências a seguir, calcular a assimetria e curtose.

INTERVALO DAS
𝑓𝑖
CLASSES (s)
31 |---- 36 4
36 |---- 41 6
41 |---- 46 8
46 |---- 51 4
51 |---- 56 2
56 |---- 61 6
TOTAL 30

Solução:

INTERVALO DAS
𝑓𝑖 𝑥𝑖 (𝑥𝑖 − 𝑋̅) (𝑥𝑖 − 𝑋̅)𝑓𝑖 (𝑥𝑖 − 𝑋̅)2 𝑓𝑖 (𝑥𝑖 − 𝑋̅)3 𝑓𝑖 (𝑥𝑖 − 𝑋̅)4 𝑓𝑖
CLASSES (s)
31 |---- 36 4 33,5 -12 -48 576 -6.912 82.944
36 |---- 41 6 38,5 -7 -42 294 -2.058 14.406
41 |---- 46 8 43,5 -2 -16 32 -64 128
46 |---- 51 4 48,5 3 12 36 108 324
51 |---- 56 2 53,5 8 16 128 1.024 8.192
56 |---- 61 6 58,5 13 78 1.014 13.182 171.366
TOTAL 30 0 2.080 5.280 277.360

1 𝑘 1
∑ (𝑥 − 𝑋̅)3 𝑓𝑖 × (5.280)
𝑎3 = 𝑛 𝑖=1 𝑖 = 30 = 0,3049
3/2 3/2
1 1
[𝑛 ∑𝑘𝑖=1(𝑥𝑖 − 𝑋̅ )2 𝑓𝑖 ] [30 × 2.080]

A distribuição apresenta assimetria positiva moderada.


Na prática, só tem sentido calcular o coeficiente do momento de curtose para
distribuições simétricas.
1 𝑘 1
∑𝑖=1(𝑥𝑖 − 𝑋̅)4 𝑓𝑖 × 277.360
𝑎4 = 𝑛 = 30
2 2 = 1,9230
1 𝑘 ̅ 2 1
[𝑛 ∑𝑖=1(𝑥𝑖 − 𝑋 ) 𝑓𝑖 ] [30 × 2.080]

A distribuição é platicúrtica.

LISTA DE EXERCÍCIOS 02

1. Foram obtidas oito medidas do diâmetro interno de anéis de pistão forjados de motor de
automóvel. Os dados (em mm) são:

74,001 - 74,003 - 74,015 - 74,000 - 74,005 - 74,002 - 74,005 - 74,004

Calcule a média, mediana, moda, desvio padrão e o coeficiente de variação da amostra.


35

2. Os tempos de esgotamento de um fluído isolante entre eletrodos a 34 kV, em minutos, são:


0,19 - 0,78 - 0,96 - 1,31 - 2,78 - 3,16 - 4,15 - 4,67 - 4,85 - 6,50 - 7,35 - 8,01 - 8,27 - 12,06 - 31,75 -
32,52 - 33,91 - 36,71 - 72,89.

Calcule a média, mediana, quartil 1, quartil 3, desvio padrão e coeficiente de variação e comente
os resultados obtidos. (Usar a fórmula de Sturges para calcular o número de classes).
3. O pH de uma solução é medido oito vezes por uma operadora que usa o mesmo instrumento.
Ela obteve os seguintes dados:
7,15 - 7,20 - 7,18 - 7,19 - 7,21 - 7,20 -7,16 - 7,18

Faça uma análise estatística dos dados e comente.


4. Prevenir a propagação de trinca de fadiga em estruturas de aviões é um importante elemento
de segurança em aeronaves. Um estudo de engenharia para investigar a trinca de fadiga em 𝑛 =
9 asas reportou os seguintes comprimentos (em mm) de trinca:
2,13 - 2,96 - 3,02 - 1,82 - 1,15 - 1,37 - 2,04 - 2,47 - 2,60

Calcule a média, os quartis (1,2 e 3), desvio padrão e coeficiente de variação da amostra. Comente
os resultados obtidos.
5. Uma amostra de 7 corpos de prova de concreto forneceu as seguintes resistências à ruptura
(kg/cm2):
340 - 329 - 337 - 348 - 351 - 360 - 354

Calcular a média, mediana, moda, variância, desvio padrão e coeficiente de variação. Comente
os resultados obtidos.
6. O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos),
sendo feita 20 medições.
45 - 37 - 39 - 48 - 51 - 40 - 53 - 49 - 39 - 41 - 45 - 43 - 45 – 34 - 45 - 35 - 38 - 46 - 46 - 58

Faça uma análise estatística dos dados construindo a distribuição de frequências em classes
(calcule também as medidas de assimetria e curtose). Usar 𝑘 = 5.

7. As taxas de octanagem de combustível para motor, de várias misturas de gasolina foram


obtidas:
88,5 - 94,7 - 84,3 - 90,1 - 89,0 - 89,8 - 91,6 - 90,3 - 90,0 - 91,5 - 89,9
98,8 - 88,3 - 90,4 - 91,2 - 90,6 - 92,2 - 87,7 - 91,1 - 86,7 - 93,4 - 96,1
Faça uma análise estatística dos dados (calcule também as medidas de assimetria e curtose).
Usar 𝑘 = 5.

8. A propagação de trincas por fadiga em diversas peças de aeronaves tem sido objeto de muitos
estudos. Os dados a seguir consistem dos tempos de propagação (horas de vôo) para atingir um
determinado tamanho de trinca em furos de fixadores propostos para uso em aeronaves militares.
Usar 𝑘 = 5.
0,736 - 0,863 - 0,865 - 0,913 - 0,915 - 0,937 - 0,983 - 1,007
1,011 - 1,064 - 1,109 -1,132 - 1,140 - 1,153 - 1,253 - 1,394

a) calcule e compare os valores da média e mediana;


b) calcule o desvio médio, desvio padrão e coeficiente de variação;
c) qual é a conclusão sobre a forma da distribuição (assimetria e curtose)?
36

9. O tempo necessário para se realizar certa operação industrial foi cronometrado (em segundos),
sendo feita 12 medições:
45 – 37 – 39 – 48 – 51 – 40 - 53 – 49 – 39 – 41- 45 – 43

a) calcular Q1 (quartil 1), Q2 (quartil 2) e Q3 (quartil 3);


b) construir o box plot.
10. As taxas de octanagem de combustível para motor, de várias misturas de gasolina foram
obtidas:
88,5 - 94,7 – 80,0 - 90,1 - 89,0 - 89,8 - 91,6 - 90,3 - 90,0 - 91,5 - 89,9

a) calcular Q1 (quartil 1), Q2 (quartil 2) e Q3 (quartil 3);


b) construir o box plot.
37

2 ELEMENTOS DE PROBABILIDADES

2.1 EXPERIMENTO ALEATÓRIO (E)

Definição 1: É o fenômeno que, mesmo repetidos várias vezes sob condições semelhantes,
apresentam resultados imprevisíveis. O resultado final depende do acaso.

2.2 ESPAÇO AMOSTRAL (S)

Definição 2: É o conjunto formado por todos os resultados possíveis em qualquer experimento


aleatório.
Exemplos: Sejam os experimentos aleatórios e os respectivos espaços amostrais:
a) Inspecionar uma peça de automóvel. 𝑆 = {𝑐𝑜𝑛𝑓𝑜𝑟𝑚𝑒 , 𝑛ã𝑜 𝑐𝑜𝑛𝑓𝑜𝑟𝑚𝑒} ;
b) Escolher uma válvula eletrônica e verificar o tempo de vida útil. 𝑆 = {𝑥 ∈ 𝑅, 𝑥 ≥ 0};
c) Inspecionar uma lâmpada. 𝑆 = {𝑑𝑒𝑓𝑒𝑖𝑡𝑢𝑜𝑠𝑎, 𝑛ã𝑜 𝑑𝑒𝑓𝑒𝑖𝑡𝑢𝑜𝑠𝑎} ;
d) Medir o conteúdo de cobre no latão. 𝑆 = {𝑥 ∈ 𝑅, 50% ≤ 𝑥 ≤ 90%}

2.3 EVENTO

Definição 3: É um subconjunto do espaço amostral S de um experimento aleatório.

A
S
Exemplo:

Seja o experimento “seleção de duas peças”.


O espaço amostral será: 𝑆 = {(𝑐, 𝑐), (𝑐, 𝑛), (𝑛, 𝑐), (𝑐, 𝑐)}

sendo c=peça conforme e n=peça não conforme


Suponha que A seja o subconjunto de resultados para os quais, no mínimo uma peça seja
conforme. Então o evento A será: 𝐴 = {(𝑐, 𝑐), (𝑐, 𝑛), (𝑛, 𝑐)}.

Por serem subconjuntos, é possível realizar a operação de união (U) entre conjuntos. A União de
Eventos representa a ocorrência de um evento OU de outro. Outra operação que pode ser feita
sobre Eventos é a intersecção (∩). A intersecção de eventos representa a ocorrência de um E
de outro.

União de eventos => A  B

A
B
38

A B

A
Interseção de eventos => A  B
B

2.3.1 Evento Complementar

O evento complementar do evento A, representado por 𝐴̅, é aquele que ocorre somente se
A deixar de ocorrer. E tem-se que:

𝐴 ∪ 𝐴̅ = 𝐴 + 𝐴̅ = 𝑆 portanto: 𝑃(𝐴 + 𝐴̅) = 1

𝐴 ∩ 𝐴̅ = 𝐴 × 𝐴̅ = ∅ portanto: 𝑃(𝐴 × 𝐴̅) = 0

Seja o evento A, obter número 4 na face superior no lançamento de um dado 𝐴 = {4} . O


evento complementar 𝐴̅ será: 𝐴̅ = {1, 2, 3, 5, 6} .

2.3.2 Eventos Independentes


Quando a realização ou não realização de um dos eventos não afeta a probabilidade da
realização do outro e vice-versa.
Exemplos:

1) No lançamento de dois dados qual é a probabilidade de obter o nº 4 no primeiro dado e o nº 3


no segundo dado ?

𝑃(1) = 𝑃(𝑛𝑜. 4 𝑛𝑜 𝑑𝑎𝑑𝑜 1) = 1/6

𝑃(2) = 𝑃(𝑛𝑜. 3 𝑛𝑜 𝑑𝑎𝑑𝑜 2) = 1/6


1 1 1
𝑃(1 ∩ 2) = 𝑃(1 𝐸 2) = 𝑃(1) × 𝑃(2) = × =
6 6 36
2) Suponha que numa produção diária de 850 peças fabricadas contenha 50 peças que não
satisfaçam as exigências dos consumidores. Duas peças são selecionadas, sendo que a primeira
peça é reposta antes da segunda ser selecionada. Qual é a probabilidade das duas peças serem
defeituosas?
50 50
𝑃(𝐷 𝑒 𝐷) = × = 0,0035 × 100 ≅ 0,35%
850 850

2.3.3 Eventos Mutuamente Exclusivos


Dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a
possibilidade de realização do(s) outro(s). Assim, no lançamento de uma moeda, o evento "tirar
39

cara" e o evento "tirar coroa" são mutuamente exclusivos, já que, ao se realizar um deles, o outro
não se realiza.

A
B
S

Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize


é igual à soma das probabilidades de que cada um deles se realize:

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴 𝑜𝑢 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)

Exemplos:

1) No lançamento de um dado qual a probabilidade de se tirar o nº 3 ou o nº 4 ?


Os dois eventos são mutuamente exclusivos então:
1 1 1
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴 𝑜𝑢 𝐵) = 𝑃(𝑛𝑜. 3) + 𝑃(𝑛𝑜. 4) = + =
6 6 3
2) Um parafuso é selecionado aleatoriamente de um lote de 100 parafusos, sendo que 15
apresentam pequenos defeitos e 10 são não-conformes (não aceitáveis). Qual é a probabilidade
do parafuso selecionado ser:
a) Perfeito ou apresentar pequeno defeito?
b) Apresentar pequeno defeito ou não-conforme?

Solução:
15 𝑝𝑒𝑞𝑢𝑒𝑛𝑜𝑠 𝑑𝑒𝑓𝑒𝑖𝑡𝑜𝑠
10 𝑛ã𝑜 𝑐𝑜𝑛𝑓𝑜𝑟𝑚𝑒𝑠
75 𝑝𝑒𝑟𝑓𝑒𝑖𝑡𝑜𝑠
a) 𝑃(𝑝𝑒𝑟𝑓𝑒𝑖𝑡𝑜 𝑜𝑢 𝑝𝑒𝑞𝑢𝑒𝑛𝑜 𝑑𝑒𝑓𝑒𝑖𝑡𝑜) =?

𝑃(𝑝𝑒𝑟𝑓𝑒𝑖𝑡𝑜 𝑜𝑢 𝑝𝑒𝑞𝑢𝑒𝑛𝑜 𝑑𝑒𝑓𝑒𝑖𝑡𝑜) = 𝑃(𝑝𝑒𝑟𝑓𝑒𝑖𝑡𝑜) + 𝑃(𝑝𝑒𝑞𝑢𝑒𝑛𝑜 𝑑𝑒𝑓𝑒𝑖𝑡𝑜)

75 15 90
𝑃(𝑝𝑒𝑟𝑓𝑒𝑖𝑡𝑜 𝑜𝑢 𝑝𝑒𝑞𝑢𝑒𝑛𝑜 𝑑𝑒𝑓𝑒𝑖𝑡𝑜) = + = = 0,90 × 100 = 90%
100 100 100

b) 𝑃(𝑝𝑒𝑞𝑢𝑒𝑛𝑜 𝑑𝑒𝑓𝑒𝑖𝑡𝑜 𝑜𝑢 𝑛ã𝑜 𝑐𝑜𝑛𝑓𝑜𝑟𝑚𝑒) = 𝑃(𝑝𝑒𝑞𝑢𝑒𝑛𝑜 𝑑𝑒𝑓𝑒𝑖𝑡𝑜) + 𝑃(𝑛ã𝑜 𝑐𝑜𝑛𝑓𝑜𝑟𝑚𝑒)

15 10 25
𝑃(𝑝𝑒𝑞𝑢𝑒𝑛𝑜 𝑑𝑒𝑓𝑒𝑖𝑡𝑜 𝑜𝑢 𝑛ã𝑜 𝑐𝑜𝑛𝑓𝑜𝑟𝑚𝑒) = + = = 0,25 × 100 = 25%
100 100 100

2.4 DEFINIÇÃO CLÁSSICA DE PROBABILIDADE

Seja A um subconjunto do espaço amostral S. Então, se todos os resultados elementares de S


são equiprováveis, a medida da probabilidade de ocorrência do evento A é dada por:
40

𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑚 𝐴 𝑛(𝐴)


𝑃(𝐴) = =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑚 𝑆 𝑛(𝑆)

2.5 DEFINIÇÃO AXIOMÁTICA DE PROBABILIDADE

Seja o espaço amostral S associado a um certo experimento. A cada evento 𝐴 ∈ 𝑆 associa-


se um número real representado por 𝑃(𝐴), chamado de probabilidade de 𝐴, satisfazendo as
propriedades:
1) 0 ≤ 𝑃(𝐴) ≤ 1
2) 𝑃(𝑆) = 1 (ou seja, a probabilidade do evento certo é igual a 1)

3) sejam A e B dois eventos mutuamente exclusivos. A probabilidade de ocorrência de A ou B


é igual à soma das probabilidades individuais.
𝑃(𝐴 𝑜𝑢 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)

2.6 PROBABILIDADE CONDICIONAL

Definição 4: Sejam A e B eventos de um experimento E, com 𝑃(𝐵) > 0. Então a probabilidade


condicional do evento A dado que B tenha ocorrido é:

𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴|𝐵) = , sendo 𝐴 ∈ E
𝑃(𝐵)

𝑃(𝐴|𝐵): probabilidade de ocorrer o evento “A”, dado que ocorreu o evento “B” (sabe-se que
ocorreu o evento “B”)

Exemplo: O quadro a seguir fornece um exemplo de 400 itens classificados por falhas na
superfície e como defeituosos (funcionalmente).
FALHAS NA SUPERFÍCIE
DEFEITUOSO
Sim Não TOTAL
Sim 10 18 28
Não 30 342 372
TOTAL 40 360 400

a) Qual é a probabilidade do item ser defeituoso, dado que apresenta falhas na superfície?
b) Qual é a probabilidade de ter falhas na superfície dado que é defeituoso?

Solução:
a) Sabe-se que o item apresenta falhas na superfície, portanto, considerar somente os itens que
apresentam falhas na superfície
10
𝑃(𝑑𝑒𝑓𝑒𝑖𝑡𝑢𝑜𝑠𝑜 | 𝑓𝑎𝑙ℎ𝑎𝑠 𝑛𝑎 𝑠𝑢𝑝𝑒𝑟𝑓í𝑐𝑖𝑒) = = 0,25 × 100 = 25%
40

b) Sabe-se que o item é defeituoso, portanto, considerar somente os itens defeituosos


10
𝑃(𝑓𝑎𝑙ℎ𝑎𝑠 𝑛𝑎 𝑠𝑢𝑝𝑒𝑟𝑓í𝑐𝑖𝑒 | 𝑑𝑒𝑓𝑒𝑖𝑡𝑢𝑜𝑠𝑜) = = 0,3571 × 100 = 35,71%
28
41

A Probabilidade Condicional pode assumir a forma abaixo, chamada algumas vezes de


teorema da multiplicação de probabilidades:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴|𝐵) × 𝑃(𝐵), ou de forma equivalente, 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵|𝐴) × 𝑃(𝐴)

Exemplo: A probabilidade de que o primeiro estágio de uma operação, numericamente controlada,


de usinagem para pistões com alta rpm atenda às especificações é igual a 0,90. Falhas são devido
a variações no metal, alinhamento de acessórios, condições da lâmina de corte, vibração e
condições ambientais. Dado que o primeiro estágio atende às especificações, a probabilidade de
que o segundo estágio de usinagem atenda à especificações é de 0,95. Qual a probabilidade de
ambos os estágios atenderem as especificações?

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵|𝐴) × 𝑃(𝐴) = 0,95 × 0,90 = 0,8550 × 100 = 85,50%

2.7 TEOREMA DA PROBABILIDADE TOTAL

Suponha que eventos aleatórios 𝐴1 , 𝐴2 , … , 𝐴𝑘 sejam 𝑘 conjuntos mutuamente exclusivos e


exaustivos (𝐴1 ∪ 𝐴2 … ∪ 𝐴𝑘 = 𝑆) . Então:

𝑃(𝐵) = ∑ 𝑃(𝐴𝑖 ) × 𝑃(𝐵|𝐴𝑖 )


𝑖

Exemplos:

1) A probabilidade de que um conector elétrico que seja mantido seco falhe durante o período de
garantia de um computador portátil é 1%. Se o conector for molhado, a probabilidade de falha
durante o período de garantia será de 5%. Se 90% dos conectores forem mantidos secos e 10%
forem mantidos molhados, qual é a probabilidade dos conectores falharem durante o período da
garantia?

𝑃(𝐵) = ∑ 𝑃(𝐴𝑖 ) × 𝑃(𝐵|𝐴𝑖 )


𝑖

𝑃(𝑓𝑎𝑙ℎ𝑎𝑟 | 𝑚𝑎𝑛𝑡𝑖𝑑𝑜 𝑠𝑒𝑐𝑜) = 0,01


𝑃(𝑓𝑎𝑙ℎ𝑎𝑟 | 𝑚𝑎𝑛𝑡𝑖𝑑𝑜 𝑚𝑜𝑙ℎ𝑎𝑑𝑜) = 0,05
𝑃(𝑚𝑎𝑛𝑡𝑖𝑑𝑜 𝑠𝑒𝑐𝑜) = 0,90
𝑃(𝑚𝑎𝑛𝑡𝑖𝑑𝑜 𝑚𝑜𝑙ℎ𝑎𝑑𝑜) = 0,10
𝑃(𝑓𝑎𝑙ℎ𝑎𝑟) =?
𝑃(𝑓𝑎𝑙ℎ𝑎𝑟) = 𝑃(𝑚𝑎𝑛𝑡𝑖𝑑𝑜 𝑠𝑒𝑐𝑜) × 𝑃(𝑓𝑎𝑙ℎ𝑎𝑟 | 𝑚𝑎𝑛𝑡𝑖𝑑𝑜 𝑠𝑒𝑐𝑜)
+𝑃(𝑚𝑎𝑛𝑡𝑖𝑑𝑜 𝑚𝑜𝑙ℎ𝑎𝑑𝑜) × 𝑃(𝑓𝑎𝑙ℎ𝑎𝑟 | 𝑚𝑎𝑛𝑡𝑖𝑑𝑜 𝑚𝑜𝑙ℎ𝑎𝑑𝑜)

𝑃(𝑓𝑎𝑙ℎ𝑎𝑟) = 0,90 × 0,01 + 0,10 × 0,05 = 0,0140 × 100 = 1,4%

2) Suponha que na fabricação de semicondutores, a probabilidade seja de 0,10 de que um chip


que esteja sujeito a altos níveis de contaminação durante a fabricação cause uma falha no
produto. A probabilidade é de 0,005 de que um chip que não esteja sujeito a altos níveis de
contaminação durante a fabricação cause uma falha no produto. Em um dado instante da
produção, 20% dos chips estão sujeitos a altos níveis de contaminação. Qual a probabilidade de
um produto usando um desses chips vir a falhar?
42

𝑃(𝐵) = ∑ 𝑃(𝐴𝑖 ) × 𝑃(𝐵|𝐴𝑖 )


𝑖

𝑃(𝑓𝑎𝑙ℎ𝑎𝑟 | 𝑎𝑙𝑡𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑡𝑎𝑚𝑖𝑛𝑎çã𝑜) = 0,10


𝑃(𝑓𝑎𝑙ℎ𝑎𝑟 | 𝑏𝑎𝑖𝑥𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑡𝑎𝑚𝑖𝑛𝑎çã𝑜) = 0,005
𝑃(𝑎𝑙𝑡𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑡𝑎𝑚𝑖𝑛𝑎çã𝑜) = 0,20
𝑃(𝑏𝑎𝑖𝑥𝑜 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑡𝑎𝑚𝑖𝑛𝑎çã𝑜) = 0,80
𝑃(𝑓𝑎𝑙ℎ𝑎𝑟) =?

2.8 TEOREMA DE BAYES

Uma das relações mais importantes envolvendo probabilidades condicionais é dada pelo teorema
de Bayes, que expressa uma probabilidade condicional em termos de outras probabilidades
condicionais.

𝑃(𝐴𝑖 ) × 𝑃(𝐵|𝐴𝑖 )
𝑃(𝐴𝑖 |𝐵) = 𝑘
∑𝑗=1 𝑃(𝐴𝑗 ) × 𝑃(𝐵|𝐴𝑗 )

Exemplo: Uma determinada peça é produzida por três fábricas, 1, 2 e 3. Sabe-se que a fábrica 1
produz o dobro de peças que 2, e 2 e 3 produziram o mesmo número de peças durante um período
de produção especificado. Sabe-se também que 2% das peças produzidas por 1 e por 2 são
defeituosas, enquanto 4% daquelas produzidas por 3 são defeituosas. Todas as peças são
colocadas num depósito. Uma peça é retirada ao acaso do depósito e se verifica que é defeituosa.
Qual a probabilidade de que tenha sido produzida na fábrica 1?

Definição dos eventos:


B={ a peça é defeituosa}
A1={ a peça é da fábrica 1}
A2={ a peça é da fábrica 2}
A3={ a peça é da fábrica 3}
𝑃(𝐵|𝐴1 ) = 0,02
1
𝑃(𝐴1 ) =
2
𝑃(𝐵|𝐴2 ) = 0,02
1
𝑃(𝐴2 ) =
4
𝑃(𝐵|𝐴3 ) = 0,04
1
𝑃(𝐴3 ) =
4
𝑃(𝐴𝑖 ) × 𝑃(𝐵|𝐴𝑖 )
𝑃(𝐴𝑖 |𝐵) = 𝑘
∑𝑗=1 𝑃(𝐴𝑗 ) × 𝑃(𝐵|𝐴𝑗 )
43

𝑃(𝐴1 ) × 𝑃(𝐵|𝐴1 )
𝑃(𝐴1 |𝐵) =
𝑃(𝐴1 ) × 𝑃(𝐵|𝐴1 ) + 𝑃(𝐴2 ) × 𝑃(𝐵|𝐴2 ) + 𝑃(𝐴3 ) × 𝑃(𝐵|𝐴3 )
1
𝑃(𝐴1 |𝐵) = 2 × 0,02 = 0,40 × 100 = 40%
1 1 1
× 0,02 + × 0,02 + × 0,04
2 4 4

2) Cada objeto manufaturado é submetido para exame com a probabilidade 0,55 a um controlador
e com a probabilidade 0,45 a um outro. A probabilidade de passar no exame é, segundo o
controlador, respectivamente igual a 0,90 e 0,98. Achar a probabilidade de que um objeto aceito
tenha sido examinado pelo segundo controlador.
B={ ser aceito }
A1={ controlador A}
A2={ controlador B}
𝑃(𝑠𝑒𝑟 𝑎𝑐𝑒𝑖𝑡𝑜|𝐴1 ) = 0,90
𝑃(𝑠𝑒𝑟 𝑎𝑐𝑒𝑖𝑡𝑜|𝐴2 ) = 0,98
𝑃(𝐴1 ) = 0,55
𝑃(𝐴2 ) = 0,45
𝑃(𝐴2 |𝐵) =?

LISTA DE EXERCÍCIOS 03

1. De uma caixa contendo 100 peças entre as quais 10 são defeituosas se extraem quatro peças
ao acaso, sem reposição. Encontrar a probabilidade de que entre estas não ocorra:
a) nenhuma peça defeituosa;
b) nenhuma peça boa.
2. De um lote de 15 válvulas 10 são boas. Encontrar a probabilidade de que de 3 válvulas extraídas
ao acaso, sem reposição, 2 sejam boas.
3. Uma caixa contém 20 peças das quais 5 são defeituosas. Extraem-se duas ao acaso, sem
reposição. Qual a probabilidade de:
a) ambas serem boas?
b) ambas serem defeituosas?
c) uma boa e outra defeituosa?

4. Dois aparelhos de alarme independentes funcionam, no caso de avaria, com a probabilidade


0,95 e 0,90, respectivamente. Achar a probabilidade de que numa avaria funcione apenas um dos
aparelhos.

5. A probabilidade de que numa medição o erro ultrapasse o admitido é 0,4. Achar a probabilidade
de que em apenas uma medição de uma série de três o erro ultrapasse o admitido.
6. A probabilidade de que uma peça do tipo exigido se ache em cada uma de quatro caixas é
igual, respectivamente, a 0,60; 0,70; 0,80 e 0,90. Calcular a probabilidade de que tal peça se
encontre:
a) no máximo em três caixas;
b) pelo menos em duas caixas.
44

7. Um circuito elétrico é constituído de três elementos ligados em série que deixam de funcionar
com probabilidade 𝑝1 = 0,10; 𝑝2 = 0,15; 𝑝3 = 0,20, respectivamente. Achar a probabilidade de
que não haja corrente no circuito.
8. Um dispositivo de freio de automóvel consiste de três subsistemas, que devem funcionar
simultaneamente para que o freio funcione. Os subsistemas são um sistema eletrônico, um
sistema hidráulico e um ativador mecânico. Ao frear, a probabilidade de sucesso dessas unidades
é de 0,96, 0,95 e 0,95, respectivamente. Estime a confiabilidade do sistema, admitindo que os
subsistemas funcionem independentemente.
Comentário: Sistemas deste tipo podem ser representados graficamente, conforme ilustração
abaixo, onde os subsistemas A (eletrônico), B (hidráulico) e C (ativador mecânico), dispõem-se
em série. Considera-se a trajetória a-b como a trajetória do sucesso.

A B C

a 0,96 0,95 0,95 b

9. Os automóveis são equipados com circuitos redundantes de frenagem; os freios falham


somente quando todos os circuitos falham. Consideremos o caso de dois circuitos redundantes,
ou paralelos, cada um com 0,95 de confiabilidade (probabilidade de sucesso). Determine a
confiabilidade do sistema, supondo que os circuitos atuem independentemente.
10. Respectivamente, 60 e 84 por cento das peças fornecidas por duas máquinas automáticas, a
produtividade da primeira sendo o dobro da segunda, são de alta qualidade. Tendo-se constatado
que uma peça escolhida ao acaso é de alta qualidade, achar a probabilidade de que provenha da
primeira máquina (teorema de Bayes).
11. Um relatório de controle de qualidade de transistores acusa os seguintes resultados por
fabricante e por qualidade:

FABRI- QUALIDADE
CANTE Aceitável Marginal Inaceitável TOTAL
A 128 10 2 140
B 97 5 3 105
C 110 5 5 120

Escolhido um transistor ao acaso, qual a probabilidade:


a) de provir do fabricante A, dado que é de qualidade aceitável?
b) de ser aceitável, dado que provém do fabricante C?
c) de provir do fabricante B, dado que apresenta qualidade marginal?
12) Suponha que na fabricação de semicondutores, as probabilidades de que um chip, sujeito a
alto, médio ou baixo nível de contaminação durante a fabricação, cause uma falha no produto
sejam respectivamente iguais a 0,10, 0,01 e 0,001. Em um experimento particular da produção,
20% dos chips estão sujeitos a altos níveis de contaminação, 30% a níveis médios de
contaminação e 50% a baixos níveis de contaminação. Qual a probabilidade de um produto falhar
ao usar um desses chips?
45

3 VARIÁVEIS ALEATÓRIAS DISCRETAS E DISTRIBUIÇÕES DE

PROBABILIDADES

3.1 DEFINIÇÕES

Definição 1: Seja E um experimento e S o espaço amostral associado ao experimento. Variável


aleatória unidimensional é uma função X, que associa a cada elemento 𝑠 ∈ 𝑆, um número real
𝑋(𝑠). R X
S

X X( s )
s

Exemplo: Uma caixa contém 4 válvulas, sendo duas perfeitas e duas defeituosas. Duas válvulas
são retiradas aleatoriamente da caixa e testadas (sendo representadas por D se a peça é
defeituosa e P se a peça é perfeita). O espaço amostral associado a este evento é:
S={PP,PD,DP,DD}
Seja a variável aleatória X=número de válvulas defeituosas. Os valores possíveis da
variável aleatória X, serão:

S X=número de válvulas
defeituosas

(P,P)
0
(P,D)
1
(D,P)
2
(D,D)

𝑅𝑋 = {0, 1,2}

Definição 2: Seja X uma variável aleatória discreta. A função de probabilidade, associa um


número real 𝑃(𝑋 = 𝑥𝑖 ), chamado de probabilidade de 𝑥𝑖 , a cada possível resultado 𝑥𝑖 .
Tem-se que:
0 ≤ 𝑃(𝑋 = 𝑥𝑖 ) ≤ 1
∑𝑥𝑖∈𝑆 𝑃(𝑋 = 𝑥𝑖 ) = 1

Uma distribuição de probabilidades é uma descrição, que fornece a probabilidade para


cada valor da variável aleatória. Ela é frequentemente expressa na forma de um gráfico, de uma
tabela ou uma fórmula.
46

Exemplo 1: Uma caixa contém 4 válvulas, sendo duas perfeitas e duas defeituosas. Duas válvulas
são retiradas aleatoriamente da caixa, com reposição, e testadas (sendo representadas por D se
a peça é defeituosa e P se a peça é perfeita). O espaço amostral associado a este evento é:
S={PP,PD,DP,DD}
1
𝑃(𝑋 = 0) =
4
2
𝑃(𝑋 = 1) =
4
1
𝑃(𝑋 = 2) =
4
A distribuição de probabilidades é

DISTRIBUIÇÃO DE PROBABILIDADES DE X
𝑿 = 𝒙𝒊 𝑷(𝑿 = 𝒙𝒊 )

0 1⁄4
1 2⁄4
2 1⁄4
𝚺 1

Exemplo 2: Em um processo de fabricação de semicondutores, 3 pastilhas de um lote são


testadas. Cada pastilha é classificada como “passa” ou “falha”. Suponha que a probabilidade de
uma pastilha passar no teste seja de 0,8 e que as pastilhas sejam independentes. Seja X a variável
número de pastilhas de um lote que passam no teste. A distribuição de probabilidades de X será:
𝑃(𝑋 = 0) = 𝑃(𝑓, 𝑓, 𝑓) = (1 − 0,8)3 = 0,23 = 0,008
𝑃(𝑋 = 1) = 𝑃(𝑝, 𝑓, 𝑓) 𝑜𝑢 𝑃(𝑓, 𝑝, 𝑓) 𝑜𝑢 𝑃(𝑓, 𝑓, 𝑝) = 3 × 0,80 × 0,20 × 0,20 = 0,096
𝑃(𝑋 = 2) = 𝑃(𝑝, 𝑝, 𝑓) 𝑜𝑢 𝑃(𝑝, 𝑓, 𝑝) 𝑜𝑢 𝑃(𝑓, 𝑝, 𝑝) = 3 × 0,80 × 0,80 × 0,20 = 0,0384
𝑃(𝑋 = 3) = 𝑃(𝑝, 𝑝, 𝑝) = (0,8)3 = 0,512

𝑋=𝑥 𝑃(𝑋 = 𝑥)
0 0,008
1 0,096
2 0,384
3 0,512

Definição 3: Seja X uma variável aleatória. A função de distribuição acumulada ou de


repartição de X é definida como

𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥)
Se X for variável discreta, tem-se

𝐹(𝑥) = ∑ 𝑃(𝑥𝑖 )
𝑥𝑖 ≤𝑥
47

Esperança

O valor esperado, esperança matemática ou média aritmética de uma variável aleatória discreta
X, é definida por:
𝑛 𝑛

𝐸(𝑋) = ∑ 𝑥𝑖 𝑃(𝑋 = 𝑥𝑖 ) = ∑ 𝑥𝑖 𝑝(𝑥𝑖 )


𝑖=1 𝑖=1

Variância
A variância da variável aleatória discreta X, é definida por:
∞ ∞

𝑉(𝑋) = ∑[𝑥𝑖 − 𝐸(𝑋)] 𝑃(𝑋 = 𝑥𝑖 ) = ∑[𝑥𝑖 − 𝐸(𝑋)]2 𝑝(𝑥𝑖 )


2

𝑖=1 𝑖=1

Exemplo: Foram inspecionados 100 lotes, cada um com 3 válvulas. A distribuição a seguir,
apresenta a variável X, que é o número de válvulas defeituosas por lote. Calcular a média e a
variância de X.

No. de defeituosos (X) 0 1 2 3 Total


No. de lotes 65 30 4 1 100

𝐸(𝑋) = ∑ 𝑥𝑖 𝑝(𝑥𝑖 )
𝑖=1
65 30 4 1
𝐸(𝑋) = 0 × +1× +2× +3× = 0,41 𝑣á𝑙𝑣𝑢𝑙𝑎 𝑑𝑒𝑓𝑒𝑖𝑡𝑢𝑜𝑠𝑎
100 100 100 100

∞ ∞

𝑉(𝑋) = ∑[𝑥𝑖 − 𝐸(𝑋)]2 𝑃(𝑋 = 𝑥𝑖 ) = ∑[𝑥𝑖 − 𝐸(𝑋)]2 𝑝(𝑥𝑖 )


𝑖=1 𝑖=1
65 30 4 1
𝑉(𝑋) = [0 − 0,41]2 × + [1 − 0,41]2 × + [2 − 0,41]2 × + [3 − 0,41]2 ×
100 100 100 100

𝑉(𝑋) = 0,1093 + 0,1044 + 0,1011 + 0,0671 = 0,3819 (𝑣á𝑙𝑣𝑢𝑙𝑎 𝑑𝑒𝑓𝑒𝑖𝑡𝑢𝑜𝑠𝑎𝑠 2

3.2 DISTRIBUIÇÕES DE PROBABILIDADES PARA V. A. DISCRETAS

3.2.1 Distribuição binomial

Uma variável aleatória discreta X, que conta o número de sucessos em n provas


independentes, que apresentam os resultados sucesso (𝑝) ou fracasso (𝑞 = 1 − 𝑝) , tem
distribuição binomial. Sua função de probabilidade é dada por:

𝑃(𝑋 = 𝑥) = (𝑛𝑥)𝑝 𝑥 𝑞 𝑛−𝑥 = 𝐶𝑛𝑥 𝑝 𝑥 𝑞 𝑛−𝑥 , 𝑥 = 0,1,2, … , 𝑛 e 0 < 𝑝 < 1

Os parâmetros da distribuição são:


Média: 𝐸(𝑋) = 𝑛𝑝
Variância: 𝑉(𝑋) = 𝑛𝑝𝑞
48

Exemplo 1: Seja X uma v.a. que indica o número de peças não conformes (não segue a
especificação definida no projeto de qualidade) produzidas pela máquina “Z”. Se a probabilidade
desta máquina produzir uma peça não conforme é de 15%, ao selecionar aleatoriamente 5 peças,
pede-se:
a) a probabilidade de nenhuma peça ser não conforme;
b) a probabilidade de todas as peças serem de acordo com especificação do projeto de qualidade;
c) obter a distribuição de probabilidades e o gráfico.

Solução
a)
𝑛=5
𝑝 = 0,15 (probabilidade de uma peça ser não conforme)
𝑞 = 1 − 𝑝 = 0,85
x=0 (nenhuma ser não conforme)
𝑃(𝑋 = 0) = 𝐶50 (0,15)0 (0,85)5−0 = 0,4437 × 100 = 44,37%

b) Todas de acordo com as especificações=nenhuma não conforme


𝑃(𝑡𝑜𝑑𝑎𝑠 𝑑𝑒 𝑎𝑐𝑜𝑟𝑑𝑜 𝑐𝑜𝑚 𝑎𝑠 𝑒𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑎çõ𝑒𝑠) = 𝑃(𝑋 = 0) = 0,4437 × 100 = 44,37%

c) Distribuição de Probabilidades

DISTRIBUIÇÃO DE PROBABILIDADES DE X
𝑥 𝑃(𝑋 = 𝑥)
0 0,4437
1 0,3915
2 0,1382
3 0,0244
4 0,0022
5 0,0001

Graficamente, tem-se:

Exemplo 2: Seja X uma v.a. que indica o número de parafusos defeituosos produzidos pela
máquina “A”. Se a probabilidade desta máquina produzir um parafuso defeituoso é de 5%, pede-
se:
49

a) Ao selecionar aleatoriamente dois parafusos, qual a probabilidade de ambos serem


defeituosos?
b) qual é a média e a variância do número de parafusos defeituosos ao selecionar aletoriamente
50 parafusos produzidos por esta máquina?
𝑝 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑠𝑒𝑟 𝑑𝑒𝑓𝑒𝑖𝑡𝑢𝑜𝑠𝑜 = 0,05
1 − 𝑝 = 𝑞 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑠𝑒𝑟 𝑝𝑒𝑟𝑓𝑒𝑖𝑡𝑜 = 0,95
a) 𝑃(𝑋 = 2) = 𝐶22 (0,05)02 (0,95)2−2 = 0,0025 × 100 = 0,25%
b) 𝑛 = 50
𝑝 = 0,05
𝑞 = 1 − 𝑝 = 0,95
Média: 𝐸(𝑋) = 𝑛𝑝 = 50 × 0,05 = 2,5
Variância: 𝑉(𝑋) = 𝑛𝑝𝑞 = 50 × 0,05 × 0,95 = 2,375 ≅ 2,4
Ao selecionar 50 parafusos produzidos por esta máquina, espera-se em média 2,5
parafusos defeituosos, e uma variância de 2,4 (parafusos defeituosos)2.

3.2.2 Distribuição de Poisson


A distribuição de Poisson pode ser aplicada a muitos casos práticos nos quais interessa o
número de vezes que um determinado evento pode ocorrer durante um intervalo de tempo ou
distância, área ou outra unidade de medida análoga.
Uma v.a. discreta X tem distribuição de Poisson se sua função de probabilidade é dada
por:

𝑒 −𝜆 𝜆𝑥
𝑃(𝑋 = 𝑥) = , 𝑥 = 0, 1, 2 … e 𝜆 > 0
𝑥!

Os parâmetros da distribuição são:


Média: 𝐸(𝑋) = 𝜆
Variância: 𝑉(𝑋) = 𝜆

Exemplo 1: São contados os números de partículas radioativas emitidas em cada intervalo de 5


segundos. Suponha que o número de partículas emitidas, durante cada intervalo de 5 segundos,
tenha uma distribuição de Poisson com parâmetro 2,0. Pede-se:
a) qual é a probabilidade de que menos de 3 partículas sejam emitidas?
b) supondo que 10 contagens são realizadas, construir a distribuição de probabilidades.

Solução:
𝜆 = 2,0 (parâmetro)

a) 𝑃(𝑋 < 3) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)

𝑒 −2 20 𝑒 −2 21 𝑒 −2 22
𝑃(𝑋 < 3) = + +
0! 1! 2!

𝑃(𝑋 < 3) = 0,1353 + 0,2707 + 0,2707 = 0,6767 × 100 = 67,67%

b) Calcular as probabilidades para 𝑥 = 0,1,2, … ,10


50

DISTRIBUIÇÃO DE PROBABILIDADES DE X
X=x 𝑃(𝑋 = 𝑥)
0 0,1353
1 0,2707
2 0,2707
3 0,1804
4 0,0902
5 0,0361
6 0,0120
7 0,0034
8 0,0009
9 0,0002
10 0,0000

Graficamente, tem-se:

Exemplo 2: Seja X o número de acidentes mensais ocorridos numa determinada indústria. Se o


número médio de acidentes por mês é 3, qual a probabilidade de não ocorrer nenhum acidente
no próximo mês?

𝜆=3
𝑒 −3 30
𝑃(𝑋 = 0) = = 𝑒 −3 = 0,050 × 100 = 5%
0!

3.2.3 Distribuição Hipergeométrica


Suponha que em um lote de N peças, k são defeituosas e (N-k) são perfeitas e escolhem-
se ao acaso, n peças desse lote (n≤ 𝑁). Pode-se estar interessado na probabilidade de selecionar
x peças das k rotuladas como defeituosas.
Uma v.a. discreta X tem distribuição hipergeométrica se sua função de probabilidade é
dada por:
𝑘 𝑁−𝑘
( )( ) 𝐶 𝑥 𝐶 𝑛−𝑥
𝑃(𝑋 = 𝑥) = 𝑥 𝑛 − 𝑥 =
𝑘 𝑁−𝑘
𝑁
( ) 𝐶𝑁𝑛
𝑛
Os parâmetros da distribuição são:
Média: 𝐸(𝑋) = 𝑛𝑝
𝑁−𝑛
Variância: 𝑉(𝑋) = 𝑛𝑝𝑞
𝑁−1
51

𝑘
onde: 𝑝=
𝑁
𝑘
𝑞 =1−
𝑁

Exemplo 1: Pequenos motores elétricos são expedidos em lotes de 30 unidades. Antes que uma
remessa seja aprovada, um inspetor seleciona ao acaso 3 destes motores para inspeção. Se
nenhum dos motores inspecionados for defeituoso, o lote é aprovado. Se um ou mais dos motores
verificados forem defeituosos, o lote todo é inspecionado. Suponha que existam, de fato, 2
motores defeituosos no lote. Qual é a probabilidade de que a inspeção de todo o lote seja
necessária?
𝑁 = 30 (número de casos total na população)
𝑘=2 (número de casos favoráveis na população)
𝑛=3 (tamanho da amostra)
𝑥 = 1, 2, 3
A probabilidade de que a inspeção seja necessária é igual a:

𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) ou 𝑃(𝑋 ≥ 1) = 1 − 𝑃(𝑋 = 0).


𝐶20 𝐶30−2
3−0
𝑃(𝑋 ≥ 1) = 1 − 𝑃(𝑋 = 0) = 1 − 3 = 1 − 0,8069 = 0,1931 × 100 = 19,31%
𝐶30

Exemplo 2: Uma empresa adquiriu diversas caixas, cada uma contendo 15 lâmpadas. Ela decidiu
fazer uma inspeção por amostragem sem reposição, analisando 5 lâmpadas de uma caixa. A
caixa será aceita caso encontre no máximo duas defeituosas. Qual a probabilidade de aceitar uma
caixa sabendo que a qualidade do produto é definida por 20% de defeituosos?

𝑁 = 15
𝑛=5
𝑥≤2
𝑘 = 0,20 × 15 = 3
𝑃(𝑋 ≤ 2) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑥 = 2)
5−0 5−1 5−2
𝐶30 𝐶15−3 𝐶31 𝐶15−3 𝐶32 𝐶15−3 792 + 1.485 + 660 2.937
𝑃(𝑋 ≤ 2) = 5 + 5 + 5 = = = 0,9780 × 100 = 97,80%
𝐶15 𝐶15 𝐶15 3.003 3.003

Curiosidade: Probabilidade de acertar na mega sena

Qual a probabilidade de acertar as 6 dezenas, jogando apenas 6 dezenas?

N=60 (total de números)


k=6 (números sorteados)
n=6 (números escolhidos para aposta)
x=6 (números que deve acertar)
52

(66)(60−6
6−6
) 1
𝑃(𝑋 = 6) = = = 1,9974 × 10−8
(60
6
) 50.063.860

LISTA DE EXERCÍCIOS 04

1. Um proprietário acaba de instalar 20 lâmpadas em uma nova casa. Supondo que cada lâmpada
tenha 0,20 de probabilidade de funcionar por mais de três meses, pede-se:
a) qual a probabilidade de ao menos cinco delas durarem mais de três meses?
b) qual o número médio de lâmpadas que deverão ser substituídas em três meses?

2. Repete-se um experimento 5 vezes. Supondo que a probabilidade de sucesso em uma prova


seja 0,75, e admitindo a independência dos resultados das provas:
a) qual a probabilidade de todas as cinco provas resultarem em sucesso?
b) qual o número esperado de sucesso?

3. Um produto eletrônico contém 40 circuitos integrados. A probabilidade de que qualquer circuito


integrado seja defeituoso é de 0,01. Os circuitos integrados são independentes. O produto opera
somente se não houver circuitos integrados defeituosos. Qual é a probabilidade de que o produto
opere?

4. Um departamento de conserto de máquinas recebe uma média de 5 chamadas por hora. Qual
a probabilidade de que em uma hora selecionada aleatoriamente sejam recebidas:
a) Exatamente três chamadas?
b) Menos que três chamadas?

5. Bateladas que consistem em 50 molas helicoidais, provenientes de um processo de produção


são verificadas com respeito à conformidade em relação aos requerimentos dos consumidores. O
número médio de molas não-conformes em uma batelada é igual 5. Considere que o número de
molas não conformes em uma batelada, denotado por X, seja uma variável aleatória binomial.
Pede-se:
a) qual é a probabilidade do número de molas não-conformes em uma batelada seja menor ou
igual a 2?
b) qual é a probabilidade do número de molas não-conformes em uma batelada seja maior ou
igual a 49?

6. Suponha que 90% de todas as pilhas do tipo D, de certo fabricante, tenham voltagens
aceitáveis. Um determinado tipo de lanterna necessita de 2 pilhas tipo D, e ela só funciona se as
duas pilhas tiverem voltagem aceitável. Entre 10 lanternas selecionadas aleatoriamente, qual é a
probabilidade de:
a) pelo menos 9 funcionarem?
b) no máximo 2 funcionarem?

7. Seja X o número de falhas na superfície de uma caldeira de um determinado tipo selecionado


aleatoriamente, com distribuição de Poisson de parâmetro 𝜆 = 5. Calcular:
a) 𝑃(𝑋 ≤ 2)
53

b) 𝑃(𝑋 = 8)
c) 𝑃(5 ≤ 𝑋 ≤ 8)

8. Cartões de circuito integrado são verificados em um teste funcional depois de serem


preenchidos com chips semicondutores. Um lote contém 140 cartões e 20 são selecionados sem
reposição para o teste funcional.
a) se 20 cartões forem defeituosos, qual será a probabilidade de no mínimo 1 cartão defeituoso
estar na amostra?
b) se 5 cartões forem defeituosos, qual será a probabilidade de 1 cartão defeituoso aparecer na
amostra?
9. Num lote de 20 pneus enviadas a um fornecedor sabe-se que há 5 defeituosos. Um cliente vai
a esse fornecedor comprar 4 pneus. Qual a probabilidade de levar 1 defeituoso?
54

4 VARIÁVEIS ALEATÓRIAS CONTÍNUAS E DISTRIBUIÇÕES DE

PROBABILIDADES

4.1 DEFINIÇÕES

Definição 1: Seja X uma variável aleatória continua. A função densidade de probabilidade 𝑓(𝑥),
é uma função que satisfaz as seguintes condições:
𝑓(𝑥) ≥ 0 para todo 𝑥 ∈ 𝑅𝑋

∫ 𝑓(𝑥)𝑑(𝑥) = 1
−∞

Exemplo: Seja X uma variável contínua com função densidade de probabilidade dada por:
𝑥
𝑓(𝑥) = , 2≤𝑥≤6
16
𝑓(𝑥) = 0, 𝑝𝑎𝑟𝑎 𝑞𝑢𝑎𝑖𝑠𝑞𝑢𝑒𝑟 𝑜𝑢𝑡𝑟𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠

A função densidade de probabilidade é:

Para 𝑥 = 2:
2 1
𝑓(2) = =
16 8
Para 𝑥 = 4:
4 2
𝑓(4) = =
16 8
Para 𝑥 = 6:
6 3
𝑓(6) = =
16 8

A condição ∫−∞ 𝑓(𝑥)𝑑(𝑥) = 1, indica que a área total limitada pela curva que representa
𝑓(𝑥) e o eixo das abcissas é igual a 1.
Seja o intervalo [a, b] de 𝑅𝑋 . A probabilidade de um valor de X pertencer a esse intervalo
𝑏
será dada por: 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫𝑎 𝑓(𝑥)𝑑(𝑥), que representa a área sob a curva da função
densidade de probabilidade.
Para variáveis aleatórias contínuas, as probabilidades são interpretadas como áreas.
Sendo X uma variável aleatória continua, a probabilidade em um ponto é nula, então:
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 < 𝑋 < 𝑏)

Definição 2: Seja X uma variável aleatória. A função de distribuição acumulada ou de


repartição de X é definida como:

𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥)
55

Se X for variável aleatória continua, tem-se:


𝑥
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫−∞ 𝑓(𝑥)𝑑(𝑥)

Exemplo: Seja X uma variável contínua com função densidade de probabilidade dada por:
𝑥
𝑓(𝑥) = , 2≤𝑥≤6
16
𝑓(𝑥) = 0, 𝑝𝑎𝑟𝑎 𝑞𝑢𝑎𝑖𝑠𝑞𝑢𝑒𝑟 𝑜𝑢𝑡𝑟𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠

A função de distribuição acumulada é dada por:


2 6 6 6
𝑥 1 𝑥2 32
𝐹(𝑥) = ∫ 𝑓(𝑥)𝑑(𝑥) + ∫ 𝑓(𝑥)𝑑(𝑥) = 0 + ∫ 𝑑(𝑥) = [ ] = =1
16 16 2 2 32
−∞ 2 2

Esperança
A esperança matemática ou média aritmética de uma variável aleatória continua X, com função
densidade de probabilidade 𝑓(𝑥), é definida por:

𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥
−∞

Variância
Se X é uma variável aleatória continua, a variância é definida por:

𝑉(𝑋) = ∫ [𝑥 − 𝐸(𝑋)]2 𝑓(𝑥)𝑑𝑥
−∞

Exemplo: Suponha que 𝑓(𝑥) = 0,25, para 0 ≤ 𝑥 ≤ 4. Calcular a média e variância.


4 4 4
𝑥2 0,25 2
𝐸(𝑋) = ∫ 𝑥0,25𝑑𝑥 = 0,25 ∫ 𝑥𝑑𝑥 = 0,25 [ ] = [4 − 02 ] = 2 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑑𝑒 𝑚𝑒𝑑𝑖𝑑𝑎
0 0 2 0
2


𝑉(𝑋) = ∫ [𝑥 − 𝐸(𝑋)]2 𝑓(𝑥)𝑑𝑥
−∞
4 4 4 4
𝑥3 𝑥2
𝑉(𝑋) = ∫ [𝑥 − 2]2 0,25𝑑𝑥 = 0,25 ∫ (𝑥 2 − 4𝑥 + 4)𝑑𝑥 = 0,25 × {[ ] − 4 [ ] + 4[𝑥]40 }
0 0 3 0 2 0

𝑉(𝑋 = 1,33 (𝑢𝑛𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑚𝑒𝑑𝑖𝑑𝑎)2

4.2 DISTRIBUIÇÕES DE PROBABILIDADES PARA V. A. CONTÍNUAS

4.2.1 Distribuição normal ou Gaussiana


É uma das mais importantes distribuições de probabilidades, sendo aplicada em inúmeros
fenômenos e frequentemente utilizada para o desenvolvimento teórico da inferência estatística.
Uma v.a. continua X, tem distribuição normal ou Gaussiana se sua função densidade de
probabilidade é dada por:
56

1 1 𝑥−𝜇 2
− ( )
𝑓(𝑥) = 𝑒 2 𝜎
𝜎√2𝜋
sendo: 𝑥 ∈ 𝑅, 𝜇 ∈ 𝑅 , 𝜎 ∈ 𝑅 +

A função de distribuição acumulada é dada por:


𝑥 1 𝑥−𝜇 2
1 − ( )
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑒 2 𝜎 𝑑𝑥
−∞ 𝜎√2𝜋

Os parâmetros da distribuição são:


Média: 𝐸(𝑋) = 𝜇
Variância: 𝑉(𝑋) = 𝜎 2

Quando se deseja especificar que a variável aleatória X, segue distribuição normal com
média 𝜇 e variância 𝜎 2 , usa-se a notação: 𝑋 ~ 𝑁(𝜇; 𝜎2 ).

A distribuição normal é definida a partir de dois parâmetros, a média 𝜇 e a variância 𝜎 2 .


Por exemplo, a curva da distribuição normal 𝑓(𝑥) para 𝜇 = 40 e 𝜎 = 10, e valores da variável
aleatória no intervalo (10, 70), é mostrada no gráfico.

Uma das características importantes é que a partir desses dois parâmetros será possível
calcular, por exemplo, a percentagem de valores que deverão estar acima ou abaixo de um
determinado valor da variável aleatória, ou entre esses dois valores definidos etc.
A probabilidade de a variável aleatória contínua X ser igual ou maior que 𝒂 e, ao mesmo
tempo, menor ou igual a 𝒃, 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏), é obtida da área definida pela função 𝑓(𝑥) entre os
limites 𝑎 e 𝑏, sendo 𝑏 > 𝑎.

O cálculo é feito integrando-se a função 𝑓(𝑥) no intervalo (𝑎, 𝑏).


1 𝑥−𝜇 2
𝑏 1 − ( )
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫𝑎 𝑒 2 𝜎 𝑑𝑥
𝜎 √2𝜋

Representação gráfica:
57

 − 3  − 2  −    +   + 2  + 3

É um gráfico em forma de sino. O seu posicionamento em relação ao eixo das ordenadas


e seu achatamento são determinados pelos parâmetros 𝜇 e 𝜎 2 , respectivamente.
A área compreendida entre 𝜇 ± 𝜎 é igual a 68,27%; entre 𝜇 ± 2𝜎, a 95,45% e entre 𝜇 ± 3𝜎,
a 99,73%.

Propriedades da distribuição normal:

1. 𝑓(𝑥) possui um ponto de máximo para 𝑋 = 𝑥;


2. 𝑓(𝑥) tem dois pontos de inflexão cujas abcissas valem 𝜇 + 𝜎 e 𝜇 − 𝜎;
3. 𝑓(𝑥) é simétrica em relação a 𝑋 = 𝜇. E, ainda 𝜇 = 𝑀𝑜 = 𝑀𝑒 ;
4. 𝑓(𝑥) tende a zero quando x tende para ±∞ (assintótica em relação ao eixo x).

4.2.1.1 Distribuição normal padronizada ou reduzida


A variável normal padronizada Z é obtida através de uma transformação linear da variável
normal X, obtendo-se assim uma escala relativa de valores na qual, a média é o ponto de referência
e o desvio padrão, uma medida de afastamento da média.
Considere a transformação:

𝑋−𝜇 𝑑𝑋
𝑍= então, 𝑑𝑍 =
𝜎 𝜎

Tem-se que:
𝑥 1 𝑥−𝜇 2
1 − ( )
𝐹(𝑥) = ∫ 𝑒 2 𝜎 𝑑𝑥
−∞ 𝜎√2𝜋

Utilizando a transformação será:


𝑧
1 1 2
(𝑧)
𝐹(𝑧) = 𝑃(𝑍 ≤ 𝑧) = ∫ 𝑒 −2 𝑑𝑧
√2𝜋 −∞

que é a função de distribuição acumulada para a variável normal reduzida, que pode ser
representada por:
𝑧
1 1 2
(𝑧)
Φ(𝑧) = ∫ 𝑒 −2 𝑑𝑧
√2𝜋 −∞
58

onde Φ é função cumulativa da distribuição normal padrão, cujas probabilidades encontram-se


tabeladas.
A integral da equação da função de distribuição acumulada, não tem solução analítica, ou
seja, para determinar a probabilidade de ocorrência de “Z” é necessário que se resolva
numericamente. Assim, as tabelas permitem obter as probabilidades com facilidade.

Os parâmetros da distribuição são:


Média: 𝐸(𝑍) = 0
Variância: 𝑉(𝑍) = 1

Gráfico da distribuição normal padrão:


f(z)

Exemplo 1: O diâmetro de um eixo de um dispositivo ótico de armazenagem é normalmente


distribuído, com média 0,2508 polegada e desvio padrão de 0,0005 polegada. As especificações
do eixo são 0,2500 ± 0,0015 polegada. Que proporção de eixo obedece às especificações?
𝜇 = 0,2508
𝜎 = 0,0005
𝑃(0,2485 ≤ 𝑋 ≤ 0,2515) =?

0,2485 − 0,2508
𝑍1 = = −4,6
0,0005

0,2515 − 0,2508
𝑍2 = = 1,4
0,0005
𝑃(−4,6 ≤ 𝑍 ≤ 1,4) = 0,9192 − 0,0000 = 0,9192 × 100 = 91,92%

Exemplo 2: O diâmetro de um cabo elétrico é normalmente distribuído com média 0,8 mm e


variância 0,0004 mm2. Dentre uma amostra de 1.000 cabos, espera-se que quantos tenham
diâmetro menor que 0,78 mm?
𝜇 = 0,8
𝜎 2 = 0,0004 , portanto 𝜎 = 0,02
Calcular a probabilidade de um cabo apresentar diâmetro menor que 0,78 𝑚𝑚.
59

𝑃(𝑋 < 0,78) =?


Fazendo a transformação para Z:
0,78 − 0,8
𝑍= = −1
0,02
𝑃(𝑍 < −1) = 𝑃(𝑍 ≤ −1) = 0,1587
Calcular a proporção de cabos elétricos com diâmetro menor que 0,78 𝑚𝑚, em uma amostra de
1.000 cabos.
𝑛𝑜. 𝑑𝑒 𝑐𝑎𝑏𝑜𝑠 = 1.000 × 0,1587 = 158,7 ≅ 159

4.2.2 Distribuição Exponencial


Uma v.a. continua X, tem distribuição exponencial se sua função densidade de
probabilidade é dada por:
𝑓(𝑥) = 𝜆𝑒 −𝜆𝑥 , 𝑥 > 0

A função de distribuição acumulada é dada por:


𝑥
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫0 𝜆𝑒 −𝜆𝑥 𝑑𝑥 = 1 − 𝑒 −𝜆𝑥 , 𝑥 > 0
Portanto:

𝑃(𝑋 > 𝑥) = 𝑒−𝜆𝑥

Os parâmetros da distribuição são:

1
Média: 𝐸(𝑋) =
𝜆
1
Variância: 𝑉(𝑋) =
𝜆2

Essa distribuição tem papel importante na descrição de uma grande classe de fenômenos,
particularmente nos assuntos relacionados a teoria da confiabilidade. Porém, é importante lembrar
que, essa distribuição considera a taxa de falha constante.
Exemplo 1: O tempo de vida X (em horas) das lâmpadas elétricas fabricadas por uma empresa é
uma variável aleatória, tendo sua função densidade de probabilidade dada por:

0,002𝑒 −0,002𝑥 , 𝑠𝑒 𝑥 > 0


𝑓(𝑥) = {
0, 𝑠𝑒 𝑥 ≤ 0

a) qual a probabilidade do tempo de vida de uma lâmpada ser superior a 600 horas?
b) qual é o tempo de vida esperado?
Solução:
Considerando a função densidade de probabilidade da distribuição exponencial tem-se:
𝑓(𝑥) = 𝜆𝑒 −𝜆𝑥
E a função densidade de probabilidade do tempo de vida das lâmpadas elétricas:
𝑓(𝑥) = 0,002𝑒 −0,002𝑥
60

Por analogia tem-se que 𝜆 = 0,002

a) 𝑃(𝑋 > 600) =?


Aplicando a expressão 𝑃(𝑋 > 𝑥) = 𝑒−𝜆𝑥 , obtém-se a probabilidade desejada.
𝑃(𝑋 > 600) = 𝑒−0,002×600 = 0,3012 × 100 = 30,12%

b) Tempo de vida esperado é o tempo médio de vida das lâmpadas


1 1
𝐸(𝑋) = = = 500 ℎ𝑜𝑟𝑎𝑠
𝜆 0,002

Exemplo 2: A vida média de um satélite é 4 anos, seguindo o modelo exponencial. Seja X a variável
definindo o tempo de vida do satélite. Calcule a 𝑃(𝑋 > 4).
1
𝐸(𝑋) =
𝜆
portanto:
1
𝜆=
4
1
−4×4
𝑃(𝑋 > 4) = 𝑒 = 𝑒 −1 = 0,3679 × 100 = 36,79%

4.2.3 Distribuição de Weibull


A distribuição de Weibull é frequentemente usada para descrever o tempo de vida de
produtos industriais. A sua popularidade em aplicações práticas deve-se ao fato dela apresentar
uma grande variedade de formas, todas com uma propriedade básica: a sua função de taxa de
falha é monótona, isto é, ela é estritamente crescente, estritamente decrescente ou constante. Ela
descreve adequadamente a vida de mancais, componentes eletrônicos, cerâmicas, capacitores e
dielétricos.

A função densidade de probabilidade da distribuição de Weibull de dois parâmetros é dada


por:
𝛽 𝑥 𝛽−1 −(𝑥 )𝛽
𝑓(𝑥) = ( ) 𝑒 𝛼
𝛼 𝛼
em que: 𝛽 > 0 , 𝛼 > 0, 𝑥 > 0

onde:
𝑥 é a variável que define o período de vida útil, podendo ser expresso em distância percorrida (km),
em número de ciclos (n) ou em tempo de funcionamento (h);
𝛽: é o parâmetro de forma
𝛼: é o parâmetro de escala

A função de distribuição acumulada pode ser expressa por:


𝑥 𝛽
−( )
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = 1 − 𝑒 𝛼

e,
𝑥 𝛽
−( )
𝑃(𝑋 ≥ 𝑥) = 𝑒 𝛼

Os parâmetros da distribuição são:


61

Média: (tempo médio até a falha, ou MTTF (mean time to failure))


1
𝐸(𝑋) = 𝛼 Γ (1 + )
𝛽

Variância:

2
2 1 2
𝑉(𝑋) = 𝛼 {Γ (1 + ) − [Γ (1 + )] }
𝛽 𝛽
OBS:

Γ(𝑛) é a função gama

Quando n é um inteiro positiva, tem-se:

Γ(𝑛) = (𝑛 − 1)!
e,
1
Γ ( ) = √𝜋
2

Observação: Quando 𝛽 = 1, a distribuição de Weibull assume a forma da distribuição exponencial.

Exemplo 1: O tempo de falha (em horas) de um mancal em um eixo mecânico é satisfatoriamente


modelado como uma variável aleatória de Weibull, com 𝛽 = 1/2 e 𝛼 = 5000 horas.
a) determine o tempo médio até falhar;
b) determine a probabilidade de um mancal durar no mínimo 6000 horas.
a) Tem-se que:

1 1
𝐸(𝑋) = 𝛼 Γ (1 + ) = 5000 × Γ (1 + ) = 5000 × Γ(3) = 5000 × 2 = 10.000 ℎ𝑜𝑟𝑎𝑠
𝛽 1/2
b) 𝑃(𝑋 > 6.000)
𝑥 𝛽 6000 1/2
−( ) −( )
𝑃(𝑋 ≥ 𝑥) = 𝑒 𝛼 =𝑒 5000 = 𝑒 −1,095 = 0,3340 × 100 = 33,40%

Exemplo 2: Suponha que a vida de um mancal de rolamento siga uma distribuição de Weibull
com parâmetros 𝛽 = 2 e 𝛼 = 10.000 horas.
a) determine a probabilidade de um mancal durar no mínimo 8.000 horas;
3
b) determine o tempo médio até haver uma falha de um mancal (dado: Γ (2) = 0,8862)

a) 𝑃(𝑋 > 8.000)


𝑥 𝛽 8000 2
−( ) −( )
𝑃(𝑋 ≥ 8000) = 𝑒 𝛼 = 𝑒 10000 = 𝑒 −0,64 = 0,5273 × 100 = 52,73%
b)
1 1 3
𝐸(𝑋) = 𝛼Γ (1 + ) = 10000 × Γ (1 + ) = 10000 × Γ ( ) = 10000 × 0,8862 = 8.862 ℎ𝑜𝑟𝑎𝑠
𝛽 2 2
62

4.2.4 Outras Distribuições de Probabilidades Contínua

4.2.4.1 Distribuição 𝝌𝟐 ( qui-quadrado)

A função densidade da distribuição “𝜒 2 “ com 𝜐 graus de liberdade é dada por:


−1 2
(𝜒𝜐2 )(𝜐/2) 𝑒 −𝜒𝜐 /2
𝑓(𝜒𝜐2 ) = 𝜐
(2)𝜐/2 Γ (2) , 𝜒𝜐2 ≥ 0

Graficamente:

Os parâmetros da distribuição são:

Média: 𝐸(𝜒2𝜐 ) = 𝜐
Variância: 𝑉(𝜒2𝜐 ) = 2𝜐
Esta distribuição possui numerosas aplicações em inferência estatística. Dentre as
aplicações da Distribuição Qui-quadrado cita-se a construção de intervalos de confiança e testes
de hipóteses para variância.

4.2.4.2 Distribuição “ t ” de Student

A função densidade da distribuição “t” com 𝜐 graus de liberdade é dada por:


𝜐+1
Γ[ ]
2
𝑓(𝑡𝜐 ) = (𝜐+1) , -∞ < 𝑡𝜐 < +∞
𝜐 𝑡2 2
√𝜐𝜋 Γ(2)(1+ 𝜐𝜐 )

Graficamente:
63

Os parâmetros da distribuição são:


Média: 𝐸(𝑡) = 0
𝜐
Variância: 𝑉(𝑡) =
𝜐−2

para 𝜐 > 2, onde o parâmetro 𝜐 é o número de graus de liberdade da distribuição.

A distribuição t é simétrica em relação a 𝑡 = 0, sendo que, quando 𝜐 → ∞ ela tende para


uma distribuição normal com média 0 e variância 1 (distribuição normal padronizada ou reduzida).
O único parâmetro 𝜐 que a define e caracteriza a sua forma é o número de graus de liberdade
(número de observações livres para variar).
Quando se deseja indicar que uma variável aleatória t segue uma distribuição t de Student
com 𝜐 graus de liberdade, usa-se a seguinte notação 𝑡 ~ 𝑡(𝜐) ou 𝑡 ~ 𝑡𝜐 .
Dentre as utilizações da Distribuição t, citam-se os testes de hipóteses e intervalos de
confiança para amostras pequenas (𝑛 < 30) e testes de hipóteses para coeficiente de correlação
amostral.

4.2.4.3 Distribuição F de Snedecor

A função densidade da distribuição “F” com 𝜐1 e 𝜐2 graus de liberdade é dada por:

1 (𝜐1/2) −1
Γ[ (𝜐1 +𝜐2 )]
2
𝜐1 (𝜐1 /2) 𝜐2 (𝜐2 /2) 𝐹𝜐 , 𝜐
1 2
𝑓(𝐹𝜐1, 𝜐2 ) = 𝜐 𝜐 × 1 , 𝐹𝜐1 , 𝜐2 ≥ 0
Γ( 1 ) Γ( 2 ) (𝜐 +𝜐 )
2 2 (𝜐2 +𝜐1 𝐹𝜐1 , 𝜐2 )2 1 2

Graficamente:

Os parâmetros da distribuição são:


𝜐2
Média: 𝐸(𝐹𝜐1 , 𝜐2 ) = , 𝜐2 ≥ 2
𝜐2 −2

2υ22 (υ1 +υ2 −2)


Variância: 𝑉(𝐹𝜐1 , 𝜐2 ) = , 𝜐2 > 4
υ1 (υ2 −2)2 (υ2 −4)
64

A distribuição F de Snedecor depende de dois parâmetros, 𝜐1 e 𝜐2 , denominados,


respectivamente, de graus de liberdade do numerador e denominador.
Dentre as aplicações da distribuição F, cita-se o teste de hipóteses para igualdade de duas
variâncias.

LISTA DE EXERCÍCIOS 05

1. O tempo de operação de uma máquina de embalagem de frascos sem interrupção para


manutenção, tem distribuição exponencial com média igual a duas horas. Qual a probabilidade
dessa máquina conseguir operar mais de uma hora sem interrupção?

2. Suponha que um componente eletrônico tenha um tempo de vida X (em unidades de 1.000
horas) que é considerado uma variável aleatória com função densidade de probabilidade
𝑓(𝑥) = 𝑒 −𝑥 , 𝑥 > 0 . Qual é a probabilidade de 𝑥 ≤ 0,9 ?

3. O tempo (em horas) necessário para reparar uma máquina é uma variável aleatória
exponencialmente distribuída com parâmetro 𝜆 = 1⁄2 . Determine a probabilidade de que o tempo
de reparo exceda duas horas.

4. Suponha que uma variável aleatória X seja distribuída como Weibull, com parâmetros 𝛼 = 250,
𝛽 = 0,25 .
a) calcular a média da variável aleatória X.
b) calcular 𝑃(5000 < 𝑋 < 7000).

5. Suponha que o tempo de vida X (anos) de um amortecedor de carro tenha distribuição de


Weibull, com 𝛼 = 1, 𝛽 = 0,4. Dado: 𝛤(3,5) = 3,3234
a) qual é a vida esperada de tal amortecedor?
b) qual é a probabilidade de que tal amortecedor esteja funcionando depois de 10 anos?

6. O diâmetro de uma determinada peça é uma característica da qualidade importante. Sabe-se


que esse diâmetro segue um modelo normal com média 40 mm e desvio padrão 2 mm. Se a
especificação estabelece que o diâmetro deve ser maior que 35mm, qual é a probabilidade de que
a peça produzida satisfaça a especificação?

7. Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa
máquina. Supondo que essa variável tenha distribuição normal com média igual 2 cm e desvio
padrão igual a 0,04 cm. Qual a probabilidade de um parafuso ter o diâmetro com valor entre 2 e
2,05 cm ?

8. A tensão de ruptura (em newtons) de uma fibra sintética é representada por X e distribuída
como 𝑁(800, 122 ). O controle de qualidade na fabricação da fibra exige uma tensão de no mínimo
772 N. Uma amostra da fibra é randomicamente testada. Qual é a probabilidade de obtermos
𝑃(𝑋 ≥ 772) ?
65

9. Suponha que as frequências indesejáveis para um determinado sinal elétrico tenham uma
variação normal com média 60 Hz e desvio padrão 15 Hz.
a) Qual a probabilidade desse sinal elétrico possuir componentes entre 40 e 70 Hz devido a essas
frequências indesejáveis?
b) Qual a maior frequência do sinal para que a probabilidade de contaminação por frequências
indesejáveis seja de 10%?

10. A vida média de certo aparelho é de oito anos, com desvio padrão de 1,8 ano. O fabricante
substitui os aparelhos que acusam defeito dentro do prazo de garantia. Se ele deseja substituir no
máximo 5% dos aparelhos que apresentem defeito, qual deve ser o prazo de garantia?

11. Um processo industrial produz peças com diâmetro médio de 2,00” e desvio padrão de 0,01”.
As peças com diâmetro que se afaste da média por mais de 0,03” são consideradas defeituosas.
Admitida a normalidade:
a) qual a percentagem das peças defeituosas?
b) qual a percentagem de peças perfeitas?
12. Uma empresa usa anualmente milhares de lâmpadas elétricas, que permanecem acesa
continuamente, dia e noite. A vida de uma lâmpada pode ser considerada uma variável aleatória
normal, com média de 50 dias e desvio padrão de 15 dias. Em 1º de janeiro a companhia instalou
8.000 lâmpadas novas. Aproximadamente quantas deverão ser substituídas em 1º de fevereiro?

13. O diâmetro do eixo principal de um disco rígido segue a distribuição normal com média 25,08
in. e desvio padrão 0,05 in. Se as especificações para esse eixo são 25,00 ± 0,15in. Determine o
percentual de unidades produzidas em conformidades com as especificações.
66

5 NOÇÕES DE AMOSTRAGEM E DISTRIBUIÇÕES AMOSTRAIS

5.1 INTRODUÇÃO

População ou universo é um conjunto de elementos com uma ou mais características em


comum. Essa característica comum deve delimitar de forma clara os elementos pertencentes à
população.
Amostra é o subconjunto, necessariamente finito e representativo da população da qual foi
extraída.
Razões para se trabalhar com amostras:
a) menor custo;
b) redução do tempo e de mão-de-obra para a realização da coleta de dados ;
c) maior confiabilidade e qualidade dos dados;
d) facilidade na realização dos trabalhos.

Existem dois tipos de amostragem: a probabilística e a não-probabilística.

Na amostragem probabilística tem-se que:


a) Todos os elementos da população têm probabilidade conhecida, e diferente de zero, de
pertencer à amostra;
b) melhor recomendação para garantir a representatividade da amostra, pois o acaso será
o único responsável por eventuais diferenças entre população e amostra;
c) É possível utilizar as técnicas de Inferência Estatística.

5.2 AMOSTRAGEM PROBABILÍSTICA


Algumas técnicas de seleção utilizando amostragem probabilística:

5.2.1 Amostragem Aleatória Simples (AAS)


• É o método mais simples e mais importante para selecionar uma amostra probabilística
• Consiste em listar todas as unidades elementares enumeradas de 1 a N
• sorteiam-se “n” elementos da população, sendo que todos os elementos têm probabilidade
conhecida e diferente de zero de serem selecionados
• A amostragem pode ser com reposição ou sem reposição.
Exemplo: Foram produzidos 500 anéis de pistão em certo processo de produção. Deseja-se obter
uma amostra de 30 anéis de pistão deste processo.
Utilizando processo aleatório simples com reposição:
1) enumerar os anéis de pistão de 1 a 500;
2) todos os anéis terão a mesma probabilidade de compor a amostra, igual a 0,2%;
3) gerar 30 números aleatórios ou selecionar 30 números utilizando tabelas de números aleatórios;
4) os anéis que comporão a amostra serão aqueles correspondentes aos números aleatórios;
290 271 211 4 456 451 389 487 397 410
473 143 381 217 128 465 457 174 160 157
206 369 155 285 421 239 454 341 424 289
67

No excel:
ALEATÓRIO()*(b-a)+a onde a=1; b=500
5) a amostra de 30 anéis de pistão será composta pelos anéis com as numerações acima.

5.2.2 Amostragem Sistemática


Usa- se a amostragem sistemática quando os elementos da população estão ordenados e
a retirada das unidades amostrais é feita sistematicamente.
É muito útil para retirar amostra em uma linha de produção. Por exemplo, a cada dez itens
produzidos, retirar um para compor a amostra da produção diária.

Considerando o exemplo dos anéis de pistão: os anéis estão enumerados de 1 a 500.


n 30 1
f= = = (fração amostral)
N 500 17

1) gera-se ou seleciona-se um número aleatório entre 1 e 17;


2) Para o exemplo, o número gerado foi 11. Para obter os demais elementos, soma-se sempre 17,
até completar o tamanho da amostra.

No excel:

ALEATÓRIO()*(b-a)+a onde a=1; b=17

11 28 45 62 79 96 113 130 147 164


181 198 215 232 249 266 283 300 317 334
351 368 385 402 419 436 453 470 487 4
3) a amostra de 30 anéis de pistão será composta pelos anéis com as numerações acima.

5.2.3 Amostragem Estratificada

Utiliza-se a amostragem estratificada quando:


• A população pode ser dividida em subgrupos (estratos).
• Quando a variável em estudo apresenta um comportamento heterogêneo entre os
diferentes subgrupos (estratos), convém que o sorteio dos elementos da amostra leve em
consideração tais estratos.
• A estratificação é usada principalmente para resolver alguns problemas como a melhoria
da precisão das estimativas.
• A amostragem estratificada pode ser: proporcional, uniforme e de Neyman.

Exemplo:

Dada a população de 5.000 operários de uma certa indústria automobilística, selecionar


uma amostra estratificada proporcional de operários para estimar seu salário médio. Usando a
variável critério “cargo” para estratificar essa população, e considerando amostra total de 250
operários, chega-se ao seguinte quadro:
68

QUADRO 6 – POPULAÇÃO TOTAL, PROPORÇÃO E TAMANHO DA AMOSTRA SEGUNDO


CARGO
CARGO POPULAÇÃO PROPORÇÃO AMOSTRA

Chefes de seção 500 0,10 25

Operários especializados 1.500 0,30 75

Operários não especializados 3.000 0,60 150

TOTAL 5.000 1,00 250

5.3 DISTRIBUIÇÕES AMOSTRAIS

Ao retirar uma amostra aleatória de uma população, está-se considerando cada valor da
amostra como um valor de uma variável aleatória cuja distribuição de probabilidade é a mesma da
população, no instante da retirada desse elemento para a amostra.
Em consequência do fato de os valores da amostra serem aleatórios, decorre que qualquer
quantidade calculada em função dos elementos da amostra, também será uma variável aleatória.
Os parâmetros são valores teóricos correspondentes à população e as estatísticas são
funções dos valores amostrais.
As estatísticas, sendo variáveis aleatórias, terão alguma distribuição de probabilidade, com
uma média, variância, etc. A distribuição de probabilidade de uma estatística chama-se,
comumente, distribuição amostral ou distribuição por amostragem.

5.3.1 Distribuição Amostral de Médias

O parâmetro 𝜇 é um valor único e desconhecido. A estatística 𝑋̅ é um valor conhecido,


porém pode variar de amostra para amostra. Se forem retiradas diferentes amostras aleatórias de
mesmo tamanho, as médias das diferentes amostras não deverão ser iguais. Apesar de a média
da população ser a mesma, a média da amostra dependerá de cada amostra.
Com as médias das amostras, é possível construir a distribuição de frequências das médias
das amostras, denominada distribuição amostral, cuja média denomina-se média da distribuição
amostral e seu desvio padrão, erro padrão.
Exemplo:
Embora os parâmetros, média e desvio padrão, da população não sejam conhecidos,
considera-se para o exemplo a seguir, como sendo conhecidos.
Seja uma população constituída dos elementos: 2, 5, 7 e 10, sendo 𝑁 = 4. A média e a
variância populacional são: 𝜇 = 6,00 e 𝜎 2 = 8,50.
Considere as possíveis amostras de 2 elementos (𝑛 = 2), que podem ser retiradas desta
população.

a) Sem reposição
O número de amostras possíveis é dado por 𝑘 = 𝐶𝑁𝑛 . Então, o número de amostras
possíveis é igual a 6.
69

QUADRO 7 – AMOSTRAS POSSÍVEIS DE 2 ELEMENTOS RETIRADAS DESSA POPULAÇÃO


SEM REPOSIÇÃO
AMOS- AMOS- AMOS- AMOS- AMOS- AMOS-
AMOSTRAS TRA 1 TRA 2 TRA 3 TRA 4 TRA 5 TRA 6

𝑋1 2 2 2 5 5 7
𝑋2 5 7 10 7 10 10
Média (𝑋̅𝑖 ) 3,5 4,5 6,0 6,0 7,5 8,5

Observe que a média da amostra depende de cada amostra extraída. Qualquer inferência
realizada sobre a média da população utilizando uma única amostra estará sujeita a alguma
incerteza, pois a média de cada amostra pode ser diferente.

A média das médias amostrais é obtida por:

𝑘
1 3,5 + 4,5 + 6,0 + 6,0 + 7,5 + 8,5 36
𝐸(𝑋̅) = ∑ 𝑋̅𝑖 = = =6
𝑘 6 6
𝑖=1

𝐸(𝑋̅) = 6

A média das médias amostrais ou a média da distribuição amostral coincide com a média
da população. Tem-se, então, a primeira conclusão importante: a média das médias amostrais é a
própria média da população.

A variância das médias amostrais é dada por:

𝑘
1
𝑉(𝑋̅) = ∑(𝑋̅𝑖 − 𝐸(𝑋̅))2
𝑘
𝑖=1

1
𝑉(𝑋̅) = [(3,5 − 6)2 + (4,5 − 6)2 + (6 − 6)2 + (6 − 6)2 + (7,5 − 6)2 (8,5 − 6)2 ]
6

1 17
𝑉(𝑋̅) = [6,25 + 2,25 + 0 + 0 + 2,25 + 6,25] = = 2,83
6 6

𝑉(𝑋̅) = 2,83
A variância das médias amostrais é igual à variância da população multiplicada pelo fator
chamado de correção de população finita:
1 𝑁−𝑛
×
𝑛 𝑁−1

Tem-se então que:

𝐸(𝑋̅) = 𝜇𝑋̅ = 𝜇 (Média da distribuição amostral de médias)

𝜎2 𝑁 − 𝑛
𝑉(𝑋̅) = 𝜎𝑋2̅ = × (Variância da distribuição amostral de médias)
𝑛 𝑁−1
70

a) Com reposição

O número de amostras possíveis é dado por 𝑘 = 𝑁 𝑛 . Então, o número de amostras


possíveis é igual a 16.

QUADRO 8 – AMOSTRAS POSSÍVEIS DE 2 ELEMENTOS RETIRADAS DESSA POPULAÇÃO COM


REPOSIÇÃO
AMOSTRAS AMOS- AMOS- AMOS- AMOS- AMOS- AMOS- AMOS- AMOS-
TRA 1 TRA 2 TRA 3 TRA 4 TRA 5 TRA 6 TRA 7 TRA 8

𝑋1 2 2 2 2 5 5 5 5
𝑋2 2 5 7 10 2 5 7 10
Média (𝑋̅𝑖 ) 2,0 3,5 4,5 6,0 3,5 5,0 6,0 7,5
AMOSTRAS AMOS- AMOS- AMOS- AMOS- AMOS- AMOS- AMOS- AMOS-
TRA 9 TRA 10 TRA 11 TRA 12 TRA 13 TRA 14 TRA 15 TRA 16

𝑋1 7 7 7 7 10 10 10 10
𝑋2
2 5 7 10 2 5 7 10

Média (𝑋̅𝑖 ) 4,5 6,0 7,0 8,5 6,0 7,5 8,5 10,0

A média das médias amostrais é obtida por:


𝑘
1 1
𝐸(𝑋̅) = ∑ 𝑋̅𝑖 = [2 + 3,5 + 4,5 + 6,0 + ⋯ + 4,5 + 6,0 + ⋯ + 10]
𝑘 16
𝑖=1
1
𝐸(𝑋̅) = × 96 = 6
16

𝐸(𝑋̅) = 6

A variância das médias amostrais é dada por:


𝑘
1
𝑉(𝑋̅) = ∑(𝑋̅𝑖 − 𝐸(𝑋̅))2
𝑘
𝑖=1
1
𝑉(𝑋̅) = [(2 − 6)2 + (3,5 − 6)2 + ⋯ + (8,5 − 6)2 + (10 − 6)2 ]
16
1 1
𝑉(𝑋̅) = [16 + 6,25 + ⋯ + 6,25 + 16] = × 68 = 4,25
16 16

A variância das médias amostrais é igual à variância da população multiplicada pelo fator:
1
𝑛

Tem-se então que:

𝐸(𝑋̅) = 𝜇𝑋̅ = 𝜇 (Média da distribuição amostral de médias)

𝜎2
𝑉(𝑋̅) = 𝜎𝑋2̅ = (Variância da distribuição amostral de médias)
𝑛
71

De forma geral, a forma da distribuição amostral depende da forma da distribuição da


população. Se a distribuição da população for 𝑁(𝜇, 𝜎 2 ), a distribuição da média amostral também
será normal, seja qual for o tamanho 𝑛 da amostra. Se a distribuição da população não for normal,
à medida que o tamanho da amostra aumentar, a distribuição da média amostral se aproximará da
distribuição normal.

De acordo com o teorema central do limite, a distribuição das médias de amostras de


tamanho suficientemente grande poderá ser considerada como normal, seja qual for a forma da
distribuição da população.

Resumindo:

a) Amostragem com reposição:

𝐸(𝑋̅) = 𝜇𝑋̅ = 𝜇 (Média da distribuição amostral de médias)


2
𝜎
𝑉(𝑋̅) = 𝜎𝑋2̅ =
𝑛 (Variância da distribuição amostral de médias)
b) Amostragem sem reposição:

𝐸(𝑋̅) = 𝜇𝑋̅ = 𝜇 (Média da distribuição amostral de médias)

𝜎2 𝑁 − 𝑛
𝑉(𝑋̅) = 𝜎𝑋2̅ = × (Variância da distribuição amostral de médias)
𝑛 𝑁−1

onde o fator 𝑁−𝑛 é denominado de fator de correção de população finita.


𝑁−1

Evidentemente, tem-se que:


𝑁−𝑛
lim =1
𝑁→∞ 𝑁 − 1

5.3.1.1Teorema Central do Limite


Em situações em que se tem 𝑛 → ∞ , é possível aplicar o Teorema Central do Limite.
Existem diversas versões do teorema central do limite. Será apresentada uma das versões.
Sejam 𝑋1 , 𝑋2 , … , 𝑋𝑛 , variáveis aleatórias independentes e identicamente distribuídas (i.i.d.),
tais que 𝐸(𝑋𝑖 ) = 𝜇 e 𝑉(𝑋𝑖 ) = 𝜎 2 , ambas finitas. Seja 𝑋̅ a média amostral. Então:

𝑋̅ − 𝜇 𝑋̅ − 𝜇
𝑍= = √𝑛 ( ) ~ 𝑁(0, 1)
2 𝜎
√𝜎
𝑛
A aproximação melhora com o aumento do tamanho da amostra.

Se, de uma população com parâmetros (𝜇, 𝜎 2 ), for retirada uma amostra de tamanho n
suficientemente grande, a distribuição de 𝑋̅ será aproximadamente 𝑁(𝜇, 𝜎 2 /𝑛), seja qual for a
forma da distribuição da população.
O teorema central do limite é muito importante, pois permite utilizar a distribuição normal
para realizar inferências da média amostral, seja qual for a forma da distribuição da população.
72

5.3.2 Distribuição Amostral de Proporções

Seja uma população tal que, a probabilidade de sucesso de certo evento é 𝑝 e de insucesso
é 𝑞 = 1 − 𝑝. Para cada amostra de tamanho 𝑛, pode-se determinar o número 𝑘 de sucesso e como
𝑘
consequência, a frequência relativa ou proporção dada por 𝑓𝑟 = 𝑝̂ = .
𝑛
O conjunto de frequências relativas calculadas para as amostras constitui a distribuição
amostral das proporções ou de frequências relativas.

Considere a população de peças com as seguintes características:


{d1, b1, b2}, sendo: d1=peça defeituosa ; b1=peça boa e b2=peça boa
Tem-se então que:
1
p=proporção de peça defeituosa=
3
2
q=proporção de peça boa =
3
𝑁=3
Retira-se amostras de tamanho n=2, desta população, considerando:

a) amostras sem reposição

𝑘 = ∁𝑛𝑁 = ∁23 = 3 amostras

(d1 , b1 )
(d1 , b2 ) DISTRIBUIÇÃO AMOSTRAL
(b1 , b2 )

( 1⁄2 )
( 1⁄2 ) DISTRIBUIÇÃO AMOSTRA DE PROPORÇÕES DE PEÇAS DEFEITUOSAS
(0)

Média da distribuição amostral de proporções 𝜇𝑝̂ :


1 1
+ +0 1
𝜇𝑃̂ = 2 2 =
3 3

Variância da distribuição amostral de proporções 𝜎𝑃2̂ :


1 1 1 1 1
(2 − 3)2 + (2 − 3)2 + (0 − 3)2 1
𝜎𝑃2̂ = =
3 18

Resumindo:

𝜇𝑝̂ = 𝑝 (média da distribuição amostral de proporções)

𝑝×𝑞 𝑁−𝑛
𝜎𝑝2̂ = × (variância da distribuição amostral de proporções)
𝑛 𝑁−1
73

b) amostras com reposição

𝑘 = 𝑁 𝑛 = 32 = 9

(d1 d1 ) (b1 d1 ) (b2 d1 )


(d1 b1 ) (b1 b1 ) (b2 b1 ) DISTRIBUIÇÃO AMOSTRAL
(d1 b2 ) (b1 b2 ) (b2 b2 )

1 1⁄2 1⁄2
1⁄2 0 0 DISTRIBUIÇÃO AMOSTRAL DE PROPORÇÕES DE PEÇAS DEFEITUOSAS
1⁄2 0 0

Média da distribuição amostral de proporções 𝜇𝑝̂ :

1 1 1 1
1+2+2+2+0+0+2+0+0 1
𝜇𝑃̂ = =
9 3

Variância da distribuição amostral de proporções 𝜎𝑃2̂ :

1 1 1 1 1 1 1 1
(1 − 3)2 + (2 − 3)2 + (2 − 3)2 + (2 − 3)2 + ⋯ + (0 − 3)2 1
𝜎𝑃2̂ = =
9 9

Resumindo:

𝜇𝑃̂ = 𝑝 (média da distribuição amostral de proporções)

𝑝×𝑞
𝜎𝑝2̂ = (variância da distribuição amostral de proporções)
𝑛

Para amostras suficientemente grandes, a distribuição amostral das proporções, que segue
distribuição binomial, poderá se aproximar de uma distribuição normal de mesma média e mesma
variância. Na prática, considera-se a amostra grande para 𝑛 ≥ 30 e 𝑝 próximo de 0,5.
74

6 ESTIMAÇÃO DE PARÂMETROS

6.1 INTRODUÇÃO

A inferência estatística tem como objetivo fazer generalizações sobre uma população, com
base nos dados amostrais.
Divide-se em duas grandes áreas: estimação e teste de hipóteses.

Pontual
Estimação
Inferência Por intervalo
Estatística
Teste de Hipóteses

Estimação: O objetivo é fornecer informações sobre os parâmetros populacionais, tendo como


base uma amostra aleatória extraída da população de interesse.
Estatística: Qualquer quantidade calculada em função dos elementos da amostra.
Distribuição amostral ou distribuição por amostragem: Distribuição de probabilidade de uma
estatística.

6.2 ESTIMADOR E ESTIMATIVA

Estimador: Quantidade calculada em função dos elementos amostrais, que será utilizada no
processo de estimação do parâmetro de interesse.
Principais métodos de obtenção de estimadores:

• Método dos momentos;


• Método da máxima verossimilhança;
• Método dos mínimos quadrados.

Estimativa: é valor numérico obtido pelo estimador numa determinada amostra.

6.3 QUALIDADES DE UM ESTIMADOR

a) Não tendencioso ou não viesado

Um estimador 𝜃̂ é não tendencioso ou não viesado quando a sua média (ou esperança ou
expectância) é o próprio valor do parâmetro populacional 𝜃 que está se pretendendo estimar, ou
seja: 𝐸(𝜃̂) = 𝜃

Considere o estimador da média populacional 𝜇:


𝑛
1 1
𝑋̅ = ∑ 𝑥𝑖 = × [𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 ]
𝑛 𝑛
𝑖=1

1 1 1
𝐸(𝑋̅) = 𝐸 [ × [𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 ]] = 𝐸[𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 ] = × 𝑛 × 𝜇 = 𝜇
𝑛 𝑛 𝑛
75

b) Consistência
Um estimador 𝜃̂ é consistente se (além de ser não viesado) sua variância tende para zero,
quando n tende para ∞, isto é:

𝐸(𝜃̂) = 𝜃 e lim 𝑉(𝜃̂) = 0


𝑛→∞

Seja o estimador da média populacional 𝜇:


𝑛
1
𝑋̅ = ∑ 𝑥𝑖
𝑛
𝑖=1

E, tem-se da distribuição amostral de médias que:


𝜎2
𝑉(𝑋̅) = 𝜎𝑋2̅ =
𝑛
Então:
𝜎2
lim 𝑉(𝑋̅) = lim ( )=0
𝑛→∞ 𝑛→∞ 𝑛

c) Eficiência

Dados dois estimadores 𝜃̂1 e 𝜃̂2 de um mesmo parâmetro, é mais eficiente aquele que
apresenta menor variância, ou seja:
Se 𝑉(𝜃̂1 ) < 𝑉(𝜃̂2 ) então 𝜃̂1 , é mais eficiente que 𝜃̂2 .

Ainda, se 𝜃̂1 e 𝜃̂2 forem ambos não tendenciosos, a eficiência relativa será dado pelo
quociente das respectivas variâncias, ou seja:
𝑉(𝜃̂1 )
𝑉(𝜃̂2 )

A média aritmética e a mediana são dois estimadores não tendenciosos da média aritmética
populacional 𝜇 para populações normais. Tem-se que:
𝜎2
𝑉(𝑋̅) =
𝑛

𝜋𝜎 2
𝑉(𝑀𝑒 ) =
2𝑛

𝜎2
𝑉(𝑋̅) 2
= 𝑛 2 = = 0,64
𝑉(𝑀𝑒 ) 𝜋𝜎 𝜋
2𝑛

d) Suficiência

Estimador suficiente é aquele que tem a capacidade de retirar da amostra toda a informação
que ela pode fornecer, ou seja, resume os dados sem perder nenhuma informação sobre o
parâmetro 𝜃.
76

6.4 ESTIMAÇÃO POR PONTOS

Quando o parâmetro é estimado através de um único valor diz-se que a estimação é por
ponto ou pontual. Por exemplo: 𝑋̅, é um estimador pontual da média populacional 𝜇; 𝑆 2 , é um
estimador pontual da variância populacional 𝜎 2 ; etc.

6.4.1 Estimador da Média Populacional


O estimador utilizado é a média aritmética amostral 𝑋̅, sendo um estimador não viesado,
consistente, eficiente e suficiente.
𝑛
1
𝑋̅ = ∑ 𝑥𝑖
𝑛
𝑖=1

6.4.2 Estimador da Variância Populacional


O estimador utilizado é a variância amostral 𝑆 2 . As estimativas obtidas pelas expressões
apresentadas a seguir são não tendenciosos e consistentes.
Quando a média populacional 𝜇 for conhecida, a estimativa é dada por:

2
∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2
𝑆 =
𝑛

E quando a média populacional 𝜇 for desconhecida, por:


𝑛
1
2
𝑆 = ∑(𝑥𝑖 − 𝑋̅)2
𝑛−1
𝑖=1

6.4.3 Estimador do Desvio Padrão Populacional


Tem-se que 𝑆 2 é um estimador não tendencioso da variância populacional 𝜎 2 . No entanto,
a raiz quadrada de 𝑆 2 não é um estimador não tendencioso do desvio padrão populacional 𝜎. A
tendenciosidade de 𝑆 tende a zero, à medida que aumenta o tamanho da amostra.

6.4.4 Estimador da Proporção Populacional


O estimador utilizado é a proporção amostral 𝑝̂ . A expressão de 𝑝̂ é dada por:
𝑘
𝑝̂ = , onde k é o número de casos favoráveis.
𝑛

6.5 ESTIMAÇÃO POR INTERVALO

Consiste em construir um intervalo em torno da estimativa por ponto, de tal forma que ele
possua probabilidade conhecida (nível de confiança) de conter o verdadeiro valor do parâmetro.
Seja o parâmetro 𝜃, tal que 𝑃(𝑡1 ≤ 𝜃 ≤ 𝑡2 ) = 1 − 𝛼. Então, tem-se:

𝑡1 ≤ 𝜃 ≤ 𝑡2 : chamado de intervalo de confiança (I.C.)


𝑡1 e 𝑡2 : são denominados de limites de confiança
1 − 𝛼: nível de confiança
77

A escolha do nível de confiança depende do grau de precisão com que se deseja estimar
o parâmetro. É comum utilizar os níveis de 95% e 99%. Evidentemente, o aumento no nível de
confiança implica no aumento de sua amplitude.

6.5.1 Intervalo de Confiança para Média populacional


1) Quando a Variância Populacional 𝝈𝟐 é Conhecida

O intervalo de confiança de (1 − 𝛼)100% será dado por:

𝜎 𝜎
𝑃 (𝑋̅ − 𝑍𝛼/2 ≤ 𝜇 ≤ 𝑋̅ + 𝑍𝛼/2 )= 1−𝛼
√𝑛 √𝑛
onde:
𝑋̅ é a média da amostra;
𝛼 é o nível de significância adotado;
𝑍𝛼/2 é o valor de Z da tabela da distribuição “t” para um determinado nível de significância e
graus de liberdade 𝜐 → ∞;
𝜎 é o desvio padrão da população;
𝑛 é o tamanho da amostra.
A utilização da expressão acima deve atender aos seguintes critérios:
Para amostras pequenas (n<30), a população deve ser normalmente distribuída;
Para grandes amostras (n≥30), não existe a exigência de que a população seja normalmente
distribuída (justificada pelo Teorema Central do Limite), e sendo 𝜎 desconhecido, pode ser
substituído pelo desvio padrão amostral 𝑆.

FIGURA 5 – DISTRIBUIÇÃO NORMAL PADRÃO

1− 

 2  2

− Z 2 Z 2

Exemplos de aplicação

1) O desvio padrão dos comprimentos de todas as peças produzidas por certa máquina é 2 mm.
Uma amostra de 50 peças produzidas por essa máquina apresenta média igual a 25 mm. Construir
o I.C. de 95% para o verdadeiro comprimento das peças produzidas por essa máquina.
𝜎=2
78

𝑛 = 50
𝑋̅ = 25
1 − 𝛼 = 0,95 , portanto, 𝛼 = 0,05 e 𝑍𝛼⁄2 = 1,96
Assim, o intervalo de confiança de (1 − 𝛼)100% será:
𝜎 𝜎
𝑃 (𝑋̅ − 𝑍𝛼/2 ≤ 𝜇 ≤ 𝑋̅ + 𝑍𝛼/2 ) = 1 − 𝛼
√𝑛 √𝑛
2 2
𝑃 (25 − 1,96 ≤ 𝜇 ≤ 25 + 1,96 ) = 95%
√50 √50
𝑃(24,45 𝑚𝑚 ≤ 𝜇 ≤ 25,55 𝑚𝑚) = 95%
É possível dizer que o intervalo acima contém o verdadeiro parâmetro 𝜇, com 95% de
confiança.

2) Experiência passada indicou que a resistência à quebra de um fio usado na fabricação de


material moldável é normalmente distribuída e que 𝜎 = 2 𝑝𝑠𝑖. Uma amostra aleatória de nove itens
é testada e a resistência média à quebra é 98 𝑝𝑠𝑖. Encontre um intervalo bilateral de confiança de
95% para a resistência média à quebra.
𝜎=2
𝑛=9
𝑋̅ = 98
1 − 𝛼 = 0,95 , portanto, 𝛼 = 0,05 e 𝑍𝛼⁄2 = 1,96
𝜎 𝜎
𝑃 (𝑋̅ − 𝑍𝛼/2 ≤ 𝜇 ≤ 𝑋̅ + 𝑍𝛼/2
)=1−𝛼
√𝑛 √𝑛
2 2
𝑃 (98 − 1,96 ≤ 𝜇 ≤ 98 + 1,96 ) = 95%
√9 √9
𝑃(96,69 𝑝𝑠𝑖 ≤ 𝜇 ≤ 99,31 𝑝𝑠𝑖) = 95%
É possível dizer que o intervalo acima contém o verdadeiro parâmetro 𝜇, com 95% de
confiança.

2) Quando a Variância Populacional 𝝈𝟐 é Desconhecida


O estudo que trata de distribuições amostrais ou distribuições de probabilidade de
estatísticas, de pequenas amostras (n<30), é chamado de Teoria das Pequenas Amostras.
A distribuição t de Student, desenvolvida por William Sealy Gosset, é uma distribuição de
probabilidade estatística. Esta distribuição é de fundamental importância para a inferência
estatística, quando o desvio padrão populacional 𝜎 é desconhecido e trata-se de amostras
pequenas (geralmente n<30).

O intervalo de confiança de (1 − 𝛼)100% será dado por:


𝑆 𝑆
𝑃 (𝑋̅ − 𝑡𝛼/2 ≤ 𝜇 ≤ 𝑋̅ + 𝑡𝛼/2 )=1−𝛼
√𝑛 √𝑛
onde:
𝑋̅ é a média da amostra;
79

𝛼 é o nível de significância adotado;


𝑡𝛼/2 é o valor de t da tabela da distribuição “t” para um determinado nível de significância e
𝜐 = 𝑛 − 1 graus de liberdade;
𝑆 é o desvio padrão da amostra;
𝑛 é o tamanho da amostra.
A utilização do I. C. acima deve obedecer aos seguintes critérios:
Para amostras pequenas (𝑛 < 30), a população de onde a amostra foi retirada deve ser
normalmente distribuída. Para grandes amostras (𝑛 ≥ 30), não há necessidade de observar o
critério anterior, justificado pelo Teorema Central do limite.

FIGURA 6 – DISTRIBUIÇÃO t DE STUDENT

1− 

2 2

− t 2 t 2

Exemplos de aplicação

1) Uma amostra de 20 cabos, produzidos por uma indústria, foram avaliados e medidas as tensões
de rupturas (em kgf). A média e o desvio padrão da amostra são iguais a 762 kgf e 14,4 kgf,
respectivamente. Deseja-se construir o intervalo de confiança de 95% para a tensão média de
ruptura de cabos produzidos pela indústria.
𝑛 = 20
𝑋̅ = 762
𝑆 = 14,4
1 − 𝛼 = 0,95 , portanto 𝛼 = 0,05 e 𝜐 = 𝑛 − 1 = 19 , então: 𝑡𝛼⁄2 = 2,09

Assim, o intervalo de confiança de (1 − 𝛼)100% será dado por:


𝑆 𝑆
𝑃 (𝑋̅ − 𝑡𝛼/2 ≤ 𝜇 ≤ 𝑋̅ + 𝑡𝛼/2
)=1−𝛼
√𝑛 √𝑛
14,4 14,4
𝑃 (762 − 2,09 ≤ 𝜇 ≤ 762 + 2,09 ) = 95%
√20 √20
𝑃(755,27 𝑘𝑔𝑓 ≤ 𝜇 ≤ 768,73 𝑘𝑔𝑓) = 95%

É possível dizer que o intervalo acima contém o verdadeiro parâmetro 𝜇, com 95% de
confiança.
80

2) A resistência do concreto à compressão está sendo testada por um engenheiro civil. Ele testa
12 corpos de prova e obtém dados abaixo. Construir um intervalo de 95% para a resistência média.

Dados: 𝑋̅ = 2.259,92 ; 𝑆 = 35,57

𝑛 = 12

1 − 𝛼 = 0,95 , portanto 𝛼 = 0,05 e 𝜐 = 𝑛 − 1 = 11 , então: 𝑡𝛼⁄2 = 2,20


𝑆 𝑆
𝑃 (𝑋̅ − 𝑡𝛼/2 ≤ 𝜇 ≤ 𝑋̅ + 𝑡𝛼/2 )=1−𝛼
√𝑛 √𝑛
35,57 35,57
𝑃 (2.259,92 − 2,20 ≤ 𝜇 ≤ 2.259,92 + 2,20 ) = 95%
√12 √12
𝑃(2.237,33 ≤ 𝜇 ≤ 2.282,51) = 95%

6.5.2 Intervalo de Confiança para Proporção Populacional

Para o cálculo do desvio padrão, deve-se estimar a proporção populacional 𝑝, utilizando a


estimativa pontual 𝑝̂ , assim fazendo 𝑞̂ = 1 − 𝑝̂ , tem-se:

𝑝̂ × 𝑞̂ 𝑝̂ × 𝑞̂
𝑃 [𝑝̂ − 𝑍𝛼⁄2 √ ≤ 𝑝 ≤ 𝑝̂ + 𝑍𝛼⁄2 √ ] =1−𝛼
𝑛 𝑛

Onde:
𝑥
𝑝̂ = é a proporção amostral (onde x representa o número de casos favoráveis ao evento
𝑛 estudado).

A utilização do I. C. acima deve obedecer aos seguintes critérios:


a) 𝑛𝑝 ≥ 5 e 𝑛(1 − 𝑝) ≥ 5, exigindo assim que a amostra seja grande. Os critérios exigidos
estão teoricamente, de acordo com a aproximação da distribuição binomial à distribuição
normal;
b) Quando as condições do item (a) não são obedecidas, a amostra será pequena e a
construção dos intervalos de confiança exige a utilização de uma tabela especial.

Exemplo de aplicação

Em uma amostra de 200 peças produzidas por certa máquina, verificou-se que 10 eram
defeituosas. Estimar a verdadeira proporção de peças defeituosas produzidas por essa máquina,
utilizando I.C. de 90%.

𝑛 = 200
10
𝑝̂ = = 0,05
200
𝑞̂ = 1 − 𝑝̂ = 0,95
𝑍𝛼⁄2 = 1,64
81

Substituindo os valores na expressão do I.C., tem-se:

𝑝̂ × 𝑞̂ 𝑝̂ × 𝑞̂
𝑝̂ − 𝑍𝛼⁄2 √ ≤ 𝑝 ≤ 𝑝̂ + 𝑍𝛼⁄2 √
𝑛 𝑛

0,05 × 0,95 0,05 × 0,95


0,05 − 1,64√ ≤ 𝑝 ≤ 0,05 + 1,64√
200 200

0,0247 ≤ 𝑝 ≤ 0,0753
𝑃[2,47% ≤ 𝑝 ≤ 7,53%] = 90%

É possível dizer que o intervalo acima contém o verdadeiro parâmetro 𝑝, com 95% de
confiança.

6.5.3 Intervalo de Confiança para Diferença entre Duas Médias Populacionais 𝝁𝟏 e 𝝁𝟐

1) Quando as Variâncias Populacionais 𝝈𝟐𝟏 e 𝝈𝟐𝟐 são Conhecidas

O intervalo de confiança de (1 − 𝛼)100% será dado por:

𝜎12 𝜎22 𝜎12 𝜎22


𝑃 [(𝑋̅1 − 𝑋̅2 ) − 𝑍𝛼⁄2 √ + ≤ (𝜇1 − 𝜇2 ) ≤ (𝑋̅1 − 𝑋̅2 ) + 𝑍𝛼⁄2 √ + ] = 1 − 𝛼
𝑛1 𝑛2 𝑛1 𝑛2

onde:

𝑋̅1 é a média da amostra 1;


𝑋̅2 é a média da amostra 2;
𝛼 é o nível de significância adotado;
𝑍𝛼⁄2 é o valor de Z da tabela da distribuição “t” para um determinado nível de significância e graus
de liberdade 𝜐 → ∞;
𝜎12é a variância da população 1;
𝜎22é a variância da população 2;
𝑛1 é o tamanho da amostra 1;
𝑛2 é o tamanho da amostra 2.

Exemplo de aplicação

Os desvios padrão das durações das lâmpadas elétricas fabricadas pelas indústrias A e B
são, respectivamente, 50 horas e 80 horas. Foram ensaiadas 40 lâmpadas de cada marca e as
durações médias obtidas foram 1.200 horas e 1.100 horas, para A e B, respectivamente. Construir
o intervalo de confiança de 99% para a diferença entre os tempos médios de vida das lâmpadas
de marcas A e B, ou seja, 𝜇𝐴 − 𝜇𝐵 .
𝜎𝐴 = 50
𝜎𝐵 = 80
𝑛𝐴 = 𝑛𝐵 = 40
𝑋̅𝐴 = 1200
82

𝑋̅𝐵 = 1100
1 − 𝛼 = 0,99 , logo: 𝑍𝛼⁄2 = 2,58
O intervalo de confiança (I.C.) de (1 − 𝛼)100% para 𝜇𝐴 − 𝜇𝐵 , será dado por:

𝜎2 𝜎2 𝜎2 𝜎2
(𝑋̅𝐴 − 𝑋̅𝐵 ) − 𝑍𝛼⁄2 √ 𝐴 + 𝐵 ≤ (𝜇𝐴 − 𝜇𝐵 ) ≤ (𝑋̅𝐴 − 𝑋̅𝐵 ) + 𝑍𝛼⁄2 √ 𝐴 + 𝐵
𝑛𝐴 𝑛𝐵 𝑛𝐴 𝑛𝐵

502 802 502 802


(1200 − 1100) − 2,58√ + ≤ (𝜇𝐴 − 𝜇𝐵 ) ≤ (1200 − 1100) + 2,58√ +
40 40 40 40
𝑃[61,52 ℎ𝑜𝑟𝑎𝑠 ≤ (𝜇𝐴 − 𝜇𝐵 ) ≤ 138,48 ℎ𝑜𝑟𝑎𝑠] = 99%

2) Quando as Variâncias Populacionais 𝝈𝟐𝟏 e 𝝈𝟐𝟐 são Desconhecidas e Supostamente Iguais

O intervalo de confiança de (1 − 𝛼)100% será dado por:

1 1 1 1
𝑃 [(𝑋̅1 − 𝑋̅2 ) − 𝑡𝛼⁄2 √𝑆𝑝2 ( + ) ≤ (𝜇1 − 𝜇2 ) ≤ (𝑋̅1 − 𝑋̅2 ) + 𝑡𝛼⁄2 √𝑆𝑝2 ( + )] = 1 − 𝛼
𝑛1 𝑛2 𝑛1 𝑛2

sendo que:
(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
𝑆𝑝2 =
𝑛1 + 𝑛2 − 2

𝑋̅1 é a média da amostra 1;


𝑋̅2 é a média da amostra 2;

𝛼 é o nível de significância adotado;


𝑡𝛼⁄2 é o valor de t da tabela da distribuição “t” para um determinado nível de significância e
𝜐 = 𝑛1 + 𝑛2 − 2 graus de liberdade;
𝑆12 é a variância da amostra 1;
𝑆22 é a variância da amostra 2;
𝑛1 é o tamanho da amostra 1;
𝑛2 é o tamanho da amostra 2.

Exemplo de aplicação

Uma amostra de 5 tubos da fábrica A, apresentou os seguintes resultados quanto aos diâmetros
(mm):
𝑋̅𝐴 = 45,40 ; 𝑆𝐴2 = 1,30
E, uma amostra de 6 tubos da fábrica B, apresentou: 𝑋̅𝐵 = 44,17 ; 𝑆𝐵2 = 1,37
Construir o I. C. de 95% para a diferença entre os diâmetros médios (𝜇𝐴 − 𝜇𝐵 ), supondo as
variâncias populacionais iguais.
𝑛𝐴 = 5
𝑛𝐵 = 6
83

1 − 𝛼 = 0,95
𝑡𝛼⁄2 , com 𝜐 = 𝑛1 + 𝑛2 − 2 graus de liberdade, logo 𝜐 = 9

𝑡𝛼⁄2 = 2,26

O intervalo de confiança (I.C.) de (1 − 𝛼)100% para 𝜇𝐴 − 𝜇𝐵 , será dado por:

1 1 1 1
𝑃 [(𝑋̅𝐴 − 𝑋̅𝐵 ) − 𝑡𝛼⁄2 √𝑆𝑝2 ( + ) ≤ (𝜇𝐴 − 𝜇𝐵 ) ≤ (𝑋̅𝐴 − 𝑋̅𝐵 ) + 𝑡𝛼⁄2 √𝑆𝑝2 ( + ) ≤ (𝜇𝐴 − 𝜇𝐵 )]
𝑛𝐴 𝑛𝐵 𝑛𝐴 𝑛𝐵

=1−𝛼
onde:
(𝑛𝐴 − 1)𝑆𝐴2 + (𝑛𝐵 − 1)𝑆𝐵2 (5 − 1)(1,30) + (6 − 1)(1,37)
𝑆𝑝2 = = = 1,34
𝑛𝐴 + 𝑛𝐵 − 2 5+6−2

1 1 1 1
(45,40 − 44,17) − 2,26√1,34 ( + ) ≤ (𝜇𝐴 − 𝜇𝐵 ) ≤ (45,40 − 44,17) + 2,26√1,34 ( + )
5 6 5 6

1,23 − 1,58 ≤ (𝜇𝐴 − 𝜇𝐵 ) ≤ 1,23 + 1,58


𝑃[−0,35 𝑚𝑚 ≤ (𝜇𝐴 − 𝜇𝐵 ) ≤ 2,81𝑚𝑚] = 95%

É possível dizer que o intervalo acima contém a verdadeira diferença entre 𝜇𝐴 e 𝜇𝐵 , com
95% de confiança.

3) Quando as Variâncias Populacionais 𝝈𝟐𝟏 e 𝝈𝟐𝟐 são Desconhecidas e Supostamente


Diferentes
Para a construção do intervalo de confiança para a diferença entre duas médias
populacionais 𝜇1 e 𝜇2 , com base nos dados amostrais, desconhecendo-se os desvios padrão
populacionais 𝜎1 e 𝜎2 , e sendo supostamente diferentes, deve-se fazer uma modificação no teste
t, denominada correção de Aspin-Welch.

O intervalo de confiança de (1 − 𝛼)100% será dado por:

𝑆12 𝑆22 𝑆12 𝑆22


𝑃 [(𝑋̅1 − 𝑋̅2 ) − 𝑡𝛼⁄2 √ + ≤ (𝜇1 − 𝜇2 ) ≤ (𝑋̅1 − 𝑋̅2 ) + 𝑡𝛼⁄2 √ + ] = 1 − 𝛼
𝑛1 𝑛2 𝑛1 𝑛2

onde a variável "𝑡" tem número de graus de liberdade dado por:

(𝑤1 + 𝑤2 )2
𝜐=
𝑤12 𝑤22
+
𝑛1 − 1 𝑛2 − 1

Sendo:
𝑆12
𝑤1 =
𝑛1
𝑆22
𝑤2 =
𝑛2
84

Tem-se que:

𝑋̅1 é a média da amostra 1;


𝑋̅2 é a média da amostra 2;
𝛼 é o nível de significância adotado;
𝑡𝛼⁄2 é o valor de t da tabela da distribuição “t” para um determinado nível de significância e 𝜐
graus de liberdade;
𝑆12 é a variância da amostra 1;
𝑆22 é a variância da amostra 2;
𝑛1 é o tamanho da amostra 1;
𝑛2 é o tamanho da amostra 2.

Exemplo de aplicação
Dois operários mediram o tempo (em min) de certa operação industrial, obtendo:
𝑋̅1 = 12,17; 𝑋̅2 = 15,60 ; 𝑆12 = 7,77; 𝑆22 = 16,30 ; 𝑛1 = 6 ; 𝑛2 = 5
Estimar através de um I.C. de 95% a diferença 𝜇1 − 𝜇2 , supondo que as variâncias sejam
diferentes.

1 − 𝛼 = 0,95
𝑡𝛼⁄2 é o valor de t da tabela da distribuição “t” para um determinado nível de significância e 𝜐 graus
de liberdade.
Onde:

(𝑤1 + 𝑤2 )2
𝜐=
𝑤12 𝑤22
+
𝑛1 − 1 𝑛2 − 1

Sendo:
𝑆12 7,77
𝑤1 = = = 1,30
𝑛1 6
𝑆22 16,30
𝑤2 = = = 3,26
𝑛2 5

Logo:

(1,30 + 3,26)2 20,7936


𝜐= = = 6,9430 ≅ 7
1,302 3,262 2,9949
6−1+5−1
O intervalo de confiança (I.C.) de (1 − 𝛼)100% para 𝜇1 − 𝜇2 , será dado por:

𝑆2 𝑆2 𝑆2 𝑆2
(𝑋̅1 − 𝑋̅2 ) − 𝑡𝛼⁄2 √ 1 + 2 ≤ (𝜇1 − 𝜇2 ) ≤ (𝑋̅1 − 𝑋̅2 ) + 𝑡𝛼⁄2 √ 1 + 2
𝑛1 𝑛2 𝑛1 𝑛2
85

7,77 16,30 7,77 16,30


(12,17 − 15,60) − 2,36√ + ≤ (𝜇1 − 𝜇2 ) ≤ (12,17 − 15,60) + 2,36√ +
6 5 6 5

−3,43 − 5,04 ≤ (𝜇1 − 𝜇2 ) ≤ −3,43 + 5,04

P[−8,47 𝑚𝑚 ≤ (𝜇1 − 𝜇2 ) ≤ 1,61𝑚𝑚]=95%

É possível dizer que o intervalo acima contém a verdadeira diferença entre 𝜇1 e 𝜇2 , com
95% de confiança.

6.6 DIMENSIONAMENTO DA AMOSTRA

O objetivo do dimensionamento de amostras é o de determinar o tamanho mínimo de


amostra que se deve tomar, de maneira que, ao se estimar o parâmetro, o erro seja menor do que
um valor especificado.

6.6.1 Estimação da Média Populacional


Suponha que se pretende dimensionar o tamanho da amostra para a estimação da média
populacional 𝜇, através do I.C. de (1 − 𝛼)100% .
Em se tratando de extração de amostras com reposição, a precisão é dada pela semi-
amplitude do I.C.:
𝜎
𝑒0 = 𝑍𝛼⁄2
√𝑛

Sendo: 𝑒0 = |𝜇 − 𝑋̅|

Tem-se então que:

𝜎 2 Extração de amostras com reposição ou população infinita


𝑛 ≥ (𝑍𝛼⁄2 )
𝑒0

𝑍𝛼2⁄2 𝜎 2 𝑁 Extração de amostras sem reposição ou população finita


𝑛≥
𝑒02 (𝑁 − 1) + 𝑍𝛼2⁄2 𝜎 2

Qual o tamanho mínimo da amostra para se estimar a média de uma população cujo desvio
padrão é igual a 10, com confiança de 99% e precisão igual a 4? Supor que a amostragem é obtida:
a) com reposição;
b) sem reposição de uma população com 1000 elementos;

a) Amostragem com reposição

Tem-se as seguintes informações:

𝜎 = 10
𝑒0 = 4
1 − 𝛼 = 0,99, logo 𝛼 = 0,01 e 𝑍𝛼⁄2 = 2,58
86

𝜎 2 10 2
𝑛 ≥ (𝑍𝛼⁄2 ) = (2,58 × ) = 41,6025 = 42
𝑒0 4

O tamanho da amostra deve ser igual ou maior do que 42.

b) Amostragem sem reposição


𝜎 = 10
𝑒0 = 4
𝑁 = 1000

1 − 𝛼 = 0,99, logo 𝛼 = 0,01 e 𝑍𝛼⁄2 = 2,58


𝑍𝛼2⁄2 𝜎 2 𝑁 2,582 × 102 × 1000
𝑛≥ = = 39,9792 = 40
𝑒02 (𝑁 − 1) + 𝑍𝛼2⁄2 𝜎 2 42 × (1000 − 1) + 2,582 × 102

O tamanho da amostra deve ser igual ou maior do que 40.

NOTA: Não conhecendo 𝜎, usar 𝑆 e substituir 𝑍𝛼/2 por 𝑡𝛼/2 com 𝜐 = 𝑛 − 1 𝑔. 𝑙. O que ocorre
é que não se conhece também o 𝑆, e se não tem um valor que possa ser utilizado, retirar uma
amostra piloto, de 𝑛0 elementos e obter o desvio padrão S.

Calcular:
𝑆 2
𝑛 ≥ (𝑡𝛼⁄2, 𝑛0 −1× )
𝑒0
Se 𝑛 ≤ 𝑛0 , a amostra piloto já terá sido suficiente para a estimação. Caso contrário, deve-
se retirar, ainda, da população os elementos necessários à complementação do tamanho mínimo
da amostra.

6.6.2 Estimação da Proporção Populacional


Suponha que se pretende dimensionar o tamanho da amostra para a estimação da
proporção populacional 𝑝 através do I.C. de (1 − 𝛼)100%. A precisão é dada pela semi-amplitude
do I.C.:
𝑝×𝑞
𝑒0 = 𝑍𝛼⁄2 √
𝑛

Sendo: 𝑒0 = |𝑝 − 𝑝̂ |

Tem-se então que:

𝑝×𝑞
𝑛 ≥ 𝑍𝛼2⁄2 (Extração de amostras com reposição ou população
𝑒02 infinita)

𝑁 × 𝑝 × 𝑞 × 𝑍𝛼2⁄2 (Extração de amostras sem reposição ou


𝑛≥
𝑝 × 𝑞 × 𝑍𝛼2⁄2 + (𝑁 − 1) × 𝑒02 população finita)
87

Exemplo de aplicação

Qual o tamanho de amostra suficiente para estimar a proporção de peças defeituosas fornecidas
por certa máquina, com precisão de 0,08 e 99% de confiança, sabendo que essa proporção não
ultrapassa a 0,10?

𝑝 = 0,10
𝑒0 = 0,08

1 − 𝛼 = 0,99, logo 𝛼 = 0,01 e 𝑍𝛼⁄2 = 2,58

𝑝 × 𝑞 2,582 × 0,10 × (1 − 0,10)


𝑛 ≥ 𝑍𝛼2⁄2 = = 93,6056 = 94
𝑒02 (0,08)2
O tamanho da amostra deve ser igual ou maior do que 94.

Se o tamanho da população for 500, qual o tamanho da amostra necessário?


𝑝 = 0,10
𝑒0 = 0,08
𝑁 = 500
1 − 𝛼 = 0,99, logo 𝛼 = 0,01 e 𝑍𝛼⁄2 = 2,58
𝑁 × 𝑝 × 𝑞 × 𝑍𝛼2⁄2
𝑛≥
𝑝 × 𝑞 × 𝑍𝛼2⁄2 + (𝑁 − 1) × 𝑒02
500 × 0,10 × 0,90 × 2,582
𝑛≥ = 78,9880 = 79
0,10 × 0,90 × 2,582 + (500 − 1) × 0,082

O tamanho da amostra deve ser igual ou maior do que 79.

1
NOTA: O problema está no fato de não se conhecer 𝑝, nesse caso, é possível fazer 𝑝 = 𝑞 = ,
2
que fornecerá o maior valor do tamanho da amostra. Assim, seguramente o tamanho de amostra
obtido será suficiente para a estimação de qualquer que seja 𝑝.
1 1
× 𝑍𝛼⁄2 2 1 𝑍𝛼⁄2 2
𝑛≥ 𝑍𝛼2⁄2 2 2 2 =( ) × =( )
𝑒0 𝑒0 4 2𝑒0

LISTA DE EXERCÍCIOS 06

1. A cronometragem (em segundos), de certa operação, obtida em uma amostra, forneceu os


seguintes resultados: 𝑛 = 11 ; 𝑋̅ = 18,27 ; 𝑆 = 2,49 .
Supondo que o tempo para a execução da operação industrial seja normalmente distribuído,
construir o I.C. de 95% para a média populacional.
2. Um fabricante produz anéis para pistões de um motor de um carro. Sabe-se que o diâmetro do
anel é distribuído normalmente com 𝜎 = 0,001 milímetro. Uma amostra aleatória de 15 anéis tem
um diâmetro médio de 74,036 milímetros. Construa o intervalo de confiança de 99% para o
diâmetro dos anéis de pistão.
88

3. Sabe-se que a vida (em horas), de um bulbo de uma lâmpada de 75 W é distribuída normalmente
com 𝜎 = 25 horas. Uma amostra aleatória de 20 bulbos tem uma vida média de 1.014 horas.
Construa um intervalo de confiança de 95% para a vida média.
4. Um engenheiro do setor de pesquisa de um fabricante de pneu está investigando a vida média
do pneu em relação a um novo componente de borracha. Ele fabricou 16 pneus e testou-os até o
final da vida em um teste na estrada. A média e o desvio padrão da amostra são 60.139,7 e
3.645,94 km, respectivamente. Sabendo-se que a vida média do pneu é normalmente distribuída,
encontre um intervalo de confiança de 95% para a vida média do pneu.
5. Uma máquina produz bastões metálicos usados em um sistema de suspensão de automóveis.
Uma amostra aleatória de 15 bastões é selecionada e mede-se o diâmetro dos bastões. Os dados
(em milímetro) resultantes são mostrados a seguir:
𝑛 = 15 ; 𝑋̅ = 8,23 ; 𝑆 = 0,03 .
Sabendo-se que o diâmetro dos bastões é distribuída normalmente, encontre um intervalo de
confiança de 95% para o diâmetro médio dos bastões;
6. Em uma amostra aleatória de 85 mancais de eixos de manivelas de motores de automóveis, 10
têm um acabamento de superfície que é mais rugoso do que as especificações permitidas.
Consequentemente, uma estimativa pontual da proporção de mancais na população que excede
10
a especificação de rugosidade é 𝑝̂ = 85 =0,12. Construir o intervalo de confiança de 95% para a
proporção populacional.
7. Um fabricante de calculadoras eletrônicas retira uma amostra aleatória de 1200 calculadoras e
encontra 80 unidades defeituosas. Construa um intervalo de confiança de 95% para a proporção
de calculadoras defeituosas na população.
8. Está-se estudando a fração de circuitos integrados defeituosos produzidos em um processo.
Uma amostra de 300 circuitos é testada, revelando 13 defeituosos. Calcular o intervalo de
confiança de 90% para a fração de circuitos defeituosos produzidos pelo processo.
9. Uma empresa vem tendo sérios problemas com sucata e retrabalho, de modo que um de seus
engenheiros de qualidade decide investigar um determinado processo. Uma amostra aleatória de
150 itens é extraída num determinado dia, sendo encontrada uma porcentagem alta e alarmante
de 16% de itens desconformes (ou seja, defeituosos). O engenheiro decide criar um intervalo de
confiança de 95% para a proporção real de unidades defeituosas naquele momento. Qual é o
intervalo obtido?
10. Dois tipos de plásticos são adequados para uso por um fabricante de componentes eletrônicos.
A resistência à quebra desse plástico é importante. É sabido que 𝜎1 = 𝜎2 = 1,0 psi. A partir de uma
amostra aleatória de 𝑛1 = 10 e 𝑛2 = 12, obteve-se 𝑋̅1 = 162,5 e 𝑋̅2 = 155,0 psi. A companhia não
adotará o plástico 1, a menos que sua resistência média à quebra exceda do plástico 2, por no
mínimo, 10 psi. Calcule o intervalo de confiança de 95% para a diferença de médias, supondo que
ambas as populações sejam normalmente distribuídas.
11. Duas formulações diferentes de um combustível oxigenado de um motor devem ser testadas
com a finalidade de estudar sua octanagem na estrada. A variância da octanagem na estrada no
caso da formulação 1 é 𝜎12 = 1,5 e no caso da formulação 2 é 𝜎22 = 1,2. Duas amostras aleatórias
89

de 𝑛1 = 15 e 𝑛2 = 20 e são testadas, sendo que as octanagens médias observadas são 𝑋̅1 = 89,6
e 𝑋̅2 = 92,5. Considere normalidade das distribuições. Calcular o intervalo de confiança de 90%
para a diferença na octanagem média (𝜇2 − 𝜇1 ) observada na estrada.

12. Diâmetro de bastões de aço (mm), fabricadas em duas máquinas extrusoras diferentes, está
sendo investigado. Duas amostras aleatórias de tamanhos de 𝑛1 = 15 e 𝑛2 = 17 são selecionadas
e as médias e variâncias das amostras são 𝑋̅1 = 8,73, 𝑠12 = 0,35, 𝑋̅2 = 8,68 e 𝑠22 = 0,40,
respectivamente. Suponha que 𝜎12 = 𝜎22 e que os dados sejam retirados de uma população
normal. Construa um intervalo de confiança de 98% para a diferença no diâmetro médio dos
bastões.
13. Duas companhias fabricam um material de borracha para uso em uma aplicação automotiva.
A peça será sujeita a um desgaste abrasivo no campo de aplicação. Assim, decide-se comparar,
através de um teste, o material produzido por cada companhia. Vinte e cinco amostras de material
de cada companhia são testadas em um teste de abrasão, sendo a quantidade de desgaste
observada depois de 1000 ciclos. Para a companhia 1, a média e o desvio padrão do desgaste na
amostra são 𝑋̅1 = 20 miligramas/1000 ciclos e 𝑆1 = 2 miligramas/1000 ciclos, enquanto para
companhia 2 são 𝑋̅2 = 15 miligramas/1000 ciclos e 𝑆2 = 8 miligramas/1000 ciclos. Construa um
intervalo de confiança para 95% e 99% para a diferença de média de desgastes, considerando que
as populações são normalmente distribuídas com variâncias diferentes.
14. Um experimento realizado para estudar várias características de pinos de ferro resultou em 38
observações sobre a resistência de corte (kip) de pinos de 3/8 polegada de diâmetro e 35
observações sobre a resistência de pinos de 1/2 polegada de diâmetro. Os resultados obtidos
foram:
PINOS 𝑛 𝑋̅ 𝑆
Pino diâmetro 3/8 38 6,140 0,9
Pino diâmetro 1/2 35 4,250 1,3

Construir um intervalo de confiança de 98% para diferença entre as resistências médias de corte,
supondo normalidade das duas populações e variâncias distintas.
15. Qual o tamanho mínimo de amostra para se estimar a média de uma população cujo desvio
padrão é igual a 12, com confiança de 95% e precisão igual a 3? Supor que a amostragem é obtida
sem reposição de uma população com 2000 elementos.
16. Qual o tamanho de amostra suficiente para estimarmos a proporção de peças defeituosas
fornecidas por certa máquina, com erro de 0,03 e 99% de confiança, sabendo que a proporção não
ultrapassa de 0,10
17. Determinar o número mínimo de elementos de uma amostra, se desejamos estimar a média
populacional com 95% de confiança e erro amostral de 1, sendo que de uma amostra piloto com
70 elementos obteve-se variância igual a 36.
18. Um fabricante de peças acredita que aproximadamente 5% de seus produtos são defeituosos
se ele deseja estimar a verdadeira porcentagem, com erro de 0,05, com 90% de confiança. Qual
deverá ser o tamanho da amostra a ser retirada?
90

7 TESTES DE HIPÓTESES

7.1 ETAPAS PARA TESTES DE HIPÓTESES

Os testes de hipóteses ou testes de significância são métodos estatísticos para a tomada


de decisão a cerca de um parâmetro populacional, baseado em dados amostrais.
Etapas básicas para testar a significância estatística:
1) estabelecer a hipótese nula 𝐻0 ;
2) estabelecer a hipótese alternativa 𝐻1 ;
3) fixar o nível de significância 𝛼;
4) escolher a distribuição de probabilidade adequada ao teste e a partir daí determinar a região
de rejeição da hipótese nula 𝐻0 ;
Para a definição da região de rejeição de 𝐻0 é necessário considerar a hipótese 𝐻1 , dado
que é ela que define o tipo do teste, se é unilateral à esquerda, unilateral à direita ou bilateral.
Conforme o tipo do teste identifica-se a área de rejeição de 𝐻0 . Genericamente, tem-se
𝐻0 : 𝑇 = 𝑇0
𝑇 < 𝑇0 (𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑎) − 𝐹𝑖𝑔𝑢𝑟𝑎 7
𝐻1 : { 𝑇 > 𝑇0 (𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑑𝑖𝑟𝑒𝑖𝑡𝑎) − 𝐹𝑖𝑔𝑢𝑟𝑎 8
𝑇 ≠ 𝑇0 (𝑇𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙) − 𝐹𝑖𝑔𝑢𝑟𝑎 9

R.R.
R.R. Figura 7 Figura 8 R.R. Figura 9

Os pontos -c e c são os pontos críticos, localizados nas tabelas das distribuições das
estatísticas do teste, considerando-se o nível de significância adotado e o número de graus de
liberdade em questão.
5) Definir o tamanho da amostra, coletar os dados e calcular o valor da estatística correspondente;
6) Rejeitar ou não rejeitar 𝐻0 , avaliando se o valor da estatística, obtida a partir dos dados
amostrais, situa-se na área de rejeição ou na região de aceitação.

7.1.1 Nível de Significância


É a probabilidade máxima com a qual se sujeitaria a correr o risco de um erro tipo I.

7.1.2 Erro Estatístico

Dois tipos de erros são possíveis:


Erro tipo I – Rejeitar a hipótese nula quando ela for verdadeira, também denominado erro
alfa (𝛼).
𝛼 = 𝑃(𝑟𝑒𝑗𝑒𝑖𝑡𝑎𝑟 𝐻0 |𝐻0 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑖𝑟𝑎)
91

Erro tipo II – Não rejeitar a hipótese nula quando ela for falsa, também denominado erro
beta (𝛽).
𝛽 = 𝑃(𝑎𝑐𝑒𝑖𝑡𝑎𝑟 𝐻0 |𝐻0 𝑓𝑎𝑙𝑠𝑎)

7.2 TESTES ESTATÍSTICOS PARAMÉTRICOS

7.2.1 Teste para a Média Populacional

7.2.1.1 Quando a variância populacional 𝜎 2 é Conhecida


Para amostras pequenas (𝑛 < 30), a população deve ser normalmente distribuída, e o
desvio padrão populacional 𝜎 deve ser conhecido.
Para grandes amostras (𝑛 ≥ 30), não existe a exigência de que a população seja
normalmente distribuída (justificada pelo Teorema Central do Limite).

Para realizar o teste de hipóteses, as etapas apresentadas na seção 7.1 devem ser
seguidas.
As hipóteses estatísticas são:
𝐻0 : 𝜇 = 𝜇0
𝜇 < 𝜇0 (𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑎)
𝐻1 : { 𝜇 > 𝜇0 (𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑑𝑖𝑟𝑒𝑖𝑡𝑎)
𝜇 ≠ 𝜇0 (𝑇𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙)

Estabelecido o nível de significância 𝛼, o valor de Z crítico para este nível de significância


será obtido em uma tabela da variável normal padronizada e, assim, definida a região de rejeição
de 𝐻0 .

Obtidos os dados amostrais, a estatística de teste é calculada por:


𝑋̅ − 𝜇0
𝑍= 𝜎
√𝑛
onde:
𝑋̅ é a média amostral;’
𝜇0 é o valor a ser testado;
𝜎 é o desvio padrão populacional;
𝑛 é o tamanho da amostra.
Deve-se rejeitar 𝐻0 se o valor de Z amostral se situar na região de rejeição ou não rejeitar
𝐻0 , se situar na região de aceitação.

Exemplo de aplicação
1) Uma peça ao ser fabricada, foi planejada de tal forma que uma de suas dimensões seja igual a
10 cm. Conhece-se o desvio padrão do processo produtivo, que é igual a 0,8 cm e sabe-se que a
distribuição das dimensões é normal. Uma amostra de 40 peças forneceu uma dimensão média
igual a 10,09 cm. Há interesse em testar se a média populacional é maior que 10 cm, ao nível de
5% de significância.
92

𝜎 = 0,8 𝑐𝑚
𝑛 = 40
𝑋̅ = 10,09 𝑐𝑚

As hipóteses estatísticas são:


𝐻0 : 𝜇 = 10
𝐻1 : 𝜇 > 10

A estatística de teste é calculada por:

𝑋̅ − 𝜇0 10,09 − 10
𝑍= 𝜎 = = 0,71
0,8
√𝑛 √40

Conclusão: O valor de Z calculado é 0,71 e o tabelado 𝑍0,05 = 1,64 . Portanto, não se rejeita 𝐻0 ,
logo, a média populacional não é maior que 10 cm.

2) Uma população normalmente distribuída tem desvio padrão conhecido, sendo igual a 5 mm.
Uma amostra de 20 elementos, obtida dessa população, tem média igual a 46 mm. Pode-se
afirmar que a média dessa população é superior a 43 mm, ao nível de significância de 1%?

𝜎 = 5𝑚𝑚

𝑛 = 20
𝑋̅ = 46 𝑚𝑚

As hipóteses estatísticas são:


𝐻0 : 𝜇 = 43
𝐻1 : 𝜇 > 43

A estatística de teste é calculada por:

𝑋̅ − 𝜇0 46 − 43
𝑍= 𝜎 = = 2,68
5
√𝑛 √20

Conclusão: O valor de Z calculado é 2,68 e o tabelado 𝑍0,01 = 2,33. Portanto, rejeita-se 𝐻0 , logo,
a média populacional é maior que 43 mm.

P-VALOR OU VALOR-P

O método de construção do teste de hipóteses descrito, parte da fixação do nível de


significância 𝛼. Outra maneira de proceder, consiste em apresentar a probabilidade de significância
ou p-valor ou valor-p.
O p-valor, também denominado nível descritivo ou probabilidade de significância do
teste, é a probabilidade de a estatística do teste apresentar um resultado igual ou mais extremo
em relação ao valor observado na amostra, supondo a hipótese 𝐻0 como verdadeira.
93

É possível interpretar o p-valor como o menor valor do nível de significância para o qual
rejeita-se 𝐻0 . Desta forma, se o nível de significância (𝛼) proposto para o teste for menor que o p-
valor não rejeita a hipótese 𝐻0 .

Exemplo:

A tensão de ruptura dos cabos produzidos por um fabricante apresenta média de 1800 kg e desvio
padrão de 100 kg. Mediante nova técnica no processo de fabricação, proclama-se que a tensão de
ruptura pode ter aumentado. Para testar esta declaração, ensaiou-se uma amostra de 50 cabos,
tendo-se determinado a tensão média de ruptura de 1850 kg. Pode-se confirmar a declaração ao
nível de significância de 0,01?
𝐻0 : 𝜇 = 1800 (não houve modificação da tensão de ruptura)

𝐻1 : 𝜇 > 1800 (houve modificação da tensão de ruptura)


𝑛 = 50 𝜎 = 100 𝑋̅ = 1850

1850 − 1800
𝑍= = 3,54
100
√50
𝑣𝑎𝑙𝑜𝑟 − 𝑝 = 𝑃(𝑍 > 3,54) = 1 − 0,9998 = 0,0002
Conclusão: Como valor-p é menor do que o nível de significância 𝛼 = 0,01, não há evidências de
que a tensão média de ruptura é igual a 1800 kg e confirma-se a declaração.

PODER DO TESTE ESTATÍSTICO

Erro tipo II: 𝛽 = 𝑃(𝑎𝑐𝑒𝑖𝑡𝑎𝑟 𝐻0 | 𝐻0 𝑓𝑎𝑙𝑠𝑎)

Poder do teste (1-𝛽): probabilidade de o teste rejeitar 𝐻𝑜 , quando 𝐻𝑜 é realmente falsa.

Vamos considerar a situação a seguir, para calcular o erro tipo II e poder do teste.

Desejamos testar 𝐻𝑜 : 𝜇 = 20 contra 𝐻1 : 𝜇 > 20. Sabemos que a variância da população é igual a
16 e foi retirada uma amostra de 16 elementos. Calcular o erro tipo II e poder do teste considerando
os valores 20,50; 21,00; 21,64 e 22,00, para a verdadeira média (retirado de: MARTINS e
DOMINGUES, 2019)
𝜎 2 = 16
𝑛 = 16
𝐻0 : 𝜇 = 20
𝐻1 : 𝜇 > 20
Qual é o valor de 𝑋̅𝑐 ?

𝑋̅𝑐 − 𝜇0
𝑍= 𝜎
√𝑛
𝜎
𝑋̅𝑐 = 𝑍 × + 𝜇0
√𝑛
94

Admitindo 𝛼 = 0,05 tem-se:


4
𝑋̅𝑐 = 1,645 × + 20 = 21,64
√16

𝑋̅ ≤ 21,645 (região de não rejeição de 𝐻0 )

Calcular o erro tipo II (𝛽 ) e poder do teste (1-𝛽), se a verdadeira média for: 20,50; 21,00; 21,64 e
22,00.
Considerando 𝜇 𝑟𝑒𝑎𝑙 = 20,50:

21,64 − 20,50 1,14


𝑍𝛽 = = = 1,14
4 1
√16

𝛽 = 𝑃(𝑎𝑐𝑒𝑖𝑡𝑎𝑟 𝐻0 | 𝜇 = 𝜇𝑜 = 20,50) = 𝑃(𝑍 ≤ 1,14) = 0,8729

1 − 𝛽 = 1,0000 − 0,8729 = 0,1271

Considerando 𝜇 𝑟𝑒𝑎𝑙 = 21,00:

21,64 − 21,00 0,64


𝑍𝛽 = = = 0,64
4 1
√16

𝛽 = 𝑃(𝑎𝑐𝑒𝑖𝑡𝑎𝑟 𝐻0 | 𝜇 = 𝜇𝑜 = 21,00) = 𝑃(𝑍 ≤ 0,64) = 0,7389

1 − 𝛽 = 1,0000 − 0,7389 = 0,2611

Considerado 𝜇 𝑟𝑒𝑎𝑙 = 21,64:

21,64 − 21,64 0,00


𝑍𝛽 = = = 0,00
4 1
√16

𝛽 = 𝑃(𝑎𝑐𝑒𝑖𝑡𝑎𝑟 𝐻0 | 𝜇 = 𝜇𝑜 = 21,64) = 𝑃(𝑍 ≤ 0,00) = 0,5000

1 − 𝛽 = 1,0000 − 0,5000 = 0,5000

Considerando 𝜇 𝑟𝑒𝑎𝑙 = 22,00:


21,64 − 22,00 −0,36
𝑍𝛽 = = = −0,36
4 1
√16
𝛽 = 𝑃(𝑎𝑐𝑒𝑖𝑡𝑎𝑟 𝐻0 | 𝜇 = 𝜇𝑜 = 22,00) = 𝑃(𝑍 ≤ −0,36) = 0,3594
1 − 𝛽 = 1,0000 − 0,3594 = 0,6406
O gráfico a seguir é a curva característica de operação (CCO), mostrando o valor de 𝛽 para
diferentes tamanhos de amostra, considerando diferentes valores para a verdadeira média 𝜇.
95

O poder do teste, 1 − 𝛽, para diferentes tamanhos de amostra, considerando diferentes


valores para a verdadeira média 𝜇.

7.2.1.2 Quando a variância populacional 𝜎 2 é desconhecida


Deve-se seguir as etapas já apresentadas anteriormente para fazer o teste.

Para amostras pequenas (𝑛 < 30), a população de onde a amostra foi retirada deve ser
normalmente distribuída. Se 𝜎 2 é desconhecida, a estatística de teste é calculada por:

𝑋̅ − 𝜇0
𝑡=
𝑆⁄√𝑛

sendo a distribuição t de Student com n-1 graus de liberdade.


onde:
𝑋̅ é a média amostral;
𝜇0 é o valor a ser testado;
𝑆 é o desvio padrão amostral;
𝑛 é o tamanho da amostra.
96

As áreas de rejeição e aceitação de 𝐻0 devem ser definidas de acordo com o valor crítico
de t, que deve ser obtido em uma tabela da distribuição t de Student, para nível de significância 𝛼
e n-1 graus de liberdade. Deve-se rejeitar 𝐻0 se o valor de t amostral situar na região de rejeição
ou não rejeitar 𝐻0 , se situar-se na região de aceitação.

Exemplos de aplicação

1) Uma amostra de 20 peças, retirada de uma população normalmente distribuída, apresenta


diâmetro médio igual a 10,80 cm e desvio padrão igual a 0,9 cm. Pode-se afirmar que o diâmetro
médio da população é superior a 10 cm, ao nível de significância de 1%?

Solução:

𝑋̅ = 10,8

𝑆 = 0,9

𝑛 = 20
𝛼 = 0,05
𝜐 = 𝑛 − 1 = 20 − 1 = 19 graus de liberdade e 𝑡0,01; 19 𝑔.𝑙. = 2,54

As hipóteses estatísticas são:


𝐻0 : 𝜇 = 10
𝐻1 : 𝜇 > 10

A estatística de teste é calculada por:

𝑋̅ − 𝜇0 10,8 − 10
𝑡= = = 3,98
𝑆⁄√𝑛 0,9
√20
Conclusão: O valor de t calculado é 3,98 e o tabelado 𝑡0,01; 19 𝑔.𝑙. = 2,54. Portanto, rejeita-se 𝐻0 ,
logo, a média populacional é maior do que 10 cm.

2) Um fabricante afirma que a tensão média de ruptura dos cabos produzidos por sua companhia
não é inferior a 500 kgf. Uma amostra de 7 cabos foi ensaiada, obtendo-se os resultados (em Kgf):
𝑋̅ = 485,14 e 𝑆 = 7,77. Sabendo-se que a tensão de ruptura é normalmente distribuída, testar a
hipótese de que a média populacional é menor que 500 kgf, utilizando o nível de significância de
5%.
𝑋̅ = 485,14
𝑆 = 7,77
𝑛=7
𝛼 = 0,05
𝜐 = 𝑛 − 1 = 7 − 1 = 6 graus de liberdade e 𝑡0,05; 6 𝑔.𝑙. = −1,943
As hipóteses estatísticas são:

𝐻0 : 𝜇 = 500
𝐻1 : 𝜇 < 500
97

A estatística de teste é calculada por:

𝑋̅ − 𝜇0 485,14 − 500
𝑡= = = −5,06
𝑆⁄√𝑛 7,77
√7
Conclusão: O valor de t calculado é -5,06 e o tabelado 𝑡0,05; 6 𝑔.𝑙. = −1,943. Portanto, rejeita-se
𝐻0 , logo, a média populacional é menor que 500 kgf.

7.2.2 Teste para a Proporção Populacional

Estabelecido o nível de significância  , o valor de Z crítico para este nível de significância


será obtido em uma tabela da variável normal padronizada e assim, definida a região de rejeição
de 𝐻0 . Deve-se rejeitar 𝐻0 se o valor de Z calculado situar-se na região de rejeição ou não rejeitar
(aceitar) 𝐻0 se situar-se na região de aceitação.
As hipóteses estatísticas a serem testadas são:
𝐻0 : 𝑝 = 𝑝0
𝑝 < 𝑝0 (𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑎)
𝐻1 : { 𝑝 > 𝑝0 (𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑑𝑖𝑟𝑒𝑖𝑡𝑎)
𝑝 ≠ 𝑝0 (𝑇𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙)

Os critérios a serem obedecidos é que 𝑛𝑝 ≥ 5 e 𝑛(1 − 𝑝) ≥ 5, exigindo assim que a


amostra seja grande. Para amostras suficientemente grandes (na prática, 𝑛 ≥ 30), a estatística de
teste é dada por:
𝑝̂ − 𝑝0
𝑍=
√𝑝0 × (1 − 𝑝0 )
𝑛
onde:

𝑝̂ é a proporção amostral;
𝑝0 é o valor a ser testado;
𝑛 é o tamanho da amostra.

Exemplos de aplicação
1) Um fabricante afirma que no máximo 3% das peças produzidas por sua indústria são
defeituosas. Um comerciante comprou 100 peças e verificou que 8 eram defeituosas. Testar a
hipótese de que a proporção de peças defeituosas é superior a 3%, utilizando nível de significância
de 5%.
𝑛 = 100
8
𝑝̂ = = 0,08
100
𝛼 = 0,05

As hipóteses estatísticas são:

𝐻0 : 𝑝 = 0,03
𝐻1 : 𝑝 > 0,03
98

A estatística de teste é dada por:


𝑝̂ − 𝑝0 0,08 − 0,03
𝑍= = = 2,93
√𝑝0 × (1 − 𝑝0 ) √0,03 × (1 − 0,03)
𝑛 100
𝑍0,05 = 1,645 (teste unilateral)

Conclusão: O valor de Z calculado é maior que o Z tabelado, portanto, rejeita-se a hipótese 𝐻0 de


que a proporção de defeituosos é igual a 3%. Logo, a proporção de defeituosos é maior que 3%.

2) Deseja-se determinar se um certo tipo de tratamento para evitar a corrosão é eficiente. O


tratamento é considerado eficiente se mais de 95% dos tubos apresentarem resultado satisfatório.
Em uma amostra de 200 tubos, observou-se que 192 apresentaram resultados satisfatórios. Qual
a conclusão, ao nível de significância de 1%?

Solução:

𝑛 = 200
192
𝑝̂ = = 0,96
200
𝛼 = 0,01 , portanto, 𝑍0,01 = 2,33

As hipóteses estatísticas são:


𝐻0 : 𝑝 = 0,95

𝐻1 : 𝑝 > 0,95

A estatística de teste é dada por:


𝑝̂ − 𝑝0 0,96 − 0,95
𝑍= = = 0,65
√𝑝0 × (1 − 𝑝0 ) √0,95 × (1 − 0,95)
𝑛 200

Conclusão: O valor de Z calculado é menor que Z tabelado, portanto, não se rejeita a hipótese
𝐻0 , logo, a proporção de tubos que apresentam resultado satisfatório não é maior que 95%.

7.2.3 Teste para a Diferença entre Duas Médias Populacionais

7.2.3.1 Quando as variâncias populacionais 𝜎12 e 𝜎22 são Conhecidas

A aplicação do teste requer as seguintes suposições:


1. As duas populações devem ser independentes;
2. Ambas as populações devem ser normais.

As hipóteses estatísticas são:


𝐻0 : 𝜇1 − 𝜇2 = 𝑑0
𝜇1 − 𝜇2 < 𝑑0 (𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑎)
𝐻1 : { 𝜇1 − 𝜇2 > 𝑑0 (𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑑𝑖𝑟𝑒𝑖𝑡𝑎)
𝜇1 − 𝜇2 ≠ 𝑑0 (𝑇𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙)
99

A estatística de teste é dada por:

(𝑋̅1 − 𝑋̅2 ) − 𝑑0
𝑍=
𝜎2 𝜎2
√ 1 + 2
𝑛1 𝑛2

onde:

𝑋̅1 é a média da amostra 1;


𝑋̅2 é a média da amostra 2;
𝜎12 é a variância da população 1;
𝜎22 é a variância da população 2;
𝑛1 é o tamanho da amostra 1;
𝑛2 é o tamanho da amostra 2.

Estabelecido o nível de significância 𝛼, o valor de Z crítico para este nível de significância


será obtido em uma tabela da variável normal padronizada e assim, definida a região de rejeição
de 𝐻0 . Deve-se rejeitar 𝐻0 se o valor de Z calculado situar-se na região de rejeição ou não rejeitar
𝐻0 , se situar na região de aceitação.

Exemplos de aplicação

1) Duas amostras de tubos de aço das marcas A e B foram analisadas e obtidas as resistências
médias, respectivamente de 40 kgf/mm2 e 35 kgf/ mm2. Conhecendo-se os desvios padrão
populacionais das resistências, de 4 kgf/ mm2 e 6 kgf/ mm2 , respectivamente, e tamanhos de
amostras iguais a 30, qual a conclusão a respeito das diferenças entre as médias, ao nível de
significância de 5%?
𝑋̅1 = 40; 𝜎1 = 4, 𝑛1 = 30
𝑋̅2 = 35; 𝜎2 = 6, 𝑛2 = 30
𝛼 = 0,05

As hipóteses estatísticas são:

𝐻0 : 𝜇1 − 𝜇2 = 0
𝐻1 : 𝜇1 − 𝜇2 ≠ 0

A estatística de teste é dada por:

(𝑋̅1 − 𝑋̅2 ) − 𝑑0 40 − 35
𝑍= = = 3,80
2 2
𝜎2 𝜎22 √4 + 6
√ 1 + 30 30
𝑛1 𝑛2

𝑍𝛼⁄2 = 1,96 (teste bilateral)

Conclusão: O valor de Z calculado é igual a 3,80 e valor tabelado é 1,96, portanto, rejeita-se
𝐻0 . Logo, as resistências médias das marcas A e B são diferentes.
100

2) Uma amostra de 100 válvulas da Indústria A apresentou vida média 𝑋̅𝐴 = 1.530 ℎ, sendo
𝜎𝐴 = 100 ℎ. Uma outra amostra de 70 válvulas da Indústria B, apresentou vida média 𝑋̅𝐵 = 1.450 ℎ,
sendo 𝜎𝐵 = 90 ℎ. Testar a hipótese de que as válvulas da indústria A em relação a B tem duração
média superior a 100 h. Utilizar nível de significância de 1%.
𝑋̅𝐴 = 1.530 ℎ ; 𝜎𝐴 = 100 ℎ ; 𝑛𝐴 = 100
𝑋̅𝐵 = 1.450 ℎ ; 𝜎𝐵 = 90 ℎ ; 𝑛𝐵 = 70
𝛼 = 0,01

As hipóteses estatísticas são:


𝐻0 : 𝜇𝐴 − 𝜇𝐵 = 100
𝐻1 : 𝜇𝐴 − 𝜇𝐵 > 100

A estatística de teste é dada por:

(𝑋̅𝐴 − 𝑋̅𝐵 ) − 𝑑0 (1.530 − 1.450) − 100


𝑍= = = −1,36
2 2
𝜎2 𝜎𝐵2 √100 + 90
√ 𝐴 + 100 70
𝑛𝐴 𝑛𝐵

𝑍0,01 = 2,33

Conclusão: Como o valor de Z calculado é igual a -1,36 e o valor tabelado é 2,33, não se rejeita
𝐻0 . Logo, a diferença entre as durações médias das válvulas da indústria A e B não é maior que
100 horas.

7.2.3.2 Quando as variâncias populacionais 𝜎12 e 𝜎22 são Desconhecidas

A aplicação do teste requer as seguintes suposições quando 𝜎12 e 𝜎22 são Desconhecidas:
1. As populações devem ser normalmente distribuídas;
2. Os tamanhos de amostras devem ser pequenos (não exceder 30)

a) Quando as Variâncias Populacionais 𝜎12 e 𝜎22 são Desconhecidas e Supostamente Iguais

As hipóteses estatísticas são:


𝐻0 : 𝜇1 − 𝜇2 = 𝑑0
𝜇1 − 𝜇2 < 𝑑0 (𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑎)
𝐻1 : { 𝜇1 − 𝜇2 > 𝑑0 (𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑑𝑖𝑟𝑒𝑖𝑡𝑎)
𝜇1 − 𝜇2 ≠ 𝑑0 (𝑇𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙)

A estatística de teste é dada por:

(𝑋̅1 − 𝑋̅2 ) − 𝑑0
𝑡=
1 1
√𝑆𝑝2 ( + )
𝑛1 𝑛2

Sendo:
101

(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22


𝑆𝑝2 =
𝑛1 + 𝑛2 − 2
Onde tem-se que:

𝑋̅1 é a média da amostra 1;


𝑋̅2 é a média da amostra 2;
𝑆12 é a variância da amostra 1;
𝑆22 é a variância da amostra 2;
𝑛1 é o tamanho da amostra 1;
𝑛2 é o tamanho da amostra 2.
A determinação da região crítica será com base no valor de t tabelado com 𝜐 = 𝑛1 + 𝑛2 − 2
graus de liberdade e nível de significância 𝛼. Deve-se rejeitar 𝐻𝑜 se o valor de t calculado situar na
região de rejeição ou não rejeitar 𝐻𝑜 , se situar na região de aceitação.

Exemplo de aplicação:

Dois tipos de soluções químicas foram ensaiados para se determinar os pH. Os resultados obtidos
foram:
𝑋̅1 = 7,516; 𝑆12 = 0,033 ; 𝑛1 = 5
𝑋̅2 = 7,505; 𝑆22 = 0,011 ; 𝑛2 = 6

Testar a hipótese de que não existe diferença entre os pH médios das duas populações,
supondo que os desvios padrão populacionais são iguais. Usar 𝛼 = 0,05.
𝛼 = 0,05

As hipóteses estatísticas são:


𝐻0 : 𝜇1 − 𝜇2 = 0
𝐻1 : 𝜇1 − 𝜇2 ≠ 0

A estatística de teste é dada por:


(𝑋̅1 − 𝑋̅2 ) − 𝑑0
𝑡=
1 1
√𝑆𝑝2 ( + )
𝑛1 𝑛2

Sendo:
(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
𝑆𝑝2 =
𝑛1 + 𝑛2 − 2

(5 − 1)0,033 + (6 − 1)0,011
𝑆𝑝2 = = 0,021
5+6−2
(7,516 − 7,505) − 0
𝑡= = 0,13
√0,021 (1 + 1)
5 6

O número de graus de liberdade é dado por: 𝜐 = 𝑛1 + 𝑛2 − 2 = 5 + 6 − 2 = 9. Portanto, o


valor de 𝑡𝛼⁄2 com 𝜐 = 9 graus de liberdade é 2,26.
102

Conclusão: O valor de t calculado é igual 0,13, menor que o valor tabelado, logo, não se rejeita
𝐻𝑜 . Conclui-se, portanto, que os pH médios das duas populações (soluções) não são diferentes,
para nível de significância de 5%.

b) Quando as Variâncias Populacionais 𝝈𝟐𝟏 e 𝝈𝟐𝟐 são Desconhecidas e Supostamente


Diferentes

As hipóteses a serem testadas são:


𝐻0 : 𝜇1 − 𝜇2 = 𝑑0
𝜇1 − 𝜇2 < 𝑑0 (𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑎)
𝐻1 : { 𝜇1 − 𝜇2 > 𝑑0 (𝑇𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑑𝑖𝑟𝑒𝑖𝑡𝑎)
𝜇1 − 𝜇2 ≠ 𝑑0 (𝑇𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙)

A estatística de teste é dada por:

(𝑋̅1 − 𝑋̅2 ) − 𝑑0
𝑡=
𝑆2 𝑆2
√ 1+ 2
𝑛1 𝑛2

A determinação da região crítica será com base no valor de t tabelado com graus de
liberdade dado pela expressão abaixo e nível de significância 𝛼.

(𝑤1 + 𝑤2 )2
𝜐=
𝑤12 𝑤22
+
𝑛1 − 1 𝑛2 − 1

Sendo:
𝑆12
𝑤1 =
𝑛1

𝑆22
𝑤2 =
𝑛2

Tem-se que:

𝑋̅1 é a média da amostra 1;


𝑋̅2 é a média da amostra 2;
𝑆12 é a variância da amostra 1;

𝑆22 é a variância da amostra 2;


𝑛1 é o tamanho da amostra 1;
𝑛2 é o tamanho da amostra 2.

Deve-se rejeitar 𝐻0 se o valor de t calculado situar na região de rejeição ou não rejeitar 𝐻0


se situar-se na região de aceitação.
103

Exemplo de aplicação

Uma mesma distância foi medida 5 vezes por dois instrumentos (em metros):

Instrumento 1: 𝑋̅1 = 100,46; 𝑆12 = 0,473 ; 𝑛1 = 5


Instrumento 2: 𝑋̅2 = 100,40; 𝑆22 = 0,01 ; 𝑛2 = 5
Testar a hipótese de que não existe diferença entre os resultados obtidos pelos dois instrumentos.
Utilizar o nível de significância de 5%.

As hipóteses estatísticas são:


𝐻0 : 𝜇1 − 𝜇2 = 0
𝐻1 : 𝜇1 − 𝜇2 ≠ 0

A estatística de teste é dada por:


(𝑋̅1 − 𝑋̅2 ) − 𝑑0 (100,46 − 100,40) − 0
𝑡= = = 0,19
𝑆2 𝑆2 √0,473 + 0,01
√ 1 + 𝑛2 5 5
𝑛1 2

Cálculo de 𝜐 (graus de liberdade):

(𝑤1 + 𝑤2 )2
𝜐=
𝑤12 𝑤22
+
𝑛1 − 1 𝑛2 − 1
Sendo:
𝑆12 0,473
𝑤1 = = = 0,0946
𝑛1 5

𝑆22 0,01
𝑤2 = = = 0,002
𝑛2 5
(0,0946 + 0,002)2
𝜐= = 4,16 ≅ 4
0,09462 0,0022
+
4 4

Conclusão: O valor de 𝑡𝛼⁄2 com 𝜐 = 4 graus de liberdade é 2,78, logo, não se rejeita 𝐻0 , logo,
as médias não são diferentes.

7.2.4 Teste para Igualdade de Duas Variâncias Populacionais

Para aplicar o teste para variâncias é necessário que as populações de onde foram
extraídas as amostras, sejam normalmente distribuídas.
As hipóteses estatísticas são:

𝐻0 : 𝜎12 = 𝜎22

𝜎12 < 𝜎22 (𝑡𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑎)


𝐻1 : { 𝜎12 > 𝜎22 (𝑡𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑑𝑖𝑟𝑒𝑖𝑡𝑎)
𝜎12 ≠ 𝜎22 (𝑡𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙)
104

A estatística de teste é calculada por:

𝑆12
𝐹=
𝑆22
onde:
𝑆12 é a variância da amostra 1;
𝑆22 é a variância da amostra 2;
𝑛1 é o tamanho da amostra 1;
𝑛2 é o tamanho da amostra 2.

O valor crítico de F é obtido a partir da tabela da distribuição F, para o nível de significância


𝛼 e 𝜐1 = 𝑛1 − 1 graus de liberdade no numerador e 𝜐2 = 𝑛2 − 1 graus de liberdade no
denominador.

𝐹(1−𝛼⁄2); 𝜐1 ; 𝜐2 𝐹𝛼⁄2; 𝜐1 ; 𝜐2

Rejeita-se a hipótese 𝐻0 se o valor de F calculado situar-se na região de rejeição ou não


se rejeita 𝐻0 , se situar-se na região de aceitação.

Exemplos de aplicação:

Exemplo 1: Foram testadas as durabilidades (em km) dos pneus das marcas A e B, obtendo-se
para 5 pneus de cada marca os seguintes resultados:
Marca A: 30.000 32.000 28.000 26.000 31.000
Marca B: 25.000 30.000 20.000 21.000 23.000

Existe diferença significativa entre as variâncias das durabilidades dos dois pneus, ao nível
de 5% de significância?
Solução:

As hipóteses estatísticas são:

𝐻0 : 𝜎12 = 𝜎22

𝐻1 : 𝜎12 ≠ 𝜎22
105

A estatística de teste é calculada por:

𝑆12
𝐹=
𝑆22
Deve-se, portanto, calcular inicialmente os desvios padrão amostrais:

𝑆12 = 5.800.000 𝑛1 = 5 𝜐1 = 𝑛1 − 1 = 4

𝑆22 = 15.700.000 𝑛2 = 5 𝜐2 = 𝑛2 − 1 = 4
𝑆12 5.800.000
𝐹= = = 0,37
𝑆22 15.700.000

A área de rejeição está representada no gráfico:

A.A.
.
A.R.
A.R.

0,16 6,39
0,10 9,60 F

𝐹𝛼⁄2; 𝜐1; 𝜐2 = 𝐹0,025; 4;4 = 9,60


1 1
𝐹(1−𝛼⁄2); 𝜐1 ; 𝜐2 = = = 0,10
𝐹𝛼⁄2; 𝜐2 ; 𝜐1 9,60

Conclusão: Não se rejeita a hipótese 𝐻𝑜 , logo, as variâncias das durabilidades dos dois pneus não
são diferentes, para nível de significância de 5%.

Exemplo 2: Foram ensaiadas válvulas das marcas A e B, e verificou-se que os tempos de vida (em
horas) foram:

Marca A: 1.500 1.450 1.480 1.520 1.510


Marca B: 1.000 1.300 1.180 1.250

Testar a hipótese de igualdade para as variâncias do tempo de vida das válvulas de marcas A e B,
ao nível de significância de 5%.

Solução:

As hipóteses estatísticas são:


𝐻0 : 𝜎𝐴2 = 𝜎𝐵2
𝐻1 : 𝜎𝐴2 ≠ 𝜎𝐵2
106

A estatística de teste é calculada por:


𝑆𝐴2
𝐹=
𝑆𝐵2
Deve-se, portanto, calcular inicialmente os desvios padrão amostrais:

𝑆𝐴2 = 770 𝑛𝐴 = 5 𝜐𝐴 = 𝑛𝐴 − 1 = 4

𝑆𝐵2 = 17.225 𝑛𝐵 = 4 𝜐𝐵 = 𝑛𝐵 − 1 = 3

𝑆𝐴2 770
𝐹= 2 = 17.225 = 0,04
𝑆𝐵

A região de rejeição está representada no gráfico:

A.A.
.
A.R.
A.R.

0,16 6,39
0,10
0,11 15,10
6,59 F

𝐹𝛼⁄2; 𝜐𝐴; 𝜐𝐵 = 𝐹0,025; 4;3 = 15,10


1 1 1
𝐹(1−𝛼⁄2); 𝜐𝐴 ; 𝜐𝐵 = = = = 0,10
𝐹𝛼⁄2; 𝜐𝐵; 𝜐𝐴 𝐹𝛼⁄2; 3; 4 9,98

Conclusão: Rejeita-se H 0 , logo, as variâncias do tempo de vida das válvulas de marcas A e B são
diferentes, para nível de significância de 5%.

LISTA DE EXERCÍCIOS 07

1. Sabe-se que os diâmetros internos de rolamentos usados no trem de pouso de aviões têm desvio
padrão  = 0,009 cm e normalmente distribuídos. Uma amostra aleatória de 15 rolamentos acusa
um diâmetro interno médio de 8,2535 cm. Testar a hipótese de que o diâmetro interno médio do
rolamento é maior que 8,25 cm. Usar 𝛼 = 0,05.

2. Deseja-se testar a hipótese de que o diâmetro médio da haste de liga de alumínio, produzidas
em uma máquina de calibragem, é diferente de 0,5025 in. Uma amostra de 25 hastes apresentou
um diâmetro médio de 0,5046 in e desvio padrão de 0,01 in. Utilizar 𝛼 = 0,05 e supor distribuição
normal.
3. A força média de resistência de uma fibra sintética é uma característica de qualidade de
interesse do fabricante, que deseja testar a hipótese de que a força média é maior que 50 psi,
usando 𝛼 = 0,05. O desvio padrão populacional da força de resistência é desconhecido. Uma
107

amostra de 16 exemplares de fibra é selecionada e são obtidos os seguintes resultados: 𝑋̅ = 50,86


e 𝑆 = 1,66. Sabe-se que a distribuição da força de resistência é normal.

4. Uma fundição produz cabos de aço usados na indústria automotiva. Deseja-se testar a hipótese
de que a fração de itens não-conformes é menor que 10%. Em uma amostra aleatória de 250
cabos, detectou-se que 24 estavam fora das especificações. Usar 𝛼 = 0,05.

5. Em uma amostra aleatória de 80 mancais para virabrequins de automóveis, 15 apresentam o


acabamento de superfície mais áspero do que as especificações permitem. Testar a hipótese de
que a fração de não-conformes é diferente de 0,19, utilizando nível de significância de 2%.
6. Uma amostra aleatória de 500 pinos de hastes de conexão contém 65 unidades não-conformes.
Testar a hipótese de que a verdadeira fração de defeituosos nesse processo é maior que 0,08.
Usar 𝛼 = 0,01.

7. Dois catalisadores estão sendo testados para determinar como afetam o rendimento médio de
um processo químico. Especificamente, o catalisador 1 está sendo usado atualmente, mas o
catalisador 2 é aceitável. Como o catalisador 2 é mais barato, ele poderia ser adotado, desde que
não alterasse o rendimento do processo. Um teste é realizado em uma fábrica piloto e os resultados
são apresentados abaixo. Existe alguma diferença entre os rendimentos médios? Usar 𝛼 = 0,05 e
supor que as populações são normais e as variâncias iguais.
Dados: 𝑋̅1 = 92,26; 𝑆1 = 1,39; 𝑛1 = 8 ; 𝑋̅2 = 92,68; 𝑆2 = 1,28; 𝑛2 = 8

8. Considerar o exercício anterior supondo que as variâncias populacionais não são iguais.

9. Uma pesquisa apresenta os resultados de uma análise do peso do cálcio no cimento padrão e
no cimento misturado com chumbo. Níveis reduzidos de cálcio são uma indicação de que o
mecanismo de hidratação no cimento está bloqueado, o que permitirá a água atacar vários locais
da estrutura de cimento. Dez unidades do cimento padrão acusaram um peso médio de cálcio de
𝑋̅1 = 90,0, com desvio padrão 𝑆1 = 5,0 e 15 unidades do cimento misturado com chumbo
apresentaram um peso médio de cálcio de 𝑋̅2 = 87,0, com desvio padrão de 𝑆2 = 4,0. Testar a
hipótese de que 𝜇1 − 𝜇2 é maior que zero, utilizando 𝛼 = 0,01 e supondo que ambas as populações
são normalmente distribuídas e têm o mesmo desvio padrão.
10. Dois técnicos de controle de qualidade mediram o acabamento da superfície de uma parte de
metal, cujos dados estão apresentados abaixo. Suponha que as medidas sejam normalmente
distribuídas. Testar a hipótese de que as medidas médias do acabamento da superfície obtidas
pelos dois técnicos são iguais. Usar 𝛼 = 0,01 e supor variâncias iguais.
Dados: 𝑋̅1 = 1,39; 𝑆1 = 0,11; 𝑛1 = 7 ; 𝑋̅2 = 1,18; 𝑆2 = 0,12; 𝑛2 = 8
108

8 ANÁLISE DA VARIÂNCIA

Introdução

O objetivo da análise da variância, conhecida como ANOVA, é comparar k médias


populacionais, sendo 𝑘 > 2, com base nas amostras provenientes de 𝑘 populações distintas. A
estatística utilizada é a estatística F.
A análise da variância é um teste para igualdade de médias que utiliza variâncias para a
tomada de decisões.

8.1 FUNDAMENTOS DA ANOVA

Supondo que se deseja testar a hipótese de igualdade de k ( 𝑘 > 2) médias populacionais,


isto é:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 = 𝜇

contra a hipótese alternativa de que, pelo menos uma dessas médias seja diferente das demais,
ou seja:
𝐻1 : pelo menos uma média 𝜇𝑗 ≠ 𝜇

Na aplicação deste método, supõe-se que as populações são normalmente distribuídas e


as variâncias populacionais iguais (homocedasticidade), ou seja:

𝜎12 = 𝜎22 = ⋯ = 𝜎𝑘2 = 𝜎 2

Sejam as k amostras extraídas das populações. A partir dessas amostras, é possível


estimar a variância 𝜎 2 de três maneiras, conforme apresentados a seguir.

POPULAÇÃO 1 POPULAÇÃO 2 POPULAÇÃO k


1 2 K
 2
 2
 2

AMOSTRA k
AMOSTRA 1 AMOSTRA 2
n1 n2  nk

1) Variância Total (𝑺𝟐𝒕 )


Consiste em estimar a variância 𝜎 2 considerando todas as k amostras reunidas em uma
única amostra, o que é possível em função da suposição de que as variâncias populacionais são
todas iguais a 𝜎 2 .
109

Essa variância é estimada através de:


𝑛
∑𝑘𝑗=1 ∑𝑖=1
𝑗
(𝑥𝑖𝑗 − 𝑋̅)2
𝑆𝑡2 =
𝑁−1

Onde:

𝑗 é o número de amostras, 𝑗 = 1,2, … , 𝑘;


𝑖 é o número de elementos de cada amostra, 𝑖 = 1,2, … , 𝑛𝑗 ;
𝑥𝑖𝑗 é o i-ésimo elemento da j-ésima amostra;
𝑁 = ∑𝑘𝑗=1 𝑛𝑗 é o número total de elementos.

𝑛
∑𝑘𝑗=1 ∑𝑖=1
𝑗
𝑥𝑖𝑗
𝑋̅ = é a média de todas as amostras.
𝑁

O numerador é denominado de Soma de Quadrados Total (SQT), então tem-se:


𝑘 𝑛𝑗

𝑆𝑄𝑇 = ∑ ∑(𝑥𝑖𝑗 − 𝑋̅)2


𝑗=1 𝑖=1

2) Variância entre Amostras (𝑺𝟐𝒆 )

Sendo verdadeira a hipótese H0 , é possível estimar a variância  , através de:


2

𝑛
∑𝑘𝑗=1 ∑𝑖=1
𝑗
(𝑋̅𝑗 − 𝑋̅)2
𝑆𝑒2 =
𝑘−1

Onde:
𝑛𝑗
∑𝑖=1 𝑥𝑖𝑗
𝑋̅𝑗 = é a média da j-ésima amostra (j=1, 2, ...,k)
𝑛𝑗

𝑛𝑗 é o tamanho de cada amostra.


Esta variância (𝑆𝑒2 ) é também chamada de Quadrado Médio Entre Amostras (QME).
O numerador é denominado de Soma de Quadrados entre Amostras (SQE), então tem-
se:
𝑘 𝑛𝑗

𝑆𝑄𝐸 = ∑ ∑(𝑋̅𝑗 − 𝑋̅)2


𝑗=1 𝑖=1

3) Variância Residual (ou Variância dentro)


Consiste em estimar as variâncias dentro de cada amostra e em seguida estimar um único
valor para 𝜎 2 , por meio da combinação dessas k variâncias. Esta variância (𝑆𝑟2 ) é chamada
também de Quadrado Médio Residual (QMR).
Para uma amostra qualquer j, a estimativa da variância é dada por:

𝑛 2
𝑗
∑𝑖=1(𝑥𝑖𝑗 − 𝑋̅𝑗 )
𝑆𝑗2 =
𝑛𝑗 − 1
110

Combinando as k variâncias, obtém-se a estimativa de 𝜎 2 , dada por:


𝑛
∑𝑘𝑗=1 ∑𝑖=1
𝑗
(𝑥𝑖𝑗 − 𝑋̅𝑗 )2
𝑆𝑟2 =
𝑁−𝑘
Onde:
𝑋̅𝑗 é a média da j-ésima amostra (j=1, 2, ...,k)

O numerador é denominado de Soma de Quadrados Residual (SQR), logo:


𝑘 𝑛𝑗

𝑆𝑄𝑅 = ∑ ∑(𝑥𝑖𝑗 − 𝑋̅𝑗 )2


𝑗=1 𝑖=1

A Soma de Quadrados Residual pode também ser obtida através de:

𝑆𝑄𝑅 = 𝑆𝑄𝑇 − 𝑆𝑄𝐸

8.2 ANÁLISE DA VARIÂNCIA A UM CRITÉRIO DE CLASSIFICAÇÃO

Neste modelo, os elementos observados são classificados segundo um critério, ou seja,


existe apenas uma característica de interesse a ser testada.
As etapas para a realização da ANOVA:

a) Formulação das hipóteses:


𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 = 𝜇
𝐻1 : pelo menos uma média 𝜇𝑗 ≠ 𝜇

b) Fixar o nível de significância 𝛼;


c) Determinar a região de rejeição (R.R.);

R.A.

1−   R.R.

O teste será sempre unilateral. O valor crítico de F será obtido para nível de significância 𝛼
e (𝑘 − 1) e (𝑁 − 𝑘) graus de liberdade, no numerador e denominador, respectivamente.
111

d) Cálculo da estatística F

A estatística F é calculada através de:


𝑆𝑒2
𝐹= 2
𝑆𝑟
e) Quadro da Análise da Variância

QUADRO DA ANÁLISE DA VARIÂNCIA - ANOVA


FONTE DE SOMA DE QUADRADOS
G.L F
VARIAÇÃO QUADRADOS MÉDIOS
𝑆𝑄𝐸
Entre amostras SQE k-1 𝑆𝑒2 = 𝑄𝑀𝐸 = 𝑆𝑒2 𝑄𝑀𝐸
𝑘−1 𝐹= =
𝑆𝑄𝑅 𝑆𝑟2 𝑄𝑀𝑅
Residual SQR N-k 𝑆𝑟2 = 𝑄𝑀𝑅 =
𝑁−𝑘

Total
SQT N-1

f) Conclusão

Se 𝐹 > 𝐹𝛼;(𝑘−1, 𝑁−𝑘) , rejeita-se hipótese 𝐻0 , caso contrário, não se rejeita 𝐻0 .

Exemplos de aplicação:

1) Verificou-se os índices de produção, segundo os postos de trabalho, durante certo período.


Analisar se há diferença nos índices de produção, devido aos postos de trabalho. Usar 𝛼 = 0,05.

POSTOS DE INDICES DE PRODUÇÃO (%)


TRABALHO
A 90,8 100,0 81,1
B 85,5 83,0 73,7
C 65,9 77,1 68,5

a) As hipóteses a serem testadas:


𝐻0 : 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶 = 𝜇
𝐻1 : pelo menos uma média 𝜇𝑗 ≠ 𝜇

b) Cálculo da Soma de Quadrados Total (SQT)


Tem-se que a soma de quadrados total é dada por:
𝑛𝑗
𝑆𝑄𝑇 = ∑𝑘𝑗=1 ∑𝑖=1(𝑥𝑖𝑗 − 𝑋̅)2

Logo, faz-se necessário calcular inicialmente a média do conjunto de todas as amostras


(𝑋̅).
112

POSTOS DE MÉDIAS
INDICES DE PRODUÇÃO (%) (𝑥𝑖𝑗 ) SOMAS
TRABALHO (𝑋̅𝑗 )
A 90,8 100 81,1 271,90 90,63
B 85,5 83 73,7 242,20 80,73
C 65,9 77,1 68,5 211,50 70,50
TOTAL 725,60 80,62

A média do conjunto de todas das amostras é:


𝑛
∑𝑘𝑗=1 ∑𝑖=1
𝑗
𝑥𝑖𝑗 725,6
𝑋̅ = = = 80,62
𝑁 9

Então, tem-se:
𝑆𝑄𝑇 = (90,8 − 80,62)2 + (100,0 − 80,62)2 + ⋯ + (77,1 − 80,62)2 + (68,5 − 80,62)2
𝑆𝑄𝑇 = 932,78

c) Soma de Quadrados entre Amostras (SQE)


𝑛
𝑆𝑄𝐸 = ∑𝑘𝑗=1 ∑𝑖=1
𝑗
(𝑋̅𝑗 − 𝑋̅)2
𝑆𝑄𝐸 = 3 × (90,63 − 80,62)2 + 3 × (80,73 − 80,62)2 + 3 × (70,5 − 80,62)2
𝑆𝑄𝐸 = 607,88

d) Cálculo da Soma de Quadrados Residual (SQR)


𝑆𝑄𝑅 = 𝑆𝑄𝑇 − 𝑆𝑄𝐸
𝑆𝑄𝑅 = 932,78 − 607,88 = 324,90

e) Quadro da ANOVA

QUADRO DA ANÁLISE DA VARIÂNCIA – ANOVA


FONTE DE SOMA DE QUADRADOS MÉDIOS
G.L F
VARIAÇÃO QUADRADOS
607,88
Entre amostras 𝑆𝑄𝐸 = 607,88 2 𝑄𝑀𝐸 = = 303,94
2 𝐹 = 5,61
Dentro da 324,90
𝑆𝑄𝑅 = 324,90
amostra 6 𝑄𝑀𝑅 = = 54,15
(residual) 6
𝑆𝑄𝑇 = 932,78
8
Total

O valor de F tabelado é 𝐹0,05;2;6 = 5,14.


f) Conclusão: Como 𝐹 > 𝐹0,05;2;6 , rejeita-se a hipótese 𝐻0 , logo, pelo menos um índice médio de
produção é diferente.

2) Em uma indústria, quatro operários executam uma mesma operação. Com o objetivo de
identificar se existe diferença entre os tempos gastos para executar a operação mencionada, foram
realizadas as seguintes observações desses tempos (em segundos):
113

Operário 1: 8,1 8,3 8,0 8,1 8,5


Operário 2: 8,4 8,4 8,5 8,3
Operário 3: 8,8 8,7 8,9
Operário 4: 8,3 8,4 8,2 8,2 8,3 8,4
Verificar se a diferença é significativa ao nível de 1% de significância.

Solução:

a) As hipóteses a serem testadas:

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇
𝐻1 : pelo menos uma média 𝜇𝑗 ≠ 𝜇

b) Cálculo da Soma de Quadrados Total (SQT)


Tem-se que a soma de quadrados total é dada por:
𝑛𝑗
𝑆𝑄𝑇 = ∑𝑘𝑗=1 ∑𝑖=1(𝑥𝑖𝑗 − 𝑋̅)2

Logo, faz-se necessário calcular inicialmente a média do conjunto de todas as amostras.


OPERÁ- SOMAS MÉDIAS
RIOS TEMPOS (𝑥𝑖𝑗 )
1 8,1 8,3 8,0 8,1 8,5 41,0 8,2
2 8,4 8,4 8,5 8,3 33,6 8,4
3 8,8 8,7 8,9 26,4 8,8
4 8,3 8,4 8,2 8,2 8,3 8,4 49,8 8,3
150,8 8,4

A média do conjunto de todas as amostras é:


𝑛
∑𝑘𝑗=1 ∑𝑖=1
𝑗
𝑥𝑖𝑗 150,8
𝑋̅ = = = 8,4
𝑁 18
Então, tem-se:

𝑆𝑄𝑇 = (8,1 − 8,4)2 + (8,3 − 8,4)2 + ⋯ + (8,4 − 8,4)2

𝑆𝑄𝑇 = 0,98

c) Soma de Quadrados entre Amostras (SQE)


𝑛
𝑆𝑄𝐸 = ∑𝑘𝑗=1 ∑𝑖=1
𝑗
(𝑋̅𝑗 − 𝑋̅)2
𝑆𝑄𝐸 = 5 × (8,2 − 8,4)2 + 4 × (8,4 − 8,4)2 + 3 × (8,8 − 8,4)2 + 6 × (8,3 − 8,4)2
𝑆𝑄𝐸 = 0,74

d) Cálculo da Soma de Quadrados Residual (SQR)

𝑆𝑄𝑅 = 𝑆𝑄𝑇 − 𝑆𝑄𝐸


𝑆𝑄𝑅 = 0,98 − 0,74
𝑆𝑄𝑅 = 0,24
114

e) Quadro da ANOVA

QUADRO DA ANÁLISE DA VARIÂNCIA – ANOVA


FONTE DE SOMA DE QUADRADOS MÉDIOS
G.L F
VARIAÇÃO QUADRADOS
0,74
Entre amostras 𝑆𝑄𝐸 = 0,74 3 𝑄𝑀𝐸 =
3 𝐹 = 14,39
Dentro da 0,24
𝑆𝑄𝑅 = 0,24
amostra 14 𝑄𝑀𝑅 =
(residual) 14
𝑆𝑄𝑇 = 0,98
17
Total

O valor de F tabelado é 𝐹0,01;3;14 = 5,56.


f) Conclusão: Como 𝐹 > 𝐹0,01;3;14 , rejeita-se a hipótese 𝐻0 , logo, pelo menos um tempo médio
gasto para execução da operação é diferente.

8.3 COMPARAÇÕES MÚLTIPLAS ENTRE MÉDIAS


A análise da variância serve para verificar se existe diferença significativa entre as médias,
porém, se houver diferenças, não é possível saber, através dela, quais as médias diferem entre si.
A identificação de diferenças entre médias, tomando-as duas a duas, deve ser feita usando testes
de comparações múltiplas entre médias.

8.3.1 Teste de Scheffé


O Teste de Scheffé é um teste mais geral, permite usar amostras com dimensões diferentes
e é robusto a violações dos pressupostos de normalidade e de igualdade de variâncias.

Hipóteses:
𝐻0 : 𝜇𝑖 = 𝜇𝑚
𝐻1 : 𝜇𝑖 ≠ 𝜇𝑚

Se |𝑋̅𝑖 − 𝑋̅𝑚 | > ∆𝛼 , rejeita-se a hipótese nula de que 𝐻0 : 𝜇𝑖 = 𝜇𝑚 , sendo que a estatística
∆𝛼 é dada por:

1 1
∆𝛼 = √𝑄𝑀𝑅 × (𝑘 − 1) × ( + ) × 𝐹𝑘−1, 𝑁−𝑘, 𝛼
𝑛𝑖 𝑛𝑚

Exercícios de aplicação
1) Para o exemplo dos índices de produção segundo diferentes postos de trabalho, verificar quais
médias são diferentes, utilizando 𝛼 = 0,05

Os índices médios, segundo diferentes postos de trabalho são:


115

POSTOS DE MÉDIAS
TRABALHO (𝑋̅𝑗 )
A 90,63
B 80,73
C 70,50

𝑘 = 3 (postos de trabalho)
𝑁−𝑘 =9−3=6
𝛼 = 0,05
𝑛 = 3 (tamanho da amostra em cada posto de trabalho)

324,90
𝑄𝑀𝑅 = = 54,15 (do quadro da ANOVA do exemplo de aplicação no. 1)
6
𝐹2;6; 0,05 = 5,14

Considerando os postos de trabalho A e B, tem-se:


𝑛𝐴 = 3

𝑛𝐵 = 3

1 1
∆𝛼 = √𝑄𝑀𝑅 × (𝑘 − 1) × ( + ) × 𝐹𝑘−1, 𝑁−𝑘, 𝛼
𝑛𝑖 𝑛𝑚

1 1
∆0,05 = √54,15 × (3 − 1) × ( + ) × 5,14
3 3

∆0,05 = 19,26

Da mesma forma para A e C e B e C, pois os tamanhos de amostras são iguais a 3.

Portanto, tem-se:

POSTOS DE ∆0,05 DIFERENÇA


DIFERENÇA DE MÉDIAS
TRABALHO SIGNIFICATIVA
AeB |90,63 − 80,73| = 9,90 19,26 Não
AeC |90,63 − 70,50| = 20,13 19,26 Sim
BeC |80,73 − 70,50| = 10,23 19,26 Não

Conclui-se, portanto, que os índices médios de produção dos postos de trabalho A e C são
diferentes, para nível de 5% de significância.

2) Para o exemplo de quatro operários que executam uma mesma operação em uma indústria,
aplicar o método de Scheffé, utilizando 𝛼 = 0,01.
116

Solução:

Os tempos médios gastos para executar determinada operação, segundo operários:

OPERÁ- MÉDIAS
RIOS 𝑛𝐽 (𝑋̅𝑗 )
1 5 8,2
2 4 8,4
3 3 8,8
4 6 8,3

Utilizando o teste de Scheffé:

1 1
∆𝛼 = √𝑄𝑀𝑅 × (𝑘 − 1) × ( + ) × 𝐹𝑘−1, 𝑁−𝑘, 𝛼
𝑛𝑖 𝑛𝑚

𝑘=4 (operários)
𝑁 = 18
𝑁 − 𝑘 = 18 − 4 = 14

𝛼 = 0,01
𝑄𝑀𝑅 = 0,24⁄14 = 0,0171 (do exemplo de aplicação no. 2)

𝐹3;14; 0,01 = 5,56

Considerando os operários 1 e 2, tem-se:


𝑛1 = 5
𝑛2 = 4
Substituindo os valores na expressão do teste de Scheffé:

1 1
∆0,01 = √0,0171 × 3 × ( + ) × 5,56 = 0,36
5 4

As médias dos operários 1 e 2 são: 𝑋̅1 = 8,2 e 𝑋̅2 = 8,4, portanto a diferença é
|𝑋̅1 − 𝑋̅2 | = 0,2 . Tem-se que |𝑋̅1 − 𝑋̅2 | = 0,2 < ∆0,01 = 0,36 , logo não há diferença entre as duas
médias.
Considerando os operários 1 e 3, tem-se:
𝑛1 = 5
𝑛2 = 3

1 1
∆0,01 = √0,0171 × 3 × ( + ) × 5,56 = 0,39
5 3

Considerando os operários 1 e 4, tem-se:


𝑛1 = 5
𝑛2 = 6
117

1 1
∆0,01 = √0,0171 × 3 × ( + ) × 5,56 = 0,32
5 6

Considerando os operários 2 e 3, tem-se:


𝑛1 = 4
𝑛2 = 3

1 1
∆0,01 = √0,0171 × 3 × ( + ) × 5,56 = 0,41
4 3

Considerando os operários 2 e 4, tem-se:


𝑛1 = 4
𝑛2 = 6

1 1
∆0,01 = √0,0171 × 3 × ( + ) × 5,56 = 0,34
4 6

Considerando os operários 3 e 4, tem-se:


𝑛1 = 3
𝑛2 = 6

1 1
∆0,01 = √0,0171 × 3 × ( + ) × 5,56 = 0,38
3 6

Assim, tem-se:

OPERÁRIOS |𝑋̅𝑖 − 𝑋̅𝑚 | ∆0,01 CONCLUSÃO

1e2 0,20 0,36 Não diferem


1e3 0,60 0,39 diferem
1e4 0,10 0,32 Não diferem
2e3 0,40 0,41 Não diferem
2e4 0,10 0,34 Não diferem
3e4 0,50 0,38 diferem

O tempo médio gasto para a execução do operário número 3 difere do tempo médio dos
operários 1 e 4, ao nível de 1% de significância.

LISTA DE EXERCÍCIOS 08
1. Uma empresa deseja adquirir certa máquina e verificou que existem no mercado três marcas
diferentes: A, B, e C que satisfazem. Decidiu-se que será comprada a máquina que apresentar
melhor rendimento. Foi realizado um ensaio com as três máquinas em períodos iguais durante 5
dias e as produções resultantes foram:
118

A 120 123 121 125 122


B 119 121 118 120 123
C 125 127 128 127 128

Pergunta-se: com relação ao rendimento, existe diferença significativa entre as máquinas ao nível
de 1% de significância? Aplicar o teste de Scheffé e concluir qual a máquina a ser adquirida.

2. Foram testados três tipos de lâmpadas elétricas e os tempos de vida (em horas) obtidos foram:
lâmpada A: 1.245 1.354 1.367 1.289
lâmpada B: 1.235 1.300 1.230 1.189
lâmpada C: 1.345 1.450 1.320

Existe diferença significativa entre os tempos médios de vida dessas três marcas de lâmpadas, ao
nível de significância de 1%? Se necessário, aplicar o teste de Scheffé.
3. Três máquinas produzem parafusos. Encontram-se a seguir, os diâmetros correspondentes a
uma amostra de 4 parafusos produzidos em cada máquina.
MÁQUINAS
A B C

8 9 7
7 7 9
9 7 7
7 8 7

Testar se os diâmetros médios são iguais a um nível de significância de 5%.


4) Pesquisadores investigaram três métodos diferentes de preparar o composto supercondutor
PbMo 6 S 8 . Eles afirmam que a presença de oxigênio durante o processo de preparação afeta a
temperatura de transição, Tc , da super condução do material. Os métodos de preparação 1 e 2
usam técnicas que são planejadas para eliminar a presença de oxigênio, enquanto o método 3
permite a presença de oxigênio. Cinco observações de Tc (em K) foram feitas para cada material,
sendo os resultados apresentados a seguir.

MÉTODO DE TEMPERATURA DE TRANSIÇÃO Tc (K)


PREPARAÇÃO
1 14,8 14,8 14,7 14,8 14,9
2 14,6 15,0 14,9 14,8 14,7
3 14,2 14,4 14,4 12,2 11,7

Há qualquer evidência que confirme a afirmação de que a presença de oxigênio durante a


preparação afete a temperatura média de transição? Usar  = 0,05 .

5) A resistência de contato de um relé foi estudada para três materiais diferentes (todos eram ligas,
tendo prata como base). Os dados encontram-se a seguir.

LIGA RESISTÊNCIA DE CONTATO


1 95 87 99 98
2 104 102 102 105
3 119 130 132 136

O tipo de liga afeta a resistência média de contato? Usar  = 0,01 .


119

9 ANÁLISE DE CORRELAÇÃO E REGRESSÃO SIMPLES

9.1 INTRODUÇÃO

A correlação simples mede a “força” ou “grau” de associação entre duas variáveis. Já, o
modelo de regressão linear simples, define uma relação linear entre a variável dependente e uma
variável independente.

9.2 DIAGRAMA DE DISPERSÃO

O diagrama de dispersão é uma representação gráfica da relação entre duas ou mais


variáveis. No diagrama de dispersão entre duas variáveis, X e Y, cada ponto no gráfico é um par
(𝑥𝑖 , 𝑦𝑖 ).
GRÁFICO 4 - DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁ-
VEIS X E Y
DIAGRAMA DE DISPERSÃO
Y
120

100

80

60

40

20

0
2 7 12 17 22

FONTE: A autora. X

A visualização do diagrama de dispersão possibilita ter uma boa ideia de como as duas
variáveis se correlacionam.

9.3 ANÁLISE DE CORRELAÇÃO

9.3.1 Coeficiente de Correlação Linear de Pearson


Diferentes formas de correlação podem existir entre as variáveis. O caso mais simples e
mais conhecido é a correlação linear simples, envolvendo duas variáveis, X e Y.
Este coeficiente mostra o grau de relacionamento entre as variáveis, fornecendo um
número, indicando como as variáveis variam conjuntamente. Não há a necessidade de definir as
relações de causa e efeito, ou seja, qual é a variável dependente e a independente.
Correlação linear positiva: quando para maiores valores de X, existe uma tendência de
obter maiores valores de Y.
Correlação linear negativa: para maiores valores de X, existir uma tendência de obter
menores valores de Y.
Correlação linear nula: quando não existe correlação linear entre X e Y.
120

GRÁFICO 5 – DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁ- GRÁFICO 6 – DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁ-
VEIS X E Y
DIAGRAMA DE DISPERSÃO VEIS XEY
DIAGRAM A DE DISPERSÃO
Y Y
120 70

60
100
50
80
40
60
30

40 20

20 10

0
0
2 7 12 17
2 7 12 17 22
X
X

FONTE: A autora. FONTE: A autora.

O coeficiente de correlação amostral é obtido através da expressão:

∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)(𝑦𝑖 − 𝑌̅)


𝑟 = 𝜌 ̂𝑋,𝑌 =
√∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)2 ∑𝑛𝑖=1(𝑦𝑖 − 𝑌̅)2

A interpretação do coeficiente quando | 𝑟 | = 1 é de que existe correlação linear perfeita


entre as variáveis X e Y. A correlação é linear perfeita positiva quando 𝑟 = 1 e linear perfeita
negativa quando 𝑟 = −1. Quando se tem 𝑟 = 0, não existe correlação linear entre as variáveis X
e Y.
O coeficiente de correlação pode ser avaliado qualitativamente de acordo com os critérios
abaixo:
Se 0 < | 𝑟 | < 0,30 existe fraca correlação linear;
Se 0,30 ≤ | 𝑟 | < 0,60 existe moderada correlação linear;
se 0,60 ≤ | 𝑟 | < 0,90 existe forte correlação linear;
se 0,90 ≤ | 𝑟 | < 1,00 existe correlação linear muito forte.

Exemplo de aplicação:

Seja o processo de recobrimento de uma determinada peça com metal. O recobrimento é


feito com metal fundido.
X= quantidade utilizada de metal fundido (em gramas);
Y = porcentagem de recobrimento obtida (%).

TABELA 12 – QUANTIDADE DE METAL FUNDIDO UTI-


ZADA E PORCENTAGEM DE RECOBRI-
MENTO OBTIDA
OBSERVAÇÃO 𝑥𝑖 𝑦𝑖
1 6,0 10
2 4,0 10
3 6,0 20
4 8,0 20
5 7,5 30
6 8,5 40
7 9,5 45
8 11,0 50
9 12,0 60
10 12,0 65
121

O diagrama de dispersão é apresentado abaixo:

GRÁFICO 7 – DIAGRAMA DE DISPERSÃO ENTRE AS VARIÁVEIS QUANTI-


DADE DE METAL FUNDIDO E PORCENTAGEM DE RECOBRI-
MENTO
Porcentagem de DIAGRAMA DE DISPERSÃO
recobrimento (%)
80

70

60

50

40

30

20

10

0
2 4 6 8 10 12 14
Quantidade de metal

A visualização do diagrama de dispersão possibilita ter uma boa ideia de como as duas
variáveis se relacionam, ou seja, qual a tendência de variação conjunta que apresentam. O gráfico
sugere a existência de uma relação linear entre as duas variáveis. Assim, calcular-se-á o
coeficiente de correlação linear de Pearson.

OBS. 𝑥𝑖 𝑦𝑖 (𝑥𝑖 − 𝑋̅) (𝑦𝑖 − 𝑌̅) (𝑥𝑖 − 𝑋̅)(𝑦𝑖 − 𝑌̅) (𝑥𝑖 − 𝑋̅)2 (𝑦𝑖 − 𝑌̅)2
1 6 10 -2,45 -25 61,25 6,00 625
2 4 10 -4,45 -25 111,25 19,80 625
3 6 20 -2,45 -15 36,75 6,00 225
4 8 20 -0,45 -15 6,75 0,20 225
5 7,5 30 -0,95 -5 4,75 0,90 25
6 8,5 40 0,05 5 0,25 0,00 25
7 9,5 45 1,05 10 10,50 1,10 100
8 11 50 2,55 15 38,25 6,50 225
9 12 60 3,55 25 88,75 12,60 625
10 12 65 3,55 30 106,50 12,60 900
 84,5 350 465,00 65,73 3.600
MÉDIA 8,45 35

Tem-se que:

∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)(𝑦𝑖 − 𝑌̅)


𝑟 = 𝜌 ̂𝑋,𝑌 =
√∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)2 ∑𝑛𝑖=1(𝑦𝑖 − 𝑌̅)2

Substituindo os valores na expressão acima tem-se:

465
𝑟 = 𝜌 ̂𝑋,𝑌 = = 0,9560
√65,73 × 3.600

Sendo o 𝑟 = 0,9560, conclui-se que existe correlação linear muito forte.


122

9.3.1.1 Teste de Hipóteses para Coeficiente de Correlação


O coeficiente de correlação linear 𝑟, é uma estimativa da correlação populacional 𝜌, obtida
com base em uma amostra de tamanho n. O tamanho da amostra exerce papel fundamental na
estimativa, desta forma, torna-se necessário testar a hipótese de que realmente existe correlação
linear entre as variáveis estudadas. Assim, as hipóteses a serem testadas são:
𝐻0 : 𝜌 = 0 (a correlação populacional é igual a zero)
𝐻1 : 𝜌 ≠ 0 (a correlação populacional é diferente de zero)

A estatística para testar a hipótese 𝐻0 : 𝜌 = 0 contra 𝐻1 : 𝜌 ≠ 0 , tem distribuição t com n - 2


graus de liberdade, ou seja:
𝑟√𝑛 − 2
𝑡= ~ 𝑡𝑛−2
√1 − 𝑟 2

Exemplo de aplicação:

Seja o exemplo do processo de recobrimento de uma determinada peça com metal. Tem-se que o
coeficiente de correlação estimado é 𝑟 = 0,9560. Testar a hipótese de que a correlação
populacional é diferente de zero, utilizando nível de significância de 5%.
As hipóteses são:

𝐻0 : 𝜌 = 0 (a correlação populacional é igual a zero)


𝐻1 : 𝜌 ≠ 0 (a correlação populacional é diferente de zero)

A estatística t é:

𝑟√𝑛 − 2 0,9560 × √10 − 2


𝑡= = = 9,22
√1 − 𝑟2 √1 − 0,95602

O valor de “t” tabelado para nível de significância e 5% e 8 graus de liberdade é ±2,31,


portanto, rejeita-se a hipótese 𝐻0 : 𝜌 = 0.

9.4 ANÁLISE DE REGRESSÃO LINEAR SIMPLES

Análise de regressão linear simples é uma técnica de modelagem utilizada para analisar a
relação entre uma variável dependente (Y) e uma variável independente X .
O objetivo dessa técnica é identificar uma função que descreve, o mais próximo possível, a
relação entre essas variáveis e assim poder predizer o valor que a variável dependente (Y) irá
assumir para um determinado valor da variável independente X.
O modelo de regressão poderá ser expresso como:
𝑌 = 𝛼 + 𝛽𝑋 + 𝜀

Um valor de Y é formado pelo componente funcional ou regressão (𝛼 + 𝛽𝑋) , que


representa a influência da variável independente X sobre o valor de Y e a componente aleatório
( 𝜺 ) , que representa a influência de outros fatores, bem como os erros de medidas da variável Y.
123

Apresenta-se a seguir, um gráfico, onde estão representados os pontos observados e a


reta ajustada.

GRÁFICO 8 – DIAGRAMA DE DISPERSÃO ENTRE X E Y E A RETA


ESTIMADA

Y
34
32
30
28
26
24
22
20
20 22 24 26 28 X 30

Verifica-se no gráfico que nem todos os pontos tocam a reta, e essa diferença é o erro (),
mas supõe-se que em média esses erros tendem a se anular, ou seja:
𝐸(𝜀𝑖 ) = 0
Ao estabelecer o modelo de regressão linear simples, deve-se pressupor que:
1) os erros (𝜀𝑖 ) têm distribuição normal;
2) os erros (𝜀𝑖 ) são independentes;
3) 𝜀𝑖 é uma variável aleatória com média igual a zero, isto é, 𝐸(𝜀𝑖 ) = 0;
4) A variância de 𝜀𝑖 é igual à 𝜎 2 para todos os valores de X.

9.4.1 Estimação dos Parâmetros

Uma vez escolhido o modelo de regressão, deve-se estimar os seus parâmetros, neste
caso, os coeficientes da equação da reta, 𝛼 e 𝛽 . Isso pode ser feito a partir da aplicação do
Método dos Mínimos Quadrados. Neste método, a soma dos erros quadráticos (isto é, a soma dos
quadrados da distância vertical entre as observações e a reta ajustada) é mínima.
Os parâmetros 𝛼 e 𝛽 são estimados através dos dados amostrais e a reta estimada será
da forma:
𝑌̂ = 𝑎 + 𝑏𝑋

Seja 𝑒𝑖 a distância da reta ajustada aos pontos amostrais. O método dos mínimos
quadrados minimiza a soma de 𝑒𝑖2 , ou seja:
∑𝑛𝑖=1 𝑒𝑖2 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̂𝑖 )2 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 )2

Derivando a expressão acima em relação a “a” e “b” e igualando a zero, obtém-se o


sistema de duas equações:
124

∑𝑛𝑖=1 𝑦𝑖 = 𝑛𝑎 + 𝑏 ∑𝑛𝑖=1 𝑥𝑖

∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 = 𝑎 ∑𝑛𝑖=1 𝑥𝑖 + 𝑏 ∑𝑛𝑖=1 𝑥𝑖2

A solução analítica do sistema de equações fornece os valores de “a” e “b”, como


apresentados a seguir.
𝑎 = 𝑌̅ − 𝑏𝑋̅

∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)𝑦𝑖
𝑏=
∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)2

Exemplos de aplicação
1) Seja o processo de recobrimento de uma determinada peça com metal. O recobrimento é feito
com metal fundido.
X= quantidade utilizada de metal fundido (em gramas);
Y = porcentagem de recobrimento obtida (%).

QUANTIDADE DE METAL FUNDIDO UTILIZADA E


PORCENTAGEM DE RECOBRIMENTO OBTIDA
OBSERVAÇÃO 𝑥𝑖 𝑦𝑖
1 6,0 10
2 4,0 10
3 6,0 20
4 8,0 20
5 7,5 30
6 8,5 40
7 9,5 45
8 11,0 50
9 12,0 60
10 12,0 65

Ajustar um modelo de regressão linear simples aos dados:

Tem-se então que:


OBS. 𝑥𝑖 𝑦𝑖 (𝑥𝑖 − 𝑋̅) (𝑥𝑖 − 𝑋̅)2 (𝑥𝑖 − 𝑋̅)𝑦𝑖
1 6 10 -2,45 6,00 -24,50
2 4 10 -4,45 19,80 -44,50
3 6 20 -2,45 6,00 -49,00
4 8 20 -0,45 0,20 -9,00
5 7,5 30 -0,95 0,90 -28,50
6 8,5 40 0,05 0,00 2,00
7 9,5 45 1,05 1,10 47,25
8 11 50 2,55 6,50 127,50
9 12 60 3,55 12,60 213,00
10 12 65 3,55 12,60 230,75
Total 84,5 350 65,725 465,00
Média 8,45 35
125

𝑋̅ = 8,45
𝑌̅ = 35
(𝑥𝑖 − 𝑋̅)2 = 65,725
(𝑥𝑖 − 𝑋̅)𝑦𝑖 = 465,00

Logo,

∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)𝑦𝑖 465,00


𝑏= 𝑛 = = 7,0749
∑𝑖=1(𝑥𝑖 − 𝑋̅)2 65,725

𝑎 = 𝑌̅ − 𝑏𝑋̅ = 35 − 7,0749 × 8,45 = −24,7832

A equação de regressão linear será:


𝑌̂ = −24,7832 + 7,0749𝑋

Os valores de 𝑦̂𝑖 para diferentes valores de 𝑥𝑖 , são:

OBS. 𝑥𝑖 𝑦𝑖 𝑦̂𝑖
1 6 10 17,7
2 4 10 3,5
3 6 20 17,7
4 8 20 31,8
5 7,5 30 28,3
6 8,5 40 35,4
7 9,5 45 42,4
8 11 50 53,0
9 12 60 60,1
10 12 65 60,1

O gráfico a seguir, apresenta o diagrama de dispersão e a função linear ajustada.

DIAGRAMA DE DISPERSÃO E FUNÇÃO LINEAR


AJUSTADA
Recobrimento
(%)
70

60

50

40

30

20

10

0
0 5 10 15
Quantidade de metal fundido
126

9.4.2 Testes de Hipóteses na Regressão


Uma etapa importante da verificação da adequação de um modelo de regressão linear é a
realização de um teste estatístico de hipóteses em relação aos parâmetros do modelo.

9.4.2.1 Análise da Variância


A análise da variância, conhecida como ANOVA, é um teste que permite verificar a
existência da regressão, ou seja, se existe relação entre a variável dependente e independente,
através do comportamento das variações total, explicada e residual. Este teste é resumido no
quadro da ANOVA.

GRÁFICO 9 – DESVIOS TOTAL, EXPLICADO E RESIDUAL

Ŷ = a + bX

yi

( y i − Y) ( y i − ŷ i )

Y
( Y − ŷ i )

X
A estatística utilizada para o teste é a variável aleatória com distribuição F de Snedecor,
com m graus de liberdade no numerador e n graus de liberdade no denominador. As hipóteses
são:
𝐻0 : A regressão linear de Y sobre X não é significativa
𝐻1 : A regressão linear de Y sobre X é significativa
As variações ou somas dos quadrados são obtidos através de:
𝑛

𝑆𝑄𝑇 = 𝑆𝑜𝑚𝑎 𝑑𝑒 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑡𝑜𝑡𝑎𝑙 = ∑(𝑦𝑖 − 𝑌̅)2


𝑖=1
𝑛

𝑆𝑄𝐸 = 𝑆𝑜𝑚𝑎 𝑑𝑒 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑒𝑣𝑖𝑑𝑜 𝑎 𝑟𝑒𝑔𝑟𝑒𝑠𝑠ã𝑜 = 𝑏 × ∑(𝑥𝑖 − 𝑋̅)(𝑦𝑖 − 𝑌̅)


𝑖=1
𝑛 𝑛

𝑆𝑄𝑅 = 𝑆𝑜𝑚𝑎 𝑑𝑒 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙 = ∑(𝑦𝑖 − 𝑌̅) − 𝑏 × ∑(𝑥𝑖 − 𝑋̅)(𝑦𝑖 − 𝑌̅) 2

𝑖=1 𝑖=1
Tem-se que: 𝑆𝑄𝑇 = 𝑆𝑄𝐸 + 𝑆𝑄𝑅

Para a ANOVA, faz-se necessária elaborar a tabela a seguir:


FONTE DE SOMA DE G.L. QUADRADO F
VARIAÇÃO QUADRADOS MÉDIO
𝑆𝑄𝐸
Explicada 𝑆𝑄𝐸 1 𝑄𝑀𝐸 = 𝑄𝑀𝐸
1 𝐹=
𝑆𝑄𝑅 𝑄𝑀𝑅
Residual 𝑆𝑄𝑅 𝑛−2 𝑄𝑀𝑅 =
𝑛−2
Total 𝑆𝑄𝑇 𝑛−1
127

Se 𝐹 > 𝐹𝛼; 1; 𝑛−2 (crítico), rejeita-se 𝐻0 e conclui-se que a regressão de Y sobre X é


significativa.

Exemplo de aplicação:

Testar o modelo ajustado no exemplo, através da análise da variância. Usar 𝛼 = 5%.

Solução:
Para obter as somas dos quadrados faz-se necessário os seguintes cálculos:
OBS. 𝑥𝑖 𝑦𝑖 𝑥𝑖 𝑦𝑖 (𝑥𝑖 − 𝑋̅) (𝑦𝑖 − 𝑌̅) (𝑥𝑖 − 𝑋̅)2 (𝑦𝑖 − 𝑌̅)2 (𝑥𝑖 − 𝑋̅)(𝑦𝑖 − 𝑌̅)
1 6 10 60,0 -2,45 -25 6,0 625 61,25
2 4 10 40,0 -4,45 -25 19,8 625 111,25
3 6 20 120,0 -2,45 -15 6,0 225 36,75
4 8 20 160,0 -0,45 -15 0,2 225 6,75
5 7,5 30 225,0 -0,95 -5 0,9 25 4,75
6 8,5 40 340,0 0,05 5 0,0 25 0,25
7 9,5 45 427,5 1,05 10 1,1 100 10,5
8 11 50 550,0 2,55 15 6,5 225 38,25
9 12 60 720,0 3,55 25 12,6 625 88,75
10 12 65 780,0 3,55 30 12,6 900 106,5
Total 84,5 350 3.422,5 65,70 3.600 465,00
𝑛

𝑆𝑄𝑇 = 𝑆𝑌𝑌 = ∑(𝑦𝑖 − 𝑌̅)2 = 3.600


𝑖=1

𝑆𝑄𝐸 = 𝑏 × 𝑆𝑋𝑌
sendo que 𝑆𝑋𝑌 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)(𝑦𝑖 − 𝑌̅) = 465

𝑏 = 7,0749 (já calculado)

Assim, tem-se que:


𝑆𝑄𝐸 = 𝑏 × 𝑆𝑋𝑌 = 7,0749 × 465 = 3.289,8285
𝑆𝑄𝑅 = 𝑆𝑌𝑌 − 𝑏 × 𝑆𝑋𝑌
𝑆𝑄𝑅 = 3.600 − 3.289,8285 = 310,1715

QUADRO DA ANÁLISE DA VARIÂNCIA


FONTE DE SOMA DOS
G.L. QUADRADO MÉDIO F
VARIAÇÃO QUADRADOS

Explicada 𝑆𝑄𝐸 = 3.289,8285 1 𝑄𝑀𝐸 = 3.289,8285


𝑆𝑄𝑅 = 310,1715 𝑛−2=8 𝐹 = 84,85
Residual 310,1715
𝑄𝑀𝑅 = = 38,7714
8
𝑆𝑄𝑇 = 3.600 𝑛−1=9
Total

Tem-se que 𝐹0,05;1; 8 = 5,32 , logo, conclui-se que a regressão de Y sobre X é significativa,
para nível de 5% de significância.
128

9.4.3 Coeficiente de Determinação ou Explicação

A medida que indica a qualidade do ajuste é o coeficiente de determinação ou explicação


2
(𝑅 ). Quanto mais próximo de 1, melhor é o ajuste do modelo.
𝑆𝑄𝐸
𝑅2 =
𝑆𝑄𝑇
onde:
𝑆𝑄𝑇: é a soma de quadrados total
𝑆𝑄𝐸: é a soma de quadrados devido à regressão

Coeficiente de determinação ou explicação ajustado:


2
(𝑛 − 1)
𝑅𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 =1− × (1 − 𝑅 2 )
(𝑛 − 𝑘)
Onde: n é o número de observações
k é o número de parâmetros estimados
Para o exemplo, tem-se que:

𝑆𝑄𝐸 3.289,829
𝑅2 = = = 0,9138
𝑆𝑄𝑇 3.600,000
O modelo ajustado explica 91,38% das variações ocorridas na variável dependente Y.

2
(𝑛 − 1) 10 − 1
𝑅𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 =1− × (1 − 𝑅 2 ) = 1 − × (1 − 0,9138) = 0,9030
(𝑛 − 𝑘) 10 − 2
2
Utilizando o 𝑅𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 , o modelo explica 90,30% das variações ocorridas na variável
dependente Y.

9.5 AJUSTE DE FUNÇÃO EXPONENCIAL


A função exponencial é da forma: 𝑌 = 𝛼𝛽 𝑋 . Graficamente, tem-se:

FUNÇÃO EXPONENCIAL FUNÇÃO EXPONENCIAL


Y Y
12
200
180 10
160
140 8 0<𝛽<1
120
6
100 𝛽>1
80
4
60
40 2
20
0 0
0 5 10 15 4 6 8 10 12 14
X X

9.5.1 Estimativa dos Coeficientes

O modelo estimado é:

𝑌̂ = 𝛼̂𝛽̂ 𝑋
129

Fazendo a transformação logarítmica:


𝑙𝑛𝑌̂ = 𝑙𝑛𝛼̂ + 𝑙𝑛𝛽̂ , que poderá ser escrito como sendo:
𝑍̂ = 𝐴̂ + 𝐵̂𝑋
onde:
𝑍̂ = 𝑙𝑛𝑌̂
𝐴̂ = 𝑙𝑛𝛼̂
𝐵̂ = 𝑙𝑛𝛽̂

Assim, reduz-se ao problema de ajuste de uma reta aos pontos (𝑥𝑖 , 𝑧𝑖 ), onde 𝑧𝑖 = 𝑙𝑛(𝑦𝑖 ).
Os parâmetros A e B são estimados através dos dados amostrais e a reta estimada será da
forma:
𝑍̂ = 𝐴̂ + 𝐵̂𝑋

Os valores de 𝐴̂ e 𝐵̂ serão obtidos a partir das equações apresentadas a seguir.

𝐴̂ = 𝑍̅ − 𝐵̂𝑋̅
∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)𝑧𝑖
𝐵̂ =
∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)2

Para obter a estimativa do modelo na sua forma original, faz-se a transformação inversa
dos coeficientes 𝐴̂ e 𝐵̂. Tem-se então que:
𝐴̂ = 𝑙𝑛𝛼̂, logo, 𝛼̂ = 𝑒 𝐴̂
𝐵̂ = 𝑙𝑛𝛽̂, logo, 𝛽̂ = 𝑒 𝐵̂

E o modelo exponencial estimado será:


𝑌̂ = 𝛼̂𝛽̂ 𝑋

9.5.2 Testes de Hipóteses na Regressão

9.5.2.1 Análise da Variância

A estatística utilizada para o teste é a variável aleatória com distribuição F de Snedecor,


com 1 grau de liberdade no numerador e n-2 graus de liberdade no denominador. As hipóteses
são:
𝐻0 : A regressão de Y sobre X não é significativa
𝐻1 : A regressão de Y sobre X é significativa

As variações ou somas dos quadrados são obtidas através de :

𝑆𝑄𝑇 = ∑𝑛𝑖=1(𝑧𝑖 − 𝑍̅)2 Soma de quadrados total

𝑆𝑄𝐸 = 𝐵̂𝑆𝑋𝑍 Soma de quadrados explicado (devido a regressão)

onde: 𝑆𝑋𝑍 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)(𝑧𝑖 − 𝑍̅)


130

𝑆𝑄𝑅 = 𝑆𝑍𝑍 − 𝐵̂𝑆𝑋𝑍 Soma de quadrados residual


onde: 𝑆𝑍𝑍 = ∑𝑛𝑖=1(𝑧𝑖 − 𝑍̅)2
Tem-se que: 𝑆𝑄𝑇 = 𝑆𝑄𝐸 + 𝑆𝑄𝑅

Para a ANOVA, faz-se necessária elaborar a tabela abaixo:

FONTE DE SOMA DOS


G.L. QUADRADO MÉDIO F
VARIAÇÃO QUADRADOS
Explicada 𝑆𝑄𝐸 = 𝐵̂𝑆𝑋𝑍 1 𝑄𝑀𝐸 = 𝐵̂𝑆𝑋𝑍
𝑄𝑀𝐸
𝑆𝑍𝑍 − 𝐵̂𝑆𝑋𝑍 𝐹=
Residual 𝑆𝑄𝑅 = 𝑆𝑍𝑍 − 𝐵̂𝑆𝑋𝑍 𝑛−2 𝑄𝑀𝑅 = 𝑄𝑀𝑅
𝑛−2
Total 𝑆𝑄𝑇 = 𝑆𝑍𝑍 𝑛−1

Se 𝐹𝑐𝑎𝑙𝑐 > 𝐹𝛼; 1; 𝑛−2 , rejeita-se 𝐻0 e conclui-se que a regressão de Y sobre X é significativa.

9.5.3. Coeficiente de Determinação ou Explicação


O coeficiente de determinação, 𝑅 2, indica quantos por cento a variação explicada pela
regressão representa da variação total. Este varia entre 0 e 1. Quanto mais próximo de 1, maior é
a explicação pelo modelo da variação total. A expressão de 𝑅 2 é dada por:
𝑆𝑄𝐸
𝑅2 =
𝑆𝑄𝑇
Coeficiente de determinação ou explicação ajustado:

2
(𝑛 − 1)
𝑅𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 =1− × (1 − 𝑅 2 )
(𝑛 − 𝑘)

Exemplo:

1) Seja o processo de recobrimento de uma determinada peça com metal. O recobrimento é feito
com metal fundido.
X= quantidade utilizada de metal fundido (em gramas);
Y = porcentagem de recobrimento obtida (%).

QUANTIDADE DE METAL FUNDIDO UTILIZADA E


PORCENTAGEM DE RECOBRIMENTO OBTIDA

OBSERVAÇÃO
𝑥𝑖 𝑦𝑖
1 6,0 10
2 4,0 10
3 6,0 20
4 8,0 20
5 7,5 30
6 8,5 40
7 9,5 45
8 11,0 50
9 12,0 60
10 12,0 65

a) ajustar uma função exponencial aos dados;


131

b) testar a existência de regressão utilizando nível de significância de 5%;


c) calcular o coeficiente de determinação.

OBS. 𝑥𝑖 𝑦𝑖 𝑧𝑖 = 𝑙𝑛(𝑦𝑖 ) (𝑥𝑖 − 𝑋̅) (𝑥𝑖 − 𝑋̅)2 (𝑥𝑖 − 𝑋̅)𝑧𝑖

1 6,0 10 2,3026 -2,45 6,00 -5,6413


2 4,0 10 2,3026 -4,45 19,80 -10,2465
3 6,0 20 2,9957 -2,45 6,00 -7,3395
4 8,0 20 2,9957 -0,45 0,20 -1,3481
5 7,5 30 3,4012 -0,95 0,90 -3,2311
6 8,5 40 3,6889 0,05 0,00 0,1844
7 9,5 45 3,8067 1,05 1,10 3,9970
8 11,0 50 3,9120 2,55 6,50 9,9757
9 12,0 60 4,0943 3,55 12,60 14,5349
10 12,0 65 4,1744 3,55 12,60 14,8191
SOMA 84,5 350 65,73 15,7045
MÉDIA 8,45 35 3,3674

a) Cálculo do coeficiente 𝐵̂:

∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)𝑧𝑖 15,7045


𝐵̂ = = = 0,2389
∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)2 65,73

Cálculo do coeficiente 𝐴̂:


𝐴̂ = 𝑍̅ − 𝐵̂𝑋̅ = 3,3674 − (0,2389 × 8,45) = 1,3487

Assim, o modelo ajustado na forma linear será:


𝑍̂ = 𝐴̂ + 𝐵̂𝑋 = 1,3487 + 0,2389𝑋

Mas tem-se que:


𝐴̂ = 𝑙𝑛𝛼̂, logo, 𝛼̂ = 𝑒 𝐴̂ = 𝑒 1,3487 = 3,8524
𝐵̂ = 𝑙𝑛𝛽̂, logo, 𝛽̂ = 𝑒 𝐵̂ = 𝑒 0,2389 = 1,2699

O modelo ajustado na forma exponencial é:


𝑌̂ = 𝛼̂𝛽̂ 𝑋 = 3,8524 × 1,2699𝑋

Assim, tem-se que:

OBS. 𝑥𝑖 𝑦𝑖 𝑦̂𝑖
1 6,0 10 16,16
2 4,0 10 10,02
3 6,0 20 16,16
4 8,0 20 26,05
5 7,5 30 23,12
6 8,5 40 29,36
7 9,5 45 37,29
8 11,0 50 53,36
9 12,0 60 67,76
10 12,0 65 67,76
132

O gráfico a seguir apresenta o diagrama de dispersão e a função exponencial ajustada:

DIAGRAMA DE DISPERSÃO E FUNÇÃO EXPONENCIAL


Recobrimento AJUSTADA
(%)
80

70

60

50

40

30

20

10

0
2 4 6 8 10 12 14

Quantidade de metal fundido


b) Testar a existência de
regressão para o exemplo, utilizando nível de significância de 5%;

OBS. 𝑥𝑖 𝑦𝑖 𝑧𝑖 = 𝑙𝑛(𝑦𝑖 ) (𝑥𝑖 − 𝑋̅) (𝑧𝑖 − 𝑍̅) (𝑧𝑖 − 𝑍̅)2 (𝑥𝑖 − 𝑋̅)(𝑧𝑖 − 𝑍̅)
1 6,0 10 2,3026 -2,45 -1,0648 1,1338 2,6088
2 4,0 10 2,3026 -4,45 -1,0648 1,1338 4,7384
3 6,0 20 2,9957 -2,45 -0,3717 0,1381 0,9106
4 8,0 20 2,9957 -0,45 -0,3717 0,1381 0,1673
5 7,5 30 3,4012 -0,95 0,0338 0,0011 -0,0321
6 8,5 40 3,6889 0,05 0,3215 0,1033 0,0161
7 9,5 45 3,8067 1,05 0,4393 0,1930 0,4612
8 11,0 50 3,9120 2,55 0,5446 0,2966 1,3888
9 12,0 60 4,0943 3,55 0,7269 0,5284 2,5807
10 12,0 65 4,1744 3,55 0,8070 0,6512 2,8648
SOMA 84,5 350 4,3177 15,7045
MÉDIA 8,45 35 3,3674

Calculando-se a soma dos quadrados tem-se:

𝑆𝑄𝑇 = ∑𝑛𝑖=1(𝑧𝑖 − 𝑍̅)2 = 4,3177

𝑆𝑄𝐸 = 𝐵̂𝑆𝑋𝑍 = 0,2389 × 15,7045 = 3,7525

𝑆𝑄𝑅 = 𝑆𝑄𝑇 − 𝑆𝑄𝐸 = 4,3177 − 3,7525 = 0,5652

Quadro da ANOVA
FONTE DE SOMA DE GRAUS DE QUADRADO
VARIAÇÃO QUADRADOS LIBERDADE MÉDIO F
Explicada 3,7525 1 3,7525
53,11
Residual 0,5652 8 0,0706
Total 4,3177 9

Tem-se que 𝐹0,05; 1; 8 = 5,32 . Como 𝐹 = 53,11 > 𝐹0,05; 1; 8 = 5,32, conclui-se que a
regressão de Y sobre X é significativa, ao nível de 5% de significância.
133

c) Cálculo do coeficiente de determinação para o exemplo.


𝑆𝑄𝐸 3,7525
𝑅2 = = = 0,8691
𝑆𝑄𝑇 4,3177

O modelo ajustado explica 86,91% das variações ocorridas na variável Y.

Coeficiente de determinação ou explicação ajustado:

2
(𝑛 − 1) (10 − 1)
𝑅𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 =1− × (1 − 𝑅 2 ) = 1 − × (1 − 0,8691) = 0,8527
(𝑛 − 𝑘) (10 − 2)
O modelo ajustado explica 85,27% das variações ocorridas na variável Y.

LISTA DE EXERCÍCIOS 09

1. Estão apresentados os pesos (em centenas de kg) e as taxas de rendimento de combustível


em rodovia (km/litro), numa amostra de 10 carros de passeio novos.

Peso 12 13 14 14 16 18 19 22 24 26
Rendimento 16 14 14 13 11 12 09 09 08 06

Pede-se:
a) calcular o coeficiente linear de Pearson e testar a significância ao nível de 5%.
b) ajustar a função linear e testar a existência de regressão, adotando 𝛼 = 0,05. Qual é o coeficiente
de explicação da função linear?
c) ajustar a função exponencial e testar a existência de regressão, adotando 𝛼 = 0,05. Qual é o
coeficiente de explicação da função exponencial?
d) Qual das funções ajustadas é a melhor? Comente?
2) Um estudo foi desenvolvido para verificar o quanto o comprimento de um cabo da porta serial
de microcomputadores influencia na qualidade da transmissão de dados, medida através do
número de falhas em 100.000 lotes de dados transmitidos (taxa de falha). Os resultados foram:

Comp. do 8 8 9 9 10 10 11 11 12
Cabo (m)
Taxa de 2,2 2,1 3,0 2,9 4,1 4,5 6,2 5,9 9,8
Falha

Comp. do 12 13 13 14 14 15
Cabo (m)
Taxa de 8,7 12,5 13,1 19,3 17,4 28,2
Falha
Pede-se:
a) calcular o coeficiente linear de Pearson e testar a significância ao nível de 5%.
b) ajustar a função linear e testar a existência de regressão, adotando 𝛼 = 0,05. Qual é o coeficiente
de explicação da função linear?
c) ajustar a função exponencial e testar a existência de regressão, adotando 𝛼 = 0,05. Qual é o
coeficiente de explicação da função exponencial?
d) Qual das funções ajustadas é a melhor? Comente.
134

3) No processo de queima de massa cerâmica, avaliou-se o efeito da temperatura do forno (X)


sobre a resistência mecânica da massa queimada (Y). Foram realizados 6 ensaios com níveis de
temperatura equidistantes, os quais designaremos por 1, 2, 3, 4, 5 e 6. Os valores obtidos de
resistência mecânica (MPa) foram: 41, 42, 50, 53, 54, 60, respectivamente.

Pede-se:
a) ajustar a função linear e testar a existência de regressão, adotando 𝛼 = 0,05. Qual é o coeficiente
de explicação da função linear?
b) ajustar a função exponencial e testar a existência de regressão, adotando 𝛼 = 0,05. Qual é o
coeficiente de explicação da função exponencial?
c) Qual das funções ajustadas é a melhor? Comente.
135

10 CONTROLE ESTATÍSTICO DE QUALIDADE

Introdução

De acordo com Montgomery (2009), a qualidade de um produto pode ser avaliada de várias
formas. É possível resumir as várias dimensões da qualidade em oito componentes: desempenho,
confiabilidade, durabilidade, assistência técnica, estética, características (o que o produto faz?),
qualidade percebida e conformidade com a especificação.
A definição moderna de qualidade, segundo Montgomery (2009), é: qualidade é
inversamente proporcional à variabilidade.
São várias as técnicas estatísticas úteis na melhoria da qualidade, sendo possível citar as
duas principais áreas: controle estatístico do processo e planejamento de experimentos.
O controle estatístico do processo (CEP) é um conjunto de ferramentas poderoso, útil para
obter estabilidade do processo e melhoria da capacidade através da redução da variabilidade. O
CEP pode ser aplicado a qualquer processo. Algumas das principais ferramentas são:
1. Histograma de frequências e diagrama de ramo e folhas
2. folha de controle
3. gráfico de Pareto
4. diagrama de causa e efeito
5. diagrama de concentração de defeito
6. diagrama de dispersão
7. gráfico de controle (mais sofisticado tecnicamente)
De acordo com Montgomery (2009), mesmo um processo de produção bem planejado ou
cuidadosamente mantido, apresentará uma pequena variabilidade, inerente ao processo. Nesse
caso, diz-se que o processo opera apenas com causas de variações aleatórias e está sob controle
estatístico.
Entretanto, outros tipos de variabilidade podem ocorrer, devido a três fatores: máquinas mal
ajustadas ou controladas de forma inadequada; erros do operador e matéria prima com problemas.
Essas fontes de variabilidade são chamadas de “causas atribuíveis”.

10.1 GRÁFICOS DE CONTROLE

O objetivo principal dos gráficos de controle é fornecer informações úteis no


aperfeiçoamento do processo. Quando se atinge o controle estatístico do processo tem-se várias
vantagens, tais como:
a) Fração de defeituosos permanece constante (na média);
b) custos e índices de qualidade serão previsíveis;
c) produtividade será máxima com o sistema corrente.
Um gráfico de controle é formado por:
• Uma linha central, representando o valor médio ou a média da característica da
qualidade que corresponde ao estado sob controle, ou seja, estão presentes somente
as causas aleatórias.
• São mostradas também, duas linhas horizontais:
Limite superior de controle (LSC)
Limite inferior de controle (LIC)
136

Seja w uma estatística amostral que mede alguma característica da qualidade de interesse,
sendo:
𝜇𝑊 : a média de w
𝜎𝑊 : desvio padrão de w
Então, a linha central, o limite superior de controle e o limite inferior de controle se tornam:
𝐿𝑆𝐶 = 𝜇𝑊 + 𝐿𝜎𝑊 (limite superior de controle)
𝐿𝐶 = 𝜇𝑊 (linha central)

𝐿𝐼𝐶 = 𝜇𝑊 − 𝐿𝜎𝑊 (imite inferior de controle)

onde:
L é a distância dos limites de controle à linha central, expressa em unidades de desvio
padrão. Normalmente, utiliza-se 𝐿 = 3. Os limites três sigmas são normalmente utilizados nos
Estados Unidos.
A teoria geral dos gráficos de controle foi proposta, inicialmente pelo Dr. Walter A. Shewhart.
Os gráficos de controle desenvolvidos segundo esses princípios são chamados gráficos de
controle de Shewhart.

INTERPRETAÇÃO DO GRÁFICO DE CONTROLE

Entende-se que o processo está “sob controle” se:

a) todos os pontos do gráfico estão dentro dos limites de controle;


b) a disposição dos pontos dentro dos limites de controle é aleatória.

𝑋̅𝑗

LSC

LC

LIC

Amostras

O processo está “fora do controle” se houver um ou mais pontos fora dos limites de controle
ou em disposição não aleatória.

𝑋̅𝑗

LSC

LC

LIC

Amostras
137

São padrões típicos de comportamento não aleatório:

a) periodicidade, isto é, “subidas” e “descidas” em intervalos regulares de tempo.

𝑋̅𝑗

LSC

LC

LIC

Amostras

b) tendência, isto é, os pontos se direcionam nitidamente para cima, ou para baixo.

𝑋̅𝑗

LSC

LC

LIC

Amostras

c) deslocamento, isto é, mudança no nível de desempenho do processo.

𝑋̅𝑗

LSC

LC

LIC

Amostras

Outra disposição de pontos que indicam processo “fora de controle”: mais de 6 pontos
consecutivos em um só lado da linha central.
138

𝑋̅𝑗

LSC

LC

LIC

Amostras

10.2 GRÁFICO DE CONTROLE PARA VARIÁVEIS

As características de qualidade podem ser expressas em termos de uma medida


quantitativa, numérica. Exemplos: diâmetro dos cilindros de um automóvel; volume de um
recipiente. São chamados de variáveis.
Neste caso, controla-se normalmente, tanto o valor médio como a sua variabilidade, através
de gráficos separados.

̅
10.2.1 Gráfico de Controle de 𝑿

Este gráfico é utilizado para o controle do valor médio do desempenho do processo.


Suponha que a característica de qualidade (variável) que se pretende controlar tenha
distribuição normal com média 𝜇 e desvio padrão 𝜎, ambos desconhecidos.

Estes parâmetros devem ser estimados com base em pelo menos 20 a 25 amostras, sendo
cada uma de tamanho 4 ou 5.
Seja 𝑋1 , 𝑋2 , … , 𝑋𝑛 uma amostra aleatória de um processo que está sob investigação. Então,
temos:

∑𝑛𝑖=1 𝑋𝑖 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑋̅ = =
𝑛 𝑛

E, sejam 𝑋̅1 , 𝑋̅2 , . . . , 𝑋̅𝑚 as médias de cada uma das m amostras. Então, o melhor estimador
de 𝜇, a média do processo, é a média geral, isto é:

∑𝑚 ̅
𝑗=1 𝑋𝑗 𝑋̅1 + 𝑋̅2 + ⋯ + 𝑋̅𝑚
𝑋̿ = =
𝑚 𝑚

Assim, 𝑋̿ deve ser usado como linha central no gráfico de 𝑋̅.

Para construir os limites de controle, é necessária uma estimativa do desvio padrão 𝜎. É


possível estimar 𝜎 através do desvio padrão ou das amplitudes. Para 𝑛 ≤ 6, a eficiência de R em
relação a S, é praticamente a mesma.
Seja 𝑋1 , 𝑋2 , … , 𝑋𝑛 uma amostra aleatória de um processo que está sob investigação. Então,
temos que a amplitude R é definida como:
139

𝑅 = 𝑋𝑚á𝑥𝑖𝑚𝑜 − 𝑋𝑚í𝑛𝑖𝑚𝑜

Sejam 𝑅1 , 𝑅2 , . . . , 𝑅𝑚 as amplitudes das m amostras. A amplitude média é:

∑𝑚
𝑗=1 𝑅𝑗 𝑅1 + 𝑅2 + ⋯ + 𝑅𝑚
𝑅̅ = =
𝑚 𝑚

Com base na normalidade, calcula-se os limites de controle três sigmas para o gráfico de
controle de 𝑋̅.

𝐿𝐶 = 𝑋̿ linha central
𝐿𝑆𝐶 = 𝑋̿ + 𝐴2 𝑅̅ limite superior de controle
𝐿𝐼𝐶 = 𝑋̿ − 𝐴2 𝑅̅ limite inferior de controle
Onde:
𝑋̿ é a média das m amostras

𝑅̅ é a amplitude média das m amostras

𝐴2 é constante tabelado em função do tamanho da amostra n.

̅
10.2.2 Gráfico de Controle de 𝑹
Este gráfico é utilizado para o controle da variabilidade do processo. OS limites de controle
três sigmas para o gráfico de controle de 𝑅 são:
𝐿𝐶 = 𝑅̅ linha central
𝐿𝑆𝐶 = 𝐷4 × 𝑅̅ limite superior de controle
𝐿𝐼𝐶 = 𝐷3 × 𝑅̅ limite inferior de controle
Onde:
𝑅̅ é a amplitude média das m amostras
𝐷3 e 𝐷4 são constantes tabelados em função do tamanho da amostra n.

CONSTANTES EM FUNÇÃO DOS TAMANHOS DA AMOSTRA


CONS- TAMANHOS DA AMOSTRA
TANTE
2 3 4 5 6 7 8 9 10
A2 1,880 1,023 0,729 0,577 0,483 0,419 0,373 0,337 0,308
D3 0 0 0 0 0 0,076 0,136 0,184 0,223
D4 3,267 2,575 2,282 2,115 2,004 1,924 1,864 1,816 1,777

CONS- TAMANHOS DA AMOSTRA


TANTE
11 12 13 14 15 16 17 18 19
A2 0,285 0,266 0,249 0,235 0,223 0,212 0,203 0,194 0,187
D3 0,256 0,283 0,307 0,328 0,347 0,363 0,378 0,391 0,403
D4 1,744 1,717 1,693 1,672 1,653 1,637 1,622 1,608 1,597
140

Exemplo 1

A tabela que se segue lista a quantidade de energia elétrica (em kWh) de certa residência.

TABELA 13 – CONSUMO BIMESTRAL DE ENERGIA ELÉTRICA (Kwh)


DE CERTA RESIDÊNCIA
PERÍODO CONSUMO BIMESTRAL (em kWh)
Ano 1: primeira metade 3375 2661 2073
Ano 1: segunda metade 2579 2858 2296
Ano 2: primeira metade 2812 2433 2266
Ano 2: segunda metade 3128 3286 2749
Ano 3: primeira metade 3427 578 3792

Usando subgrupos de tamanho n=3 correspondendo às linhas da tabela, construa os


gráficos de média e amplitude.

PERIODO 1 2 3 SOMA 𝑋̅𝑗 𝑅𝑗


Ano 1: primeira metade 3375 2661 2073 8109 2703,0000 1302
Ano 1: segunda metade 2579 2858 2296 7733 2577,6667 562
Ano 2: primeira metade 2812 2433 2266 7511 2503,6667 546
Ano 2: segunda metade 3128 3286 2749 9163 3054,3333 537
Ano 3; primeira metade 3427 578 3792 7797 2599,0000 3214
SOMA 40313
MÉDIA 2687,5333 2687,5333 1232,20

̅
Gráfico de controle de 𝑿
𝐿𝐶 = 𝑋̿ = 2687,5333
𝐿𝑆𝐶 = 𝑋̿ + 𝐴2 𝑅̅ = 2687,5333 + 1,023 × 1232,20 = 3948,0739
𝐿𝐼𝐶 = 𝑋̿ − 𝐴2 𝑅̅ = 2687,5333 − 1,023 × 1232,20 = 1426,9927

Gráfico de controle de R
𝐿𝐶 = 𝑅̅ = 1232,20
𝐿𝑆𝐶 = 𝐷4 × 𝑅̅ = 2,575 × 1232,20 = 3172,915
𝐿𝐼𝐶 = 𝐷3 × 𝑅̅ = 0 × 1232,20 = 0
141

Exemplo 2
A tabela adiante fornece dados sobre medidas de diâmetros de rolamentos de esferas usados nas
rodas de equipamento pesado de construção. Doze amostras, cada uma de tamanho quatro, são
extraídas diretamente da linha de produção. As amostras são provenientes de todos os três turnos,
e nenhuma amostra contém dados de mais de um turno. Use esses dados para construir gráficos
𝑋̅ e R, e para verificar se o processo está estável. Suponha que as medidas dos diâmetros sejam
normalmente distribuídas.

TABELA 14 – MEDIDAS DE DIÂMETROS DE ROLAMENTOS DE ES-


FERA USADOS NAS RODAS DE EQUIPAMENTO PE-
SADO DE CONSTRUÇÃO
MEDIDAS (mm)
AMOSTRA
1 2 3 4
1 15,155 15,195 15,145 15,125
2 15,095 15,162 15,168 15,163
3 15,142 15,150 15,168 15,152
4 15,132 15,168 15,154 15,146
5 15,172 15,188 15,178 15,194
6 15,174 15,166 15,186 15,194
7 15,166 15,178 15,192 15,184
8 15,172 15,187 15,193 15,180
9 15,182 15,198 15,185 15,195
10 15,170 15,150 15,192 15,180
11 15,186 15,194 15,175 15,185
12 15,178 15,192 15,168 15,182

∑𝑛𝑖=1 𝑋𝑖 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑋̅ = =
𝑛 𝑛

𝑅 = 𝑋𝑚á𝑥𝑖𝑚𝑜 − 𝑋𝑚í𝑛𝑖𝑚𝑜
142

MEDIDAS (mm)
AMOSTRA 𝑋̅𝑗 𝑅𝑗
1 2 3 4
1 15,155 15,195 15,145 15,125 15,155 0,070
2 15,095 15,162 15,168 15,163 15,147 0,073
3 15,142 15,150 15,168 15,152 15,153 0,026
4 15,132 15,168 15,154 15,146 15,150 0,036
5 15,172 15,188 15,178 15,194 15,183 0,022
6 15,174 15,166 15,186 15,194 15,180 0,028
7 15,166 15,178 15,192 15,184 15,180 0,026
8 15,172 15,187 15,193 15,180 15,183 0,021
9 15,182 15,198 15,185 15,195 15,190 0,016
10 15,170 15,150 15,192 15,180 15,173 0,042
11 15,186 15,194 15,175 15,185 15,185 0,019
12 15,178 15,192 15,168 15,182 15,180 0,024
SOMA 182,0590 0,4030
MÉDIA 15,1716 0,0336

∑𝑚 ̅
𝑗=1 𝑋𝑗 182,0590
𝑋̿ = = = 15,1716
𝑚 12

∑𝑚
𝑗=1 𝑅𝑗 0,4030
𝑅̅ = = = 0,0336
𝑚 12
̅
Gráfico de controle de 𝑿
𝐿𝐶 = 𝑋̿ = 15,1716
𝐿𝑆𝐶 = 𝑋̿ + 𝐴2 𝑅̅ = 15,1716 + 0,729 × 0,0336 = 15,1961
𝐿𝐼𝐶 = 𝑋̿ − 𝐴2 𝑅̅ = 15,1716 − 0,729 × 0,0336 = 15,1471

Gráfico de controle de R
𝐿𝐶 = 𝑅̅ = 0,0336
𝐿𝑆𝐶 = 𝐷4 × 𝑅̅ = 2,282 × 0,0336 = 0,0767
𝐿𝐼𝐶 = 𝐷3 × 𝑅̅ = 0 × 0,0336 = 0
143

Eficiência de R em relação a S

Estudos realizados mostram que o tamanho da amostra é fator preponderante na determinação da


eficiência de R comparada a S.

TABELA 15 - EFICIÊNCIA RELATIVA DE R COM-


PARADA A S, SEGUNDO ALGUNS
MANHOS DE AMOSTRA
TAMANHO DA EFICIÊNCIA
AMOSTRA (n) RELATIVA
2 1,000
3 0,992
4 0,975
5 0,955
6 0,930
10 0,850

10.3 GRÁFICO DE CONTROLE PARA ATRIBUTOS

10.3.1 Gráfico de Controle para Fração de Não Conformes (Gráfico p)

Neste caso, considera-se como medida de qualidade a fração de defeituosos produzidos


pelo processo. Entende-se por fração de produtos defeituosos como a razão entre o número de
itens defeituosos e o total de itens.
Os princípios subjacentes ao gráfico de controle para a fração de não conformes baseiam-
se na distribuição binomial.
Quando a fração de não conformes do processo, p, não é conhecida, deve, então, ser
estimada a partir de dados observados. O procedimento usual é a seleção de m amostras
preliminares, cada uma de tamanho n. Como regra geral, m deve ser 20 ou 25.
Então, se há 𝐷𝑖 unidades não conformes na amostra 𝑖, calcula-se a fração de não
conformes na i-ésima amostra através de:

𝐷𝑖
𝑝̂ 𝑖 = , 𝑖 = 1,2, … , 𝑚
𝑛

A média 𝑝̅ dessas frações de não conformes das amostras individuais é:


144

∑𝑚
𝑖=1 𝐷𝑖 ∑𝑚
𝑖=1 𝑝̂𝑖
𝑝̅ = =
𝑚×𝑛 𝑚

Os limites de controle e a linha central do gráfico de controle serão definidos através de:

𝑝̅ (1 − 𝑝̅ )
𝐿𝐼𝐶 = 𝑝̅ − 3√
𝑛
𝐿𝐶 = 𝑝̅
𝑝̅ (1 − 𝑝̅ )
𝐿𝑆𝐶 = 𝑝̅ + 3√
𝑛

Exemplo 1
Usa-se um gráfico de controle para a fração de não conformes de uma parte plástica
fabricada em um processo de moldagem por injeção. Dez subgrupos fornecem os seguintes dados:
Estabeleça um gráfico de controle para a fração de não conformes em amostra de n=100.

No. DE NÃO
AMOSTRA
CONFORMES
1 10
2 15
3 31
4 18
5 24
6 12
7 23
8 15
9 8
10 8

No. DE NÃO
AMOSTRA
CONFORMES
𝑝̂𝑖
1 10 0,100
2 15 0,150
3 31 0,310
4 18 0,180
5 24 0,240
6 12 0,120
7 23 0,230
8 15 0,150
9 8 0,080
10 8 0,080
SOMA 1,640
𝑝̅ 0,164

𝑝̅ = 0,164
𝐿𝐶 = 𝑝̅ = 0,164

𝑝̅ (1 − 𝑝̅ ) 0,164(1 − 0,164)
𝐿𝐼𝐶 = 𝑝̅ − 3√ = 0,164 − 3√ = 0,0529
𝑛 100
145

𝑝̅ (1 − 𝑝̅ ) 0,164(1 − 0,164)
𝐿𝑆𝐶 = 𝑝̅ + 3√ = 0,164 + 3√ = 0,2751
𝑛 100

Exemplo 2
Um processo que produz cárter para mancais é controlado por um gráfico de controle para a
fração de não conformes, usando tamanho de amostra n=100 e uma linha central 𝑝̅ = 0,02.
a) Ache os limites três-sigma para esse gráfico;
b) Analise as dez novas amostras (n=100) mostrada para controle estatístico. Que conclusões
podem ser tiradas sobre o processo?

No. DE NÃO
AMOSTRA
CONFORMES
1 5
2 2
3 3
4 8
5 4
6 1
7 2
8 6
9 3
10 4
a)

𝑝̅ = 0,02
𝐿𝐶 = 𝑝̅ = 0,02

𝑝̅ (1 − 𝑝̅ ) 0,02 × 0,98
𝐿𝐼𝐶 = 𝑝̅ − 3√ = 0,02 − 3√ = 0,02 − 0,042 = −0,022 = 0
𝑛 100

𝑝̅ (1 − 𝑝̅ ) 0,02 × 0,98
𝐿𝑆𝐶 = 𝑝̅ + 3√ = 0,02 + 3√ = 0,02 + 0,042 = 0,062
𝑛 100
146

b)
No. DE NÃO 𝑝̂𝑖 No. DE NÃO 𝑝̂ 𝑖
AMOSTRA AMOSTRA
CONFORMES CONFORMES
1 5 0,05 7 2 0,02
2 2 0,02 8 6 0,06
3 3 0,03 9 3 0,03
4 8 0,08 10 4 0,04
5 4 0,04 SOMA 0,38
6 1 0,01 𝑝̅ 0,038

A média de fração de não conformes aumentou, passou de 0,02 para 0,038.

LISTA DE EXERCÍCIOS 10

1. A espessura de uma placa de circuito impresso é um parâmetro importante da qualidade. Foram


obtidas as espessuras (em polegadas, in) de 25 amostras, sendo três placas cada amostra.
AMOSTRA x1 x2 x3 AMOSTRA x1 x2 x3
1 0,0629 0,0636 0,0640 14 0,0645 0,0640 0,0631
2 0,0630 0,0631 0,0622 15 0,0619 0,0644 0,0632
3 0,0628 0,0631 0,0633 16 0,0631 0,0627 0,0630
4 0,0634 0,0630 0,0631 17 0,0616 0,0623 0,0631
5 0,0619 0,0628 0,0630 18 0,0630 0,0630 0,0626
6 0,0613 0,0629 0,0634 19 0,0636 0,0631 0,0629
7 0,0630 0,0639 0,0625 20 0,0640 0,0635 0,0629
8 0,0628 0,0627 0,0622 21 0,0628 0,0625 0,0616
9 0,0623 0,0626 0,0633 22 0,0615 0,0625 0,0619
10 0,0631 0,0631 0,0633 23 0,0630 0,0632 0,0630
11 0,0635 0,0630 0,0638 24 0,0635 0,0629 0,0635
12 0,0623 0,0630 0,0630 25 0,0623 0,0629 0,0630
13 0,0635 0,0631 0,0630

Construir os gráficos de controle 𝑋̅ e 𝑅 para esse processo. O processo está sob controle?
2. A tabela apresenta, 20 subgrupos de cinco medidas, de uma dimensão crítica de uma peça
produzida por um processo de usinagem.
AMOS- AMOS-
x1 x2 x3 x4 x5 x1 x2 x3 x4 x5
TRA TRA
1 138,1 110,8 138,7 137,4 125,4 11 139,6 127,9 151,1 143,7 110,5
2 149,3 142,1 105,0 134,0 92,3 12 125,3 160,2 130,4 152,4 165,1
3 115,9 235,6 124,2 155,0 117,4 13 145,7 101,8 149,5 113,3 151,8
4 118,5 116,5 130,2 122,6 100,2 14 138,6 139,0 131,9 140,2 141,1
5 108,2 123,8 117,1 142,4 150,9 15 110,1 114,6 165,1 113,8 139,6
6 102,8 112,0 135,0 135,0 145,8 16 145,2 101,0 154,6 120,2 117,3
7 120,4 84,3 112,8 118,5 119,3 17 125,9 135,3 121,5 147,9 105,0
8 132,7 151,1 124,0 123,9 105,1 18 129,7 97,3 130,5 109,0 150,5
9 136,4 126,2 154,7 127,1 173,2 19 123,4 150,0 161,6 148,4 154,2
10 135,0 115,4 149,1 138,3 130,4 20 144,8 138,3 119,6 151,8 142,7

Construir gráficos de controle 𝑋̅ e 𝑅 para esse processo. O processo está sob controle?

3. Os dados apresentados a seguir são a média e a amplitude de 24 amostras de tamanho 5


tomadas de um processo de produção de eixos. Calcular os limites de controle para o gráfico da
média e para o gráfico da amplitude.

AMOSTRA 𝑋̅𝑗 R AMOSTRA 𝑋̅𝑗 R AMOSTRA 𝑋̅𝑗 R


147

1 34,95 0,22 9 35,08 0,37 17 35,00 0,28


2 35,05 0,33 10 35,02 0,09 18 35,04 0,29
3 35,01 0,27 11 34,98 0,33 19 35,0 0,27
4 34,97 0,16 12 34,98 0,23 20 34,81 0,27
5 35,02 0,39 13 35,03 0,15 21 34,96 0,29
6 34,95 0,19 14 35,05 0,29 22 35,05 0,18
7 34,96 0,21 15 35,00 0,31 23 35,02 0,29
8 34,97 0,27 16 34,92 0,18 24 35,03 0,29

4. A tabela abaixo apresenta as medidas dos diâmetros internos (mm) de anéis de pistão de
motores de automóveis.

AMOSTRA X1 X2 X3 X4 X5
1 74,030 74,002 74,019 73,992 74,008
2 73,995 73,992 74,001 74,011 74,004
3 73,988 74,024 74,021 74,005 74,002
4 74,002 73,996 73,993 74,015 74,009
5 73,992 74,007 74,015 73,989 74,014
6 74,009 73,994 73,997 73,985 73,993
7 73,995 74,006 73,994 74,000 74,005
8 73,985 74,003 73,993 74,015 73,988
9 74,008 73,995 74,009 74,005 74,004
10 73,998 74,000 73,990 74,007 73,995
11 73,994 73,998 73,994 73,995 73,990
12 74,004 74,000 74,007 74,000 73,996
13 73,983 74,002 73,998 73,997 74,012
14 74,006 73,967 73,994 74,000 73,984
15 74,012 74,014 73,998 73,999 74,007
16 74,000 73,984 74,005 73,998 73,996
17 73,994 74,012 73,986 74,005 74,007
18 74,006 74,010 74,018 74,003 74,000
19 73,984 74,002 74,003 74,005 73,997
20 74,000 74,010 74,013 74,020 74,003
21 73,982 74,001 74,015 74,005 73,996
22 74,004 73,999 73,990 74,006 74,009
23 74,010 73,989 73,990 74,009 74,014
24 74,015 74,008 73,993 74,000 74,010
25 73,982 73,984 73,995 74,017 74,013

Construir os gráficos de controle de 𝑋̅ e 𝑅.


5. Usa-se um gráfico de controle para a fração não conformes de uma parte plástica fabricada em
um processo de moldagem por injeção. Dez amostras fornecem os seguintes dados:
TAMANHO DA NÚMERO DE NÃO
AMOSTRA
AMOSTRA CONFORMES
1 100 10
2 100 15
3 100 31
4 100 18
5 100 24
6 100 12
7 100 23
8 100 15
9 100 8
10 100 8
6. Um processo produz correias de transmissão de borracha em lotes de tamanho 2500. Inspeção
dos últimos 20 lotes mostram os seguintes dados.
148

UNIDADES NÃO UNIDADES NÃO


No. LOTE No. LOTE
CONFORMES CONFORMES
1 230 11 456
2 435 12 394
3 221 13 285
4 346 14 331
5 230 15 198
6 327 16 414
7 285 17 131
8 311 18 269
9 342 19 221
10 308 20 407

Calcular os limites de controle para fração de não conformes e construir o gráfico.

7. Um altímetro é considerado defeituoso se não pode ser calibrado ou corrigido para fornecer
leituras precisas (dentro de 20 fit, ou aproximadamente 6,10 metros de altitude real). Uma empresa
produz altímetros em lotes de 100, e cada altímetro é testado e se determina se é aceitável ou
defeituoso. A seguir, estão listados os números de altímetros defeituosos em lotes sucessivos de
100. Construa um gráfico de controle para a proporção p de altímetros defeituosos e determine se
o processo está sob controle estatístico.

LOTES 1 2 3 4 5 6 7 8 9 10 11 12
ALTÍMETROS
DEFEITUOSOS
2 0 1 3 1 2 2 4 3 5 3 7
149

BIBLIOGRAFIA

1. AMADEU, M. S. U. S. et. al. Manual de normalização de documentos científicos de acordo com


as normas da ABNT. Curitiba: Ed. UFPR, 2015.
2. BARBETTA, P. A.; REIS, M. M.; BORNIA, A. C. Estatística para cursos de engenharia e
informática. 3a. ed. São Paulo: Ed. Atlas S. A., 2010.
3. BUSSAB, W.O.; MORETTIN, P. A. Estatística Básica. 5ª Edição, Editora Saraiva, 2002.
4. COSTA NETO, P. L. O. Estatística. 2 ed. rev., São Paulo: Edgard Blücher, 1994.

5. DEVORE, J. L. Probabilidade e estatística para engenharia e ciências. São Paulo: Pioneira


Thomson Learning, 2006.
6. GUPTA, B. C; GUTTMAN, I. Estatística e probabilidade com aplicações para engenheiros e
cientistas. Rio de Janeiro: LTC, 2017.
7. MARQUES, J. M.; MARQUES, M. A. M. Estatística Básica para os Cursos de Engenharia.
Curitiba: Domínio do Saber. 2009.
8. MARTINS, G.A; DOMINGUES, O. Estatística geral e aplicada. São Paulo: Atlas, 2019.
9. MEYER, P. L. Probabilidade. Aplicações à Estatística. Rio de Janeiro: Livros Técnicos e
Científicos, 1978.
10. MONTGOMERY, D. C.; RUNGER, G. C. Estatística Aplicada e Probabilidade para
Engenheiros. 4 ed. Rio de Janeiro: LTC, 2009.
11. MONTGOMERY, D. C. Introdução ao controle estatístico da qualidade. Rio de Janeiro: LTC,
2009.
12. RYAN, T. Estatística Moderna para Engenharia. Rio de Janeiro: Elsevier, 2009.
13. SPIEGEL, M. R. Estatística. Coleção Schaum. McGraw-Hill do Brasil Ltda.
14. SPIEGEL, M. R. et al. Probabilidade e estatística. Porto Alegre: Bookman, 2013.
15. TRIOLA, M. F. Introdução à Estatística. 10. ed. Rio de Janeiro: LTC, 2008.
150

APÊNDICE 1 – MÉTODOS DE OBTENÇÃO DE ESTIMADORES


151

1 MÉTODO DOS MOMENTOS

De acordo com Montgomery e Runger (2009): Seja 𝑋1 , 𝑋2 , … , 𝑋𝑛 uma amostra aleatória de


distribuição de probabilidade 𝑓(𝑥), podendo ser uma função discreta de probabilidade ou de função
continua de densidade de probabilidade. O k-ésimo momento da população é 𝐸(𝑋 𝑘 ), 𝑘 = 1, 2, … .
e o k-ésimo momento na amostra é:
𝑛
1
∑ 𝑋𝑖𝑘 , 𝑘 = 1, 2, …
𝑛
𝑖=1

Aplicação:

Sejam 𝑋1 , 𝑋2 , … , 𝑋𝑛 uma amostra aleatória da distribuição normal com parâmetros 𝜇 e 𝜎 2 .


Para a distribuição normal, tem-se que: 𝐸(𝑋) = 𝜇 e 𝐸(𝑋 2 ) = 𝜎 2 + 𝜇2
1
O primeiro momento da amostra é ∑𝑛𝑖=1 𝑥𝑖 , que é igual a 𝑋̅. Igualando os dois
𝑛
momentos tem-se: 𝜇̂ = 𝑋̅
1
O segundo momento da amostra é ∑𝑛𝑖=1 𝑥𝑖2 . Igualando os dois momentos tem-se:
𝑛
𝑛
1
𝜎̂ + 𝜇̂ = ∑ 𝑥𝑖2
2 2
𝑛
𝑖=1
Logo:
𝑛
1 ∑𝑛𝑖=1 𝑥𝑖2 − 𝑛𝑋̅ 2 ∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)2
𝜎̂ = ∑ 𝑥𝑖2 − 𝜇̂ 2 =
2
=
𝑛 𝑛 𝑛
𝑖=1

2 MÉTODO DA MÁXIMA VEROSSIMILHANÇA

Suponha que X seja uma variável aleatória com distribuição de probabilidade 𝑓(𝑥, 𝜃) em
que 𝜃 é um único parâmetro desconhecido. Sejam 𝑥1 , 𝑥2 , … , 𝑥𝑛 os valores observados na amostra
aleatória de tamanho n. Então, a função de verossimilhança da amostra é
𝐿(𝜃) = 𝑓(𝑥1 , 𝜃) ∙ 𝑓(𝑥2 , 𝜃) ∙ … ∙ 𝑓(𝑥𝑛 , 𝜃)
Se 𝜃̂ é o valor de 𝜃 que maximiza, 𝐿(𝜃) então 𝜃̂ é o estimador de máxima verossimilhança de 𝜃.
(MONTGOMERY e RUNGER, 2009).
Aplicação:

Sejam 𝑋1 , 𝑋2 , … , 𝑋𝑛 uma amostra aleatória da distribuição normal com parâmetros 𝜇 e 𝜎 2 .


Tem-se que:
𝐿(𝜇, 𝜎 2 ) = 𝑓(𝑥1 ; 𝜇, 𝜎 2 ) ∙ 𝑓(𝑥2 ; 𝜇, 𝜎 2 ) ∙ … ∙ 𝑓(𝑥𝑛 ; 𝜇, 𝜎 2 )
1 1 𝑥𝑖 −𝜇 2
∑𝑛𝑖=1{−2( 𝜎 ) }
𝐿(𝜇, 𝜎 2 ) = 𝑒
(2𝜋𝜎 2 )𝑛/2
Tomando-se o logaritmo:
𝑛
𝑛 𝑛 1 𝑥𝑖 − 𝜇 2
𝑙𝑛 𝐿(𝜇, 𝜎2 ) = − 𝑙𝑛𝜎 2 − ln(2𝜋) − ∑ {− ( ) }
2 2 2 𝜎
𝑖=1

Derivando a expressão acima em relação a 𝜇:


152

𝑛
𝜕𝑙𝑛𝐿(𝜇, 𝜎 2 ) 1 ∑𝑛𝑖=1 𝑥𝑖 − 𝑛𝜇
= 2 ∑(𝑥𝑖 − 𝜇) =
𝜕𝜇 𝜎 𝜎2
𝑖=1

Igualando a zero:

∑𝑛𝑖=1 𝑥𝑖 − 𝑛𝜇
=0
𝜎2
∑𝑛𝑖=1 𝑥𝑖
𝜇̂ = = 𝑋̅
𝑛
Derivando a expressão 𝑙𝑛 𝐿(𝜇, 𝜎2 ) em relação a 𝜎 2 :

𝜕𝑙𝑛𝐿(𝜇, 𝜎 2 ) 𝑛 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2


=− 2+
𝜕𝜇 2𝜎 2𝜎 4
Igualando a zero:
𝑛 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2
− + =0
2𝜎 2 2𝜎 4

−𝑛𝜎 2 + ∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2


=0
2𝜎 4
𝑛

−𝑛𝜎 + ∑(𝑥𝑖 − 𝜇)2 = 0


2

𝑖=1
∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2
𝜎̂ 2 =
𝑛

3 MÉTODO DOS MÍNIMOS QUADRADOS

O modelo de regressão linear simples é ser expresso através de:


𝑌 = 𝛼 + 𝛽𝑋
Os parâmetros 𝛼 e 𝛽 são estimados através de dados amostrais com n observações, e a
reta estimada é dada por:
𝑌̂ = 𝑎 + 𝑏𝑋
Seja 𝑒𝑖 a distância da reta estimada aos pontos amostrais. O método dos mínimos
quadrados minimiza a soma de 𝑒𝑖2 .
𝑛 𝑛 𝑛

∑ 𝑒𝑖2 = ∑(𝑦𝑖 − 𝑦̂𝑖 ) = ∑(𝑦𝑖 − [𝑎 + 𝑏𝑥𝑖 ])2


2

𝑖=1 𝑖=1 𝑖=1

Desenvolvendo o polinômio tem-se:


𝑛 𝑛

𝑓= ∑(𝑦𝑖2 − 2[𝑎 + 𝑏𝑥𝑖 ]𝑦𝑖 + (𝑎 + 𝑏𝑥𝑖) ) = ∑(𝑦𝑖2 − 2𝑎𝑦𝑖 − 2𝑏𝑥𝑖 𝑦𝑖 + 𝑎2 + 2𝑎𝑏𝑥𝑖 + 𝑏 2 𝑥𝑖2 )
2

𝑖=1 𝑖=1

Derivando a função acima em relação a “a” e em relação a “b”, tem-se:


153

𝑛 𝑛
𝜕𝑓
= −2 ∑ 𝑦𝑖 + 2𝑛𝑎 + 2 ∑ 𝑥𝑖
𝜕𝑎
𝑖=1 𝑖=1
𝑛 𝑛 𝑛
𝜕𝑓
= −2 ∑ 𝑥𝑖 𝑦𝑖 + 2𝑎 ∑ 𝑥𝑖 + 2𝑏 ∑ 𝑥𝑖2
𝜕𝑏
𝑖=1 𝑖=1 𝑖=1

Dividindo ambos os lados da igualdade das duas funções por 2 e igualando a zero, tem-
se:
𝑛 𝑛

− ∑ 𝑦𝑖 + 𝑛𝑎 + 𝑏 ∑ 𝑥𝑖 = 0
𝑖=1 𝑖=1
𝑛 𝑛 𝑛

− ∑ 𝑥𝑖 𝑦𝑖 + 𝑎 ∑ 𝑥𝑖 + 𝑏 ∑ 𝑥𝑖2 = 0
𝑖=1 𝑖=1 𝑖=1

Reorganizando obtém-se o sistema de duas equações:


𝑛 𝑛

∑ 𝑦𝑖 = 𝑛𝑎 + 𝑏 ∑ 𝑥𝑖
𝑖=1 𝑖=1
𝑛 𝑛 𝑛

∑ 𝑥𝑖 𝑦𝑖 = 𝑎 ∑ 𝑥𝑖 + 𝑏 ∑ 𝑥𝑖2
𝑖=1 𝑖=1 𝑖=1

A solução analítica do sistema de equações fornece os valores de “a” e “b”, apresentados


a seguir:
𝑎 = 𝑌̅ − 𝑏𝑋̅
∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅)𝑦𝑖
𝑏=
∑𝑛𝑖=1(𝑥𝑖 − 𝑋̅ )2
154

APÊNDICE 2 – TESTES DE ADERÊNCIA


155

TESTES DE ADERÊNCIA

Também chamados de testes de bondade do ajustamento, servem para testar a hipótese


de que uma determinada amostra aleatória tenha sido extraída de uma população com distribuição
especificada.
Seja 𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛 uma amostra aleatória de uma população 𝑋 com função (densidade) de
probabilidade 𝑓 desconhecida e 𝑓0 a função (densidade) de probabilidade proposta. Assim, as
hipóteses a serem testadas são:
𝐻0 : 𝑓(𝑋) = 𝑓0 (𝑋)
𝐻1 : 𝑓(𝑋) ≠ 𝑓0 (𝑋)

Existem diferentes testes de ajustamento que possibilitam testar as hipóteses acima. Por
exemplo, o teste de ajustamento do Qui-quadrado (sugerido por Karl Pearson).

1 TESTE DO QUI-QUADRADO

Seja uma amostra aleatória de 𝑛 elementos, retirada de uma população com distribuição
desconhecida, a partir dos quais se observa uma determinada característica (variável) qualitativa
ou quantitativa. Os valores assumidos pela característica em estudo são inicialmente divididos em
𝑘 classes mutuamente exclusivas, 𝐴1 , 𝐴2 , ⋯ , 𝐴𝑘 .
A estatística de teste é dada por:
𝑘
2
𝑂𝑖 − 𝐸𝑖 2
𝜒 = ∑( )
𝐸𝑖
𝑖=1

sendo 𝐸𝑖 obtida através de:


𝐸𝑖 = 𝑛 × 𝑝𝑖

onde:
𝑂𝑖 são os números de observações ou frequências absolutas observadas da classe 𝐴𝑖 ;
𝑛 é o número total de observações;
𝑝𝑖 são as probabilidades de obter uma observação na classe 𝐴𝑖 ;

Sendo verdadeira a hipótese nula, a estatística acima tem distribuição assintótica do Qui-
2
quadrado com (𝑘 − 𝑝 − 1) graus de liberdade, ou seja, 𝜒(𝑘−𝑝−1) , onde 𝑘 representa o número de
classes e 𝑝 o número de parâmetros da distribuição da população, estimados a partir da amostra.

Para utilizar este teste tem-se as seguintes regras:


a) A dimensão da amostra deve ser não inferior a 30 (𝑛 ≥ 30);
b) A frequência esperada em cada classe deve ser 𝑛 ≥ 5.

Se esta última condição não prevalecer, o teste pode ainda ser utilizado, embora com
moderada confiança se, não mais de 20% dos valores de 𝐸𝑖 forem inferiores a 5 e nenhum for
inferior a 1. Quando tal não se verificar, procuram-se agregar classes adjacentes, de forma a obter
novas classes que satisfaçam esta condição.
156

2 2
Se 𝜒𝑐𝑎𝑙𝑐 ≤ 𝜒𝑐𝑟í𝑡𝑖𝑐𝑜 , não se rejeita 𝐻𝑜 (Há aderência a distribuição especificada)
2 2
Se 𝜒𝑐𝑎𝑙𝑐 > 𝜒𝑐𝑟í𝑡𝑖𝑐𝑜 , rejeita-se 𝐻𝑜 (Não há aderência a distribuição especificada).

Graficamente tem-se:

1.1 TESTE DE ADERÊNCIA PARA A DISTRIBUIÇÃO DE POISSON


O teste tem como objetivo testar a aderência dos dados à distribuição de Poisson.
A distribuição de Poisson pode ser aplicada a muitos casos práticos nos quais interessa o
número de vezes que um determinado evento pode ocorrer durante um intervalo de tempo ou
distância, área ou outra unidade de medida análoga.
Uma variável aleatória discreta X tem distribuição de Poisson se sua função de
probabilidade é dada por:

𝑒 −𝜆 𝜆𝑥
𝑃(𝑋 = 𝑥) = , 𝑥 = 0, 1, 2 … e 𝜆 > 0
𝑥!

Os parâmetros da distribuição são:


Média: 𝐸(𝑋) = 𝜆
Variância: 𝑉(𝑋) = 𝜆
Exemplo:

Supõe-se que o número de defeitos nas placas de circuito impresso segue a distribuição de
Poisson. Uma amostra de 60 placas impressas foi coletada e observou-se o número de defeitos,
apresentados a seguir.

NÚMERO DE FREQUÊNCIA
DEFEITOS OBSERVADA
0 32
1 15
2 9
3 4

A forma da distribuição de defeitos é Poisson? Usar 𝛼 = 0,05 .

As hipóteses a serem testadas:


𝐻𝑜 : A distribuição de defeitos se ajusta à distribuição de Poisson
𝐻′ : A distribuição de defeitos não se ajusta à distribuição de Poisson
157

É possível obter as probabilidades para cada valor de X.

NO. DE
No. DE
MÁQUINAS 𝑃(𝑋 = 𝑥𝑖 )
DEFEITOS (𝑥𝑖 )
(Freq.)
0 32 0,53
1 15 0,25
2 9 0,15
3 4 0,07
TOTAL 60 1,00

Tem-se que o número médio de defeitos é dado por:


𝑛 𝑛

𝐸(𝑋) = ∑ 𝑥𝑖 𝑃(𝑋 = 𝑥𝑖 ) = ∑ 𝑥𝑖 𝑝(𝑥𝑖 )


𝑖=1 𝑖=1

𝐸(𝑋) = 0 × 0,53 + 1 × 0,25 + 2 × 0,15 + 3 × 0,07 = 0,75


A função de probabilidade da distribuição de Poisson é dada por:
𝑒 −𝜆 𝜆𝑥
𝑃(𝑋 = 𝑥) =
𝑥!
onde:
Média: 𝐸(𝑋) = 𝜆 = 0,75
Tem-se então que:
𝑒 −0,75 0,750
𝑃(𝑋 = 0) = = 0,472
0!
𝑒 −0,75 0,751
𝑃(𝑋 = 1) = = 0,354
1!

𝑒 −0,75 0,752
𝑃(𝑋 = 2) = = 0,133
2!
𝑒 −0,75 0,753
𝑃(𝑋 = 3) = = 0,033
3!
As frequências esperadas são obtidas pela multiplicação do tamanho da amostra ( 𝑛 =
60) pelas probabilidades (𝑝𝑖 = 𝑃(𝑋 = 𝑥𝑖 )), ou seja, 𝐸𝑖 = 𝑛 × 𝑝𝑖 . As frequências observadas e as
esperadas estão apresentadas na tabela abaixo.

NÚMERO DE FREQUÊNCIA FREQUÊNCIA


DEFEITOS OBSERVADA ESPERADA
0 32 60 × 0,472 = 28,32
1 15 60 × 0,354 = 21,24
2 9 60 × 0,133 = 7,98
3 4 60 × 0,033 = 1,98
TOTAL 60 59,52

É necessário ajustar a frequência esperada, como segue:


158

28,32
× 60 = 28,548 ≅ 28,55
59,52

21,24
× 60 = 21,411 ≅ 21,41
59,52

7,98
× 60 = 8,044 ≅ 8,04
59,52

1,98
× 60 = 1,996 ≅ 2,00
59,52

A estatística de teste é:
𝑘
2
(𝑂𝑖 − 𝐸𝑖 )2 (32 − 28,55)2 (15 − 21,41)2 (9 − 8,04)2 (4 − 2,00)2
𝜒 =∑ = + + + = 4,45
𝐸𝑖 28,55 21,41 8,04 2,00
𝑖=1

O número de graus de liberdade é 𝑘 − 𝑝 − 1, onde 𝑘 representa o número de classes e 𝑝


o número de parâmetros da distribuição da população estimados a partir da amostra. Assim tem-
se: 𝑔. 𝑙. = 4 − 1 − 1 = 2
O valor de 𝜒 2 tabelado com 2 graus de liberdade e 5% de significância é 5,99.

Conclusão:
2 2
Como 𝜒𝑐𝑎𝑙𝑐 = 4,45 é menor que 𝜒0,05;2𝑔.𝑙. = 5,99, não se rejeita a hipótese de que a
distribuição de defeitos é Poisson.

1.2 TESTE DE ADERÊNCIA PARA A DISTRIBUIÇÃO BINOMIAL

O teste tem como objetivo testar a aderência dos dados à distribuição binomial.
Uma variável aleatória discreta X, que conta o número de sucessos em n provas
independentes, que apresentam os resultados sucesso (𝑝) ou fracasso (𝑞 = 1 − 𝑝) , tem
distribuição binomial. Sua função de probabilidade é dada por:

𝑃(𝑋 = 𝑥) = (𝑛𝑥)𝑝 𝑥 𝑞 𝑛−𝑥 = 𝐶𝑛𝑥 𝑝 𝑥 𝑞 𝑛−𝑥 , 𝑥 = 0,1,2, … , 𝑛 e 0 < 𝑝 < 1

Os parâmetros da distribuição são:


Média: 𝐸(𝑋) = 𝑛𝑝
Variância: 𝑉(𝑋) = 𝑛𝑝𝑞

Exemplo:
Foram inspecionados 100 lotes, cada um com 3 válvulas. A distribuição a seguir, apresenta a
variável X, que é o número de válvulas defeituosas por lote. Testar a hipótese de que a
distribuição é binomial, utilizando 𝛼 = 0,01.

No. de defeituosos 0 1 2 3 Total


No. de lotes 65 30 4 1 100
159

O número médio (média ou valor esperado) de válvulas defeituosas observadas é calculada


por:
𝑛

𝐸(𝑋) = ∑ 𝑥𝑖 𝑝(𝑥𝑖 )
𝑖=1
65 30 4 1
𝐸(𝑋) = 0 × +1× +2× +3× = 0,41
100 100 100 100
A distribuição binomial é dada por:
𝑛
𝑃(𝑋 = 𝑥) = ( ) 𝑝 𝑥 𝑞𝑛−𝑥 = 𝐶𝑛𝑥 𝑝 𝑥 𝑞𝑛−𝑥
𝑥
onde 𝑝 é a probabilidade de uma válvula ser defeituosa.
A média da distribuição binomial é 𝐸(𝑋) = 𝑛𝑝 (parâmetro da distribuição binomial), assim,
𝐸(𝑋) = 3𝑝 .
Tem-se que 𝐸(𝑋) = 0,41, e assim, 3𝑝 = 0,41, portanto, 𝑝 = 0,14 e consequentemente,
𝑞 = 0,86. Então, a distribuição binomial ajustada é:
𝑃(𝑋 = 𝑥) = 𝐶3𝑥 (0,14)𝑥 (0,86)3−𝑥
As probabilidades são:
𝑃(𝑋 = 0) = 𝐶30 (0,14)0 (0,86)3−0 = 0,6361
𝑃(𝑋 = 1) = 𝐶31 (0,14)1 (0,86)3−1 = 0,3106
𝑃(𝑋 = 2) = 𝐶32 (0,14)2 (0,86)3−2 = 0,0506
𝑃(𝑋 = 3) = 𝐶33 (0,14)3 (0,86)3−3 = 0,0027

Foram agrupadas as duas últimas classes, pois a frequência esperada da última classe é
menor do que 1.
As probabilidades, as frequências teóricas e observadas são:

No. DE
FREQ. TEÓRICA FREQ. OBS.
DEFEITUOSAS 𝑃(𝑋 = 𝑥𝑖 ) (𝐸𝑖 ) (𝑂𝑖 )
(𝑥𝑖 )
0 0,6361 100 × 0,6361 = 63,61 65
1 0,3106 100 × 0,3106 = 31,06 30
≥2 0,0533 100 × 0,0533 = 5,33 5

𝑘
(𝑂𝑖 − 𝐸𝑖 )2 (65 − 63,61)2 (30 − 31,06)2 (5 − 5,33)2
𝜒2 = ∑ = + +5 = 0,0870
𝐸𝑖 63,61 31,06 5,33
𝑖=1
O número de graus de liberdade é 𝑘 − 𝑝 − 1, onde 𝑘 representa o número de classes e 𝑝
o número de parâmetros da distribuição da população estimados a partir da amostra. Assim tem-
se: 𝑔. 𝑙. = 3 − 1 − 1 = 1

O valor de 𝜒 2 tabelado com 1 grau de liberdade e 1% de significância é 6,635.


Conclusão:
2 2
Como 𝜒𝑐𝑎𝑙𝑐 = 0,087 é menor que 𝜒0,01;1𝑔.𝑙. = 6,635, não se rejeita a hipótese de que a
distribuição de válvulas defeituosas é binomial.
160

APÊNDICE 3 - VERIFICAÇÃO DA NORMALIDADE DOS DADOS


161

VERIFICAÇÃO DA NORMALIDADE DOS DADOS

A suposição de normalidade pode ser verificada graficamente ou através de testes


estatísticos. É usual a utilização do gráfico normal probabilístico (QQ-normal) e os testes mais
utilizados são: Teste de Shapiro-Wilk e Kolmogorov-Smirnov com correção de Lilliefors.

1 GRÁFICO PARA VERIFICAR NORMALIDADE

1.1 Gráfico normal probabilístico (QQ-normal)

Para construir o gráfico de probabilidade normal, as observações na amostra são


inicialmente ordenadas, da menor para maior 𝑥(𝑖) . Calcula-se as frequências cumulativas
observadas, Φ(𝑧𝑖 ) = (𝑖 − 0,5)/𝑛 (função de distribuição cumulativa de uma normal padrão) e,
obtém-se o valor de 𝑧𝑖 . E, são plotados os valores de 𝑧𝑖 versus 𝑥(𝑖) .

Exemplo: Dez observações sobre o tempo (em minutos) efetivo de serviço de baterias usadas em
um computador pessoal são: (retirado de Montgomery e Runger, 2009)
176 191 214 220 205 192 201 190 183 185

As observações são ordenadas (𝑥(𝑖) ) e numeradas (𝑖). Calcula-se as frequências


cumulativas Φ(𝑧𝑖 ) e obtém-se os valores de 𝑧𝑖 .

𝑖 𝑥(𝑖) Φ(𝑧𝑖 ) = (𝑖 − 0,5)/10 𝑧𝑖


1 176 0,05 -1,64
2 183 0,15 -1,04
3 185 0,25 -0,67
4 190 0,35 -0,39
5 191 0,45 -0,13
6 192 0,55 0,13
7 201 0,65 0,39
8 205 0,75 0,67
9 214 0,85 1,04
10 220 0,95 1,64

O gráfico QQ-normal é construído plotando-se os pares (𝑧𝑖 , 𝑥(𝑖) ), como apresentado a


seguir.
162

2 TESTES PARA VERIFICAR A NORMALIDADE

2.1 Teste de Lilliefors (Kolmogorov-Smirnov com correção de Liliefors)

O teste de Lilliefors é utilizado para verificar a aderência dos dados a uma distribuição
normal. Lilliefors modificou o teste de Kolmogorov-Smirnov, utilizando as estimativas de média e
variância dos dados.
As hipóteses a serem testadas são:
𝐻0 : a amostra provém de uma população que segue uma distribuição normal
𝐻1 : a amostra não provém de uma população que segue uma distribuição normal

Calcula-se a estatística de teste, D, em termos da amostra em análise:


𝐷 = 𝑚𝑎𝑥 {|𝐹(𝑥𝑖 ) − 𝑆(𝑥𝑖 )|, |𝐹(𝑥𝑖 ) − 𝑆(𝑥𝑖−1 )|}
𝑖

Onde:
𝑆(𝑥𝑖 ) é a frequência relativa acumulada observada
𝑥𝑖 − 𝑋̅
𝑍𝑖 =
𝑆
𝐹(𝑥𝑖 ) = 𝑃(𝑥𝑖 ≤ 𝑍𝑖 )

Se 𝐷 < 𝐷𝑐𝑟í𝑡𝑖𝑐𝑜 , não se rejeita a hipótese 𝐻𝑜 , caso contrário, rejeita-se 𝐻𝑜 .

Exemplo:
Dez observações sobre o tempo (em minutos) efetivo de serviço de baterias usadas em um
computador pessoal são: (retirado de Montgomery e Runger, 2009)
176 191 214 220 205 192 201 190 183 185
𝐻0 : a amostra provém de uma população que segue uma distribuição normal
𝐻1 : a amostra não provém de uma população que segue uma distribuição normal

𝑖 𝑥𝑖 𝑓𝑟𝑖 𝑆(𝑥𝑖 ) 𝑍𝑖 𝐹(𝑥𝑖 ) |F(𝑥𝑖 ) − 𝑆(𝑥𝑖 )| |F(𝑥𝑖 ) − 𝑆(𝑥𝑖−1 )|


1 176 0,10 0,10 -1,404 0,0801 0,0199 0,0801
2 183 0,10 0,20 -0,905 0,1827 0,0173 0,0827
3 185 0,10 0,30 -0,763 0,2228 0,0772 0,0228
4 190 0,10 0,40 -0,406 0,3423 0,0577 0,0423
5 191 0,10 0,50 -0,335 0,3688 0,1312 0,0312
6 192 0,10 0,60 -0,264 0,3960 0,2040 0,1040
7 201 0,10 0,70 0,378 0,6472 0,0528 0,0472
8 205 0,10 0,80 0,663 0,7463 0,0537 0,0463
9 214 0,10 0,90 1,304 0,9039 0,0039 0,1039
10 220 0,10 1,00 1,732 0,9584 0,0416 0,0584
𝑋̅ 195,70
𝑆 14,03

O valor da estatística de teste é:

𝐷 = 𝑚𝑎𝑥 {|𝐹(𝑥𝑖 ) − 𝑆(𝑥𝑖 )|, |𝐹(𝑥𝑖 ) − 𝑆(𝑥𝑖−1 )|} = 0,2040


𝑖
163

O valor crítico para nível de significância de 5% é 𝐷0,05= 0,258, portanto menor que 0,2040,
logo, não se rejeita 𝐻𝑜 .

2.2 Teste de Shapiro-Wilk

O método de Shapiro-Wilk fornece o valor da estatística 𝑊, variando de 0 a 1. A estatística


do teste é dada por:

∑𝑛/2
𝑖=1 𝑎𝑛−𝑖+1 × (𝑥(𝑛−𝑖+1) − 𝑥(𝑖) ) 𝑠𝑒 𝑛 𝑝𝑎𝑟
𝑏2
𝑊= 𝑛
{∑𝑖=1(𝑥𝑖 −𝑋)2 }
, onde 𝑏={
∑(𝑛+1)/2
𝑖=1 𝑎𝑛−𝑖+1 × (𝑥(𝑛−𝑖+1) − 𝑥(𝑖) ) 𝑠𝑒 𝑛 í𝑚𝑝𝑎𝑟

em que 𝑥1 ≤ 𝑥2 ≤. . . ≤ 𝑥𝑛 são dados ordenados, em ordem crescente, e os 𝒂′𝒊 𝒔 são constantes


tabelados.
Este teste é utilizado quando o conjunto de observações é pequeno (𝑛 ≤ 50).

As hipóteses a serem testadas são:


𝐻𝑜 : A amostra é proveniente de uma população com distribuição normal
𝐻1 : A amostra não é proveniente de uma população com distribuição normal

A estatística 𝑊 é comparada ao valor obtido em tabelas, caso 𝑊 < 𝑊𝑐𝑟𝑖𝑡𝑖𝑐𝑜 , o teste rejeita
𝐻0 , indicando a não normalidade das observações.

Exemplo:
Dez observações sobre o tempo (em minutos) efetivo de serviço de baterias usadas em um
computador pessoal são: (retirado de Montgomery e Runger, 2009)
176 191 214 220 205 192 201 190 183 185
𝐻0 : a amostra provém de uma população que segue uma distribuição normal
𝐻1 : a amostra não provém de uma população que segue uma distribuição normal

𝑖 𝑥𝑖 ∑(𝑥𝑖 − 𝑋̅ )2
𝑖=1
1 176 388,09
2 183 161,29
3 185 114,49
4 190 32,49
5 191 22,09
6 192 13,69
7 201 28,09
8 205 86,49
9 214 334,89
10 220 590,49
Soma 1.772,10
𝑋̅ 195,70
𝑆 14,03
164

𝑛−𝑖
𝑖 𝑎𝑛−𝑖+1 𝑥𝑛−𝑖+1 𝑥𝑖 𝑎𝑛−𝑖+1 (𝑥𝑛−𝑖+1 − 𝑥𝑖 )
+1
1 10 0,5739 220 176 25,2516
2 9 0,3291 214 183 10,2021
3 8 0,2141 205 185 4,2820
4 7 0,1224 201 190 1,3464
5 6 0,0399 192 191 0,0399
SOMA 41,122

𝑏 = 41,122
𝑏2 41,1222
𝑊= 𝑛 = = 0,9543
{∑𝑖=1(𝑥𝑖 − 𝑋)2 } 1.772,10

O valor de 𝑊 > 𝑊0,05 = 0,842, logo, não se rejeita 𝐻𝑜 , portanto, a amostra provém de uma
população que segue uma distribuição normal.
165

ANEXOS
166

TABELA A1.1 – ÁREAS SOB A CURVA NORMAL


Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
-0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
167

TABELA A1.2 – ÁREAS SOB A CURVA NORMAL


Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
168

TABELA A2 - DISTRIBUIÇÃO ‘ t ’ DE STUDENT

TESTE UNILATERAL
P 0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,950 0,975 0,990 0,995

1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657
2 0,142 0,289 0,445 0,617 0,817 1,061 1,386 1,886 2,920 4,303 6,965 9,925
3 0,137 0,277 0,424 0,584 0,765 0,979 1,250 1,638 2,353 3,182 4,541 5,841
4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604
5 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032
6 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707
7 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,500
8 0,130 0,262 0,400 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,897 3,355
9 0,129 0,261 0,398 0,544 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250
10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,813 2,228 2,764 3,169
11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106
12 0,128 0,259 0,395 0,539 0,696 0,873 1,083 1,356 1,782 2,179 2,681 3,055
13 0,128 0,259 0,394 0,538 0,694 0,870 1,080 1,350 1,771 2,160 2,650 3,012
14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,625 2,977
15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,603 2,947
16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,584 2,921
17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898
18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878
19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,540 2,861
20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845
21 0,127 0,257 0,391 0,533 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831
22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819
23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,320 1,714 2,069 2,500 2,807
24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797
25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787
26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779
27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771
28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763
29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756
30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750
40 0,127 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,705
50 0,126 0,255 0,388 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678
60 0,126 0,255 0,387 0,527 0,679 0,848 1,046 1,296 1,671 2,000 2,390 2,660
70 0,126 0,254 0,387 0,527 0,678 0,847 1,044 1,294 1,667 1,994 2,381 2,648
80 0,126 0,254 0,387 0,527 0,678 0,846 1,043 1,292 1,664 1,990 2,374 2,639
90 0,126 0,254 0,387 0,526 0,677 0,846 1,042 1,291 1,662 1,987 2,369 2,632
100 0,126 0,254 0,386 0,526 0,677 0,845 1,042 1,290 1,660 1,984 2,364 2,626
200 0,126 0,254 0,386 0,525 0,676 0,843 1,039 1,286 1,653 1,972 2,345 2,601
300 0,126 0,254 0,386 0,525 0,675 0,843 1,038 1,284 1,650 1,968 2,339 2,592
400 0,126 0,254 0,386 0,525 0,675 0,843 1,038 1,284 1,649 1,966 2,336 2,588
 0,126 0,253 0,385 0,524 0,675 0,842 1,036 1,282 1,645 1,960 2,326 2,576

P 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950 0,980 0,990
TESTE BILATERAL
169

TABELA A3 - DISTRIBUIÇÃO 𝝌𝟐

P 0,005 0,010 0,025 0,050 0,100 0,250 0,750 0,900 0,950 0,975 0,990 0,995

1 0,000 0,000 0,001 0,004 0,016 0,102 1,323 2,706 3,842 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 0,575 2,773 4,605 5,992 7,378 9,210 10,597
3 0,072 0,115 0,216 0,352 0,584 1,213 4,108 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 1,923 5,385 7,779 9,488 11,143 13,277 14,860
5 0,412 0,554 0,831 1,146 1,610 2,675 6,626 9,236 11,071 12,833 15,086 16,750
6 0,676 0,872 1,237 1,635 2,204 3,455 7,841 10,645 12,592 14,449 16,812 18,548
7 0,989 1,239 1,690 2,167 2,833 4,255 9,037 12,017 14,067 16,013 18,475 20,278
8 1,344 1,647 2,180 2,733 3,490 5,071 10,219 13,362 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 4,168 5,899 11,389 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 6,737 12,549 15,987 18,307 20,483 23,209 25,188
11 2,603 3,054 3,816 4,575 5,578 7,584 13,701 17,275 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 8,438 14,845 18,549 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 7,042 9,299 15,984 19,812 22,362 24,736 27,688 29,820
14 4,075 4,660 5,629 6,571 7,790 10,165 17,117 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 11,037 18,245 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 11,912 19,369 23,542 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 10,085 12,792 20,489 24,769 27,587 30,191 33,409 35,719
18 6,265 7,015 8,231 9,391 10,865 13,675 21,605 25,989 28,869 31,526 34,805 37,157
19 6,844 7,633 8,907 10,117 11,651 14,562 22,718 27,204 30,144 32,852 36,191 38,582
20 7,434 8,260 9,591 10,851 12,443 15,452 23,828 28,412 31,410 34,170 37,566 39,997
21 8,034 8,897 10,283 11,591 13,240 16,344 24,935 29,615 32,671 35,479 38,932 41,401
22 8,643 9,543 10,982 12,338 14,042 17,240 26,039 30,813 33,924 36,781 40,289 42,796
23 9,260 10,196 11,689 13,091 14,848 18,137 27,141 32,007 35,173 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 19,037 28,241 33,196 36,415 39,364 42,980 45,559
25 10,520 11,524 13,120 14,611 16,473 19,939 29,339 34,382 37,653 40,647 44,314 46,928
26 11,160 12,198 13,844 15,379 17,292 20,843 30,435 35,563 38,885 41,923 45,642 48,290
27 11,808 12,879 14,573 16,151 18,114 21,749 31,528 36,741 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 22,657 32,621 37,916 41,337 44,461 48,278 50,993
29 13,121 14,257 16,047 17,708 19,768 23,567 33,711 39,088 42,557 45,722 49,588 52,336
30 13,787 14,954 16,791 18,493 20,599 24,478 34,800 40,256 43,773 46,979 50,892 53,672
35 17,192 18,509 20,569 22,465 24,797 29,054 40,223 46,059 49,802 53,203 57,342 60,275
40 20,707 22,164 24,433 26,509 29,051 33,660 45,616 51,805 55,759 59,342 63,691 66,766
45 24,311 25,901 28,366 30,612 33,350 38,291 50,985 57,505 61,656 65,410 69,957 73,166
50 27,991 29,707 32,357 34,764 37,689 42,942 56,334 63,167 67,505 71,420 76,154 79,490
55 31,735 33,571 36,398 38,958 42,060 47,611 61,665 68,796 73,312 77,381 82,292 85,749
60 35,535 37,485 40,482 43,188 46,459 52,294 66,982 74,397 79,082 83,298 88,379 91,952
65 39,383 41,444 44,603 47,450 50,883 56,990 72,285 79,973 84,821 89,177 94,422 98,105
70 43,275 45,442 48,758 51,739 55,329 61,698 77,577 85,527 90,531 95,023 100,425 104,215
75 47,206 49,475 52,942 56,054 59,795 66,417 82,858 91,062 96,217 100,839 106,393 110,286
80 51,172 53,540 57,153 60,392 64,278 71,145 88,130 96,578 101,880 106,629 112,329 116,321
85 55,170 57,634 61,389 64,749 68,777 75,881 93,394 102,079 107,522 112,393 118,236 122,325
90 59,196 61,754 65,647 69,126 73,291 80,625 98,650 107,565 113,145 118,136 124,116 128,299
95 63,250 65,898 69,925 73,520 77,818 85,376 103,899 113,038 118,752 123,858 129,973 134,247
100 67,328 70,065 74,222 77,930 82,358 90,133 109,141 118,498 124,342 129,561 135,807 140,170
110 75,550 78,458 82,867 86,792 91,471 99,666 119,608 129,385 135,480 140,917 147,414 151,949
170

TABELA A4 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR

Nível de significância de 1%

1 1 2 3 4 5 6 7 8 12 24 
2
1 4.052,18 4.999,50 5.403,35 5.624,58 5.763,65 5.858,99 5.928,36 5.981,07 6.106,32 6.234,63 6.365,83
2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,42 99,46 99,50
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,05 26,60 26,13
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,37 13,93 13,46
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 9,89 9,47 9,02
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,72 7,31 6,88
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,47 6,07 5,65
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,67 5,28 4,86
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,11 4,73 4,31
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,71 4,33 3,91
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,40 4,02 3,60
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,16 3,78 3,36
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 3,96 3,59 3,17
14 8,86 6,51 5,56 5,04 4,70 4,46 4,28 4,14 3,80 3,43 3,00
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,67 3,29 2,87
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,55 3,18 2,75
17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,46 3,08 2,65
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,37 3,00 2,57
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,30 2,92 2,49
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,23 2,86 2,42
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,17 2,80 2,36
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,12 2,75 2,31
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,07 2,70 2,26
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,03 2,66 2,21
25 7,77 5,57 4,68 4,18 3,86 3,63 3,46 3,32 2,99 2,62 2,17
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 2,96 2,58 2,13
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 2,93 2,55 2,10
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 2,90 2,52 2,06
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 2,87 2,49 2,03
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 2,84 2,47 2,01
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,66 2,29 1,80
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,50 2,12 1,60
120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,34 1,95 1,38
 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,18 1,79 1,01
171

TABELA A5 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR

Nível de significância de 5%

1 GRAUS DE LIBERDADE DO NUMERADOR


1 2 3 4 5 6 7 8 12 24 
2
1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 243,91 249,05 254,31
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,41 19,45 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,74 8,64 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 5,91 5,77 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,68 4,53 4,37
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,00 3,84 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,57 3,41 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,28 3,12 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,07 2,90 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 2,91 2,74 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,79 2,61 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,69 2,51 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,60 2,42 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,53 2,35 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,48 2,29 2,07
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,42 2,24 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,38 2,19 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,34 2,15 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,31 2,11 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,28 2,08 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,25 2,05 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,23 2,03 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,20 2,01 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,18 1,98 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,16 1,96 1,71
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,15 1,95 1,69
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,13 1,93 1,67
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,12 1,91 1,65
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,10 1,90 1,64
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,09 1,89 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,00 1,79 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 1,92 1,70 1,39
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,83 1,61 1,25
 3,84 3,00 2,61 2,37 2,21 2,10 2,01 1,94 1,75 1,52 1,01
172

TABELA A6 - DISTRIBUIÇÃO ‘F’ DE SNEDECOR

Nível de significância de 10%

1 GRAUS DE LIBERDADE DO NUMERADOR


1 2 3 4 5 6 7 8 12 24 
2
1 39,86 49,50 53,59 55,83 57,24 58,20 58,91 59,44 60,71 62,00 63,33
2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,41 9,45 9,49
3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,22 5,18 5,13
4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,90 3,83 3,76
5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,27 3,19 3,11
6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,90 2,82 2,72
7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,67 2,58 2,47
8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,50 2,40 2,29
9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,38 2,28 2,16
10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,28 2,18 2,06
11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,21 2,10 1,97
12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,15 2,04 1,90
13 3,14 2,76 2,56 2,43 2,35 2,28 2,23 2,20 2,10 1,98 1,85
14 3,10 2,73 2,52 2,39 2,31 2,24 2,19 2,15 2,05 1,94 1,80
15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,02 1,90 1,76
16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 1,99 1,87 1,72
17 3,03 2,64 2,44 2,31 2,22 2,15 2,10 2,06 1,96 1,84 1,69
18 3,01 2,62 2,42 2,29 2,20 2,13 2,08 2,04 1,93 1,81 1,66
19 2,99 2,61 2,40 2,27 2,18 2,11 2,06 2,02 1,91 1,79 1,63
20 2,97 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,89 1,77 1,61
21 2,96 2,57 2,36 2,23 2,14 2,08 2,02 1,98 1,88 1,75 1,59
22 2,95 2,56 2,35 2,22 2,13 2,06 2,01 1,97 1,86 1,73 1,57
23 2,94 2,55 2,34 2,21 2,11 2,05 1,99 1,95 1,85 1,72 1,55
24 2,93 2,54 2,33 2,19 2,10 2,04 1,98 1,94 1,83 1,70 1,53
25 2,92 2,53 2,32 2,18 2,09 2,02 1,97 1,93 1,82 1,69 1,52
26 2,91 2,52 2,31 2,17 2,08 2,01 1,96 1,92 1,81 1,68 1,50
27 2,90 2,51 2,30 2,17 2,07 2,00 1,95 1,91 1,80 1,67 1,49
28 2,89 2,50 2,29 2,16 2,06 2,00 1,94 1,90 1,79 1,66 1,48
29 2,89 2,50 2,28 2,15 2,06 1,99 1,93 1,89 1,78 1,65 1,47
30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,77 1,64 1,46
40 2,84 2,44 2,23 2,09 2,00 1,93 1,87 1,83 1,71 1,57 1,38
60 2,79 2,39 2,18 2,04 1,95 1,87 1,82 1,77 1,66 1,51 1,29
120 2,75 2,35 2,13 1,99 1,90 1,82 1,77 1,72 1,60 1,45 1,19
 2,71 2,30 2,08 1,94 1,85 1,77 1,72 1,67 1,55 1,38 1,01
173

TABELA A7 - VALORES CRÍTICOS ( dc ) PARA TESTE DE LILLIERFORS

n  = 5%  = 1%
4 0,381 0,417
5 0,337 0,405
6 0,319 0,364
7 0,300 0,348
8 0,285 0,331
9 0,271 0,311
10 0,258 0,294
11 0,249 0,284
12 0,242 0,275
13 0,234 0,268
14 0,227 0,261
15 0,220 0,257
16 0,213 0,250
17 0,206 0,245
18 0,200 0,239
19 0,179 0,235
20 0,190 0,231
25 0,173 0,200
30 0,161 0,187
0,886 1,031
n  30 dc = dc =
n n
174

TABELA 8 – COEFICIENTES 𝒂𝒏−𝒊+𝟏 PARA O TESTE DE NORMALIDADE 𝒘 DE


SHAPIRO-WILK

𝑖 ⁄𝑛 2 3 4 5 6 7 8 9 10
1 0,7071 0,7071 0,6872 0,6646 0,6431 0,6233 0,6052 0,5888 0,5739
2 0,0000 0,1677 0,2413 0,2806 0,3031 0,3164 0,3244 0,3291
3 0,0000 0,0875 0,1401 0,1743 0,1976 0,2141
4 0,0000 0,0561 0,0947 0,1224
5 0,0000 0,0399

𝑖 ⁄𝑛 11 12 13 14 15 16 17 18 19 20
1 0,5601 0,5475 0,5359 0,5251 0,5150 0,5056 0,4968 0,4886 0,4808 0,4734
2 0,3315 0,3325 0,3325 0,3318 0,3306 0,3290 0,3273 0,3253 0,3232 0,3211
3 0,2260 0,2347 0,2412 0,2460 0,2495 0,2521 0,2540 0,2553 0,2561 0,2565
4 0,1429 0,1586 0,1707 0,1802 0,1878 0,1939 0,1988 0,2027 0,2059 0,2085
5 0,0695 0,0922 0,1099 0,1240 0,1353 0,1447 0,1524 0,1587 0,1641 0,1686

6 0,0000 0,0303 0,0539 0,0727 0,0880 0,1005 0,1109 0,1197 0,1271 0,1334
7 0,0000 0,0240 0,0433 0,0593 0,0725 0,0837 0,0932 0,0113
8 0,0000 0,0196 0,0359 0,0496 0,0612 0,0711
9 0,0000 0,0163 0,0303 0,0422
10 0,0000 0,0140

Você também pode gostar