Escolar Documentos
Profissional Documentos
Cultura Documentos
1
INTRODUÇÃO
. A Estatística hoje se configura como uma das ciências que mais vem
crescendo em termos de utilização e importância na Engenharia: estudos de
qualidade, confiabilidade, desenvolvimentos de novos produtos, avaliação de
metodologias de produção, novos materiais, etc. são alguns exemplos da
ampla utilização das ferramentas estatísticas para resolução de problemas e
tomada de decisões nesta área.
2
1. CONCEITOS BÁSICOS DE ESTATÍSTICA
Simone Echeveste
b) O padrão de variação nos dados faz com que a resposta não seja óbvia,
ou seja, somente tratando os dados adequadamente é que poderemos
verificar o comportamento das variáveis de estudo.
3
c) Uma análise estatística é composta por métodos para coleta e descrição
dos dados, viabilizando a verificação da força da evidência nos dados
pró ou contra as hipóteses de pesquisa. A presença de uma variação
não previsível nos dados faz disso, muitas vezes, uma tarefa pouco
trivial.
Problema
Tomada de Decisão
4
Rao (1999) define estatística como:
5
Outro conceito importante é o conceito da Variável, que vem a ser a
matéria prima de qualquer pesquisa, ou seja, quando se termina uma coleta de
dados em um primeiro momento dispomos de um conjunto de valores ou ainda
respostas pertinentes as nossas variáveis de pesquisa.
Uma variável (x) é uma característica dos elementos investigados que difere
de um elemento para outro e do qual temos interesse em estudar. Cada
unidade (elemento) da população que é escolhido como parte de uma
amostra fornece uma medida de uma ou mais variáveis, também chamadas
observações.
6
Variáveis Qualitativas nominais: não existe ordenação dentre
as categorias. Exemplos: marca do carro, tipo de fornecedor,
região de produção, etc.
7
c) Corpo da Tabela: é a parte composta por linhas e colunas com as
informações observadas.
d) Rodapé: espaço logo abaixo da tabela que pode ser utilizado para a
apresentação de notas ou observações de natureza informativa.
0 1 0 2 3 3 2 1 0 4
3 1 0 0 4 2 1 0 1 0
8
c) Valores da variável que surgiram: corresponde às quantidades
observadas de parafusos fora da conformidade. Neste caso
encontramos 0, 1, 2, 3 e 4 parafusos.
d) Frequência (f) de cada valor da variável: corresponde ao número de
vezes que cada valor se repetiu.
9
Agora organizamos essa informação através da estrutura de uma tabela
de frequência, considerando todos os seus elementos:
Cálculo da Porcentagem:
Expressão Geral:
IMPORTANTE!!!
De acordo com as normas, as tabelas de frequência não podem ser fechadas dos
lados e nem ter linhas dividindo as categorias da variável. As únicas linhas permitidas
são as que delimitam o cabeçalho e as que delimitam o total e no centro da tabela é
opcional colocar ou não o traço divisório das colunas.
10
Recapitulando
11
Atividades: Conceitos Básicos de Estatística
12
Questão 4. Marque V para verdadeiro e F para falso nas seguintes
afirmativas:
6 5 6 7 8
8 8 8 5 7
8 7 6 8 6
13
Gabarito das atividades propostas
14
2. MEDIDAS ESTATÍSTICAS
Simone Echeveste
Média
Medidas de
tendência Mediana
Central
Moda
Medidas
Estatísticas
Variância
Medidas de Desvio-
Variabilidade padrão
Coeficiente
de variação
15
2.1. MEDIDAS DE TENDÊNCIA CENTRAL
2.1.1. MÉDIA
Notação:
- média populacional
- média amostral
Fórmula:
onde:
= somatório
x – variável (valores obtidos para a variável investigada)
n – tamanho da amostra
16
Exemplo
15 18 18 20 17 18 16
Elementos importantes:
Média:
17
MÉDIA PARA DADOS AGRUPADOS EM TABELAS DE FREQUENCIA
onde:
= somatório
x – variável
f – frequência de cada valor da variável
n – tamanho da amostra
Exemplo
18
= 2,9 peças
2.1.2. MEDIANA
Notação:
Md ou Me
19
Exemplo 1: Quando o tamanho da amostra “n” for ímpar
Mediana (Md)
Mediana
20
Exemplo 2: Quando o tamanho da amostra “n” for par
Mediana
3º) Calcular o ponto médio entre estes dois valores central (somando os dois
valores e dividindo por dois)
Md = 9,0
21
2.1.3. MODA
Notação:
Mo
Exemplo
Moda
Mo = 210 kg/cm2
(este valor se repete quatro vezes na amostra, foi o valor de resistência que
mais se repetiu).
22
Algumas situações podem ocorrer em relação à moda:
1ª) Um conjunto de dados pode não ter moda, ou seja, nenhum valor se repetir
2ª) Um conjunto de dados pode ter mais que uma moda, ou seja, poderemos ter
mais que um valor da variável se repetindo com frequências iguais.
23
2.2. MEDIDAS DE VARIABILIDADE
Exemplo:
Considere uma linha de produção que possui três máquinas em
operação: Máquina A, Máquina B e Máquina C. Está sendo investigado o
número de unidades com falhas produzidas em três dias de produção. Os
dados coletados foram:
24
Observando apenas a média de unidades com falhas das três máquinas
investigadas chegaremos à conclusão de que elas são iguais, ou seja,
possuem o mesmo comportamento no que se refere à produção de unidades
com falhas. Porém ao analisar os dados brutos (unidades com falhas para cada
um dos dias investigados) observamos que, embora a média seja a mesma
entre as três máquinas, a variação de um dia para o outro possui um
comportamento bem distinto.
Por este motivo, além das medidas de tendência central devemos obter
as medidas de variabilidade que contribuem para uma melhor interpretação
do comportamento de uma variável quantitativa. Estas medidas representam a
variação de um conjunto de dados em torno da média.
Medias de Variabilidade
Coeficiente de
Variância Desvio-padrão
Variação
25
2.2.1. VARIÂNCIA
Notação:
2 - variância populacional
s2 - variância amostral
Fórmula:
onde:
x – valores da variável investigada
- média da amostra
n – tamanho da amostra
Σ - somatório
Propriedades da Variância
1. Somando-se (ou subtraindo-se) a cada elemento de um conjunto de valores
uma constante, a variância não se altera;
2. Multiplicando-se (ou dividindo-se) cada elemento de um conjunto de valores
por um valor constante, a variância fica multiplicada (ou dividida) pelo quadrado
da constante.
26
2.2.2. DESVIO-PADRÃO
Notação:
- desvio-padrão populacional
s- desvio-padrão amostral
Fórmula:
Propriedades do Desvio-padrão
1. Somando-se (ou subtraindo-se) a cada elemento de um conjunto de valores uma
constante, o desvio-padrão não se altera;
2. Multiplicando-se (ou dividindo-se) cada elemento de um conjunto de valores por
um valor constante, o desvio-padrão fica multiplicado (ou dividido) pela constante.
27
Figura 12. Etapas para o cálculo do Desvio-padrão
Importante:
28
MÁQUINA A
1º Dia: 5 unidades
2º Dia: 0 unidades
3º Dia: 10 unidades
MÁQUINA B
MÁQUINA B
Média de vendas –
Unidades com falhas:
1º Dia: 5 unidades
2º Dia: 5 unidades
3º Dia: 5 unidades
29
Interpretação: “Para a Máquina B observa-se que, em média, são produzidas
ao dia 5 unidades com falhas com uma variação em torno desta média de 0
unidades.”
MÁQUINA C
1º Dia: 5 unidades
2º Dia: 4 unidades
3º Dia: 6 unidades
30
Podemos agora comparar as três máquinas utilizando as medidas
estatísticas média e desvio-padrão da seguinte forma:
[5 ± 5] [5 ± 0] [5 ± 1]
Notação:
C.V. - Coeficiente de variação
Fórmula:
onde:
- média da amostra
s – desvio-padrão
31
No exemplo da comparação das filiais:
32
Exemplo
Média
Variância
33
Desvio-Padrão
34
Agora vamos calcular a variância e o desvio-padrão. Neste caso
devemos considerar a frequência de cada valor da variável.
Variância
Desvio-padrão
35
Recapitulando
36
Atividades Medidas de Tendência Central e Medidas de Variabilidade
37
b) Qual turno apresentou resultados mais homogêneos?
Corsa: 240 litros Uno: 224 litros Hobby: 325 litros Gol: 146 litros
38
Gabarito das atividades propostas
Questão 1.
a) Comparação das taxas de desemprego (em %)
b) O mais homogêneo foi o grupo dos países da Europa, pois possui menor
Coeficiente de variação.
Questão 2:
a) Manhã:
Média = 2,5 mm
Desvio-padrão = 0,19 mm
CV = 7,6 %
Tarde:
Média = 2,4 mm
Desvio-padrão = 0,23 mm
CV = 9,6 %
Noite:
Média = 2,3 mm
Desvio-padrão = 0,58 mm
CV = 25,2 %
Questão 3.
Tabela 1. Número de molas fora de conformidade
Número de molas f %
6 3 15,0 6 x 3 = 18 (6 – 8,4)2 . 3 = 17,28
7 6 30,0 7 x 6 = 42 (7 – 8,4)2 . 6 = 17,34
8 4 20,0 8 x 4 = 32 (8 – 8,4)2 . 4 = 0,64
9 3 15,0 9 x 3 = 27 (9 – 8,4)2 . 3 = 1,08
12 4 20,0 12 x 4 = 48 (12 – 8,4)2 . 4 = 51,84
Total 20 100,0 167 88,18
39
Média
Variância
Desvio-padrão
Interpretação: “Em média são produzidas por lote 8,4 molas fora da
conformidade com uma variação de 2,2 molas”. [8,4 ± 2,2 molas fora da
conformidade]
Questão 4.
40
b) Calcule e interprete a média e o desvio-padrão para estes dados.
Média
Variância
Desvio-padrão
41
3. GRÁFICOS DE CONTROLE
Simone Echeveste
42
A variação que ocorre num processo de produção pode ser
desmembrada em duas componentes: uma de difícil controle, chamada
variação aleatória; e outra chamada variação controlável. Assim a equação
da variação total de um processo pode ser escrita como sendo:
43
Benefícios dos gráficos de controle
Podem ser aplicados pelos próprios operários, que poderão discutir com
os supervisores, engenheiros e técnicos através da linguagem dos
dados fornecidos pelos gráficos de controle;
O uso dos gráficos de controle para medições deve ocorrer sempre que
uma característica da qualidade observada é expressa em unidades reais
como peso em quilogramas, comprimento em centímetros, temperatura em
graus celsius
44
Símbolos Importantes:
n = tamanho da amostra
k = número (quantidade) de amostras
= média das médias das amostras (média global)
R = amplitude amostral média
= média das amplitudes
d2, A3, D3, D4 = fatores de correção tabelados
3º) Calcular para todas as k amostras obtidas a Média das Médias e a Média
das amplitudes :
45
Figura 1. Fator de Correção para gráfico de controle das Médias
Fator de Correção
Tamanho das amostras (n) D3 D4 D c4 d2
2 0 3,267 0,709 0,798 1,128
3 0 2,574 0,524 0,886 1,693
4 0 2,282 0,446 0,921 2,059
5 0 2,114 0,403 0,94 2,326
6 0 2,004 0,375 0,952 2,534
7 0,076 1,924 0,353 0,959 2,704
8 0,136 1,864 0,338 0,965 2,847
9 0,184 1,816 0,325 0,969 2,970
10 0,223 1,777 0,314 0,973 3,078
46
7º) Plotar o gráfico no Excel
90
85
80
Média
75
LSC
70
LM
65
LIC
60
55
50
1 2 3 4 5 6 7 8 9 10
Amostra
47
Exemplo 1
1 65 70 75 60 80
2 75 70 80 90 70
3 80 70 70 80 80
4 65 65 65 80 65
5 80 60 80 80 75
6 75 70 60 85 75
7 80 75 65 75 70
8 70 65 75 65 85
9 85 85 75 65 80
10 65 65 65 80 60
Atenção:
K = 10 amostras extraídas
n = 5 peças em cada amostra
48
Amostra Pesos Observados (n = 5) Soma Média ( ) Amplitude ( R )
1 65 70 75 60 80 350 70 20
2 75 70 80 90 70 385 77 20
3 80 70 70 80 80 380 76 10
4 65 65 65 80 65 340 68 15
5 80 60 80 80 75 375 75 20
6 75 70 60 85 75 365 73 25
7 80 75 65 75 70 365 73 15
8 70 65 75 65 85 360 72 20
9 85 85 75 65 80 390 78 20
10 65 65 65 80 60 335 67 20
49
- Calcular os Limites
50
- Construir o gráfico de controle para a Média
100
95
90
85
80
LSC
75 Média
LM
70
LIC
65
60
55
50
1 2 3 4 5 6 7 8 9 10
51
Linha Média (LM)
52
- Construir o Gráfico de controle para R – Amplitude
50
45
40
35
30
LSC
25
Amplitude R
20 LM
15 LIC
10
0
1 2 3 4 5 6 7 8 9 10
-5
-10
53
Exemplo de um processo que está FORA de controle
90
85
80
75 Média
70 LCI
65 LM
60 LCS
55
50
1 2 3 4 5 6 7 8 9 10
Amostra
Recapitulando
54
Atividades Gráficos de Controle
55
Questão 5. Um processo está sob controle quando:
a.( ) Os resultados de medição apresentam variação dentro dos limites de
controle.
b.( ) O desvio-padrão encontrado é menor que a média da variável.
c.( ) A variação aleatória é conhecida durante todo o processo.
d.( ) Não há ocorrência registrada de danos nas unidades produzidas.
Questão 1.
Amostra Medidas (litros de leite) Amplitude ( R ) Média (
1 1003,2 1004,4 993,5 994,6 997,6 10,9 998,7
2 1002,3 999,0 1000,8 1000,7 998,0 4,3 1000,2
3 998,3 998,1 1004,2 1002,1 991,3 12,9 998,8
4 1002,2 996,6 1002,7 1004,2 1001,8 7,6 1001,5
5 998,3 997,5 1006,1 996,5 998,1 9,6 999,3
6 995,8 1000,8 999,1 1002,5 1001,0 6,7 999,8
7 1004,1 1003,0 1004,8 997,9 999,9 6,9 1001,9
8 1000,1 994,9 1000,1 1004,9 997,3 10,0 999,5
9 1000,2 996,1 998,0 1006,1 999,4 10,0 1000,0
10 996,2 1017,3 993,6 996,5 1003,7 23,7 1001,5
11 1014,0 1008,9 1004,1 1007,9 1000,7 13,3 1007,1
12 997,1 1000,7 999,8 1000,6 1001,7 4,6 1000,0
56
Resultados para o Gráfico de Controle para a Amplitude
1010
1005
LSC
1000 Média
LM
LIC
995
990
985
1 2 3 4 5 6 7 8 9 10 11 12
57
Gráfico de Controle para Amplitude
30
25
20
15
LSC
Amplitude ( R )
10
LM
LIC
5
0
1 2 3 4 5 6 7 8 9 10 11 12
-5
-10
Questão 2.
Resposta: Pensar e decidir baseado em dados e fatos; Pensar separando a
causa do efeito, buscar sempre conhecer a causa fundamental dos problemas;
Reconhecer a existência da variabilidade na produção e administrá-la e
Identificar instantaneamente focos e locais de disfunção e corrigir os problemas
a tempo.
Questão 3.
c.( x ) Auxiliar na eliminação de causas especiais, trazendo o processo para o
estado de controle.
58
Questão 5. Um processo está sob controle quando:
a.( x ) Os resultados de medição apresentam variação dentro dos limites de
controle.
59
4. PROBABILIDADE
Simone Echeveste
60
2ª) Quando o experimento é repetido algumas vezes, os resultados ocorrem de
uma forma aparentemente acidental. Mas quando o número de repetições
aumenta, uma regularidade aparecerá. E esta regularidade que torna possível
construir um modelo matemático preciso para analisar o experimento.
Definição de probabilidade
Exemplo
a) Ganhar um livro
b) Ganhar um celular
c) Ganhar um rádio ou um celular
d) Não ganhar perfume
Resolução:
Vamos considerar então que ao todo nessa caixa temos 10 brindes dos
quais apenas 1 deles será seu. Então o Espaço amostral (conjunto de todos os
possíveis resultados de um experimento) pode assim ser definido:
61
a) Ganhar um livro
Como temos na caixa 4 livros em um total de 10 brindes, a probabilidade de
ganhar um livro é:
b) Ganhar um celular
Não esqueça!!!
A probabilidade de um evento A deve ser sempre:
0 P(A) 1
ou ainda
0% P(A) 100%
62
Propriedades da probabilidade
P( A ) 1 P( A)
A B
Exemplo
Ao retirar uma carta do baralho considere os eventos: A – retirar um Ás
e R – retirar um Rei. Qual a probabilidade de selecionar aleatoriamente uma
carta deste baralho e ela ser um Ás ou um Rei?
A B
63
Exemplo
Atenção!
Questão 1
De 300 estudantes do curso de Engenharia, 100 são matriculados em
Geometria Analítica e 80 em Estatística. Estes dados incluem 30 estudantes
que estão matriculados em ambas as disciplinas. Qual a probabilidade de um
estudante de engenharia selecionado ao acaso esteja matriculado em
Geometria Analítica ou Estatística?
64
Qual a probabilidade de um estudante de engenharia selecionado ao
acaso esteja matriculado em Geometria Analítica ou Estatística?
Questão 2
De 100 pessoas que solicitaram emprego de engenheiro de produção,
durante o ano passado, 65 possuíam experiência anterior e 30 possuíam um
certificado profissional. Vinte dos candidatos possuíam tanto experiência
anterior como certificado profissional. Qual a probabilidade de um candidato
selecionado ao acaso deste grupo tenha experiência anterior ou certificado
profissional?
65
Qual a probabilidade de um candidato selecionado ao acaso deste grupo
tenha experiência anterior ou certificado profissional?
Exemplo
66
c) A peça ser perfeita na largura e no comprimento
P(PL e Pc) = 0,98 x 0,95 = 0,931
P(A e B)
Onde: P(B/A)
P(A)
Exemplo
67
b) A primeira peça ser boa e a segunda defeituosa
P(B1 e D2) = P(B1) x P(D2/B1) = 8/10 x 2/9 = 16/90 = 0,1777
ÁRVORE DE PROBABILIDADES
2ª Peça
Boa
1ª Peça 7/9
Boa Defeituosa
8/10 2/9
8 Boas
2 defeituosas
__________ Boa
10 peças Defeituosa 8/9
2/10
Defeituosa
1/9
Questão 1
68
b) A falha do sistema ocorrer apenas no componente A
Então
Então
Não ocorrer falha no sistema
69
Questão 2
Considere os eventos:
H – ser homem
B- votar em branco
70
Recapitulando
Probabilidade Complementar:
P( A ) 1 P( A)
Regra da Adição:
Se A e B são dois eventos independentes: P(A ou B) = P(A) + P(B)
Se A e B são dois eventos dependentes: P(A ou B) = P(A) + P(B) – P(A e B)
Regra da Multiplicação:
Se A e B são dois eventos independentes: P(A e B) = P(A) x P(B)
Se A e B são dois eventos dependentes: P(A e B) = P(A) x P(B/A)
P(A e B)
Onde: P(B/A)
P(A)
71
Atividades
Questão 3. Marcelo tem dois velhos automóveis. Nas manhãs frias, há 20% de
probabilidade de um deles não pegar e 30% do outro não pegar. Em uma
manhã fria qual a probabilidade de nenhum dos carros pegar:
72
Gabarito
Questão 1
a) P(V ou L) = 5/11 = 0,4545
b) P(não Amarela) = 8/11 = 0,7272
c) P(R) = 3/11 = 0,2727
Questão 2.
a) P(Ambos estejam vivos) = 0,26
b) P(Somente a mulher esteja viva) = 0,39
Questão 3.
P(Nenhum pegar) = 0,60
Questão 4.
Questão 5.
P(Embalagem) = 0,02 P(Consistência) = 0,05
73
5. DISTRIBUIÇÕES DE PROBABILIDADE
Simone Echeveste
P(X=x) = f(x)
74
5.1. DISTRIBUIÇÃO BINOMIAL
Características:
O Modelo Binomial
n nº de repetições do evento
x valor que se deseja determinar
n!
P( X x) . p x .(1 p) n x , onde
x!.(n x)! p probabilidade de sucesso
(1- p) probabilidade de fracasso
75
Exemplo 1
n= 5 lotes
x = nº lotes com peças defeituosas
p = 0,05 (5%)
(1-p) = 1- 0,05 = 0,95 (95%)
n= 5 lotes
x = nº lotes com peças defeituosas
p = 0,05 (5%)
(1-p) = 1- 0,05 = 0,95 (95%)
76
Exemplo 2
Pede-se:
P(metade da frota de 8 caminhões apresentar problemas na direção hidráulica)
P(x=4)
Resolução:
8!
P(x= 4) = .0,10 4.0,90 4 70 . 0,0001 . 0,6561 0,0046
4!.4!
P(x= 4) = 0,0046
Média Desvio-padrão
E( x) n. p n. p.(1 p)
77
Exemplo
E o desvio-padrão:
78
Num processo de Poisson podem ser observados eventos discretos
numa área de oportunidade de tal forma que, reduzindo suficientemente essa
área de oportunidade que pode ser um intervalo de tempo, espaço, ou área na
qual mais de uma ocorrência de um evento pode ocorrer:
O Modelo Poisson
onde:
79
Exemplo 1
x= Nº peças finalizadas
n= 1 minuto
p=
λ= n . p =
Pede-se:
P(x = 8 peças finalizadas)
Exemplo 2
Informações Importante:
x = nº de defeitos
p= = 0,2
80
n = 3 metros
λ= n . p =
a) Nenhum defeito
Pede-se: P(x=0)
b) Ocorram 3 defeitos
Pede-se: P(x=3)
( x ) 2
f ( x)
1
e 2 2 ; para - < x < , - < < e 2 > 0
2
81
Figura 5. Gráfico da Curva Normal
82
Figura 6. Áreas importantes da Curva Normal
Para evitar cálculos com a integração, uma tabela única foi desenvolvida
para uma variável aleatória agora chamada de “Z” com μ=0 e σ=1, e sua
distribuição de probabilidades é definida como normal padronizada, ou ainda
normal padrão.
83
Seja X uma variável aleatória normalmente distribuída com quaisquer
parâmetros média e desvio-padrão . Para realizar o processo de
padronização devemos realizar a seguinte transformação:
x
Z
onde:
84
Tabela da Distribuição Normal Padrão P(Z<z) – VALORES POSITIVOS
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
85
Tabela da Distribuição Normal Padrão P(Z<z) – VALORES NEGATIVOS
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
86
Como utilizar a Tabela Normal Padrão
1,35
Linha
1,35 Coluna
87
Outro exemplo: P(z<-0,27)
Linha
-0,27 Coluna
Exemplo 1
88
Passo 2: Padronizar para obter o cálculo da área pela tabela Normal Padrão
Linha
2,00
Coluna
89
Então a P(x < 21 horas)= 0,9772 ou 97,72%
97,72%
90
Exemplo 2
Passo 2: Padronizar para obter o cálculo da área pela tabela Normal Padrão
91
Passo 3: Buscar o valor da probabilidade P(z<-1,00) na tabela normal
Linha
-1,00
Coluna
15,87%
92
Nos exemplos anteriores observe que as áreas/probabilidades
solicitadas foram sempre áreas INFERIORES a um valor “x” de interesse,
observe que na tabela normal padrão utilizada as probabilidade que ali se
encontram referem-se sempre a áreas inferiores:
P( x ≥ a ) = 100% - P( x ≤ a )
93
Voltando ao exemplo:
Linha
0,83
Coluna
94
Então a P(x < 7500 horas)= 0,7967 ou 79,67%
79,67%
79,67%
20,33%
95
Agora vejamos o terceiro e último tipo de área/probabilidade a ser
calculada: ENTRE dois valores.
Pede-se:
P( 6 00 ≤ x ≤ 400 )
Neste caso, teremos dois valores de “x” que deverão ser padronizados
resultando em dois valores de probabilidade, uma referente á área inferior a
7400 e outra inferior a 6300.
P (x < 7400)
P (x < 6300)
P( a ≤ x ≤ b ) = P( x ≤ b ) – P( x ≤ a )
96
Voltando ao exemplo:
Então:
P( 6 00 ≤ x ≤ 400 ) = 74,86% – 12,10%
62,76%
97
Recapitulando
Distribuição Binomial
Distribuição Poisson
Distribuição Normal
É o modelo probabilístico mais conhecido, onde várias técnicas
estatísticas necessitam da suposição de que os dados se distribuam
normalmente para serem utilizadas. Seus parâmetros são a média e o
desvio-padrão.
98
Atividades
99
Gabarito
Questão 5.
a) R: 0,9992 ou 99,92%
b) R: 0,08665 ou 86,65%
c) R: 0,0132 ou 1,32%
100
6. ESTIMAÇÃO E INTERVALOS DE CONFIANÇA
Simone Echeveste
101
Importante:
A média populacional é estimada por
O desvio-padrão populacional é estimado por s
A proporção populacional é estimada por p
102
Figura 7. Representação do Intervalo de Confiança 95% para a média
95%
Seja “X” uma variável aleatória que apresenta distribuição normal com
desvio-padrão conhecido, o intervalo de confiança para a média µ pode ser
assim determinado:
Atenção!
x = média amostral
= erro de estimação
z= valor tabelado da Normal Padrão
Onde: = desvio-padrão
n = tamanho da amostra
103
Os valores de Z (normal-padrão) podem ser obtidos na tabela t com
infinitos graus de liberdade. Valores típicos:
Seja “X” uma variável aleatória que apresenta distribuição normal com
desvio-padrão desconhecido, o intervalo de confiança para a média µ pode
ser assim determinado:
Atenção!
x = média amostral
= erro de estimação
t= valor tabelado tabela t-student
Onde: s = desvio-padrão amostral
n = tamanho da amostra
104
Tabela de valores críticos da distribuição t de Student.
Gl (n-1) IC 95% IC 98% IC 99%
0,050 0,020 0,010
1 12,706 31,821 63,656
2 4,303 6,965 9,925
3 3,182 4,541 5,841
4 2,776 3,747 4,604
5 2,571 3,365 4,032
6 2,447 3,143 3,707
7 2,365 2,998 3,499
8 2,306 2,896 3,355
9 2,262 2,821 3,250
10 2,228 2,764 3,169
11 2,201 2,718 3,106
12 2,179 2,681 3,055
13 2,160 2,650 3,012
14 2,145 2,624 2,977
15 2,131 2,602 2,947
16 2,120 2,583 2,921
17 2,110 2,567 2,898
18 2,101 2,552 2,878
19 2,093 2,539 2,861
20 2,086 2,528 2,845
21 2,080 2,518 2,831
22 2,074 2,508 2,819
23 2,069 2,500 2,807
24 2,064 2,492 2,797
25 2,060 2,485 2,787
26 2,056 2,479 2,779
27 2,052 2,473 2,771
28 2,048 2,467 2,763
29 2,045 2,462 2,756
30 2,042 2,457 2,750
39 2,023 2,426 2,708
40 2,021 2,423 2,704
49 2,010 2,405 2,680
50 2,009 2,403 2,678
59 2,001 2,391 2,662
60 2,000 2,390 2,660
99 1,984 2,365 2,626
100 1,984 2,364 2,626
120 1,980 2,358 2,617
200 1,972 2,345 2,601
infinito 1,960 2,326 2,576
105
Exemplo 1
Dados do Problema:
Variável (x) - voltagem de quebra em kV
Amostra (n)= 25
= 54,7 kV
s = 5,2 kV
t = 2,064 (veja na página a seguir como encontrar esse valor)
= 2,1466
[54,7 ± 2,15]
[52,55 a 56,85]
106
Como encontrar o valor de “t” na tabela t-student
107
Exemplo 2
Dados do Problema:
Variável (x) – resistência mecânica em MPa
Amostra (n)= 15
= 53 MPa
s = 4 MPa
t = 2,145 (procurar na tabela - linha 14 e coluna IC95%)
= 2,22
108
[53 ± 2,22]
[50,78 a 55,22]
95%
Atenção!
109
Os valores de Z (normal-padrão) podem ser obtidos na tabela t com
infinitos graus de liberdade. Valores típicos:
Exemplo
Dados do Problema:
Proporção investigada – proporção de latas com prazo de validade vencido
= 0,0522
110
Intervalo de Confiança 95%
111
Recapitulando
112
Questão 4. Uma amostra de 150 componentes de um equipamento eletrônico
foi testada e 93 deles funcionaram mais de 500 horas. Determinar um intervalo
de confiança 95% para a verdadeira proporção de componentes que funcionam
mais de 500 horas.
Gabarito
113
7. TESTES DE HIPÓTESES
Simone Echeveste
114
Exemplos:
115
Figura 8. Elementos de um Teste de Hipóteses
2º) A Hipótese Nula (H0) é a afirmação de que tal efeito não está presente
na população;
3º) Com base nos dados obtidos na amostra verifique se os valores obtidos
estão muito distantes do valor do parâmetro pela hipótese nula; caso
afirmativo, os dados evidenciam que a hipótese nula é falsa e que o efeito
que está procurando está realmente presente;
116
Figura 9. Tipos de Erros em um Teste de Hipóteses
Hipóteses de pesquisa
117
-O tempo médio de fabricação é de 15 minutos
H0 : = 15 minutos
H1 : 15 minutos
H0 : A = B
H1 : A > B
H0 : = 3%
H1 : 3%
Estatística do teste
Regra de decisão
118
Conclusão experimental
Concluir
119
7.1. TESTE DE HIPÓTESES PARA UMA MÉDIA (TESTE T – STUDENT)
Hipóteses
Ho : o (referência )
Ha : o (referência )
Estatística do teste
X o 0 = valor de referência
tcal s = desvio-padrão da amostra
S n
n = tamanho da amostra
Regra de decisão
120
Para o caso do valor calculado na estatística estar localizado na região
crítica deveremos então rejeitar a hipótese nula H0 que representa a decisão
de que SIM, existe diferença significativa dos dados amostrais com os
parâmetros populacionais.
0
(-) Valor tabelado (+) Valor tabelado
121
Como obter o valor tabelado da Regra de Decisão
122
Exemplo 1
H0 : µ = 18 meses
H1 : µ ≠ 18 meses
t calc - 0,196
123
Passo 4 – Regra de Decisão
124
Regra de Decisão
0
-2,045 +2,045
0
-2,045 -0,196 +2,045
125
Ao aceitar a hipótese nula H0 estaremos aceitando a seguinte afirmação:
H0 : µ = 18 meses
Passo 5 – Conclusão
Exemplo 2
126
= 5,6
182meses (desvio-padrão
gramas da amostra)
(média da amostra)
s = 12 gramas (desvio-padrão da amostra)
α = 0,0 (nível de significância do teste: p= %)
H0 : µ = 190 gramas
H1 : µ ≠ 190 gramas
x - μ0 182 - 190 -8 -8
t calc = = = = - 9,41
s 12 12 0,85
n 200 14,14
t calc - 9,41
127
Tabela de valores críticos da distribuição t de Student.
Gl (n-1) IC 95% IC 98% IC 99%
0,050 0,020 0,010
18 2,101 2,552 2,878
19 2,093 2,539 2,861
20 2,086 2,528 2,845
21 2,080 2,518 2,831
22 2,074 2,508 2,819
23 2,069 2,500 2,807
24 2,064 2,492 2,797
25 2,060 2,485 2,787
26 2,056 2,479 2,779
27 2,052 2,473 2,771
28 2,048 2,467 2,763
29 2,045 2,462 2,756
30 2,042 2,457 2,750
39 2,023 2,426 2,708
40 2,021 2,423 2,704
49 2,010 2,405 2,680
50 2,009 2,403 2,678
59 2,001 2,391 2,662
60 2,000 2,390 2,660
99 1,984 2,365 2,626
100 1,984 2,364 2,626
120 1,980 2,358 2,617
200 1,972 2,345 2,601
infinito 1,960 2,326 2,576
Regra de Decisão
0
-9,41 -1,972 +1,972
128
Este valor (t=-9,41) está localizado, na nossa regra de decisão, FORA
da região de aceitação, ou ainda, ele localiza-se na REGIÃO CRÍTICA – então
nossa decisão será REJEITAR H0.
H0 : µ = 190 gramas
H1 : µ ≠ 190 gramas
H1 : µ ≠ 190 gramas
Passo 5 – Conclusão
129
7.2. TESTE DE HIPÓTESES PARA COMPARAÇÃO ENTRE DUAS
MÉDIAS (T-STUDENT PARA DUAS AMOSTRAS)
n1 n2
Grupo 1 x1 Grupo 2 x2
s s
1 2
Hipóteses:
H o : 1 2
H1 : 1 2
130
Estatística do teste
Onde:
(desvio-padrão ao quadrado)
(desvio-padrão ao quadrado)
Regra de decisão
Região crítica
Região de Região crítica
Aceitação
131
Exemplo 1
H o : 1 2
H1 : 1 2
132
Passo 3 – Cálculo da Estatística do Teste
Gl: (n1+n2 – 2) = (40+40 - 2) = .78 (Na tabela não temos linha 78, então
iremos para a mais próxima que é a linha 60)
133
O valor de “t” tabelado é então 2,000 – esse valor determinará na regra
de decisão os limites da região crítica.
Regra de Decisão
0
-2,000 +2,000
8,77
H o : 1 2
H1 : 1 2
H1 : µ1 ≠ µ2
134
médio de duração do fabricante (65 horas) é SUPERIOR ao tempo médio de
duração do concorrente (60 horas).
Passo 5 – Conclusão
Exemplo 2
135
Passo 1 – Dados do Problema
H o : 1 2
H1 : 1 2
136
Passo 4 – Regra de Decisão
Gl: (n1+n2 – 2) = (15+18 - 2) = 31 (Na tabela não temos linha 31, então
iremos para a mais próxima que é a linha 30)
Regra de Decisão
0
-3,64 -2,042 +2,042
137
Este valor (t=-3,64) está localizado, na nossa regra de decisão, FORA
da região de aceitação, ou ainda, ele localiza-se na REGIÃO CRÍTICA – então
nossa decisão será REJEITAR H0.
H o : 1 2
H1 : 1 2
H1: µ1 ≠ µ2
Passo 5 – Conclusão
138
7.3. TESTE DE HIPÓTESES PARA UMA PROPORÇÃO
Hipóteses
H0 : = 0 (proporção de referência)
H1 : 0 (proporção de referência)
Estatística do teste:
Regra de decisão
0
-1,96 +1,96
139
Exemplo 1
H0 : = 0,98 (98%)
H1 : 0,98 (98%)
p 0
z calc
0 (1 0 )
n
140
Passo 4 – Regra de Decisão
0
-1,96 +1,96
+0,95
H0 : = 0,98 (98%)
Passo 5 – Conclusão
141
Recapitulando
Atividades
142
Questão 3. Dois fabricantes de automóveis possuíam o intuito de verificar qual
dos dois veículos seria o mais econômico. Após analisar uma amostra de 22
automóveis das duas marcas, obteve-se o resultado apresentado a seguir.
Seria possível afirmar que o carro Andaluz é menos econômico, isto é, que
apresenta uma média populacional inferior que a do Reluzente? Assuma nível
de significância de 5%.
143
Gabarito
Questão 1. t= -8,125
Conclusão: Rejeita-se H0, logo a substituição do componente importado pelo
similar nacional diminuiu significativamente a duração do produto.
Questão 2. t= -1,67
Conclusão: Rejeita-se H0, logo após o reajuste da máquina a resistência à
tração teve uma redução significativa.
Questão 3. t= -0,77
Conclusão: Aceita-se H0, logo não existe diferença significativa na média de
consumo entre os dois tipos de automóveis, sendo assim, não podemos afirmar
que o carro Andaluz é menos econômico.
Questão 4. t= -0,91
Conclusão: Aceita-se H0, logo não existe diferença significativa entre as duas
técnicas.
Questão 5. z= 1,08
Conclusão: Aceita-se H0, logo a proporção peças defeituosas é igual a 4%,
sendo assim o lote pode ser aceito.
144
8. ANÁLISE DE VARIÂNCIA – ANOVA
Simone Echeveste
Hipóteses
145
Condições necessárias
146
Notações (símbolos) importantes:
k – grupos ou tratamentos
r – nº de repetições em cada grupo, ou seja, o tamanho da amostra para
cada grupo a ser comparado.
n – tamanho total da amostra ( )
y – valores da variável de cada unidade amostral
I) Graus de Liberdade:
Grupo (tratamentos) = k - 1
Erro (resíduo) = n – k
Total= n -1
y 2
C
n
-C
147
V) A soma de quadrados de resíduo – SQR
VIII) O valor de F
148
Regra de decisão: a tabela F
ATENÇÃO!!!!!
149
Exemplo 1
Nº repetições r1 = 5 r2 =5 r3 =5 n = 15
k – 3 máquinas
r – 5 repetições para cada máquina
n – 15 unidades (tamanho total da amostra)
y – número de peças defeituosas
I) Graus de Liberdade
Grupo (tratamentos) ( k – 1) = (3 – 1) = 2
Erro (resíduo) n – k = 15 – 3 = 12
Total= n -1 15 – 1 = 14
150
II) O valor de correção - C
-C
151
VI) O quadrado médio de tratamentos – QMTr
VIII) O valor de F
152
Resultados da Análise de Variância - ANOVA
Causas de Variação GL SQ QM F
Grupos (Tratamentos) 2 54,93 27,47 19,62
Resíduo 12 16,80 1,40
Total 14 71,73
Regra de decisão:
FCALC = Valor da estatística F calculada
FTAB = Valor encontrado na tabela F
Para nosso exemplo FCALC = 19,62 e FTAB = 3,89, então Se FCALC > FTAB
– Rejeita-se H0; logo existe diferença significativa entre as máquinas!
153
Conclusão:
Onde:
q = é o valor encontrado na tabela F (FTAB)
QMR = quadrado médio do resíduo
r = número de repetições realizadas em cada grupo (tamanho da amostra para
cada grupo)
154
ATENÇÃO!
Se o valor absoluto da diferença das médias entre os grupos for igual ou maior
que a d.m.s, então a diferença é significativa!!
No exemplo:
Máquina n Média Desvio-padrão
A 5 1,4 0,9
B 5 5,8 1,6
C 5 2,2 0,8
Comparações Múltiplas:
Conclusão Final
155
Recapitulando
Faça uma análise de variância para comparar a uniformidade (%) entre as três
taxas de escoamento. Use nível de significância de 5%
156
Questão 2. Um experimento foi realizado para determinar se três específicas
temperaturas de queima afetam a densidade de certo tipo de tijolo. O
experimento levou aos seguintes dados:
Faça uma análise de variância para comparar a uniformidade (%) entre as três
taxas de escoamento. Use nível de significância de 5%
157
Gabarito
Questão 1.
Resultados da Análise de Variância - ANOVA
Causas de Variação GL SQ QM F
Grupos (Tratamentos) 2 15,46 7,73 16,40
Resíduo 12 5,66 0,47
Total 14 21,12
Questão 2.
Resultados da Análise de Variância - ANOVA
Causas de Variação GL SQ QM F
Grupos (Tratamentos) 2 3,35 1,68 2,69
Resíduo 9 5,62 0,62
Total 11 8,97
Questão 3.
158
9. ANÁLISE DE CORRELAÇÃO
Simone Echeveste
159
Os dados para a análise de correlação são provenientes de observações
de variáveis aos pares, isto significa que cada observação da amostra é
composta por dois valores (x e y), e com estes valores pode construir o
digrama de dispersão que é uma forma de verificar o tipo de correlação
existente entre duas variáveis.
Diagrama de Dispersão
20
18
16
14
Impurezas
12
10
4
15 20 25 30 35 40 45
Velocidade (RPM)
160
Tipos de Correlações
330
280
Vendas (mil reais)
230
180
130
80
1 1,5 2 2,5 3 3,5
Gastos em propaganda (m il reais)
10
Desempenho do aluno
8
6
4
2
0
0 2 4 6 8 10 12 14 16
Número de faltas
161
Ausência de Correlação
200
190
180
170
Altura
160
150
140
130
120
110
85 95 105 115 125
Quociente de Inteligência
Condições Importantes:
162
Sua fórmula é:
n. x. y ( x).( y)
r
[n. x 2 ( x) 2 ] [n. y 2 ( y ) 2 ]
Como Calcular:
1º) Obtenha a soma dos valores de x : x
2º) Obtenha a soma dos valores de y: y
3º) Multiplique cada valor de x por seu valor y correspondente e obtenha a sua soma: x.y
4º) Eleve ao quadrado cada valor de x e obtenha a sua soma: x2
5º) Eleve ao quadrado cada valor de y e obtenha a sua soma: y2
6º) Use essas cinco somas para calcular o coeficiente de correlação.
-1 0
+1
Correlação Inversa
Correlação Direta
Ausência
de
Correlação
100
80 150
60
40 150 100
20
100 50
0
0 50 100 150 50 0
0 50 100 150
0
0 50 100 150
163
Se r > 0 indica uma correlação positiva ou direta entre as variáveis, um
aumento na variável X provocará um aumento na variável Y.
Exemplo 1
n = 6 residências
x = Idade do Imóvel
y = Preço de venda dos imóveis
164
3º) Multiplique cada valor de x por seu valor y correspondente e obtenha a sua
soma: x.y
4º) Eleve ao quadrado cada valor de x e obtenha a sua soma: x2
5º) Eleve ao quadrado cada valor de y e obtenha a sua soma: y2
Tabela de cálculos:
n. x. y ( x).( y)
r
[n. x 2 ( x) 2 ] [n. y 2 ( y ) 2 ]
6 960 - (21)x(355)
r
[6 x 91 - (21)2 ] x [6 x 27.625 - (355)2 ]
r 0,8299
Interpretação:
Como r apresenta um valor negativo, indica correlação negativa/inversa entre a
idade do imóvel e o seu preço de venda, ou seja, quanto maior a idade do
imóvel (mais antigo for) menor tende a ser o preço de venda.
165
Interpretação da intensidade da correlação
Exemplo 2
166
Para este exemplo temos as seguintes informações:
n = 11 ensaios
x = Velocidade
y = Taxa de Impureza
Tabela de cálculos:
n. x. y ( x).( y)
r
[n. x ( x) 2 ] [n. y 2 ( y ) 2 ]
2
r 0,9652
167
Interpretação:
Como r apresenta um valor positivo, indica correlação positiva/direta entre a
velocidade e a quantidade de impurezas, ou seja, quanto maior a velocidade
utilizada maior tende a ser a taxa de impureza encontrada. Podemos ainda
destacar se esta correlação é muito forte.
Hipóteses:
Estatística do Teste:
r
tt
1 r 2
n2
168
Regra de Decisão:
Região crítica
Região de Região crítica
Aceitação
Dados do Problema:
n = 11 ensaios
x = Velocidade
y = Taxa de Impureza
r 0,9652
Hipóteses:
H0: = 0 (não existe correlação significativa entre as variáveis)
H1: ≠ 0 (existe correlação significativa entre as variáveis)
Estatística do Teste:
169
Regra de Decisão:
Gl = n – 2 = 11 – 2 = 9
Região crítica
Região de Região crítica
Aceitação
-2,262 +2,262
11,07
tt 11,07
170
Coeficiente de determinação linear – r2
r² = ( r )²
n = 11 ensaios
x = Velocidade
y = Taxa de Impureza
r 0,9652
Interpretação:
171
Recapitulando
.
Atividades
172
Questão 2. Há suspeitas de que a qualidade (medida em uma escala de 0 a 50
pontos – maior pontuação representa melhor qualidade) do remédio depende
do tempo de maturação despendido em sua produção. Para verificar isso, um
laboratório farmacêutico coletou os seguintes dados:
173
Questão 3. Para estudar a poluição de um rio, um engenheiro ambiental mediu
a concentração de um determinado composto orgânico em % (Y) e a
precipitação pluviométrica na semana anterior (X):
Considere:
Considere:
174
Gabarito
Questão 1. r = -0,630
“Existe uma correlação forte inversa entre as milhas percorridas/galão de
gasolina e a capacidade do carburador (cilindros), ou seja, quanto maior a
quantidade de cilindros menor tende a ser a quantidade de milhas
percorridas/galão de gasolina”
Questão 2.
d. ( x ) Existe uma correlação direta significativa entre o tempo de maturação e a
qualidade, ou seja, quanto maior o tempo de maturação melhor tende a qualidade.
Questão 3.
a) r = 0,887
“Existe uma correlação forte direta entre a concentração de um determinado
composto orgânico em % e a precipitação pluviométrica na semana anterior,
ou seja, quanto maior a concentração do composto orgânico, maior tende a ser
a precipitação pluviométrica”
b) r2 = 78,68%
“ 8,68% das variações da concentração do composto orgânico são explicadas
pelas variações na precipitação pluviométrica”
Questão 4. r = 0,998
“Existe uma correlação muito forte direta inversa entre a temperatura de
operação do processo e o resultado da produção, ou seja, quanto maior a
temperatura de operação, maior tende a ser o resultado da produção”
175
10. ANÁLISE DE REGRESSÃO LINEAR SIMPLES
Simone Echeveste
176
Modelo de Regressão Linear
F(X) = Y = a + bX
Y = a + bX
177
Os valores de a e b serão determinados, através do Método dos
Mínimos Quadrados (MMQ), aplicado na amostra selecionada, utilizando-se
as seguintes fórmulas:
A magnitude da inclinação da regressão pode ser lida como segue: para cada acréscimo
unitário na variável (X), a variável dependente aumentará/diminuirá b unidades de y .
178
Exemplo 1
n = 10 ensaios
x = Temperatura (°C)
y = Resultado da Produção (%)
Tabela de cálculos:
Ensaio Temperatura °C (x) Resultado % (y) x.y x2
1 100 45 4500 10000
2 110 51 5610 12100
3 120 54 6480 14400
4 130 61 7930 16900
5 140 66 9240 19600
6 150 70 10500 22500
7 160 74 11840 25600
8 170 78 13260 28900
9 180 85 15300 32400
10 190 89 16910 36100
Totais 1450 673 101570 218500
179
Cálculos para a construção da Equação da Reta
Cálculo do Coeficiente b
Cálculo do Coeficiente a
180
Após a determinação da Equação da Reta poderemos utilizá-la agora
com o objetivo de fazer previsões. Por exemplo, poderemos estimar qual será o
resultado esperado para uma temperatura de 200°C.
Para x = 200°C
Exemplo 2
181
Para este exemplo temos as seguintes informações:
n = 10 amostras
x = Concentração de madeira de lei (%)
y = Resistência do papel (mpa)
Tabela de cálculos:
Amostra Concentração % (x) Resistência (mpa) (y) x.y x2
1 1,0 101 101,0 1,0
2 1,5 117 175,5 2,3
3 1,5 107 160,5 2,3
4 1,5 117 175,5 2,3
5 2,0 132 264,0 4,0
6 2,0 147 294,0 4,0
7 2,2 147 323,4 4,8
8 2,4 134 321,6 5,8
9 2,8 145 406,0 7,8
10 3,0 134 402,0 9,0
Total 19,9 1281 2623,5 43,2
Cálculo do Coeficiente b
182
Cálculo do Coeficiente a
Para x = 2,5
183
Recapitulando
184
Questão 3. Certa empresa, estudando a variação da demanda de seu produto
em relação à variação de preço de venda, obteve os dados que estão na tabela
abaixo:
Mês Preço (X) Demanda (Y)
1 35 350
2 40 325
3 50 290
4 55 270
5 60 250
6 65 240
7 70 235
8 80 220
9 95 215
185
Questão 5. A tabela a seguir relaciona os pesos (em centenas de Kg) e as
taxas de rendimento de combustível em rodovia (Km/ litro), numa amostra de 7
carros de passeio novos:
Peso Rendimento
12 16
13 14
14 14
14 13
16 11
18 12
19 9
Gabarito
Questão 1.
R: Y = 15,6 + 7,686 X
Questão 2.
R: R$ 1.300,00
Questão 3.
R: Y = 407,55 – 2,314 X
A demanda deste produto considerando um preço de 48 reais: 296,48
unidades.
Questão 4.
R: Y = -0,24 + 0,176 X
O valor estimado do comprimento da barra para a temperatura de 22 oC é de
3,63 metros
.
Questão 5.
R: Y = 24,839 - 0,801 X
186
Referências Bibliográficas
MOORE, D. A Estatística Básica e sua prática. Rio de Janeiro: Ed. LTC, 2000.
RAO, C.R. Statistics: A technology for the millennium Internal. J. Math. &
Statist. Sci, Vol. 8, No.1,Junho 1999.
187