Você está na página 1de 76

PROJETO DE EXPERIMENTOS

Conceitos Básicos de Estatística


Aula 1

Material baseado em:


Ribeiro, J.L.D. e ten Katen, C.S., Projeto de Experimentos – Série
monográfica Qualidade – FEENGE / UFRGS - PPGEP
Box, G.E.P., Hunter, W.G e Hunter, J.S., Statistics for Experimenters –
John Wiley & Sons.
1
PROJETO DE EXPERIMENTOS

1. Terminologia e conceitos básicos

SISTEMA:
Qualquer produto, processo ou serviço que é objeto do estudo.

INDICADORES DE DESEMPENHO:
Características de qualidade resultantes da operação do
sistema e que são percebidas como importantes (pelo cliente)

VARIÁVEIS DE RESPOSTA (Var. Dependentes):


Aspectos do sistema que podem ser medidos e que
permitem quantificar os indicadores de desempenho. Se
qualitativas, dever ser transformadas em quantitativas. 2
PROJETO DE EXPERIMENTOS

PARÂMETROS DO PROCESSO (Var. Independentes):


Todos os fatores do sistema que podem ser alterados e que
TALVEZ tenham algum efeito sobre as Variáveis de Resposta.

FATORES CONTROLÁVEIS:
São os parâmetros do processo que foram eleitos para serem
estudados a vários níveis em um experimento a fim de verificar
sua influência sobre os Indicadores de Desempenho.

FATORES CONSTANTES:
São os parâmetro do processo que, mesmo significativos, são
mantidos constantes durante o experimento.

RUÍDO (Fatores não controláveis)


São as variáveis que, por restrições técnicas ou financeiras,
não podem ser controladas pela equipe técnica e constituem o
erro experimental (variabilidade residual).
3
PROJETO DE EXPERIMENTOS

VARIABILIDADE x MEDIÇÃO:
Nada na Natureza é igual e se repete de forma absolutamente
idêntica. Quando não há variações entre repetições, é porque a
o Sistema de Medição não tem sensibilidade suficiente para
perceber a diferença.

Variáveis de
Entrada SISTEMA Resposta

Parâmetros do Sistema Ruído


Definir o o ajuste ótimo Responsável pela variabilidade
4
PROJETO DE EXPERIMENTOS

FORMAS DE REPRESENTAÇÃO DE DADOS:


Diagrama de Pontos (poucas observações):

63 64 65 66 67 68 69 70 71

•Mostra a localização geral das observações


•Mostra o espalhamento das observações

5
PROJETO DE EXPERIMENTOS

FORMAS DE REPRESENTAÇÃO DE DADOS:


Diagrama de freqüências (histograma):

•Observações agrupadas em intervalos (60,00 a 60,99) , (61,00 a


61,99)
6
•Área do retângulo é proporcional ao número de observações
PROJETO DE EXPERIMENTOS

FORMAS DE REPRESENTAÇÃO DE DADOS:


Diagrama de freqüências relativas (histograma):

ni
fi 
N

•A freqüência relativa dá a probabilidade de ocorrência de


cada intervalo.
•A área total do diagrama = 1 7
PROJETO DE EXPERIMENTOS

Diagrama de freqüências relativas (histograma)


Para variáveis contínuas (observações podem ocorrer em
qualquer valor dentro do intervalo (61,00 a 64,99)

Pr = fr = 0,1 x 4 = 0,4 = 40%


8
PROJETO DE EXPERIMENTOS

FORMAS DE REPRESENTAÇÃO DE DADOS:


Diagrama de freqüências relativas (histograma):

Pr = fr = 0,11 x 2 + 0,09 x 2 = 0,22 + 0,18 = 0,4 = 40%

9
PROJETO DE EXPERIMENTOS

FORMAS DE REPRESENTAÇÃO DE DADOS:


Diagrama de freqüências relativas (histograma):

Pr = fr = 0,10 x 1 + 0,12 x 1 + 0,10 x 1 + 0,08 X 1 = 0,4 = 40%

10
PROJETO DE EXPERIMENTOS

FORMAS DE REPRESENTAÇÃO DE DADOS:


Diagrama de freqüências relativas (histograma):

Pr = fr = 0,09 x 0,5 + 0,11 x 0,5 + 0,12 x 0,5 + 0,12 x 0,5 +


0,105 x 0,5 + 0,095 x 0,5 + 0,09 x 0,5 + 0,07 x 0,5 = 0,4 = 40%
11
PROJETO DE EXPERIMENTOS

Distribuição de Probabilidade

•Para toda a população de observações, os saltos do diagrama devido


às variações amostrais desaparecem, e a aparência se torna regular.
•Se tornarmos os intervalos cada vez menores (  0), o histograma
tende a uma distribuição contínua chamada Distribuição de
Probabilidade.
•A ordenada vertical p(y) é chamada Densidade de Probabilidade. 12
PROJETO DE EXPERIMENTOS

Distribuição de Probabilidade

•Pr (y = 62, 5) = zero


•Pr (62,0 < y < 63,0) = Área
•Quando a Distribuição de Probabilidade é expressa por uma função
matemática, esta é chamada Função Densidade de Probabilidade.
13
PROJETO DE EXPERIMENTOS

PARÂMETROS x ESTATÍSTICAS:
.
POPULAÇÃO AMOSTRA
Um conjunto muito grande (ou a Um pequeno conjunto de n
totalidade) de N observações de observações efetivamente disponível
onde se imagina que venha a Em geral pequeno  n < 30
amostra.

PARÂMETROS ESTATÍSTICA
Média: y Média amostral: y
m � y
N n
Variância:
( y - m)
2 Variância amostral:
s 
2 ( y - y)2
s2 � n -1
N
Desvio padrão: Desvio padrão
( y - m) ( y - y)2
2

s � N
amostral: s  n -1
14
PROJETO DE EXPERIMENTOS

PARÂMETROS x ESTATÍSTICAS

•A média indica a localização da Distribuição (ponto que divide a


distribuição em áreas iguais)
•A variância e o desvio padrão dão noção de espalhamento da
Distribuição em relação à média (o desvio padrão tem a unidade da
média) 15
PROJETO DE EXPERIMENTOS

PARÂMETROS x ESTATÍSTICAS
Graus de Liberdade
A soma dos resíduos ou desvios dos valores amostrais y1,
y2,... em relação à média amostral ÿ devem ser zero.
n

�( y - y )  0
i 1
i

Esta restrição linear nos n resíduos usados no cálculo da


variância amostral faz com que somente n-1 resíduos
possam variar livremente, sendo o último determinado pela
restrição. Diz-se então que a variância amostral (e o desvio
padrão amostral) tem n-1 Graus de Liberdade.
( yi - y )
2
n
s �
2

i 1 n -1 16
PROJETO DE EXPERIMENTOS

PARÂMETROS x ESTATÍSTICAS
Graus de Liberdade
Quando a média m da população é conhecida, a variância
amostral é calculada como a média dos desvios quadrados
dos valores amostrais em relação à média da população.

( yi - m )
2
n
s&  �
2

i 1 n

Neste caso há n e não n-1 graus de liberdade, pois os n


valores podem variar livremente em relação à média da
população (a média amostral não necessita ser igual à
média da população).
17
PROJETO DE EXPERIMENTOS

PARÂMETROS x ESTATÍSTICAS
Exemplo:
Para os dados xi = 1 2 3 4 5 6 7
n=7

1 n 1
x  �xi  ( 1 + 2 + 3 + 4 + 5 + 6 + 7 )  4
n 11 7
n

�i
( x - x ) 2
( (1 - 4) 2 + (2 - 4) 2 + K + (7 - 4) 2 )  4, 67
s 
2 11

n -1 6

s  s 2  4, 67  2,16
18
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal
Observações repetitivas que diferem por causa de um erro
experimental freqüentemente variam em torno de um valor
central em uma distribuição grosseiramente simétrica na
qual pequenos desvios ocorrem mais freqüentemente que
grandes desvios.
Uma distribuição contínua freqüentemente usada para
representar esta situação é a Distribuição Gaussiana ou
Distribuição Normal.
 ( y - ) 2 
- 2 
1  2 s 
p( y)  C e
s
19
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal
Uma vez conhecida a média m e a variância s2, a totalidade
da distribuição está caracterizada.
N(m,s2)  Distribuição Normal de média m e variância s2

20
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal
•Aprox. 2/3 da probabilidade está concentrada na região ±s
•Aprox. 95% da probabilidade está concentrada na região ±2s
•Aprox. 100% na região ±3s

21
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal Padronizada
N(0,1)
Desvio normal padronizado ou desvio normal unitário:
y-m
z
s
Pr (-1 < z < +1) = 2/3 aprox.
Pr (-2 < z < +2) = 95% aprox.
Pr (-3 < z < +3) = 100% aprox.

22
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição t de Student
Quando o desvio padrão da população s não é conhecido, o
mesmo é aproximado pelo desvio padrão amostral s, e não
mais é possível calcular z e utilizar a Distribuição Normal.
Ao invés, calcula-se: y-m
t m �y
s

Que obedece à distribuição t de Student, a qual depende do


número de Graus de Liberdade da amostra (n-1) utilizados para
calcular s.
y- y
t
s 23
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição t de Student.

Quanto menor o número de graus de liberdade, maior


incerteza há na determinação de s, maior a possibilidade de
haver desvios extremos, levando a uma distribuição com
maior cauda. Para n = N (ou ∞ ), s = s e t = N (t = z).
Para n ≥ 15 , t aproxima N (Exceto nos extremos). 24
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição t de Student.
Suposições necessária para que t = (y-m) / s tenha um
Distribuição t com (n-1) graus de liberdade:
•y é normalmente distribuída em relação a m com variância s2.
•s é distribuída independentemente de y.
•a quantidade s2, com n-1 graus de liberdade, é calculada a partir
de observações normalmente e independentemente distribuídas
tendo variância s2.

25
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal
Por que a Distribuição Normal é tão utilizada?
•Pelas robustez ou insensibilidade de muitos procedimentos
estatísticos largamente utilizados em relação a desvios da
normalidade teórica.
•Pelo efeito de limite central, o qual produz uma tendência
da distribuição dos erros reais de serem “aparentemente
normais” .

26
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal – Efeito de Limite Central
É normalmente verdade que um erro genérico  = y – m é
um agregado de um certo número de componentes de erro
(erro analítico, erro de amostragem, erro de processo,
variação nas condições experimentais, variação nos
materiais, etc.)
 = a11 + a22 + ... + ann
Sob certas condições geralmente encontradas na realidade
das experimentações, tal distribuição linear de erros tende à
Normalidade à medida que o número de componentes
torna-se grande, independentemente da distribuição original
de cada componente de erro.
27
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal – Efeito de Limite Central
Condições:
•Várias das fontes de erro DEVEM fazer importantes
contribuições para o erro geral.
•Nenhuma fonte de erro pode dominar as demais.
Exemplo:
Suponhamos que cada fonte de erro ou variação pode ser
representada por um dado, e que todas as fontes de erro
tem igual importância na formação do erro geral.
n
1
   i
i 1 n 28
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal – Efeito de Limite Central
Se tivermos apenas uma fonte de erro (1 dado) a média é
da distribuição de erros é m = 3,5 e a distribuição obtida é
constante ( p(y) = 1/6, qualquer que seja y)

29
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal – Efeito de Limite Central
Se tivermos 2,3,...10 fontes de erro independentes (10 dados) a
distribuição de erro resultante (média das fontes) gradativamente
se aproxima da distribuição Normal.

Apesar da distribuição original ser muito distante da Normal,


mesmo para um n tão pequeno como 5 já há boa concordância. 30
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal – Efeito de Limite Central
O exemplo ilustra 2 importantes fatos:
•A distribuição de erro  = a11 + a22 + ... + ann a qual é um
agregado linear de componentes de erro tende à forma
normal, mesmo quando a distribuição de cada componente
é marcadamente não Normal.
•A média amostral tende a ser normalmente distribuída,
mesmo quando as observações individuais nas quais ela é
baseada não são. Métodos estatísticos que dependam não
das observações individuais, mas de uma ou mais médias
de observações tendem a ser insensíveis ou robustos em
relação à não-normalidade.
31
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal – Efeito de Limite Central
Consideremos a seguinte POPULAÇÃO:
yi = 3 4 5
m4 s  23

Se retirarmos dessa população uma amostra aleatória de


tamanho 1 (com reposição) a distribuição de probabilidade é:
Valor de yi Probabilidade 0,35
0,30
0,25
3 1/3 0,20
0,15

4 1/3 0,10
0,05
0,00
5 1/3 3 4 5
32
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal – Efeito de Limite Central
Consideremos todas as amostras de tamanho 2 com reposição
que podem ser retiradas da população.
(3 ; 3) (3 ; 4) (3 ; 5) (4 ; 3) (4 ; 4) (4 ; 5) (5 ; 3) (5 ; 4) (5 ; 5)
Para as médias amostrais ÿi :
3 3,5 4 3,5 4 4,5 4 4,5 5
A distribuição de probabilidades é
Valor de yi Probabilidade Valor de yi Probabilidade
3 1/9 4,5 2/9
3,5 2/9 5 1/9
33
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal – Efeito de Limite Central
0,35
0,30
E( y )  m  4
0,25
2
s
0,20
0,15
DP( y )   3  1
0,10
0,05 n 2 3
0,00
3 3,5 4 4,5 5

(3 - 4)2 + (3,5 - 4) 2 + (4 - 4) 2 + K (5 - 4) 2 3
DP( y )  
9 9
34
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal – Efeito de Limite Central

A distribuição da média amostral ÿ de uma amostra aleatória


de tamanho n extraída de uma POPULAÇÃO NORMAL que
tem média m e desvio padrão s é NORMAL com média m e
desvio padrão s/ √n

y -m
z é N (0;1)
s
n

Para n suficientemente grande ( n > 30 )

35
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Normal – Efeito de Limite Central

A distribuição da média amostral ÿ de uma amostra aleatória


de tamanho n extraída de uma POPULAÇÃO NÃO NORMAL
que tem média m e desvio padrão s é APROXIMADAMENTE
NORMAL com média m e desvio padrão s/ √n

y -m
z é aproximadamente N (0;1)
s
n

Para n suficientemente grande ( n > 30 )

36
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
( 2 -1)
( )
2
-
Distribuição de Qui-quadrado. p(  2 )  C  2 e 2

A distribuição Qui-quadrado tem um parâmetro que é o


número de graus de liberdade .

37
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição F de Fisher-Snedecor.

A razão entre 2 distribuições qui-quadrado divididas pelos


respectivos graus de liberdade resulta numa distribuição F
com dois parâmetros (1,2).

12
1
 22
2

38
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Binomial:

Apropriada para descrever o padrão de ocorrência dos


valores de uma população, quando cada elemento dessa
população pode ser classificado com atributos como
sucesso e falha, bom e ruim, defeituoso e não-defeituoso.

Para uma amostra de tamanho n extraída da população,


conta-se o número de elementos x que possuem o atributo
de interesse.

39
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES DE PROBABILIDADE
Distribuição Binomial:

�n � k
P [ x  k ]  � �p ( 1 - p ) , k  0,1,..., n
n-k

�k�
�n � n n!
� � Ck 
�k� k !(n - k )!

Onde P é a probabilidade de x assumir o valor particular k e


p é a probabilidade ou proporção de ocorrência de sucesso.

Média E ( x)  np
Variância VAR ( x )  np (1 - p )
40
PROJETO DE EXPERIMENTOS

VARIÁVEIS ALEATÓRIAS
Uma quantidade que não é conhecida com exatidão mas
para a qual conhecemos a distribuição de probabilidade é
chamada de Variável Aleatória.
Ex: Altura dos habitantes adultos do Rio Grande do Sul.

DEPENDÊNCIA ESTATÍSTICA
Consideremos p(y1) a distribuição de altura dos gaúchos
adultos e p(y2) a distribuição de peso.
É fácil verificar que p(y2|y1=1.60m) ≠ p(y2|y1=1.80m)
y1 (altura) e y2 (peso) são variáveis estatisticamente
dependentes.
41
Pr (y1=1.60m,y2=60kg) = Pr (y1=1.60m).Pr (y2=60kg| y1=1.60m).
PROJETO DE EXPERIMENTOS

INDEPENDÊNCIA ESTATÍSTICA aplicada em Observações


Científicas Repetidas

Consideramos y1, y2, ...yn como diferentes tipos de


variáveis: altura, peso, QI.
Contudo, as fórmulas obtidas aplicam-se também a
repetidas observações de uma mesma medida.
Uma observação y1 pode ser tratada como variável aleatória
de uma dada população com densidade de probabilidade
p(y1), o mesmo ocorrendo para y2, ...yn.
Pode ser verdade que p(y1), p(y2), ...p(yn) são idênticas em
forma, localização e espalhamento e que y1, y2, ...yn podem
ser tratadas como estatisticamente independentes.
42
PROJETO DE EXPERIMENTOS

INDEPENDÊNCIA ESTATÍSTICA

Se duas variáveis y1 e y2 são independentes , então

Cov( y , y ) 
�(y 1 - m1 )( y2 - m2 )
0
1 2
N

A escala da covariância depende das unidades escolhidas


para as grandezas. Uma “covariância sem escala” chamada
coeficiente de correlação  (y1,y2) é obtida dividindo-se os
desvios pelos respectivos desvios-padrão
( y1 - m1 ) ( y2 - m2 )
� s s2 Cov( y1 , y2 )
 ( y1 , y2 )  1

N s 1s 2

43
PROJETO DE EXPERIMENTOS

INDEPENDÊNCIA ESTATÍSTICA

O coeficiente de correlação amostral r (y1,y2) é dado por


( y1 - y1 ) ( y2 - y2 )
 s s2
r ( y1 , y2 )  1
n -1

44
PROJETO DE EXPERIMENTOS

INDEPENDÊNCIA ESTATÍSTICA
Quando dados são obtidos em seqüência, é freqüente que
observações obtidas próximas (em tempo ou espaço) sejam
mais parecidas entre si que observações obtidas distantes
(em tempo ou espaço). Para medir essa dependência
utilizam-se os Coeficientes de Auto-correlação de
espaçamento k (espaçamento entre observações)

rk 
 ( y - y )( y - y )
t t+k

 ( y - y)
t
2

Quando o número de observações se torna grande rk se


aproxima de k, o coeficiente de autocorrelação teórico ou
autocorrelação da população de espaçamento k.

45
PROJETO DE EXPERIMENTOS

AMOSTRAGEM ALEATÓRIA

Amostragem aleatória é uma maneira de induzir


independência entre as observações.
Independência estatística implica que a ordem na qual são
obtidas as observações não tem influência nos resultados e
dota estatísticas amostrais tais como y de distribuição com
propriedades especiais.

46
PROJETO DE EXPERIMENTOS

MÉDIA E VARIÂNCIA DE y PARA OBSERVAÇÕES


INDEPENDENTES E IDENTICAMENTE DISTRIBUÍDAS (iid)

Se o modelo de amostragem randômica é adequado, de


modo que os erros sejam independentes, então a média
amostral ÿ varia sobre a média da população m com
variância s2/n, onde n é o número de observações da
amostra.
s2 y
E( y )   E( y - m) 
2

n
Tende à distribuição normal
y
Distante da normalidade

47
PROJETO DE EXPERIMENTOS

DISTRIBUIÇÕES AMOSTRAIS DE UMA SOMA OU DIFERENÇA

Se Y é a soma de 2 variáveis aleatórias independentemente


distribuídas yA com média mA e variância sA2, e yB com
média mB e variância sB2 , então: E (Y )  m A + m B
V (Y )  s A2 + s B2

Se Y é a diferença , então: E (Y )  m A - m B
V (Y )  s A2 + s B2

Se yA e yB são amostras independentes da mesma


população com variância s, então: V (Y )  2s 2

48
PROJETO DE EXPERIMENTOS

AMOSTRAGEM ALEATÓRIA DE UMA POPULAÇÃO NORMAL

Se uma amostra aleatória de n observações é extraído de


uma distribuição normal com média m e variância s, então:
•A média amostral ÿ é também normal, com média m e
variância s2/n
•A variância amostral s2 é distribuída independentemente de
ÿ em uma distribuição escalada qui-quadrada
s2 tem uma distribuição enviesada para a direita.
Considerando  o número de Graus de Liberdade de s2:

 2  s 2 s 2
A distribuição de s2 tem média s2 e variância 2s4/
49
PROJETO DE EXPERIMENTOS

AMOSTRAGEM ALEATÓRIA DE UMA POPULAÇÃO NORMAL

•A quantidade
( y - m)
s
n

É distribuída com n-1 graus de liberdade em uma


distribuição t de Student.

50
PROJETO DE EXPERIMENTOS

AMOSTRAGEM ALEATÓRIA DE UMA POPULAÇÃO NORMAL

51
PROJETO DE EXPERIMENTOS

2. Comparação de 2 Tratamentos

Tratamentos são combinações de níveis dos Fatores


Controláveis.
Experimentos destinados a comparar 2 tratamentos
(Ex.: 2 máquinas, 2 métodos, processos, materiais) permitem
uma revisão de conceitos estatísticos importantes

52
PROJETO DE EXPERIMENTOS

2.1. Uso de uma Distribuição de Referência


Externa para comparar 2 médias

Em uma fábrica de produtos químicos, uma seqüência de 10


lotes foi feita utilizando-se o método de produção padrão (A)
sendo seguida de uma seqüência de 10 lotes com um método
modificado (B).
Os resultados em termos de rendimento são dados a seguir:

53
PROJETO DE EXPERIMENTOS

No Método Rendimento No Método Rendimento


1 A 89.7 11 B 84.7
2 A 81.4 12 B 86.1
3 A 84.5 13 B 83.2
4 A 84.8 14 B 91.9
5 A 87.3 15 B 86.3
6 A 79.7 16 B 79.3
7 A 85.1 17 B 82.6
8 A 81.7 18 B 89.1
9 A 83.7 19 B 83.7
10 A 84.5 20 B 88.5
Que evidências os dados forecem de que o método B é melhor
que A?
54
PROJETO DE EXPERIMENTOS

As médias de cada método são dadas por

yA = 84.24 yB = 85.54 yB - yA = 1.30

Dada a variabilidade,
pode-se afirmar que
1.30 de diferenças
nas médias é
evidência forte o
suficiente para
indicar que o método
B é melhor que o A?

55
PROJETO DE EXPERIMENTOS

Consideremos que existe uma Distribuição de Referência


Externa: dados de 210 lotes seqüenciais produzido pelo método
A com a mesmas condições das amostras anteriores.

56
PROJETO DE EXPERIMENTOS

A Hipótese Nula (H0):

As modificações no processo de produção resultantes da


passagem do Método A para o Método B NÃO tiveram efeito
sobre o rendimento do processo:
yA = yB

Se a Hipótese Nula for negada, dizemos que


“Diferenças estatisticamente significativas”
existem entre os processos.

57
PROJETO DE EXPERIMENTOS

Para testar a H0, pode-se perguntar:


Quão freqüentemente a diferença entre a média de 10 grupos
sucessivos de 10 observações foi maior ou igual a 1.30?
Com base na Distribuição de Referência Externa com 210
observações, pode calcular as 201 médias de grupos de 10
observações sucessivas.
Média 1 = média (1 a 10)
Média 2 = média (2 a 11)
etc.

58
PROJETO DE EXPERIMENTOS

59
PROJETO DE EXPERIMENTOS

A partir das médias de 10 observações sucessivas, pode-se


calcular as 191 diferenças entre médias de 2 grupos de 10
observações adjacentes.
Diferença 1 = média(11 a 20) - média (1-10)
Diferença 2 = média(12 a 21) - média (2-11)
etc

60
PROJETO DE EXPERIMENTOS

Das 191 observações de diferenças, apenas 9 atingem o valor


de 1.30 ou superior, ou seja, 9/191 = 4,7%
Como essa proporção é bastante pequena, a Hipótese Nula é
desacreditada.
Estatisticamente : “A diferença observada é estatisticamente
significativa no nível de probabilidade ou nível de significância
de 4,7% ou 0,047.”

61
PROJETO DE EXPERIMENTOS

2.2. Uso de uma Distribuição t de Referência


Externa para comparar 2 médias
Do conjunto de 210 dados coletados é possível obter 10
diferenças em médias de seqüências não sobrepostas, com um
espaço de 1 observação entre elas para reduzir a dependência
entre eles:
Diferença 1: média (11 a 20) – média (1 a 10)
Diferença 2: média (32 a 41) – média (22 a 31)
As 10 diferenças obtidas são aproximadamente normais devido
ao efeito de limite central.
Além disso, mesmo considerando que os redimentos de cada
lote individual sucessivo são estatisticamente dependentes, a
diferença entre médias será aproximadamente independente.
62
PROJETO DE EXPERIMENTOS

Como o método A foi utilizado para todas as 210 observações,


não há motivo para acreditar que o valor médio amostral do
primeiro grupo de 10 observações seja diferente do segundo,
de modo que pode-se supor que as diferenças entre médias
seguem uma distribuição que tem como média da população o
valor conhecido de m = 0.
63
PROJETO DE EXPERIMENTOS

A variância amostral pode ser calculado por

s 2

( - 0,43 - 0) + ( + 0,43 - 0) + ... + ( - 0,64 - 0)
2 2 2
 0,36
10
s  s 2  0,60

64
PROJETO DE EXPERIMENTOS

Podemos voltar a atenção para o teste de 20 lotes, 10 com o


processo A usual e 10 com o processo B modificado, com uma
diferença encontrada de 1.30.
A Hipótese Nula H0 é : mA – mB = 0

t
( yB - y A ) - ( m B - m A )

1.30 - 0
 2.17
s& 0.60

A distribuição t com 10 graus de liberdade fornece para


Pr(t > 2.17) = 0.028 aproximadamente.

65
PROJETO DE EXPERIMENTOS

O valor obtido é comparável ao 0.047 obtido a partir da


distribuição externa de referência composta pelas 191
diferenças, e leva, da mesma forma, à negação da Hipótese
Nula.

66
PROJETO DE EXPERIMENTOS

2.3. Uso de uma Distribuição de Referência


baseada no modelo de amostragem aleatória
e num valor externo para s.

Consideremos que as duas séries de 10 observações dos


métodos A e B são amostras aleatórias de 2 populações com
aproximadamente a mesma forma (a mesma variânica s2) mas
possivelmente com diferentes média mA e mB.

s2 s2
VAR ( y A )  VAR ( yB ) 
nA nB
s2 s2 2 �1 1 �
VAR( yB - y A )  + s � + �
nA nB �nA nB � 67
PROJETO DE EXPERIMENTOS

O desvio padrão da diferença das médias amostrais,


freqüentemente chamado erro padrão da diferença, seria:
�1 1 �
VAR ( yB - y A )  s � + �
�nA nB �

Mesmo que a distribuição das observações originais seja


moderadamente não-normal, a distribuição da diferença entre
médias amostrais seria esperada como muito próxima da
normalidade (efeito de limite central). Assim o desvio normal
unitário seria:

( yB - y A ) - ( m B - m A )
z
�1 1 �
s � + �
�nA nB � 68
PROJETO DE EXPERIMENTOS

Os 210 ensaios anteriores fornecem um um Desvio Padrão


amostral s=2.88 que pode ser utilizado como aproximação do
Desvio Padrão da população, de modo que o Desvio Padrão
para a diferença (ÿB-ÿA) = 1.30 é:

 1 1  1 1
s  +   2.88  +   1.29
 n A nB   10 10 

Se as suposições feitas estão corretas, o nível de significância


aproximado associado com qualquer diferença (mB-mA)0 é dado
por

1.30 - ( m B - m A )0
z0 
1.29
69
PROJETO DE EXPERIMENTOS

Para a Hipótese Nula H0 : o método B não traz alteração nos


valores observados, ÿB e ÿA vem de amostras de uma mesma
população (B-A)=0 e: 1.30 - 0
z0   1.01
1.29
Resultando em uma probabilidade Pr(z > 1.01) = 0.156 ou
15,6%. Este valor difere bastante dos valores encontrados
anteriormente que não consideram amostragem aleatória mas
empregam distribuições de referência externas.
Neste caso a Hipótese Nula não pode ser rejeitada.

70
PROJETO DE EXPERIMENTOS

2.4. Uso de uma Distribuição de Referência


baseada no modelo de amostragem aleatória
e numa estimativa interna para s.

Consideremos que os 210 ensaios anteriores não estão


disponíveis, de modo que s deve ser estimado a partir das 10
observações do método A e das 10 do método B.
As variâncias amostrais são dadas por:

s A2 
 A A
( y - y ) 2

 8.42
nA - 1

s B2 
 B B
( y - y ) 2

 13.32
nB - 1 71
PROJETO DE EXPERIMENTOS

Considerando que os métodos A e B tem populações com igual


variância s2, estas estimativas podem combinadas de forma a
fornecer uma estimativa agrupada s2 da variância das
populações s2.

s2 
 A A
( y - y ) 2
+ ( y B - y B ) 2

 10.87
(n A - 1) + (nB - 1)

OBS: A expressão acima pode ser escrita como:

� A A
( y - y ) 2
 s A ( n A - 1)
2
(
s2  A
n - 1) s 2
A + ( nB - 1) s 2
B

� B B
( y - y ) 2
 s B ( nB - 1)
2 (nA - 1) + (nB - 1)
72
PROJETO DE EXPERIMENTOS

Usando a estimativa s2 em lugar de s2 resulta, para a


distribuição t de Student com (nA-1)+(nB-1)=18 graus de
liberdade (ao invés da Normal).
( yB - y A ) - ( m B - m A )
t
�1 1 �
s � + �
�nA nB �

Para o exemplo considerado ÿB-ÿA=1.30 e

�1 1 � �1 1 �
s � + � 10.87. � + � 1.47
�nA nB � �10 10 �

73
PROJETO DE EXPERIMENTOS

Resultando para uma diferença hipotética (A-B)0 em

1.30 - ( m B - m A )0
t0 
1.47

Para a Hipótese Nula (mA-mB)0 = 0, t0 = 0.88 resultando em um


nível de significância Pr (t > 0.88) = 0.195

74
PROJETO DE EXPERIMENTOS

Logo, a probabilidade da diferença entre médias amostrais ser


maior ou igual a 1.3 quando as observações A e B pertencem a
uma mesma população (mA = mB) é de 19,5%, alta o suficiente
para que a Hipótese Nula não seja rejeitada.

75
PROJETO DE EXPERIMENTOS

Quanto menos dados


se usa para definir a
Distribuição
(Distribuição Externa x
dados amostrais
unicamente) maior a
incerteza e maior o
espalhamento da
distribuição resultante.

76