Escolar Documentos
Profissional Documentos
Cultura Documentos
FSA
CENTRO UNIVERSITÁRIO
FUNDAÇÃO SANTO ANDRÉ
Elenilton Vieira Godoy
SUMÁRIO
1. INFERÊNCIA ESTATÍSTICA
SITUAÇÃO-PROBLEMA:
Suponha que, numa linha de produção, um equipamento de
empacotamento que abastece caixas de cereal com 368 gramas está ajustado,
de modo que, a quantidade de cereal em uma caixa seja normalmente
distribuída com uma média aritmética de 368 gramas. A partir de experiências
anteriores, o desvio padrão da população para este processo é conhecido
como sendo igual a 15 gramas.
5
Questão 1:
Se uma amostra de 25 caixas for escolhida aleatoriamente das milhares
que são abastecidas por dia e o peso médio for calculado para essa amostra,
que tipo de resultado seria de se esperar?Por exemplo, você acha que a média
aritmética da amostra seria de 368 gramas? De 200 gramas? De 365 gramas?
Questão 2:
O gerente de produção está preocupado em avaliar se o processo está
funcionando de modo a assegurar que, na média, a quantidade apropriada de
cereal (isto é, 368 gramas) está sendo colocada em cada caixa. Ele decide
selecionar uma amostra aleatória de 25 caixas, do processo de abastecimento,
e examinar seus pesos a fim de determinar quão próximo cada uma delas está
da especificação da empresa, fixada numa média de 368 gramas por caixa. O
gerente de produção espera descobrir que o processo está operando de
maneira apropriada. No entanto ele pode descobrir que as caixas da amostra
pesam pouco ou talvez muito.; ele pode então decidir suspender o processo de
produção, até que o motivo da falha em atender ao peso especificado de 368
gramas seja atendido.
Analisando as diferenças entre os pesos obtidos a partir da amostra e a
expectativa de 368 gramas obtida a partir das especificações da empresa,
pode ser tomada uma decisão, com base nas informações dessa amostra, e
pode-se chegar a uma das duas conclusões a seguir:
2. O conteúdo médio não é igual a 368 gramas; ele é menor ou maior do que
368 gramas. Ações corretivas são necessárias.
6
Nível de Significância
A probabilidade de se cometer um erro do tipo I, representado α, é
identificada como o nível de significância do teste estatístico.
Tradicionalmente, o estatístico controla as taxas do erro tipo I decidindo o nível
de risco α que ele está disposto a tolerar, em termos de rejeitar a hipótese nula
quando ela é efetivamente verdadeira. Uma vez que o nível de significância é
especificado antes de o teste de hipóteses ser realizado, o risco de cometer um
erro do tipo I, está diretamente sob controle do indivíduo que está realizando o
teste.
Coeficiente de Confiança
O complemento (1-α) da probabilidade de um erro do tipo I é chamado
de coeficiente de confiança, que, ao ser multiplicado por 100%, produz o nível
de confiança (intervalo de confiança).
O coeficiente de confiança, identificado como 1-α, é a probabilidade de
que a hipótese nula não seja rejeitada quando de fato for verdadeira e não
deve ser rejeitada.
9
Eficácia do Teste
O complemento (1-β) da probabilidade de um erro do tipo II é chamado
de eficácia de um teste estatístico.
A eficácia de um teste estatístico, identificado como 1-β, é a
probabilidade de se rejeitar a hipótese nula quando ela é de fato falsa e deveria
ser rejeitada.
2. TESTES PARAMÉTRICOS
1
Observação: As caudas em uma distribuição são as regiões extremas delimitadas por valores
críticos.
11
p'−p 0
z= e, do mesmo modo como foi feito nos casos anteriores,
p 0 (1 − p 0 )
n
calculamos a probabilidade P associada a esse valor z e concluímos.
NOTAÇÃO:
n = número de provas
p0 = proporção populacional (usada na hipótese nula)
f
q=1–p p' = i
n
Hipóteses usadas ao testar uma afirmação sobre uma proporção
populacional
Suposições
1. Duas amostras dependentes devem ser escolhidas aleatoriamente de duas
populações;
2. Ambas as populações devem ter distribuição normal.
16
Testes de Hipóteses
Utilizaremos a notação precedente para descrever a estatística de teste
a ser usada nos testes de hipóteses para afirmações sobre médias de duas
populações, no caso de as amostra serem dependentes. Quando selecionamos
aleatoriamente duas amostras dependentes de populações distribuídas
normalmente, em que a média populacional das diferenças emparelhadas é µ d ,
a estatística seguinte tem distribuição t de Student.
Pessoa A B C D E F G H I J K L M N
Direita 191 97 116 165 116 129 171 155 112 102 188 158 121 133
Esquerda 224 171 191 207 196 165 177 165 140 188 155 219 177 174
Antes do treinamento 99 57 62 69 74 77 59 92 70 85
Depois do treinamento 94 57 62 69 66 76 58 88 70 84
Testes de Hipóteses
Uma conclusão do teorema central do limite é que as médias amostrais
tendem a distribuir-se normalmente. As diferenças entre médias amostrais
(x1 − x2 ) também tendem a distribuir-se normalmente. Com estas propriedades
e as suposições feitas anteriormente, obtemos a seguinte estatística a ser
utilizada em testes de hipóteses formuladas sobre as médias de duas
populações.
base em um teste da hipótese σ12 = σ22, não rejeitamos a igualdade das duas
variâncias populacionais.)
Caso 3: As duas populações parecem ter variâncias diferentes. (Isto é,
com base em um teste da hipótese σ12 = σ22, rejeitamos a igualdade das duas
variâncias populacionais.)
t=
(x1 − x2 ) − (µ1 − µ 2 ) onde
2
sp =
(n 1 − 1)s12 + (n 2 − 1)s 2 2
s p2 s p2 (n 1 − 1) + (n 2 − 1)
+
n1 n2
e o grau de liberdade é φ = n1 + n 2 − 2.
20
t=
(x1 − x 2 ) − (µ1 − µ2 ) , onde o grau de liberdade é o menor dos dois n e n2 − 1
1 −1
s12 s 2
+ 2
n1 n2
Suposições:
1. Temos dois conjuntos independentes de dados amostrais selecionados
aleatoriamente.
2. Em ambas as amostras verificam-se as condições np ≥ 5 e nq ≥ 5.
Notação:
Para a população 1, seja:
p1 = proporção populacional
n1 = tamanho da amostra
x
p̂1 = p'1 = 1 (proporção amostral)
n1
Testes de Hipóteses
p (1 − p1 ) p 2 (1 − p 2 )
σ2 = 1 + .
n1 n2
4. TESTES NÃO-PARAMÉTRICOS
A maioria dos métodos de inferência estatística pode ser designada
como métodos paramétricos, porque se baseiam em amostragem de uma
população com parâmetros específicos, tais como a média µ , o desvio-
padrão σ ou a proporção p . Esses métodos paramétricos usualmente devem
enquadrar-se em condições um tanto quanto restritas, como a exigência de que
os dados amostrais provenham de uma população distribuída normalmente.
4.1 DEFINIÇÕES
Os testes paramétricos exigem suposições sobre a natureza ou forma
da população envolvida; os métodos não-paramétricos não dependem de tais
exigências. Por isso, os testes de hipóteses não-paramétricos costumam
chamar-se testes livres de distribuição.
Embora o termo não-paramétrico sugira que o teste não se baseia em
um parâmetro, há alguns testes não-paramétricos que dependem efetivamente
de um parâmetro, como a mediana, mas não exigem uma distribuição
específica. Embora livre de distribuição seja uma descrição mais precisa, a
expressão não-paramétrico é mais usada.
Notação:
O: representa a freqüência observada de um resultado
E: representa a freqüência esperada de um resultado
K: representa o número de categorias, ou resultados, diferentes.
n: representa o número total de provas
24
χ2 = ∑
(O − E)2
E
Os testes de hipótese de aderência são sempre unilaterais à direita.
χ2 = ∑
(O − E )2
E
A freqüência esperada E de cada célula da tabela de freqüências pode
ser calculada com auxílio da equação abaixo:
E=
(total de linhas )(total de colunas )
(total geral)
5. ANÁLISE DE VARIÂNCIA
5.1 Definição
A análise de variância (ANOVA) é um método para testar a igualdade
de três ou mais médias populacionais, baseado na análise de variâncias
amostrais.
5.2 A Distribuição F
Os métodos de ANOVA utilizam a distribuição F. A distribuição F
apresenta as seguintes propriedades importantes:
Suposições
Valem as seguintes suposições quando testamos a hipótese de que três
ou mais amostras provêm de populações com a mesma média:
1. As populações têm distribuições normais.
2. As populações têm a mesma variância σ 2 (ou o mesmo desvio-
padrão σ ).
3. As amostras são aleatórias e mutuamente independentes.
4. As diferentes amostras provêm de populações classificadas em
apenas uma categoria.
Definição
Um tratamento (ou fator) é uma característica que nos permite distinguir
diferentes populações uma das outras.
Fundamentos Lógicos
O método da análise de variância se baseia neste conceito fundamental:
Com a suposição de que as populações tenham todas a mesma variância σ 2 ,
estimamos seu valor comum utilizando duas abordagens diferentes. A
estatística de teste F é a razão dessas duas estimativas, de modo que um valor
de F significativamente grande (localizado muito à direita do gráfico da
28
H 0 : µ1 = µ 2 = µ 3 = ... = µ k
H 1 : existe pelo menos uma média diferente das demais
O teste para esse caso é conhecido com análise de variância (ANOVA).
Colhendo uma amostra de tamanho n i de cada população i , obtemos
as médias amostrais x i para i = 1,2,3,..., k
Temos ainda a média geral de todas as k amostras indicada por x e o
k
número total de observações n = ∑ n i .
i =1
i =1 j=1 i =1 j=1 n
i =1 i =1 ni n
30
i =1 j=1 i =1 n i
QME
Fcal = é uma distribuição F-Snedecor com (k-1) graus de liberdade
QMR
no numerador e (n-k) graus de liberdade no denominador. Se vale
H 0 : µ1 = µ 2 = µ 3 = ... = µ k
31
6. CORRELAÇÃO
6.1 Definição
Existe uma correlação entre duas variáveis quando uma delas está, de
alguma forma, relacionada com a outra.
Suposições
1. A amostra de dados emparelhados (x, y ) é aleatória.
2. Os pares de dados (x, y ) têm uma distribuição normal bivariada (ou
seja, para cada valor fixo de x, os valores correspondentes de y têm
distribuição normal, e que, para cada valor fixo de y, os valores de x
também têm uma distribuição em forma de sino).
n∑ X i Yi − (∑ X i )(∑ Yi )
rxy =
[n∑ X i
2
][
− (∑ X i )2 n∑ Yi 2 − (∑ Yi )2 ]
32
Exemplos
1) As vendas de um determinado produto A, em milhares de unidades, foram
anotadas para diferentes valores de gastos com propaganda, em unidades
monetárias. Foram obtidos os seguintes resultados.
x (gastos) 1 2 3 4 5 6 7 8
y (vendas) 2.2 3.0 2.8 3.4 3.7 3.5 3.6 3.8
Pessoa 1 2 3 4 5 6 7 8 9 10
Altura (x) 177 175 178 182 185 163 169 170 160 178
Peso (y) 91 72 67 93 180 71 68 65 65 83
r
t= , onde φ = (n − 2) graus de liberdade.
1 − (r )2
n−2
Peso (x) 29 35 28 44 25 34 30 33 28 24
Combustível (y) 31 27 29 25 31 29 28 28 28 33
34
Plástico (x) 0,27 1,41 2,19 2,83 2,19 1,81 0,85 3,05
Combustível (y) 2 3 3 6 4 2 1 5
35
7. REGRESSÃO LINEAR
Exemplo:
Os dados amostrais a seguir representam o consumo de cerveja em um
dia (em 100 litros) e a temperatura máxima (em ºC).
Estas variáveis foram observadas em nove localidades com as mesmas
características demográficas e sócio-econômicas.
Temperatura (x) 16 31 38 39 37 36 36 22 10
Consumo (y) 290 374 393 425 406 370 365 320 269
450
400
350
300
250
Consumo
200
150
100
50
0
0 5 10 15 20 25 30 35 40 45
Temperatura
36
∆Y = variação em Y
β0 ∆X = variação em X
O
X
pode ser traçada no diagrama de dispersão. Depois disso, podemos fazer uma
comparação visual no sentido de verificar até que ponto nosso determinado
modelo estatístico (uma linha reta) se ajusta aos dados originais. Isto é,
podemos verificar se os dados originais se encontram perto da linha ajustada
ou se eles desviam muito da linha ajustada.
A análise de regressão simples significa encontrar a linha reta que
melhor se ajuste aos dados. O melhor ajuste significa a tentativa de encontrar a
linha reta para a qual as diferenças entre os valores reais (Yi ) e os valores que
∑ (Y ) 2
i − Ŷi .
i =1
n
Como Ŷi = b 0 + b1 .X i , estamos minimizando ∑ [Y − (b
i =1
i 0 + b1 .X i )] que
2
Ou seja, devemos ter 0
∂ ∑ (Y − b − b X )2 = 0
∂b1 i 0 1 i
∑ Yi = nb 0 + b1 ∑ X i
i =1 i =1
n n n
∑ X i Yi = b 0 ∑ X i + b1 ∑ X i
i =1 i =1 i =1
2
∑ X i Yi − nXY ∑ Xi ∑Y i
b1 = i =1
n
e b 0 = Y − b1 X , onde X = i =1
e Y= i =1
n n
∑X
i =1
i
2
− nX 2
Exemplos:
1) Em relação ao conjunto de dados amostrais que representam o consumo de
cerveja em um dia (em 100 litros) e a temperatura máxima (em ºC). Determine
a equação linear utilizando o Método dos Mínimos Quadrados.
39
Gastos (X) 1 2 3 4 5 6 7 8
Vendas (Y) 2,2 3,0 2,8 3,4 3,7 3,5 3,6 3,8
n 2
∑ (Yi − Ŷi )
i =1
O erro padrão da estimativa, dado pelo símbolo S YX = .
n−2
40
n 2 n n n
Sabendo-se que ∑ (Yi − Ŷi ) = ∑ Yi − b 0 ∑ Yi − b1 ∑ X i Yi , obtemos
2
i =1 i =1 i =1 i =1
n n n
∑ Yi 2 − b 0 ∑ Yi − b1 ∑ X i Yi
i =1 i =1 i =1
S YX = .
n−2
SQR: representa aquela parte das variações em Y que não são explicadas pela
regressão. Ela é baseada na diferença entre o valor observado ( y r ) e o valor
previsto ( ŷ r ).
41
Fórmulas: n n n
SQR = ∑ Yr 2 − b0 ∑ Yr − b1 ∑ Xr Yr
r =1 r =1 r =1
n n
STQ = ∑ Yr − Y( )2 = ∑ Yr 2 − nY 2
r =1 r =1
SQReg = STQ - SQR
n n
SQReg = b0 ∑ Yr + b1 ∑ Xr Yr − nY 2
r =1 r =1
relação a xr. Se o modelo ajustado não for apropriado, existirá uma relação
entre os valores de xr e os resíduos ei.
dada por
S YX
S b1 = e a estatística de teste t segue uma distribuição t com n-2
n
∑X
2 2
i − nX
i =1
graus de liberdade.
b1 ± t n − 2 ⋅ S b1
Uma vez que esses valores estão acima de zero, podemos concluir que
existe relação linear significativa.
Por outro lado, se o valor zero estiver contido no intervalo, nenhuma
relação teria sido determinada.
43
lineares, é por meio da aplicação da Análise de Variância. Este teste será aqui
apresentado não propriamente pelo seu interesse imediato, mas pela
importância de suas extensões.
O teste de significância do modelo pode ser feito pela técnica de análise
de variância, comparando-se a variabilidade de Y explicada pela regressão
n n
∑ X i ∑ Yi
S xy = S XY = ∑ X i Yi − i =1 i =1
n
2
n
∑ Xi
−
i =1
S xx = S XX = ∑ X i 2
n
2
n
∑ Yi
= ∑ Yi 2 −
i =1
S yy = S YY
n
S YY − b1S XY
S YX = S R =
n−2
45
9.1Origem agrícola
Boa parte da formalização que existe hoje em experimentação se deve a
Sir Ronald Fisher (1890-1962), um estatístico que trabalhou na Estação
Experimental de Agricultura de Rothamstead, na Inglaterra. É a origem agrícola
da experimentação que explica o uso de vários termos técnicos. Assim, o termo
parcela foi criado para designar a unidade de área usada no experimento.
O termo parcela tem, hoje, significado mais geral porque, dependendo
do experimento, a parcela pode ser um animal, uma peça fabricada, uma
pessoa etc. Muitos autores, no entanto, passaram a usar o termo unidade
experimental, em lugar de parcela, porque é mais abrangente.
O termo tratamento também foi introduzido em experimentação pela
área agrícola. Servia para indicar o que estava em comparação: fertilizantes,
inseticidas, variedades. Hoje o termo tratamento tem significado mais geral.
Muitos experimentos são feitos para comparar máquinas, métodos, produtos ou
materiais.
Mas o interesse, em experimentação, nem sempre é o de comparar
tratamentos. Muitas vezes, o pesquisador quer apenas saber se determinado
tratamento tem efeito. Nesse caso, deve comparar um grupo de unidades que
recebeu o tratamento – grupo tratado – com um grupo de unidades que não
recebeu o tratamento – grupo de controle.
46
9.2 Repetição
A idéia, em experimentação, é comparar grupos, não apenas unidades.
As unidades experimentais do mesmo grupo recebem, em estatística, o nome
de repetições ou réplicas. Mas a necessidade do uso de repetições precisa ser
bem entendida.
Do ponto de vista do estatístico, é sempre desejável que os
experimentos tenham grande número de repetições. Na prática, porém, o
número de repetições é limitado pelos recursos disponíveis. Mas o pesquisador
deve levar em conta (quando estabelece o tamanho do seu experimento) o que
é usual na área.
De qualquer forma, convém deixar claro que é possível calcular o
número de repetições que devem ser usadas em determinado experimento. A
aplicação de fórmulas exige, no entanto, que o pesquisador conheça a
variabilidade do material experimental. Quanto mais homogêneo é o material –
em termos das características que possam influir nas observações ou
medições que serão feitas – menor é o número de repetições necessário para
mostrar, com clareza, o efeito de uma tratamento.
9.3 Casualização
Para formar grupos tão iguais quanto possível é fundamental que os
tratamentos sejam sorteados às unidades experimentais. É o que os
estatísticos chamam de casualização. A casualização pode ser feita da
seguinte forma: toma-se uma unidade e joga-se uma moeda: se ocorrer “cara”,
a unidade é designada para o grupo tratado e se ocorrer “coroa” a unidade é
designada para o grupo controle.
47
os grupos, isto é, uma diferença que não possa ser facilmente atribuída ao
acaso.
Finalmente – vale insistir – não existem alternativas válidas para a
casualização. O pesquisador que “escolhe” as unidades por critério próprio –
por melhores que sejam as intenções – introduz tendenciosidade nos
resultados. Se o pesquisador tiver objeções à técnica de casualização, deve
consultar um estatístico competente, pois muitas vezes é possível fazer o
sorteio mantendo as restrições que o pesquisador considera necessárias.
a) graus de liberdade:
de tratamentos: (k − 1)
do total: (n − 1) , com n = kr
do resíduo: (n − 1) − (k − 1) = n − k
51
−C
r
e) a soma de quadrados de resíduo: SQR = SQT = SQTr
SQTr
f) o quadrado médio de tratamentos: QMTr =
k −1
SQR
g) o quadrado médio dos resíduos: QMR =
n−k
QMTr
h) o valor de F: F =
QMR
Note que os quadrados médios são obtidos dividindo as somas de
quadrados pelos respectivos graus de liberdade.
Todas as quantidades calculadas são apresentadas numa tabela de
análise de variância.
BIBLIOGRAFIA