Você está na página 1de 10

TEMA IV

INFERENCIA ESTATISTICA: Estimação e Teste de Hipóteses

O sentido da inferência estatística

A inferência estatística e um dos mais importantes e cruciais aspectos do processo de


tomada de decisão. Faz uso das várias ferramentas da teoria estatística como um meio
para chegar a conclusões razoáveis acerca da população a partir de uma análise
baseada numa amostra extraída desta mesma população. Assim, a inferência
estatística simplesmente definida é o estudo da relação entre a População e a Amostra
dela extraída.

População: é o conjunto formado por indivíduos ou objectos que têm pelo menos
uma característica (variável) comum e observável.
 população dos alunos do primeiro ano de uma faculdade;
 população de peças fabricadas numa linha de produção.

Amostra: Qualquer subconjunto formado exclusivamente por elementos de uma certa


população. Detona-se por n o número de elementos da amostra, o seu tamanho.

Parâmetro: é a medida usada para descrever uma característica numérica


populacional. É uma quantidade da população, em geral desconhecida, sobre a qual
interessa estudar. Genericamente representaremos por θ. Por exemplo: a média (µ) e a
variância (σ2).

Estimador: É uma característica numérica determinada na amostra, em função de


seus elementos, com a finalidade de representar, ou estimar, um parâmetro de
interesse na população. Em geral, representa-se por θhat. Por exemplo: a média
amostral ( x ) e variância amostral (s2) são estimadores de µ e σ2, respectivamente.

Estimativa: é o valor numérico determinado pelo estimador. Geralmente, denota-se


por θ0.

Resumo: Denote os parâmetros média, variância e proporção de certa característica


na população por µ, σ2 e p, respectivamente. Os estimadores “naturais” para estas
quantidades são as correspondentes média, variância e proporção calculadas na
^ ^
amostra. Representando-os, respectivamente, por x ,  2 e p , temos:

X  X 2  ...  X n n
X ^
1 n
^
m
x 1  i s  2 
2
( X i  X )2 p
n i 1 n n  1 i 1 n

^
Note que cada um dos estimadores, digamos  i é uma função das variáveis aleatórias
^
constituintes da amostra, isto é,  = f(X1, X2,...,Xn). Logo, um estimador também é
uma variável aleatória.

1
Propriedades de um estimador

^
i) Estimador centrado ou não-enviesado: Um estimador  é centrado ou não-
^
enviesado paraum parâmetro θ se E(  )= θ. Em outras palavras, um estimador é
não-enviesado se em repetidas amostra o seu valor esperado coincide com o
parâmetro de interesse.
^
ii) Estimador Eficiente: Um estimador  diz-se eficiente, se na classe de
estimadores centrados, possuir variancia mínima. Em outras palavras, dados dois
^ ^ ^
estimadores  1 e  2 , centrados para um parâmetro θ, dizemos que  1 é mais
^ ^ ^
eficiente do que  1 se Var(  1 ) < Var(  2 ).
^
iii) Estimador Consistente: Um estimador  é consistente, se, à medida que o
tamanho da amostra (n) aumenta, seu valor esperado converge para o parâmetro
de interesse (θ) e sua variância converge para zero.

Tested e hipóteses

Quando se pretende estimar um parâmetro da população a partir dos dados da


amostra, pode ser feito:
 Através de um único número (estimativa pontual) ou
 Por meio de um intervalo de confiança;

No entanto, quando o objectivo é averiguar ou verificar, com base nos dados da


amostra, a veracidade de uma afirmação sobre o parâmetro, a técnica estatística
utilizada é chamada Teste de hipóteses;

O teste de hipótese é um processo de decisão estatística (entre duas alternativas).

Uma hipótese estatística, ou simplesmente hipótese, é a alegação ou afirmação sobre o


valor do parâmetro da população. Por exemplo:
 Os relógios da marca A tem vida média µ = µ 0;
 O equipamento A produz peças corn variabilidade menor que a do
equipamento B: σ2A = σ2B;

No teste de hipóteses, são formuladas duas hipóteses básicas:


 A Hipótese nula, representada por H0, é a alegação inicialmente assumida
como verdadeira.
 A Hipótese alternativa, representada por H1, é a afirmação contraditória a H0.
„ H0 será rejeitada em favor de H1 se e somente se a evidência da amostra
sugerir que H0 seja falsa;
 Se a amostra não contradisser fortemente H0, continua-se acreditando na
verdade de H0, que não será rejeitada.

2
Um teste de hipóteses é um método para usar os dados da amostra para decidir se a
hipótese nula deve ser ou não rejeitada.

Em tratamento do teste de hipóteses, por conveniência técnica, H0 sempre será


definida como uma expressão de igualdade.

Hipóteses genéricas que englobam a maioria dos casos:


H :    0
1. (Para testes bilaterais)  0
H 1 :    0
H :    0
2. (Para testes unilaterais à direita)  0
H 1 :    0
H :    0
3. (Para testes unilaterais à esquerda)  0
H 1 :    0

Existem duas abordagens mutuamente complementares que delineiam regras ou


procedimentos para decidir se uma hipótese nula deve ser rejeitada ou não: Intervalo
de Confiança e Teste de Significância

Abordagem de Intervalo de Confiança

Na abordagem de intervalo de confiança especificamos um intervalo de confiança


dado, por exemplo, pelas expressões (1) ou (2) dependendo se a variância
populacional é conhecida ou não:
 Z  2 * x Z  2 * x 
P X  X   1

(1)
 n n 

 t 2 * S x t 2 * S x 
P X  X   1

(2)
 n n 
e verificamos se o valor sob hipótese nula se encontra dentro ou fora desse intervalo.
Caso se encontre dentro do intervalo, não rejeitamos a hipótese nula, caso contrário,
rejeitamos a hipótese nula.

Abordagem de teste de significância

O teste de significância é uma alternativa, mas complementar e talvez a mais curta


forma de teste de hipóteses. Por esta abordagem, ao em vez de especificarmos um
intervalo plausível de valores, tomamos um valor específico do parâmetro sugerido
pela hipótese nula, calculamos o teste estatístico (t, Z, F, etc.) e encontramos a sua
distribuição e a probabilidade de obter um valor específico de tal teste estatístico. Se
este valor for maior em termos absolutos que o valor crítico da distribuição
correspondente, a um nível de significância α previamente escolhido, rejeitamos a
hipótese nula, caso contrário, não rejeitamos.

Na prática o recurso a teste de hipótese quer pela abordagem do intervalo de


confiança quer pela abordagem do teste de significância é um problema de
conveniência

3
O procedimento padrão de um teste de hipóteses

 definem-se as hipóteses do teste: H0 e H1;


 fixa-se um nível de significância α ou nivel de confiança (1- α) ;
^
 levanta-se uma amostra de tamanho n e calcula-se uma estimativa  0 do
parâmetro θ;
^
 usa-se para cada tipo de teste uma variável cuja distribuição amostral do  0 seja a
mais concentrada em torno do θ;
 Com o valor dado em H0, calcula-se a estatística do teste, uma função dos dados
da amostra na qual a decisão se baseia. O valor da estatística é chamado o valor
estatístico calculado (Vcalc).
 fixam-se a região de não rejeição (RNR) de H0 e a região de rejeição de H0 ou
região crítica (RC) para o valor calculado ao nível α.
 A H0 será então rejeitada se, e somente se, o valor estatístico observado Vcalc ∈
região crítica. Caso contrário, a decisão será a de não rejeitar H 0.

Erro de Tipo I e de Tipo II

Ao testar uma hipótese, estaremos sempre sujeitos a cometer dois tipos de erros. O
Erro de Tipo I que é a probabilidade de rejeitar a hipótese nula quando de facto ela é
verdadeira e o Erro de Tipo II que é a probabilidade de não rejeitar a hipótese nula
quando de facto ela é falsa.

O erro de tipo I é chamado de nível de significância e é representado pelo símbolo 


(alfa). O nível de significância, , é usado para achar o(s) ponto(s) crítico(s) que
separam a área de aceitação da área de rejeição.

O termo nível de significância de um teste é usado para a probabilidade dos valores


dos parâmetros que têm pouca probabilidade de virem a ser observadas. Geralmente
são usados os níveis de significância de 10%, 5% ou 1%.

(i) Teste de hipótese para média (), de uma distribuição normal (Variância
populacional conhecida), a transformação apropriada corresponde à seguinte
fórmula
X  x
Z (3)
x
n
 Z  2 * x Z  2 * x 
P X  X   1

(4)
 n n 

Exemplo 1: Quando o processo de produção de rolamentos opera correctamente, o


peso dos rolamentos é uma variável normalmente distribuída com média 5 onças e
desvio padrão igual a 0.1 onça. Foi feito um ajuste ao processo, e o gestor da planta
suspeita que este ajuste alterou a média do peso dos rolamentos produzidos deixando
o desvio padrão inalterado. Uma amostra de 16 rolamentos forneceu um peso médio
de 5.4 onças. Ao nível de significância de 5%, teste a hipótese nula de que a média do
peso dos rolamentos na população alterou.

4
Teste bilateral – abordagem de teste de significancia
X 
5.04  5
H0 :   5 H1 :   5 Z 5% / 2  1.96 Z 
 1.6
 0.1
n 16
Conclusão: Com base nessa amostra, ao nível de significância de 5%, não há
evidências suficientes para afirmar que o ajuste alterou o peso médio dos rolamentos,
porque o valor do teste (Z=1.6) é inferior ao valor critico Zα% = 1.96.

Abordagem de intervalo de confiança

H0 :   5 H1 :   5 Z 5% / 2  1.96

Z 2 * x Z 2 * x
X X
n n

1.96 * 0.1 1.96 * 0.1


5.04     5.04  4.991    5.0089
16 16

Conclusão: Com base nessa amostra, ao nível de confiança de 95%, não há


evidências suficientes para afirmar que o ajuste alterou o peso médio dos rolamentos,
porque o intervalo conte o valor sob a hipótese nula.

Exemplo 2: Uma fábrica anuncia que o índice de nicotina dos cigarros da marca X
apresenta-se abaixo de 26 mg por cigarro. Um laboratório realiza 9 análises do índice
obtendo: 26, 24, 23, 22, 28, 25, 27, 26, 28, 24. Sabe-se que o índice de nicotina dos
cigarros da marca X se distribui normalmente com variância 5,29 mg2. Pode-se aceitar
a afirmação do fabricante, ao nível de 5%?

Teste unilateral à esquerda

H 0 :   26 H1 :   26 Z 5%  1,65
n
X i 26  24  23  22  28  25  27  26  28  24 253
x    25,3
i 1 n 10 10

25,3  26
Z obs   0,913
2,3
9

Conclusão: Com base na amostra, ao nível de significancia de 5%, não há evidências


suficientes para rejeitar a hipótese nula de que o índice de nicotina dos cigarros da
marca X apresenta-se abaixo de 26 mg por cigarro, porque o valor calculado do teste
Zobs=-0,913) é em termos absolutos inferior ao valor critico (Z5%=1,65).

Exemplo 3: Um fabricante de tijolos de cerâmica introduz um novo material em sua


fabricação e acredita que aumentará a resistência média, que é de 206 kg. A
resistência dos tijolos tem distribuição normal com desvio padrão de 12 kg. Retira-se

5
uma amostra de 36 tijolos, obtendo x =210kg. Ao nível de 10%, pode o fabricante
aceitar que a resistência média de seus tijolos tenha aumentado?

Teste unilateral à direita


210  206
H 0 :   206 H1 :   206 Z 5%  1,28 2 Z obs 
12
36
Conclusão: Com base na amostra, ao nível de significancia de 10%, há evidências
suficientes para aceitar que a resistência média de seus tijolos tenha aumentado,
porque o valor calculado do teste Zobs=2) é em termos absolutos superior ao valor
critico (Z5%=1.28).

(ii) Teste de hipótese para a Média () de uma distribuição normal (Variância
populacional desconhecida), a transformação apropriada corresponde à seguinte
formula.
( X - x )
t= (5)
s
n
 t 2 * S x t 2 * S x 
P X  X   1

(6)
 n n 

Exemplo 4: Um retalhista sabe que em média, as vendas no estabelecimento são 20%


mais altas em Dezembro que em Novembro. Para o ano corrente, foi seleccionada
uma amostra de seis estabelecimentos que forneceu os seguintes valores como os
aumentos das vendas de Dezembro.

19.2 18.4 19.8 20.2 20.4 19.0

Assumindo uma população normalmente distribuída, a um nível de significância de


5%, teste a hipótese nula de que a verdadeira percentagem de aumento médio é de 20.

H 0 :   20 H1 :   20 t 5% / 2 ( 61)  2,5706

n
X i 19,2  18,4  19,8  20,2  20,4  19 117
x    19,5
i 1 n 6 6

1 n 2,94
s 
2

n  1 i 1
( X i  X )2 
5
 0,588 s  0,588  0,767

Pela abordagem de teste de significancia


( X -  x ) 19,5  20
t=   1,597
s 0,767
n 6
Conclusão: Com base na amostra, ao nível de significancia de 5% e com 5 graus de
liberdade, não há evidências suficientes para rejeitar a hipótese nula de que a
verdadeira percentagem de aumento médio é de 20%, porque o valor calculado do
teste tobs=-1,597) é, em termos absolutos inferior ao valor critico (t 5%=2,5706).

6
Pela abordagem de teste de significancia
H 0 :   20 H1 :   20 t 5% / 2 ( 61)  2,5706
t 2 * S x t 2 * S x
X X
n n
2,5706 * 0,767 2,5706 * 0,767
19,5     19,5  18,695    20,305
6 6

(iii) Teste de hipótese para a diferença entre médias populacionais (variâncias


conhecidas ou amostras grandes a transformação apropriada corresponde à
seguinte formula:

Z

X  Y   x   y   (7)
 x2  y2

nx ny

 y2  y2
X  Y   Z  /2 *
 x2
nx

ny
 
  x   y   X  Y  Z  / 2 *
 x2
nx

ny
(8)

Se o tamanho da amostra nx e ny for grande, então, para uma boa aproximação, testes
de níveis de significância  para a diferença entre médias populacionais são obtidos
substituindo as variâncias populacionais por variâncias amostrais. Para amostras
grandes, esta aproximação não afecta os resultados mesmo quando a distribuição da
população não for normal.

Z
X Y   x  y  (9)
2
S x2 S y

nx n y

   
2 2
s x2 s y s x2 s y
X  Y  Z / 2 *    x   y   X  Y  Z  / 2 *  (10)
nx n y nx n y

Exemplo 5: De duas populações normais X e Y com variâncias σ2 = 25, levantaram-


9 16
se duas amostras de tamanhos nx = 9 e ny =16, obtendo-se: X
i 1
i  27 Y
i 1
i  32

Ao nível de 1%, testar as hipóteses: H 0 :  x   y H1 :  x   y


9 16

 Xi 27
Y i
32
X  i 1
 3 Y i 1
 2
9 9 16 16

Pela abordagem de teste de signficancia Z1%  2,58

Z
X  Y    x  y 

3 2
 2,083
 2
 y2 25 25

x
 9 16
nx ny

7
Conclusão: Com base nas amostras, e ao nível de significancia de 1%, não há
evidências suficientes para rejeitar a hipótese nula de que as médias das duas
populações são iguais, porque o valor calculado do teste (Zobs=2,083) é em termos
absolutos infeiro ao valor critico (Z1%/2=2,58).

Pela abordagem de teste de signficancia Z1%  2,58


H0 : x   y  x  y  0 H1 :  x   y   x   y  0

  x   y   3  2  2,58 *
25 25 25 25
3  2  2,58 *  
9 16 9 16

4,375   x   y   6,375
Conclusão: Dado que o intervalo 4,375   x   y   6,375 contem o valor sob a
hipótese nula (  x   y  0 ),ao nível de confiança de 95%, não há evidências
suficientes para rejeitar a hipótese nula de que as médias das duas populações são
iguais.

(iv) Teste de hipótese para a diferença entre médias populacionais (variâncias


iguais amostras pequenas) a transformação apropriada corresponde à seguinte
formula:

t
X Y   x  y  onde S 2 
(n x  1) S x2  (n y  1) S y2
(11)
nx  n y nx  n y  2
S
nx n y

Pode-se demonstrar que a variável t assim definida segue a distribuição t com (n x+ny
–2) graus de liberdade (gl).

Exemplo 6: Em uma prova de estatística, 12 alunos de uma turma conseguiram média


7,8 e desvio padrão de 0,6, ao passo que 15 alunos de outra turma, do mesmo curso,
conseguiram média 7,4 com desvio padrão de 0,8. Considerando distribuições
normais para as notas, verificar se o primeiro grupo é superior ao segundo, ao nível de
5%.
H0 : x   y  x  y  0 H1 :  x   y   x   y  0
(n x  1) S x2  (n y  1) S y2 (12  1) * 0,36  (15  1) * 0,64
S 
2
  0,5168
nx  n y  2 12  15  2
S  0,5168  0,719 t 5%(1215 2 )  1,7081

t
X  Y    x  y 

(7,6  7,4)  0

0,2
 0,5164
nx  n y 12  15 0,719 * 0,3873
S 0,719 *
nx n y 12 *15
Conclusão: Com base nas amostras, ao nível de significancia de 5% e com 25 graus
de liberdade, não há evidências suficientes para aceitar a hipótese de que a nota do

8
primeiro grupo é superior ao segundo, porque o valor observado do teste (t 0bs=0,5165)
é inferior ao valor crítico (t5%(25) = 1,7081).

(v) Teste de hipótese para a proporção (P) da população (amostras grandes)


a transformação apropriada corresponde à seguinte fórmula
^
px  p
Z (12)
^ ^
p x (1  p x )
n
Onde Px = a proporção numa amostra aleatória com n observações e P = a proporção
na população

Exemplo 7: Sabe-se por experiência que 5% da produção de um determinado artigo é


defeituosa. Um novo empregado é contratado. Ele produz 600 peças do artigo sendo
82 defeituosas. Ao nível de 5%, verificar se o novo empregado produz peças com
maior índice de defeitos que o existente.
82
H 0 : P  0,5 H1 : P  0,5 Z 5%  1,65 P  0,1367
600
^
px  p 0,1367  0,05
Z   9.74
P * (1  P) 0,05 * (1  0,05)
n 600

Conclusão: Como Zobs > Z5%, (9,74>1,65), rejeita-se H0, isto é, ao nível de 5%,
existem evidencias da fraca habilidade do novo empregado na fabricação do artigo,
sendo sua proporção de defeitos superior à dos demais.

(vi) Teste de hipótese para a igualdade entre duas proporções da população


(amostras grandes), a transformação apropriada corresponde à seguinte
formula:
 ^ ^ 
 p x  p y  ^ ^
  ^ n x p x  n y py
Z onde: p (13)
^  nx  n y
^  nx  n y
p(1  p) 
 nx n y 
 

Exemplo 8: De uma amostra aleatória de 203 vendedores de revistas de publicidade


de um país X, 52 são de humor. Uma amostra aleatória e independente de 270
vendedores de revistas de publicidade do país Y, concluiu que 56 são de humor. A um
nível de significância de 5%, teste a hipótese nula de que as proporções de vendedores
de revista dos dois países são iguais. Adopte um teste bilateral.
H 0 : Px  Py H 1 : Px  Py Z 5% / 2  1,96
^ ^
52 62
px  203  0,2562 p y  270  0,20741
^ ^
^
nx p x  n y py 203 * 0,2562  270 * 0,20741
p nx  n y

203  270
 0,22835

9
 ^ ^

 px  p y 
Z   
0,2562  0,20741  1,2512
^  nx  n y
^   203  270 
p(1  p)  0,22835 * (1  0,22835) 
 n n   203 * 270 
 x y 

Conclusão: Como Zobs < Z5%/2, (1,2512<1,96), não há evidencia para rejeitar a
hipótese nula de que as proporções de vendedores de revista dos dois países são
iguais.

(vii) Teste sobre a igualdade de variâncias de duas populações normais

A transformação apropriada corresponde à seguinte formula:

S x2
Fobs  (14)
S y2
onde S 2 no numerador – é a maior variâncias e no denominador, a menor variância
de entre as duas variâncias amostrais

Sabemos das aulas anteriores que a razão F calculada desta maneira segue a
Distribuição F com (k1) gl no numerador e (k2) gl no denominador.

Os valores críticos do teste F encontra-se na Tabela da Distribuição F. Se Fobs > Fα(k1;


k2)Rejeita-se a hipótese nula de que as duas variâncias sejam iguais.

Exemplo 15: Para uma amostra de 17 títulos do tipo AAA recentemente produzidos, a
variância da maturidade (em anos ao quadrado) é de 123.35. Para uma amostra
aleatória e independente de 11 títulos do tipo CCC recentemente produzidos, a
variância é de 80,2. Se denotarmos por  x2 e  y2 as variâncias populacionais de X e de
Y respectivamente, teste a hipótese nula de que H 0 ;  x2   y2 contra a alternativa de que
S x2 123,35
H 0 ;  
2
x
2
y Fobs  2   1,538 F5%(16;10)  2,54
Sy 80,2

Conclusão: Como Fobs < F5%, (1,538<2,54), não há evidencia para rejeitar a hipótese
nula de que as variancias são iguais, ao nivel de significancia de 5%.

10

Você também pode gostar