Você está na página 1de 10

ESTATÍSTICA INDUTIVA

Teste de Hipóteses

MÓDULO 3

1. HIPÓTESE ESTATÍSTICA

Na prática, o maior problema enfrentado por engenheiros e cientistas não é estimar os parâmetros populacionais como a média e o desvio padrão, por exemplo, mas descrever um método que gere conclusões confiáveis a partir de um conjunto de dados. Veja os exemplos as seguir:

Um engenheiro pode ter que conferir se há diferença de massa entre dois lotes de cimento da mesma marca,

Cada um desses casos envolve uma conjectura a respeito daquilo que se deseja saber, ou seja, uma hipótese.

baseado em dados amostrais. Um cientista pode ter que investigar se a ingestão de refrigerante aumenta o risco de infarto, com base em

evidências experimentais. Um estudante de ciências sociais, ao avaliar os resultados do censo, pode desejar saber se há alguma relação

entre o poder aquisitivo e a estatura de uma comunidade.

A

inferência estatística engloba os procedimentos de tomada de decisão, com base em dados experimentais,

sobre a aceitação ou a rejeição da hipótese postulada. A hipótese estatística é uma afirmação ou conjectura sobre uma ou mais populações (Walpole et al., 2009). É impossível afirmar, com 100% de certeza que uma determinada hipótese estatística é verdadeira ou falsa, a menos que se faça uma investigação em toda população. Todavia, trabalhar com todos os dados de uma população é muito oneroso e exaustivo, por isso é comum retirar uma amostra aleatória e a partir dela fazer

análises que forneçam evidências amostrais suficientes para aceitar ou refutar a hipótese sobre a população como um todo.

2. HIPÓTESES

Hipótese Nula (H 0 ): hipótese existente ou a ser testada.

Hipótese Alternativa (H 1 ): hipótese que contraria a hipótese nula, complementar de H 0 .

H 0 : o réu é inocente

H 1 : o réu é culpado

3. TIPOS DE ERROS

Pelo fato de se trabalhar com resultados amostrais para se fazer inferência sobre uma população, o processo está sujeito a erros, ou seja, pode-se tomar decisões corretas ou erradas, por exemplo:

Pode-se rejeitar a hipótese nula (H 0 ) mesmo sendo verdadeira. Pode-se aceitar a hipótese nula (H 0 ) mesmo sendo falsa.

O quadro abaixo resume bem as possibilidades de erros e acertos, para tanto considere que:

a

b

= P(erro do tipo I) = P(rejeitar H 0 / H 0 é verdadeira) = P(erro do tipo II) = P(aceitar H 0 / H 0 é falsa)

Realidade

H 0 verdadeira Decisão correta

(1-a)

H 0 falsa

Erro do tipo II

(b)

Decisão correta

(1-b)

Decisão

Aceitar H 0

Rejeitar H 0

Erro do tipo I

(a)

A partir do quadro acima pode-se inferir que:

Se na realidade H 0 é verdadeira e a decisão é aceitar H 0 , a decisão é correta. Se na realidade H 0 é falsa e a decisão é rejeitar H 0 , a decisão é correta. Se na realidade H 0 é verdadeira e a decisão é rejeitar H 0 , a decisão é um erro denominado erro do tipo I. Se na realidade H 0 é falsa e a decisão é aceitar H 0 , a decisão é um erro chamado de erro do tipo II.

1

Prof. M.Sc. Eng. Braitner Lobato

02/2010

ESTATÍSTICA INDUTIVA

Teste de Hipóteses

MÓDULO 3

Na prática, estes conceitos podem ser extrapolados de tal forma que os erros do tipo I e II podem ser aplicados da seguinte maneira:

Risco do produtor: risco associado à possibilidade de erro do tipo I, ou seja, quando um lote bom é rejeitado.

Risco do consumidor: risco associado à possibilidade de erro do tipo II, ou seja, quando um lote ruim é aceito.

4. NÍVEL DE SIGNIFICÂNCIA

O nível de significância indica qual a probabilidade de erro se está disposto a aceitar, por exemplo, a = 1%,

significa que a probabilidade de aceitar o erro do tipo I é de 1%. Pela distribuição normal, uma área de 0,01 abaixo da curva normal corresponde ao escore padrão de 2,58. Na prática, os valores mais adotados são:

5. ESTATÍSTICA DE TESTE

a

= 1%

z = 2,58 z = 1,64

a

= 5%

A estatística de teste é o cálculo do escore padrão que será usado para comparar com o nível de significância

determinado no problema. No entanto, há dois casos distintos para o cálculo da estatística de teste. Quando o desvio padrão da população for conhecido usa-se a distribuição normal; quando o desvio padrão populacional for desconhecido recomenda-se usar a distribuição t-Student, indicada para amostras menores ou iguais a 30.

Desvio padrão populacional conhecido

Desvio padrão populacional desconhecido

z

=

x

µ

0

t

=

x

µ

0

 

teste

σ

 

teste

s

 
n
n
 
n
n

onde:

 

onde:

z: estatística de teste x: média m 0 :média da população s: desvio padrão da população n: número de elementos na amostra

t: estatística de teste x: média m 0 :média da população s: desvio padrão da amostra n: número de elementos na amostra

6. REGIÃO CRÍTICA

A região crítica é aquela onde os valores da estatística dos testes conduzem à rejeição da hipótese nula (H 0 ). A

área delimitada por essa região é definida como o nível de significância e sua direção é a mesma da hipótese

alternativa (H 1 ).

Unilateral à esquerda

da hipótese alternativa (H 1 ). Unilateral à esquerda H H 0 1 : : µ

H

H

0

1

:

:

µ

µ

=

<

µ

0

µ

0

Unilateral à direita

H H 0 1 : : µ µ = < µ 0 µ 0 Unilateral à

H

H

0

1

:

:

µ

µ

=

>

µ

0

µ

0

Bilateral

à direita H H 0 1 : : µ µ = > µ 0 µ 0

H

H

0

1

:

:

µ

µ

=

µ

0

µ

0

2

Prof. M.Sc. Eng. Braitner Lobato

02/2010

ESTATÍSTICA INDUTIVA

Teste de Hipóteses

MÓDULO 3

7. REGRA DE DECISÃO

Se o valor da estatística do teste cair dentro da região crítica deve-se rejeitar H 0 . Ao rejeitar a hipótese nula (H 0 ) existe uma forte evidência nos dados de sua falsidade. Ao aceitar a hipótese nula (H 0 ) não existe uma forte evidência amostral significativa para rejeitar H 0 .

8. TESTE DE HIPÓTESES OU TESTE DE SIGNIFICÂNCIA

1. Formulação de H 0 e H 1 .

H

H

0

1

:

:

µ

=

µ

0

µ

µ

µ

<

>

µ

0

µ

0

µ

0

2. Escolha de um nível de significância (a) e definição da região crítica. Se o desvio padrão populacional for conhecido, a variável teste será Normal (z) para n > 30 . Se o desvio padrão populacional for desconhecido, a variável teste será t de Student com ϕ = n 1 para n 30 .

3. Cálculo de uma estatística de teste. x − µ x − µ 0 0
3. Cálculo de uma estatística de teste.
x −
µ
x − µ
0
0
=
ou t
=
z cal
σ cal
s
n
n
4. Comparação do valor teste,
z
ou
cal

t

cal

, com o valor tabelado,

z

tab

ou

t

tab

.

5. Rejeitar H 0 se o valor teste excede a região crítica ou aceitar em caso contrário. Se a variável de teste (calculada) cair dentro da região de aceitação não se pode rejeitar H 0 . Se a variável de teste (calculada) cair fora da região de aceitação, rejeita-se H 0 .

Exemplo 01 (Teste de significância para a média). Uma amostra aleatória de 100 registros de mortes em Cabrobó da Serra durante o ano passado revelou uma expectativa de vida de 72 anos. Assumindo um desvio padrão de 9 anos, isso parece indicar que a média da expectativa de vida hoje é maior do que 70 anos? Adote um nível de significância de 0,05.

a) Defina as hipóteses:

b) Calcule a estatística de teste:

c) Identifique a estatística tabelada:

3

Prof. M.Sc. Eng. Braitner Lobato

02/2010

ESTATÍSTICA INDUTIVA

Teste de Hipóteses

MÓDULO 3

d) Comparar o

z

cal

com o

z

tab

:

e) Através da tabela de distribuição de probabilidades determine

f) Conclusão

P = P

(

z > z

cal

)

.

Exemplo 02 (Teste de significância para a média). Um novo fabricante de Cabrobrolândia desenvolveu um novo traço de concreto com carga de ruptura de 8 MPa com desvio padrão de 0,5 MPa. Teste a hipótese de que m = 8 MPa contra a alternativa de que m 8 MPa, se uma amostra aleatória de 50 vigas de concreto foi testada e descobriu-se uma carga de ruptura de 7,8 MPa. Adote um nível de significância de 0,01.

a)

b)

Defina as hipóteses:

Calcule a estatística de teste:

c)

Identifique a estatística tabelada:

d) Comparar o

z

cal

com o

z

tab

:

d) Através da tabela de distribuição de probabilidades determine

e) Conclusão

P = P

(

z < z

cal

)

.

4

Prof. M.Sc. Eng. Braitner Lobato

02/2010

ESTATÍSTICA INDUTIVA

Teste de Hipóteses

MÓDULO 3

Exemplo 03 (Teste de significância para a média). A Thomas Franscisvaldo Edson Lumino Eletric divulgou recentemente um relatório com o consumo semanal de energia elétrica de alguns eletrodomésticos. Verificou-se que um “chapinha” gasta em média 46 kW/h. Se uma amostra aleatória de 12 quartos femininos indica que uma “chapinha” consome 42 kW/h semanalmente, para um nível de significância de 5%, as “chapinhas” gastam, em média, 46 kW/h por semana? Assuma que a distribuição de quilowatts-hora é normal.

a)

b)

c)

Defina as hipóteses:

Calcule a estatística de teste:

Identifique a estatística tabelada:

d) Comparar o

t

cal

com o

t

tab

:

d) Através da tabela de distribuição de probabilidades determine

e) Conclusão

9. TESTE DO QUI-QUADRADO

P = P ( t < t

cal

)

.

Até aqui temos estudado testes paramétricos, testes de hipóteses com relação a um parâmetro populacional ou a comparação entre dois parâmetros. Todavia, há casos em que os testes não dependem de um parâmetro populacional nem de suas estimativas. É nesse cenário que surge o teste do Qui-quadrado. Esse teste é usado quando o objetivo é comparar freqüências observadas com freqüências esperadas e podem ser divididos em três grupos:

Teste de adequação do ajustamento: indicado para verificar se as freqüências observadas concordam ou não com as freqüências teóricas esperadas. Teste de aderência: indicado quando se deseja testar a natureza da distribuição amostral, ou seja, verificar se determinado conjunto de dados tem uma boa ou má aderência a um determinado modelo de distribuição de probabilidade (normal, binomial, Poisson etc) Teste de independência (tabela de contingência): indicado quando se deseja verificar a relação entre duas ou mais variáveis de forma que as frequências observadas podem ser observadas através de uma tabela de contingência.

5

Prof. M.Sc. Eng. Braitner Lobato

02/2010

ESTATÍSTICA INDUTIVA

Teste de Hipóteses

MÓDULO 3

10. PROCEDIMENTO BÁSICO PARA O TESTE DO QUI-QUADRADO

1. Determina as hipóteses:

H

H

0

1

:

:

F

0

F

0

=

F

e

F

e

2. Escolha o nível de significância (a)

3. Calcule a estatística:

χ

cal

2

k

=

i = 1

(

F

o

F

e

) 2

F

e

4. Identificar a estatística tabelada:

5.

χ

tab

2

= χ

ϕ ,α

Comparar o

2

χ

cal

6. Conclusão:

Se

Se

χ

cal

χ

cal

2

2

χ

tab

> χ

tab

2

2

2

com o

χ

tab

2

, aceita-se

, rejeita-se

H .

0

H

0

.

2 2 2 com o χ tab 2 , aceita-se , rejeita-se H . 0 H
2 2 2 com o χ tab 2 , aceita-se , rejeita-se H . 0 H

Exemplo 01 (Teste de adequação do ajustamento). Francisvaldo, funcionário do Departamento Nacional de Trânsito, recebe a missão de verificar se os acidentes em uma das rodovias de Cabrobó da Serra se distribuem igualmente de segunda a sexta-feira. Para tanto, ele fez uma pesquisa e levantou os dados dispostos na tabela abaixo. Admita nível de significância de 5%.

Dia da semana

Segunda

Terça

Quarta

Quinta

Sexta

Número de acidentes

12

09

11

15

18

a) Defina as hipóteses:

b) Calcule a estatística:

χ

cal

2

k

(

F

o

F

e

) 2

=

i

=

1 F

e

Dia da semana

Segunda

Terça

Quarta

Quinta

Sexta

k = 5

Número de acidentes

8

12

23

27

30

 

P

i

           

F e = n.p i

           

6

Prof. M.Sc. Eng. Braitner Lobato

02/2010

ESTATÍSTICA INDUTIVA

Teste de Hipóteses

MÓDULO 3

c) Identifique a estatística tabelada:

ϕ = k 1: quando as frequências esperadas podem ser calculadas sem as estimativas dos parâmetros populacionais a partir das distribuições amostrais. ϕ = k 1 m : quando para a determinação das frequências esperadas, m parâmetros tiverem suas estimativas determinadas a partir das distribuições amostrais.

χ

tab

2

= χ

α ,ϕ

2

d) Comparar o

χ

cal

2

com o

χ

tab

2

e) Conclusão

Exemplo 02 (Teste de independência – tabela de contingência). Cabrobó da Serra é uma cidade que tem crescido bastante. No intuito de investigar se há relação entre o nível de renda e a escolaridade dos Cabroboenses, Francisvaldo fez um censo a partir de uma amostra de 200 moradores, como mostra a tabela abaixo. Verifique se há independência entre a renda e a escolaridade para um nível de significância de 1%.

Nível de renda

Pobre

Rico

Nível de escolaridade

Nível de escolaridade

Fundamental

56

38

Médio

42

44

a) Defina as hipóteses:

b) Calcule a estatística:

χ

cal

2

k

=

i = 1

(

F

o

F

e

) 2

F

e

(

soma da linha i

.

.

. )(

soma da coluna j

.

.

)

.

total . de observações ϕ = (l 1)( c 1) , onde l (linha) e c (coluna)

F

eij

=

.

7

Prof. M.Sc. Eng. Braitner Lobato

02/2010

ESTATÍSTICA INDUTIVA

Teste de Hipóteses

MÓDULO 3

Nível de renda

Nível de escolaridade

Total

Fundamental

Médio

Pobre

90

30

120

Rico

20

60

80

Total

110

90

200

c) Identifique a estatística tabelada:

d) Comparar o

χ

cal

2

com o

χ

tab

2

e) Coeficiente de contingência (grau de relacionamento):

C =

2 χ cal 2 χ + n cal
2
χ
cal
2
χ
+ n
cal

f) Conclusão

H

0

Valor da estatística de teste

H

1

Região crítica

 

µ = µ

0

z

=

x − µ 0 ; σ n
x −
µ
0
;
σ
n

σ conhecido

 

µ µ

0

µ µ

0

µ µ

0

< <

z

> >

z

< −

z

z

α

2

z

z

ou

α

α

z >

z α

2

µ = µ

0

t

=

x

µ

0

s n
s
n

;

v = n 1

σ desconhecido

µ µ

0

µ µ

0

µ µ

0

t

t

< <

> >

2

α

t < −

t

t

t

α

α

ou t >

t α

2

8

Prof. M.Sc. Eng. Braitner Lobato

02/2010

ESTATÍSTICA INDUTIVA

Teste de Hipóteses

MÓDULO 3

EXERCÍCIOS PROPOSTOS

Questão 01 (Walpode, 2009). Uma indústria elétrica fabrica lâmpadas cuja vida útil tem distribuição aproximadamente normal com média de 800 horas e desvio padrão de 40 horas. Teste a hipótese de que m = 800 horas contra a alternativa m 800 horas, se uma amostra aleatória de 30 lâmpadas tem média de vida de 768 horas e determine o valor de a abaixo do qual a média não é significante.

Questão 02 (Walpode, 2009). Afirma-se que um automóvel é dirigido, em média, mais de 20.000 quilômetros por ano. Para testar essa afirmação, uma amostra aleatória de 100 proprietários de automóveis registra os quilômetros viajados. Você concordaria com essa afirmação, se esta amostra mostrasse uma média de 23.500 quilômetros e desvio padrão de 3.900 quilômetros? Use um valor P em sua conclusão?

Questão 03 (Walpode, 2009). Em uma pesquisa feita na Escola de Medicina da Universidade da Califórnia, afirmou-se que os ratos com média de vida de 32 meses viveriam por mais ou menos 40 meses se 40% das calorias de suas refeições fossem substituídas por vitaminas e proteínas. Há alguma razão para acreditarmos que m< 40 se 64 ratos colocados sob essa dieta têm uma média de vida de 38 meses com desvio padrão de 5,8 meses? Use um valor P em sua conclusão.

Questão 04 (Walpode, 2009). Teste a hipótese de que o conteúdo médio de recipientes de certo lubrificante é dez litros, se os conteúdos de uma amostra aleatória de dez recipientes são 10,2; 10,1; 10,3; 10,1; 9,8; 9,9; 10,4; 10.3 e 9.8 litros. Use o nível de significância 0,01 e assuma que a distribuição dos conteúdos dos recipientes é normal.

Questão 05 (Walpode, 2009). A altura média de estudantes calouras do sexo feminino de certa universidade é 162,5 cm, com desvio padrão de 6,9 cm. Há alguma razão para acreditar que houve uma mudança na média das alturas se uma amostra de 50 mulheres na atual classe de calouros tem altura média de 165,2 cm? Use um valor P em sua conclusão. Assuma que o desvio padrão continua o mesmo.

Questão 06 (Lopes, 2003). Teste para α = 5% se há alguma relação entre as notas escolares e o salário.

Salário

Notas Escolares

Alta

Baixa

Média

Alto

18

5

17

Médio

26

16

38

Baixo

6

9

15

Questão 07 (Lopes, 2003). Com o objetivo de investigar a relação entre a situação do emprego no momento em que se aprovou um empréstimo e se saber se o empréstimo está, agora, pago ou não, o gerente de uma financeira selecionou ao acaso 100 clientes obtendo os resultados da tabela abaixo. Teste a hipótese nula de que a situação de emprego e a de empréstimo são variáveis independentes, comα = 5% .

Estado atual do empréstimo

Em mora

Em dia

Situação de empregado

Situação de empregado

Empregado

10

60

Desempregado

8

22

Questão 08 (Walpole, 2009). Em um experimento para estudar a relação entre hipertensão e o hábito de fumar, os seguintes dados forma obtidos de 180 indivíduos. Teste a hipótese de que a presença ou ausência da hipertensão depende dos hábitos relacionados ao fumo. Use um nível de significância de 0,05.

9

Prof. M.Sc. Eng. Braitner Lobato

02/2010

ESTATÍSTICA INDUTIVA

Teste de Hipóteses

MÓDULO 3

 

Não

Fumante

Fumante

Fumante

Moderado

Inveterado

Empregado

Desempregado

Desempregado

Hipertenso

21

36

30

Não hipertenso

48

26

19

Questão 09 (Walpole, 2009). Uma amostra aleatória de 90 adultos é classificada de acordo com o gênero e o número de horas que eles assistem à televisão durante a semana. Use o nível de significância de 0,01 e teste a hipótese de que o tempo gasto com televisão é independente do gênero do telespectador.

Gênero

Masculino

Feminino

Mais de 25 horas

15

29

Menos de 25 horas

27

19

Questão 10 (Walpole, 2009- adaptada). Um perito criminal conduziu uma investigação para determinar se a incidência de certos tipos de crime varia de acordo com a região de uma cidade grande. Os tipos de crime de interesse são: agressão, arrombamento, roubo e homicídio. A tabela a seguir mostra o número de crimes cometidos em quatro áreas da cidade no ano passado. Pode-se concluir, com base nesses dados, num nível de significância de 0,01, que a ocorrência desses tipos de crime depende da área da cidade?

REFERÊNCIA BIBLIOGRÁFICA

Aula 11, Estatística-UVB, Faculdade On-line UVB. Kato, Sérgio, Teste de hipótese, Departamento de estatística, FAMAT, PUCRS. Lopes, Luis Felipe Dias, (2003), Apostila de Estatística, DE-UFSM. Neto, Pedro Luiz de Oliveira Costa (2002); Estatística; Edgard Blücher; 2ª ed.; São Paulo. Walpole, Ronald E., Myers, Raymond H., Myers, Sharon L., Ye, Keying (2009); Probabilidade e Estatística para Engenharia e Ciências; Ed. Pearson, Ed. 8ª; São Paulo.

GABARITO

Questão 01

z

= -1,64

Questão 06

P

= 0,10

Resposta: aceitar H o

Questão 02

z = 8,97; sim, m >20.000 km; P = 0,001

Questão 03

z = -2,76; sim, m <40 meses; P = 0,0029

Questão 04

t = 0,77; não rejeitar H 0

Questão 05

z = 2,77; rejeitar H 0 e concluir que m162,5.

Questão 07 Resposta: aceitar H o

Questão 08 Resposta: rejeitar H o

Questão 09 Resposta: rejeitar H o

Questão 10 Resposta: rejeitar H o

“Porque Deus amou o tanto o mundo, que deu o seu único Filho, para que todo aquele que nele crer não morra, mas tenha a vida eterna” João 3.16

10

Prof. M.Sc. Eng. Braitner Lobato

02/2010