Você está na página 1de 6

AVALIAO DO ERRO TIPO 1 NA APLICAO DE UM TESTE DE HIPTESES Luciano Amaral da Silva1; Cleber Giugioli Carrasco2

1 2

Bolsista PBIC/UEG, graduando do Curso de Matemtica, UnUCET UEG. Orientador, docente do Curso de Matemtica, UnUCET UEG.

RESUMO

Neste projeto pretendemos avaliar a probabilidade de se cometer o erro tipo I, ao utilizarmos um teste de hipteses para a mdia, atravs de um estudo de simulao conhecido como mtodo de Monte Carlo. Essa avaliao ser feita verificando a influncia do tamanho amostral e do nvel de significncia , na avaliao do erro tipo I. Todo esse procedimento ser implementado computacionalmente no software free R. Exemplos numricos ilustraro a metodologia adotada. Palavras-chave: teste de hipteses, erro tipo I, nvel de significncia.

Introduo Uma hiptese uma pressuposio a respeito de certa caracterstica de uma determinada populao, ou ainda, uma pressuposio sobre os parmetros dessa populao ou de um modelo. Uma vez formulada a hiptese, desejamos test-la a fim de verificar se a rejeitamos ou no. O procedimento que ir verificar se tal hiptese deve ser rejeitada ou no, denominado teste de hipteses (T.H.). Essa hiptese ser testada atravs de resultados amostrais. Dessa forma, o objetivo de um teste de hipteses concluir, atravs de uma estatstica obtida de uma amostra ( ), se rejeitamos ou no a hiptese nula H0, isto pode ser feito construindo uma regio crtica (RC), tambm conhecida como regio de rejeio (Bussab e Morettin, 1987). Se a estatstica obtida da amostra pertencer a RC, temos evidncia para rejeitarmos H0. Caso contrrio, no h evidencias suficiente para rejeitarmos essa hiptese. Esta regio crtica pode ser construda de maneira que P( RC | H0 verdadeira) = . Isto , fixado = 5% por exemplo, esperamos rejeitar H0 quando H0 for verdadeira, isto , cometermos o erro tipo I em 5% das vezes que aplicarmos o teste de hipteses.

A hiptese a ser testada em um teste de hipteses chamada hiptese nula (H0), geralmente, a hiptese nula uma afirmao do tipo no h diferena, ou seja, do tipo igualdade (Moore and McCabe, 1999). A hiptese complementar a hiptese nula denominada hiptese alternativa (HA). O teste de hipteses planejado para avaliar a intensidade da evidncia contra a hiptese nula. As hipteses se referem a alguma populao ou algum modelo, e no a um resultado particular. Dessa forma, devemos formular H0 e HA em termos de parmetros populacionais. Em particular, nem sempre claro se HA deve ser unilateral ou bilateral. Em geral, as hipteses de um teste so dadas por: H0 : = 0 HA : 0 As hipteses alternativas tambm podem ser do tipo unilateral dadas por: HA : < 0 ou HA : > 0
(2) (1)

necessrio, entretanto, tomar cuidado na tomada de deciso sobre a rejeio ou no da hiptese nula, uma vez que, estamos sujeitos a cometer erros. Devido a este problema, as regras de deciso so construdas seguindo critrios que nos permitam reduzir erros na tomada de uma deciso. Em geral, podemos cometer dois tipos de erros ao aplicar um teste de hipteses: Erro tipo I: Ocorre quando rejeitamos H0, e H0 de fato verdadeira. Erro tipo II: Ocorre quando no rejeitamos H0, e H0 de fato falsa. As probabilidades de cometermos os erros tipo I e II so dadas respectivamente por: = P(erro tipo I) = P(rejeitar H0 | H0 verdadeira) = P(erro tipo II) = P(no rejeitar H0 | H0 falsa) A probabilidade de cometermos o erro tipo I denominada nvel de significncia. Ou seja, a probabilidade do teste rejeitar H0, quando de fato H0 verdadeira. Em geral fixado em 10%, 5% ou 1%. Os possveis resultados da aplicao de um teste de hipteses e suas respectivas probabilidades de ocorrncia condicionadas realidade so apresentados na Tabela 1 retirada de Costa Neto 1977.
2

(3)

(4)

Tabela 1: Resultados de um T.H. e suas probabilidades condicionadas realidade Realidade H0 verdadeira Aceitar H0 Deciso Rejeitar H0 deciso correta (1 ) Erro tipo I () H0 falsa Erro tipo II () deciso correta (1 )

Em geral, ao realizar um teste de hipteses controlamos o erro do tipo I, fixando a sua probabilidade de ocorrncia . Entretanto, a determinao de , ou seja, do erro tipo II no fixada, e o seu clculo feito atribuindo alguns valores, escolhidos dentro do caso alternativo. O esquema abaixo juntamente com a Figura 1, apresenta uma formulao de um T.H. bilateral: 1. Determinar as hipteses a serem testadas H0 (nula) e HA (alternativa); 2. Escolher qual estatstica (estimador) ser usada para julgar H0; 3. Fixar a probabilidade de cometer o erro tipo I, ou seja, a P(rejeitar H0 | H0 verdadeira) e usar este valor para construir a RC (regio crtica); 4. Usar as informaes fornecidas pela amostra para encontrar o valor da estatstica ( ) que definir a deciso; 5. Se o valor da estatstica observada na amostra pertencer RC, rejeitar H0, caso contrrio no rejeitar H0.

Hipteses:
H0 : = 0 HA : 0

, distribuio terica de
considerando H0 verdadeira

Figura 1 : Distribuio terica de


3

Regio Crtica:

R| < C1 ou > C2} RC : {


Concluso do teste:

(5)

RC rejeita-se H0, caso contrrio no temos evidncia suficiente para rejeitarmos H0. Se

Material e Mtodos Consideremos inicialmente o teste de hipteses para a mdia com varincia conhecida e, fixamos a probabilidade do erro tipo I, ou seja, o nvel de significncia . A partir disso, geramos uma amostra de tamanho n de um modelo normal com mdia = 0 e aplicamos o teste bilateral e/ou unilateral. Dessa forma definimos = 0 se o teste no rejeitar H0 e = 1 se o teste rejeitar H0. Utilizando o mtodo de Monte Carlo, repetimos o processo r vezes, e verificamos quantas vezes o teste rejeitou a hiptese nula de = 0. Assim temos, i = 0 se o teste no rejeitar H0 i = 1, 2, . . . , r i = 1 se o teste rejeitar H0 Dessa forma podemos estimar o valor de (a probabilidade do erro tipo I), ou seja, P(rejeitar H0 | H0 verdadeira) da seguinte maneira,
r

(6)

* =
i =1

i = 1, 2, . . . , r.

(7)

Esperamos a priori que o valor estimado de * esteja prximo do valor nominal de se a probabilidade do erro tipo I estimada (*) for maior que ento o procedimento dito ser conservativo, caso contrrio, se a probabilidade * for menor que a probabilidade nominal de , ento o procedimento dito anti-conservativo, ou simplesmente no conservativo. Para avaliar o efeito do tamanho amostral e do nvel de significncia na probabilidade de se cometer o erro tipo 1 num teste de hipteses para a mdia com varincia conhecida, atravs do mtodo de Monte Carlo, tomaremos amostras de tamanhos distintas e

fixaremos o nvel de significncia do teste em 10%, 5% e 1%. Dessa forma teremos vrias combinaes de amostras, e para cada caso ser verificado o valor estimado de , ou seja, *. A metodologia adotado foi implementado no software R (Venables and Smith, 2006) onde foram geradas amostras de uma distribuio normal com parmetros = 5 e varincia 2 = 1, e os tamanhos amostrais fixamos em n = 5, 10, 30, 50, 20 e 1000 e, os nveis de significncia dos testes em = 0,10, 0,05 e 0,01. Ao todo foram 18 combinaes de amostras para cada tipo de hiptese alternativa. Para o teste bilateral, as hipteses dos testes foram definidas por testar: H0 : = 5 HA : 5 No caso dos testes unilaterais esquerda e a direita, as hipteses alternativas foram definidas respectivamente por: HA : < 5 e HA : > 5
(9) (8)

Para o clculo estimado do erro tipo 1 no estudo de Monte Carlo utilizou-se r = 1.000, ou seja, repetiu-se o processo 1000 vezes, e verificou-se em cada uma se o teste rejeitou a hiptese nula ou no.

Resultados e Discusso

As Tabelas 2, 3 e 4 apresentam os resultados de simulao para os testes bilateral, unilateral esquerda e unilateral direita respectivamente, para todos os casos. Nessas tabelas observamos que as probabilidades de se cometer o erro tipo I esto prximas do nvel de significncia fixado, tanto para o teste bilateral com para os testes unilaterais. Com relao ao tamanho amostral, no observamos um padro quando diminumos ou aumentamos a amostra, ou seja, no observamos efeito na estimativa do erro tipo I com relao ao tamanho da amostra. Tabela 2: Resultado da simulao para o teste bilateral
5 0,10 0,05 0,01 0,101 0,050 0,010 Tamanho da amostra (n) 10 0,112 0,048 0,011 30 0,110 0,060 0,006 50 0,104 0,047 0,010 200 0,098 0,050 0,006 1000 0,119 0,063 0,007

Tabela 3: Resultado da simulao para o teste unilateral esquerda


5 0,10 0,05 0,01 0,098 0,044 0,007 Tamanho da amostra (n) 10 0,089 0,050 0,007 30 0,110 0,061 0,011 50 0,096 0,058 0,010 200 0,126 0,060 0,011 1000 0,106 0,061 0,015

Tabela 4: Resultado da simulao para o teste unilateral direita


5 0,10 0,05 0,01 0,108 0,057 0,013 Tamanho da amostra (n) 10 0,116 0,062 0,014 30 0,102 0,049 0,011 50 0,095 0,046 0,006 200 0,088 0,038 0,005 1000 0,105 0,058 0,009

Vale ressaltar ainda que para amostras geradas com distintos valores para varincia 2, os resultados encontrados permanecem o mesmo, devido a rea da regio crtica ser sempre fixada em %.

Concluses

Neste trabalho, atravs de um estudo de Monte Carlo verificou-se que a probabilidade de cometer o erro tipo I num T.H. est muito prxima da probabilidade nominal de , ou seja, quando fixamos o nvel de significncia do teste, a probabilidade de se cometer um erro do tipo I esta sob controle, mesmo para tamanhos amostrais variados.

Referncias Bibliogrficas

BUSSAB, W. O.; MORETTIN, P. A. Estatstica Bsica. 4 edio, So Paulo. Atual, 1987. COSTA NETO, P. L. O. Estatstica. So Paulo, Editora Edgar Blcher, 1977. MOORE, D. S.; McCABE, G. P. Introduo Prtica da Estatstica. 3 edio, New York. Editora LTC, 1999. VENABLES, W.N.; SMITH, D. M. An Introduction to R: Notes on R: A Programing Environment for Data Analysis and Grafics, Version 2.4.1, 2006. disponvel em http://cranr.c3sl.ufpr.br/.
6