Você está na página 1de 10

Uma Avaliação do Erro Tipo II no Uso do

Teste t-student

Cleber Giugioli Carrasco †


Thiago Santana Lemes 1
Unidade Universitária de Ciências Exatas e Tecnológicas, Universidade Estadual de Goiás,
UnUCET/UEG, 75.132-903, Anápolis, GO

Resumo
O objetivo deste trabalho foi utilizar o método de Monte Carlo para estimar a
probabilidade de se cometer o erro tipo II ao realizar o teste t-student para uma amostra,
o qual é uma ferramenta estatística muito importante na tomada de decisões, através de
um estudo de simulação. Neste estudo, foi verificada a influência do tamanho amostral,
da variabilidade, do nível de significância do teste e das médias alternativas sobre o erro
tipo II. Todo esse procedimento foi implementado computacionalmente no software free
R. Os resultados desse estudo convalidam os resultados teóricos apresentados na
literatura estatística sobre o erro tipo II, ou seja, que esse erro diminui quando se
aumenta o tamanho da amostra e/ou o nível de significância do teste e quando os
valores atribuídos para as médias alternativas se distanciam do valor do parâmetro
fixado na hipótese nula. E ainda, quando o desvio-padrão aumenta, a probabilidade de
ocorrer o erro tipo II também aumenta. Dessa forma, pode-se controlar esse erro, em
particular, através do nível de significância fixado no teste e pelo tamanho da amostra.

Palavras Chave: Método de Monte Carlo, simulação, teste de hipóteses.

____________________________

Email: cleber.carrasco@ueg.br. Docente da Universidade Estadual de Goiás – UEG.
1
Graduado em Licenciatura em Matemática na Unidade de Ciências Exatas e Tecnológicas da
Universidade Estadual de Goiás e voluntário no programa de iniciação científica PVIC/UEG.
________________________________________________________________________
CARRASCO, C. G.; LEMES, T. S. Uma avaliação do erro tipo II no uso do teste t-student. C.Q.D. - Revista Eletrônica Paulista de
Matemática, Bauru, v. 3, p. 7-16, dez. 2014.
DOI: 10.21167/cqdvol3201423169664cgctsl0716 - Disponível em: http://www2.fc.unesp.br/revistacqd/index.jsp
7
Introdução
Quando se tem interesse em testar uma alegação a respeito do valor de um
parâmetro populacional, pode-se utilizar um teste de hipóteses para auxiliar na tomada
da decisão correta. Por exemplo, se afirmam que a altura média de uma população é
1,70 m, pode-se então aceitar ou rejeitar essa afirmação fazendo um teste de hipóteses
para a média. Para isso é necessário em primeiro lugar, definir a hipótese nula (H0) que
será testada e a hipótese alternativa (HA) que será dita aceita caso se rejeite H0. Nesse
caso a hipótese nula é de que a população tem média de altura igual a 1,70 m e a
hipótese alternativa é de que a média de altura é diferente de 1,70 m, podendo também
ser maior ou menor do que 1,70 m, dependendo das informações ou suspeitas a priori do
pesquisador. Feito isso, deve-se estabelecer o nível de significância do teste (α) que
indicará a probabilidade da estatística do teste pertencer a região crítica (RC) quando a
hipótese nula for verdadeira.
Ao definir as hipóteses nula e alternativa para realizar um teste de hipóteses são
encontradas diferentes situações de acordo com o problema em estudo. A partir disso é
possível expressar o teste de três diferentes maneiras:
1) Teste bilateral: Nesse caso o teste será chamado de bilateral, pois se na
hipótese alternativa o parâmetro θ é diferente do valor θ0 ele necessariamente é maior
ou menor do que θ0.
H0:θ = θ0
HA:θ ≠ θ0 (1)

2) Teste unilateral à direita: Nesse caso o teste será chamado de unilateral à


direita, pois θ tem que ser maior do que θ0.
H0:θ = θ0
HA:θ > θ0 (2)

3) Teste unilateral à esquerda: Nesse caso o teste será chamado de unilateral à


esquerda, pois θ tem que ser menor do que θ0.
H0:θ = θ0
HA:θ < θ0 (3)

________________________________________________________________________
CARRASCO, C. G.; LEMES, T. S. Uma avaliação do erro tipo II no uso do teste t-student. C.Q.D. - Revista Eletrônica Paulista de
Matemática, Bauru, v. 3, p. 7-16, dez. 2014.
DOI: 10.21167/cqdvol3201423169664cgctsl0716 - Disponível em: http://www2.fc.unesp.br/revistacqd/index.jsp
8
Assim, de acordo com o problema a ser estudado é que as hipóteses do teste
poderão ser definidas, e a formulação da hipótese alternativa irá depender do grau de
conhecimento que se tem do problema (BUSSAB e MORETTIN 2002). Portanto nem
sempre será possível realizar um teste mais específico como os unilaterais devido à falta
de informações.
Quando um teste de hipóteses é realizado, ele está sujeito a erros que distorcem a
compreensão da veracidade do resultado, e por isso é importante minimizar ao máximo
a probabilidade de se cometer esses erros. Devido a este problema, as regras de decisão
são construídas seguindo critérios que nos permitam reduzir erros na tomada de uma
decisão. Em geral, podemos cometer dois tipos de erros: erro tipo I e tipo II, que podem
ser escritos da seguinte maneira:

Erro Tipo I: Rejeitar H0 quando H0 for verdadeira.


Erro Tipo II: Não rejeitar H0 quando H0 for falsa.

Portanto as probabilidades dos erros tipo I e II podem ser dadas respectivamente


por:
α = P(erro tipo I) = P(rejeitar H0 | H0 é verdadeira)
β = P(erro tipo II) = P(não rejeitar H0 | H0 é falsa) (4)

Note que a probabilidade do erro tipo I é o nível de significância do teste.


A Tabela 1 adaptada de Costa Neto (1977, p. 86) apresenta os resultados de um
teste de hipóteses e suas respectivas probabilidades condicionadas a realidade.

Tabela 1: Erros e decisões corretas resultantes de um teste de hipóteses.


Realidade
Decisão
H0 Verdadeira H0 Falsa
Aceitar H0 Decisão correta (1 – α) Erro Tipo II (β)
Rejeitar H0 Erro Tipo I (α) Decisão correta (1 – β)

________________________________________________________________________
CARRASCO, C. G.; LEMES, T. S. Uma avaliação do erro tipo II no uso do teste t-student. C.Q.D. - Revista Eletrônica Paulista de
Matemática, Bauru, v. 3, p. 7-16, dez. 2014.
DOI: 10.21167/cqdvol3201423169664cgctsl0716 - Disponível em: http://www2.fc.unesp.br/revistacqd/index.jsp
9
Infelizmente não se pode controlar o erro tipo I e o erro tipo II simultaneamente,
ao menos que se aumenta o tamanho da amostra. O que vai ocorrer é que ao diminuir α
estaremos aumentando β e vice versa, como mostra a Figura 1 a seguir, onde θA é um
valor pertencente a hipótese alternativa.

Figura 1: Representação dos erros tipo I e II.

A princípio, sempre é dada grande atenção ao erro tipo I, controlando esse erro
através da escolha do nível de significância do teste e deixando o erro tipo II sem
controle, pois o mesmo requer um procedimento mais complexo para sua avaliação. No
entanto, segundo Bussab e Morettin (2002) fixado α, é possível calcular a probabilidade
do erro tipo II, atribuindo valores arbitrários para o parâmetro θ, que podem ser tanto
menores quanto maiores do que o valor θ0 a ser testado.
Dessa forma, diversos autores avaliaram a probabilidade de ocorrer o erro tipo II
em um teste de hipóteses e mostraram que essa probabilidade pode ser afetada pelo
tamanho amostral, nível de significância do teste, variabilidade e pela distância entre o
valor real do parâmetro e o valor a ser testado. Alguns desses autores utilizaram a
função poder (BUSSAB; MORETTIN, 2002) ou a curva característica de operação
(COSTA NETO, 1977) para mostrar esse resultado.
Neste trabalho propõem-se realizar um estudo de simulação utilizando o método
de Monte Carlo, o qual consiste em repetir o mesmo procedimento várias vezes (MUN,

________________________________________________________________________
CARRASCO, C. G.; LEMES, T. S. Uma avaliação do erro tipo II no uso do teste t-student. C.Q.D. - Revista Eletrônica Paulista de
Matemática, Bauru, v. 3, p. 7-16, dez. 2014.
DOI: 10.21167/cqdvol3201423169664cgctsl0716 - Disponível em: http://www2.fc.unesp.br/revistacqd/index.jsp
10
2006), para mostrar que a probabilidade de ocorrer o erro tipo II em um teste de
hipóteses para a média com variância desconhecida é influenciada pelo tamanho da
amostra, nível de significância do teste, variabilidade e pelos valores das médias
alternativas, corroborando com os resultados teóricos amplamente discutidos na
literatura estatística e, apresentar os resultados desse estudo para que se tenha uma
percepção da dimensão desses erros em termos quantitativos.
Para realizar esse estudo de simulação será utilizado o software free R
(VENABLES AND SMITH, 2012). Segundo Peternelli & Mello (2007, p.81), uma das
maiores vantagens do R é a facilidade na criação de novas funções, este é um dos
motivos para a escolha deste software no desenvolvimento deste trabalho, além de ser
um software gratuito.

1 Material e Métodos
O teste de hipóteses para a média tem o intuito de verificar se determinado
parâmetro referente à média populacional é ou não verdadeiro. Ao realizar um teste de
hipóteses, primeiramente definem-se as hipóteses nula e alternativa e fixa-se o nível de
significância do teste. Ao testar a média de uma determinada população, em geral não se
conhece a sua variância, no entanto, é possível estimá-la através da variância amostral, a
qual é dada por (MAGALHÃES; LIMA, 2008):
n

∑ (x − x)
2
i
S2 = i =1
(5)
n −1
onde xi é o i-ésimo valor da amostra, x a média amostral e n o tamanho da amostra.
Assim, utiliza-se a distribuição t-student com n – 1 graus de liberdade para testar
a média de interesse, por isso o teste é conhecido como t-student. A expressão a seguir
calcula o valor denominado como t observado (tobs) (MAGALHÃES; LIMA, 2008):
x−µ
t obs = (6)
S
n
onde µ é a média populacional e S é o desvio padrão amostral.
Dessa forma é construída a região de rejeição do teste, conhecida como região
crítica, que segundo Costa Neto (1977, p.86) é a faixa de valores da variável de teste

________________________________________________________________________
CARRASCO, C. G.; LEMES, T. S. Uma avaliação do erro tipo II no uso do teste t-student. C.Q.D. - Revista Eletrônica Paulista de
Matemática, Bauru, v. 3, p. 7-16, dez. 2014.
DOI: 10.21167/cqdvol3201423169664cgctsl0716 - Disponível em: http://www2.fc.unesp.br/revistacqd/index.jsp
11
que leva à rejeição de H0. A região crítica é construída com base nos valores
denominado t crítico (tc) da distribuição t-student. Se for constatado que o valor de tobs
pertence à região crítica do teste, rejeita-se a hipótese nula (H0) ao nível de α%, caso
contrário não se rejeita H0.
Para realizar o estudo de simulação para o erro tipo II, serão fixados o nível de
significância do teste e gerado uma amostra de tamanho n no software R a partir de um
modelo normal com média e variância (ou desvio-padrão) pré-estabelecida. Em seguida,
será aplicado o teste t-student para uma amostra (bilateral, unilateral à esquerda e
unilateral à direita), onde será definido um contador δ, tal que δ = 0 se o teste rejeitar H0
e δ = 1 se o teste não rejeitar H0 (CARRASCO; SILVA, 2013).
Através do método de Monte Carlo repetir-se-á o processo descrito acima r
vezes e verificar-se á em quantas delas, o teste rejeitou ou não a hipótese nula. Dessa
forma, a probabilidade do erro tipo II (β) será estimada através da seguinte expressão
adaptada de Carrasco e Silva (2009):
r

∑δ i
β =* i =1
, i = 1,2,3,..., r. (7)
r

Serão feitas diferentes combinações entre tamanhos amostrais, médias


alternativas, desvios padrão (variâncias) e níveis de significância. Este procedimento
será aplicado para o teste bilateral, considerando todas as médias alternativas
escolhidas, para o teste unilateral à esquerda considerando somente as médias
alternativas menores que µ 0, e para o teste unilateral à direita considerando as médias
alternativas maiores que µ 0.

2 Resultados e Discussão
Para realizar o estudo de simulação através do método de Monte Carlo para o
erro tipo II foram geradas amostras de tamanhos n = 5, 10, 20, 30, 40 e 50 a partir de
uma distribuição normal com média µ = µ A (média alternativa) e desvio padrão σ =
0,25; 1 e 5. A escolha desses tamanhos amostrais se deve ao fato do teste t-student ser
indicado para amostras pequenas. Os níveis de significância foram estabelecidos em α =
0,01; 0,05 e 0,10. A hipótese nula foi fixada em H0: µ = 5 e a alternativa em H0: µ ≠ 5

________________________________________________________________________
CARRASCO, C. G.; LEMES, T. S. Uma avaliação do erro tipo II no uso do teste t-student. C.Q.D. - Revista Eletrônica Paulista de
Matemática, Bauru, v. 3, p. 7-16, dez. 2014.
DOI: 10.21167/cqdvol3201423169664cgctsl0716 - Disponível em: http://www2.fc.unesp.br/revistacqd/index.jsp
12
para o teste bilateral e para os testes unilaterais a esquerda e a direita respectivamente
em H0: µ < 5 e H0: µ > 5. Foram escolhidos para o teste bilateral os seguintes valores
para as médias alternativas: µ A = 4,0; 4,5; 4,9; 5,1; 5,5 e 6,0 e, para o teste unilateral à
esquerda os valores menores do que 5,0 e para o teste unilateral à direita os valores das
médias alternativas maiores do que 5,0. Utilizou-se r = 1000 e o nível de significância,
o tamanho amostral e o desvio padrão variaram na medida em que foram feitos os testes
para as três diferentes hipóteses alternativas, com o intuito de verificar a sua influência
sobre o erro tipo II.
Todo o estudo de simulação de Monte Carlo foi realizado no software R. Assim
tem-se 6 x 3 x 3 x 6 x 1000 = 324.000 simulações para avaliar o erro tipo II para os
testes bilaterais e mais 6 x 3 x 3 x 3 x 1000 x 2 = 324.000 simulações para avaliar o erro
tipo II para os testes unilaterais à esquerda e à direita, totalizando 648.000 simulações
neste estudo. Os resultados desse estudo estão condensados nas Tabelas 2 e 3 a seguir.

Tabela 2: Gráficos dos resultados do erro tipo II para o teste unilateral à esquerda.
µA α = 0,01 α = 0,05 α = 0,10
1,0 1,0 1,0

0,8 0,8 0,8

0,6 0,6 0,6

4,0
0,4 0,4 0,4

0,2 0,2 0,2

0,0 0,0 0,0


5 10 20 30 40 50 5 10 20 30 40 50 5 10 20 30 40 50

1,0 1,0 1,0

0,8 0,8 0,8

0,6 0,6 0,6

4,5
0,4 0,4 0,4

0,2 0,2 0,2

0,0 0,0 0,0


5 10 20 30 40 50 5 10 20 30 40 50 5 10 20 30 40 50

1,0 1,0 1,0

0,8 0,8 0,8

0,6 0,6 0,6

4,9
0,4 0,4 0,4

0,2 0,2 0,2

0,0 0,0 0,0


5 10 20 30 40 50 5 10 20 30 40 50 5 10 20 30 40 50

________________________________________________________________________
CARRASCO, C. G.; LEMES, T. S. Uma avaliação do erro tipo II no uso do teste t-student. C.Q.D. - Revista Eletrônica Paulista de
Matemática, Bauru, v. 3, p. 7-16, dez. 2014.
DOI: 10.21167/cqdvol3201423169664cgctsl0716 - Disponível em: http://www2.fc.unesp.br/revistacqd/index.jsp
13
Tabela 3: Gráficos dos resultados do erro tipo II para o teste unilateral à direita.
µA α = 0,01 α = 0,05 α = 0,10
1,0 1,0 1,0

0,8 0,8 0,8

0,6 0,6 0,6

0,4 0,4 0,4


5,1
0,2 0,2 0,2

0,0 0,0 0,0


5 10 20 30 40 50 5 10 20 30 40 50 5 10 20 30 40 50

1,0 1,0 1,0

0,8 0,8 0,8

0,6 0,6 0,6

5,5
0,4 0,4 0,4

0,2 0,2 0,2

0,0 0,0 0,0


5 10 20 30 40 50 5 10 20 30 40 50 5 10 20 30 40 50

1,0 1,0 1,0

0,8 0,8 0,8

0,6 0,6 0,6

6,0
0,4 0,4 0,4

0,2 0,2 0,2

0,0 0,0 0,0


5 10 20 30 40 50 5 10 20 30 40 50 5 10 20 30 40 50

As Tabelas 2 e 3 apresentam os resultados do estudo de simulação para os testes


unilaterais à esquerda e unilaterais à direita, respectivamente, onde o desvio padrão é
representado pelos seguintes valores: σ = 0,25; σ= 1 e σ = 5. Como esperado,
observou-se que a probabilidade de ocorrer o erro tipo II diminui quando o tamanho
amostral e/ou o nível de significância do teste (α) aumentam, fato que também pode ser
observado na Figura 1 e, quando a distância entre a média alternativa µA e a média
estabelecida em H0 (µ = 5) forem maiores. Com relação ao desvio padrão, observou-se
que maiores variabilidades aumentam a chance do erro tipo II. Esses comportamentos
são observados para todos os testes bilaterais e unilaterais, corroborando com os
resultados teóricos apresentados na literatura estatística.
Os resultados dos testes bilaterais foram suprimidos deste trabalho, pois os
mesmos são semelhantes aos resultados apresentados para os testes unilaterais, apenas
ligeiramente diferentes pelo fato da região crítica ser constituída por duas partes.

________________________________________________________________________
CARRASCO, C. G.; LEMES, T. S. Uma avaliação do erro tipo II no uso do teste t-student. C.Q.D. - Revista Eletrônica Paulista de
Matemática, Bauru, v. 3, p. 7-16, dez. 2014.
DOI: 10.21167/cqdvol3201423169664cgctsl0716 - Disponível em: http://www2.fc.unesp.br/revistacqd/index.jsp
14
3 Conclusão
Com a realização deste estudo de simulação através do método de Monte Carlo,
pode-se convalidar os resultados teóricos discutidos na literatura estatística sobre a
probabilidade de se cometer o erro tipo II, ou seja, esse erro diminui na medida em que
se aumenta o tamanho da amostra e/ou o nível de significância do teste, e quando os
valores atribuídos para as médias alternativas se distanciam do valor do parâmetro
fixado na hipótese nula. E ainda, quando o desvio padrão aumenta, a probabilidade de
se cometer o erro tipo II também aumenta. Os resultados desse estudo também
possibilitaram ter uma dimensão quantitativa desse erro através dos gráficos de colunas
apresentados.
Dessa forma é necessário cuidado ao aplicar um teste t-student para a média,
uma vez que se está sujeito a cometer erros. Para o erro tipo II, é necessária a
preocupação com alguns fatores, uma vez que o erro tipo II é sensível ao tamanho
amostral, variabilidade, ao nível de significância do teste e aos valores alternativos da
média, entretanto, pode-se controlar esse erro, em particular através do nível de
significância do teste e do tamanho amostral, controlando assim também a
probabilidade de se tomar uma decisão correta.

Referências
[1] BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 5ª edição. Saraiva, 2002.

[2] CARRASCO, C. G.; SILVA, L. A. Avaliação do erro tipo I na aplicação de um teste


de hipóteses para a média. Revista Mosaicum, Bahia, Nº. 9, p. 63-68, 2009.

[3] CARRASCO, C. G.; SILVA, L. A. Um estudo do erro tipo II em um teste de


hipóteses para a média. Revista Nucleus, V. 10, Nº. 2, p. 7-12, 2013.

[4] COSTA NETO, P. L. O. Estatística. 1ª edição. Edgard Blücher, 1977.

[5] MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. 6ª


edição. Edusp, 2008.

________________________________________________________________________
CARRASCO, C. G.; LEMES, T. S. Uma avaliação do erro tipo II no uso do teste t-student. C.Q.D. - Revista Eletrônica Paulista de
Matemática, Bauru, v. 3, p. 7-16, dez. 2014.
DOI: 10.21167/cqdvol3201423169664cgctsl0716 - Disponível em: http://www2.fc.unesp.br/revistacqd/index.jsp
15
[6] MUN, J. Applying Monte Carlo Simulation, Real Options Analysis, Forecasting,
and Optimization Techniques. 1ª edição. Wiley, 2006.

[7] PETERNELLI, L. A.; MELLO, M. P. Conhecendo o R - Uma visão estatística. 1ª


edição. UFV, 2007.

[8] VENABLES, W. N.; SMITH, D. M. An Introducion to R: Notes on R: A


Programing Environment for Data Analysis and Grafics, Version 2.15.1, 2012.
Disponível em: http://cran-r.c3sl.ufpr.br/.

________________________________________________________________________
CARRASCO, C. G.; LEMES, T. S. Uma avaliação do erro tipo II no uso do teste t-student. C.Q.D. - Revista Eletrônica Paulista de
Matemática, Bauru, v. 3, p. 7-16, dez. 2014.
DOI: 10.21167/cqdvol3201423169664cgctsl0716 - Disponível em: http://www2.fc.unesp.br/revistacqd/index.jsp
16