Você está na página 1de 189

UniversidadeFederalFluminense

DEPARTAMENTO DE ESTATSTICA

InstitutodeMatemticaeEstatstica

INTRODUO INFERNCIA ESTATSTICA


Ana Maria Lima de Farias Luiz da Costa Laurencel

2008

Contedo
1 Inferncia Estatstica - Conceitos Bsicos 1.1 Introduo . . . . . . . . . . . . . . . . . . . . 1.1.1 Exemplo 1 . . . . . . . . . . . . . . . . 1.1.2 Exemplo 2 . . . . . . . . . . . . . . . . 1.2 Populao . . . . . . . . . . . . . . . . . . . . 1.3 Amostra aleatria simples . . . . . . . . . . . 1.4 Estatsticas e Parmetros . . . . . . . . . . . . 1.5 Distribuies Amostrais . . . . . . . . . . . . 1.6 Propriedades de estimadores . . . . . . . . . . 1.7 Alguns Mtodos de Obteno de Estimadores 1.7.1 Mtodo dos momentos . . . . . . . . . 1.7.2 Mtodo da mxima verossimilhana . . 1.8 Resumo do Captulo . . . . . . . . . . . . . . 1.9 Exerccios . . . . . . . . . . . . . . . . . . . . 1.10 Soluo dos Exerccios . . . . . . . . . . . . . 1 1 2 2 3 3 4 5 10 12 12 14 16 17 24 27 27 28 29 34 34 37 37 38 39 41 42 48 48 51 53 54 54

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2 Distribuio Amostral da Mdia 2.1 Mdia e varincia da distribuio amostral da mdia . . 2.2 Distribuio amostral da mdia para populaes normais 2.3 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Lista de Exerccios 1 . . . . . . . . . . . . . . . . 2.4 Teorema Limite Central . . . . . . . . . . . . . . . . . . 2.4.1 Lista de Exerccios 2 . . . . . . . . . . . . . . . . 2.5 Distribuio amostral da varincia amostral . . . . . . . 2.6 Resumo do Captulo . . . . . . . . . . . . . . . . . . . . 2.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8 Soluo das Listas de Exerccios . . . . . . . . . . . . . . 2.9 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . 3 Distribuio Amostral da Proporo 3.1 Aproximao normal da distribuio binomial 3.1.1 Lista de Exerccios 1 . . . . . . . . . . 3.2 A distribuio amostral da proporo . . . . . 3.2.1 Lista de Exerccios 2 . . . . . . . . . . 3.3 Resumo do Captulo . . . . . . . . . . . . . . i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

CONTEDO

ii

3.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.5 Soluo das Listas de Exerccios . . . . . . . . . . . . . . . . . . . . . . . 56 3.6 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4 Intervalos de Conana 4.1 Idias bsicas . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Intervalo de conana: mdia da N (; 2 ), 2 conhecida 4.2.1 Notao . . . . . . . . . . . . . . . . . . . . . . . 4.2.2 Interpretao do intervalo de conana para . . 4.2.3 Lista de Exerccios 1 . . . . . . . . . . . . . . . . 4.3 Margem de erro . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Lista de Exerccios 2 . . . . . . . . . . . . . . . . 4.4 Resumo do Captulo . . . . . . . . . . . . . . . . . . . . 4.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6 Soluo das Listas de Exerccios . . . . . . . . . . . . . . 4.7 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 61 64 64 66 68 68 71 71 72 73 74 78 78 79 82 85 86 87 89 89 90 92 92 94 95 95 96 96 99 101 101 101 105 106

5 Intervalos de Conana: Propores - Amostra Grande 5.1 Estimao de uma proporo populacional . . . . . . . . . 5.2 Intervalo de conana para a proporo populacional . . . 5.3 Determinao do tamanho da amostra . . . . . . . . . . . 5.4 Resumo do Captulo . . . . . . . . . . . . . . . . . . . . . 5.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . .

6 Intervalo de Conana: Mdia da N (; 2 ), 2 Desconhecida 6.1 Idias bsicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Intervalo de conana para a mdia de uma populao normal com varincia desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Margem de erro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Amostras grandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5 Resumo comparativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5.1 IC para a mdia de populaes normais . . . . . . . . . . . . . . . 6.5.2 IC para uma proporo . . . . . . . . . . . . . . . . . . . . . . . . 6.5.3 Intervalo de conana para a mdia de populaes no-normais amostra grande . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.7 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Intervalo de Conana: Varincia da N (; 2 ) 7.1 Idias bsicas . . . . . . . . . . . . . . . . . . 7.2 Intervalo de conana para a varincia de uma 7.3 Exerccios . . . . . . . . . . . . . . . . . . . . 7.4 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . populao . . . . . . . . . . . . . . . . . normal . . . . . . . . . . . . . . . . . . . . . . . . . .

CONTEDO 8 Testes de Hipteses 8.1 Noes bsicas . . . . . . . . . . . . . . . . . . . . . . . . 8.1.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . 8.1.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . 8.1.3 Exemplo 3 . . . . . . . . . . . . . . . . . . . . . . . 8.1.4 Exemplo 4 . . . . . . . . . . . . . . . . . . . . . . . 8.1.5 Exemplo 5 . . . . . . . . . . . . . . . . . . . . . . . 8.1.6 Exemplo 6 . . . . . . . . . . . . . . . . . . . . . . . 8.1.7 Lista de Exerccios 1 . . . . . . . . . . . . . . . . . 8.2 Conceitos bsicos . . . . . . . . . . . . . . . . . . . . . . . 8.2.1 Hiptese nula . . . . . . . . . . . . . . . . . . . . . 8.2.2 Hiptese alternativa . . . . . . . . . . . . . . . . . 8.2.3 Estatstica de teste, erros e regra de deciso . . . . 8.2.4 Regio crtica e nvel de signicncia . . . . . . . . 8.2.5 Funo caracterstica de operao e poder do teste . 8.3 Exemplo 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4 Exemplo 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4.1 Lista de Exerccios 2 . . . . . . . . . . . . . . . . . 8.5 Resumo do Captulo . . . . . . . . . . . . . . . . . . . . . 8.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.7 Soluo das Listas de Exerccios . . . . . . . . . . . . . . . 8.8 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . 9 Teste de Hiptese: Mdia da N (; 2 ) - 2 Conhecida 9.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 9.1.1 Hipteses nula e alternativa . . . . . . . . . . . . 9.1.2 Estatstica de teste . . . . . . . . . . . . . . . . . 9.1.3 Nvel de signicncia e regio crtica . . . . . . . 9.1.4 Determinao da regio crtica . . . . . . . . . . . 9.1.5 Poder . . . . . . . . . . . . . . . . . . . . . . . . 9.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3 Exemplo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . 9.4 Procedimento geral para construo do teste de hiptese de uma N (; 2 ) - 2 conhecida . . . . . . . . . . . . . . 9.4.1 Teste bilateral . . . . . . . . . . . . . . . . . . . . 9.4.2 Teste unilateral direita . . . . . . . . . . . . . . 9.4.3 Teste unilateral esquerda . . . . . . . . . . . . . 9.4.4 Teste de hiptese versus intervalo de conana . . 9.5 Valor P . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.5.1 Teste bilateral - Valor P para o Exemplo 1 . . . . 9.5.2 Teste unilateral direita - Exemplo 2 . . . . . . . 9.5.3 Teste unilateral esquerda - Exemplo 3 . . . . . . 9.6 Exemplo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . 9.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . 9.8 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . .

iii 107 . 107 . 107 . 109 . 111 . 112 . 113 . 114 . 114 . 115 . 115 . 116 . 116 . 116 . 117 . 118 . 119 . 120 . 121 . 122 . 123 . 126 131 132 132 132 132 134 134 135 137 139 140 142 142 143 144 144 145 145 146 148 149

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . sobre a mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

CONTEDO 10 Teste de Hiptese: Propores - Amostra Grande 10.1 Contexto bsico . . . . . . . . . . . . . . . . . . . . 10.2 Teste de hipteses sobre propores . . . . . . . . . 10.2.1 Teste bilateral . . . . . . . . . . . . . . . . . 10.2.2 Testes unilaterais . . . . . . . . . . . . . . . 10.3 Valor P . . . . . . . . . . . . . . . . . . . . . . . . 10.4 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . 10.5 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . 10.6 Resumo do Captulo . . . . . . . . . . . . . . . . . 10.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . 10.8 Soluo dos Exerccios . . . . . . . . . . . . . . . .

iv 154 . 154 . 155 . 156 . 157 . 157 . 157 . 158 . 159 . 160 . 161

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

11 Teste de Hiptese: Mdia da N (; 2 ) - 2 Desconhecida 164 11.1 Contexto bsico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 11.2 Procedimento geral para construo do teste de hiptese sobre a mdia de uma N (; 2 ) - 2 desconhecida . . . . . . . . . . . . . . . . . . . . . 165 11.2.1 Hiptese nula e hiptese alternativa . . . . . . . . . . . . . . . . . 165 11.2.2 Estatstica de teste, erros, regra de deciso . . . . . . . . . . . . . 166 11.2.3 Nvel de signicncia e regio crtica . . . . . . . . . . . . . . . . 168 11.3 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 11.3.1 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 11.3.2 Exemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 11.3.3 Exemplo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 11.4 Poder do teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 11.5 Valor P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 11.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 11.7 Soluo dos Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 12 Teste de Hiptese: Varincia da N (; 2 ) 176 12.1 Contexto bsico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176 12.2 Procedimento geral para construo do teste de hiptese sobre a varincia de uma N (; 2 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 12.2.1 Hiptese nula e hiptese alternativa . . . . . . . . . . . . . . . . . 177 12.2.2 Estatstica de teste, erros, regra de deciso . . . . . . . . . . . . . 177 12.2.3 Nvel de signicncia e regio crtica . . . . . . . . . . . . . . . . 178 12.3 Exemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 12.4 Exemplo 2 (Bussab&Morettin - Exerccio 40 p. 353) . . . . . . . . . . . . 181

Captulo 1 Inferncia Estatstica - Conceitos Bsicos


No estudo de mtodos estatsticos, j foi visto como resumir um conjunto de dados atravs de tabelas de freqncias, grcos e medidas de posio e disperso. Depois, foram estudados modelos probabilsticos, discretos ou contnuos, para descrever determinados fenmenos. Agora, essas ferramentas sero utilizadas no estudo de um importante ramo da Estatstica, conhecido como Inferncia Estatstica, que busca mtodos de fazer armaes sobre caractersticas de uma populao, conhecendo-se apenas resultados de uma amostra. Neste captulo voc estudar os seguintes conceitos: populao e amostra amostra aleatria simples estatsticas e parmetros estimador distribuio amostral de um estimador mtodo dos momentos mtodo da mxima verossimilhana

1.1

Introduo

No estudo da estatstica descritiva, vimos que populao o conjunto de elementos para os quais se deseja estudar determinada(s) caracterstica(s). Vimos tambm que uma amostra um subconjunto da populao. No estudo da inferncia estatstica, o objetivo principal obter informaes sobre uma populao a partir das informaes de uma amostra e aqui vamos precisar de denies mais formais de populao e amostra. Para facilitar a compreenso destes conceitos, iremos apresentar alguns exemplos a ttulo de ilustrao. 1

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

1.1.1

Exemplo 1

Em um estudo antropomtrico em nvel nacional, uma amostra de 5000 adultos selecionada dentre os adultos brasileiros e uma das variveis de estudo a altura. Neste exemplo, a populao o conjunto de todos os brasileiros adultos. No entanto, o interesse (um deles, pelo menos) est na altura dos brasileiros. Assim, nesse estudo, a cada sujeito da populao associamos um nmero correspondente sua altura. Se determinado sujeito sorteado para entrar na amostra, o que nos interessa esse nmero, ou seja, sua altura. Como vimos, essa a denio de varivel aleatria: uma funo que associa a cada ponto do espao amostral um nmero real. Dessa forma, a nossa populao pode ser representada pela varivel aleatria X = altura do adulto brasileiro. Como essa uma varivel aleatria contnua, a ela est associada uma funo de densidade de probabilidade f e da literatura, sabemos que razovel supor que essa densidade seja a densidade normal. Assim, nossa populao, nesse caso, representada por uma varivel aleatria X N (; 2 ). Conhecendo os valores de e teremos informaes completas sobre a nossa populao. Uma forma de obtermos os valores de e medindo as alturas de todos os brasileiros adultos. Mas esse seria um procedimento caro e demorado. Uma soluo, ento, retirar uma amostra (subonjunto) da populao e estudar essa amostra. Suponhamos que essa amostra seja retirada com reposio e que os sorteios sejam feitos de forma independente, isto , o resultado de cada extrao no altera o resultado das demais extraes. Ao sortearmos o primeiro elemento, estamos realizando um experimento que d origem varivel aleatria X1 =altura do primeiro elemento; o segundo elemento d origem varivel aleatria X2 =altura do segundo elemento e assim por diante. Como as extraes so feitas com reposio, todas as varivel aleatria X1 , X2 , . . . tm a mesma distribuio, que reete a distribuio da altura de todos os brasileiros adultos. Para uma amostra especca, temos os valores observados x1 , x2 , . . . dessas variveis aleatrias.

1.1.2

Exemplo 2

Consideremos, agora, um exemplo baseado em pesquisas eleitorais, em que estamos interessados no resultado do segundo turno de uma eleio presidencial brasileira. Mais uma vez, nossos sujeitos de pesquisa so pessoas com 16 anos ou mais, aptas a votar. O interesse nal saber a proporo de votos de um e outro candidato. Vamos considerar uma situao simplicada em que no estamos considerando votos nulos, indecisos, etc. Ento, cada sujeito de pesquisa d origem a uma varivel aleatria binria, isto , uma varivel aleatria que assume apenas dois valores. Como visto, podemos representar esses valores por 1 (candidato A) e 0 (candidato B), o que dene uma varivel aleatria de Bernoulli, ou seja, essa populao pode ser representada pela varivel aleatria X Bern(p). O parmetro p representa a probabilidade de um sujeito dessa populao votar no candidato A. Uma outra interpretao que p representa a proporo populacional de votantes no candidato A. Para obtermos informao sobre p, retira-se uma amostra da populao e, como antes, vamos supor que essa amostra seja retirada com reposio. Ao sortearmos

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

o primeiro elemento, estamos realizando um experimento que d origem varivel aleatria X1 =voto do primeiro elemento; o segundo elemento d origem varivel aleatria X2 =voto do segundo elemento e assim por diante. Como as extraes so feitas com reposio, todas as varivel aleatria X1 , X2 , . . . tm a mesma distribuio de Bernoulli populacional, isto , Xi Bern(p), i = 1, 2, . . . .

1.2

Populao

A inferncia estatstica trata do problema de se obter informao sobre uma populao a partir de uma amostra. Embora a populao real possa ser constituda de pessoas, empresas, animais, etc., as pesquisas estatsticas buscam informaes sobre determinadas caractersticas dos sujeitos, caractersticas essas que podem ser representadas por nmeros. Sendo assim, a cada sujeito da populao est associado um nmero, o que nos permite apresentar a seguinte denio. Denio 1.1 A populao de uma pesquisa estatstica pode ser representada por uma varivel aleatria X que descreve a caracterstica de interesse. Os mtodos de inferncia nos permitiro obter estimativas dos parmetros da distribuio de probabilidade de tal varivel aleatria, que pode ser contnua ou discreta.

1.3

Amostra aleatria simples

Como j dito, bastante comum o emprego da amostragem em pesquisas estatsticas. Nas pesquisas por amostragem, uma amostra selecionada da populao de interesse e todas as concluses sero baseadas apenas nessa amostra. Para que seja possvel inferir resultados para a populao a partir da amostra, necessrio que esta seja representativa da populao. Embora existam vrios mtodos de seleo de amostras, vamos nos concentrar aqui no caso mais simples, que a amostragem aleatria simples. Segundo tal mtodo, toda amostra de mesmo tamanho n tem igual chance (probabilidade) de ser sorteada. possvel extrair amostras aleatrias simples com e sem reposio. Quando estudamos as distribuies binomial e hipergeomtrica, vimos que a distribuio binomial correspondia a extraes com reposio e a distribuio hipergeomtrica correspondia a extraes sem reposio. No entanto, para populaes grandes - ou innitas - extraes com e sem reposio no levam a resultados muito diferentes. Assim, no estudo da Inferncia Estatstica, lidaremos sempre com amostragem aleatria simples com reposio. Este mtodo de seleo atribui a cada elemento da populao a mesma probabilidade de ser selecionado e esta probabilidade se mantm constante ao longo do processo de seleo da amostra (se as extraes fossem sem reposio isso no aconteceria). No restante desse curso omitiremos a expresso com reposio, ou seja, o termo amostragem (ou

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

amostra) aleatria simples sempre se referir amostragem com reposio. Por simplicidade, muitas vezes abreviaremos o termo amostra aleatria simples por amostra aleatria simples. Uma forma de se obter uma amostra aleatria simples escrever os nmeros ou nomes dos elementos da populao em cartes iguais, colocar estes cartes em uma urna misturando-os bem e fazer os sorteios necessrios, tendo o cuidado de colocar cada carto sorteado na urna antes do prximo sorteio. Na prtica, em geral so usados programas de computador, uma vez que as populaes tendem a ser muito grandes. Agora vamos formalizar o processo de seleo de uma amostra aleatria simples, de forma a relacion-lo com os problemas de inferncia estatstica que iremos estudar. Seja uma populao representada por uma varivel aleatria X. De tal populao ser sorteada uma amostra aleatria simples com reposio de tamanho n. Como visto nos exemplos anteriores, cada sorteio d origem a uma varivel aleatria Xi e, como os sorteios so com reposio, todas essas variveis tm a mesma distribuio de X. Isso nos leva seguinte denio. Denio 1.2 Uma amostra aleatria simples (aas) de tamanho n de uma varivel aleatria X (populao) um conjunto de n variveis aleatrias X1 , X2 , ..., Xn independentes e identicamente distribudas (i.i.d.). interessante notar a conveno usual: o valor observado de uma varivel aleatria X representado pela letra minscula correspondente. Assim, depois do sorteio de uma amostra aleatria simples de tamanho n, temos valores observados x1 , x2 , . . . , xn das respectivas variveis aleatrias.

1.4

Estatsticas e Parmetros

Obtida uma amostra aleatria simples, possvel calcular diversas caractersticas desta amostra, como, por exemplo, a mdia, a mediana, a varincia, etc. Qualquer uma destas caractersticas uma funo de X1 , X2 , ..., Xn e, portanto, o seu valor depende da amostra sorteada. Sendo assim, cada uma dessas caractersticas ou funes tambm uma varivel aleatria. Por exemplo, a mdia amostral a varivel aleatria denida por X1 + X2 + + Xn X= n Temos, ento, a seguinte denio: Denio 1.3 Uma estatstica amostral ou estimador T qualquer funo da amostra X1 , X2 , ..., Xn , isto , T = g (X1 , X2 , ..., Xn ) onde g uma funo qualquer.

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS As estatsticas amostrais que consideraremos neste curso so mdia amostral varincia amostral X1 + X2 + + Xn n
n 2 1 P Xi X n 1 i=1

X=

(1.1)

S2 =

(1.2)

Para uma amostra especca, o valor obido para o estimador ser denominado estimativa e, em geral, ser representada por letras minsculas. Por exemplo, temos as seguintes notaes correspondentes mdia amostral e varincia: x e s2 . Outras estatsticas possveis so o mnimo amostral, o mximo amostral, a amplitude amostral, etc. De forma anloga, temos as caractersticas de interesse da populao. No entanto, para diferenciar entre as duas situaes (populao e amostra), atribuimos nomes diferentes. Denio 1.4 Um parmetro uma caracterstica da populao. Assim, se a populao representada pela varivel aleatria X , alguns parmetros so a esperana E (X ) e a varincia V ar(X ) de X . Com relao s caractersticas mais usuais, vamos usar a seguinte notao: Caracterstica Parmetro Estatstica (populao) (amostra) Mdia X Varincia 2 S2 Nmero de elementos N n Lembre-se que, para uma varivel aleatria discreta (nita) uniforme, = E (X ) =
N 1 P Xi N i=1

V ar(X ) =

N N N 1 P 1 P 1 P [Xi E (X )]2 = [Xi ]2 = Xi2 2 N i=1 N i=1 N i=1

1.5

Distribuies Amostrais

Nos problemas de inferncia, estamos interessados em estimar um parmetro da populao (por exemplo, a mdia populacional) atravs de uma amostra aleatria simples X1 , X2 , ..., Xn . Para isso, usamos uma estatstica T (por exemplo, a mdia amostral) e, com base no valor obtido para T a partir de uma particular amostra, iremos tomar as

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

decises que o problema exige. J foi dito que T uma varivel aleatria, uma vez que depende da amostra sorteada; amostras diferentes fornecero diferentes valores para T . Consideremos o seguinte exemplo, onde nossa populao o conjunto {1, 3, 6, 8}, isto , este o conjunto dos valores da caracterstica de interesse da populao em estudo. Assim, para esta populao, ou seja, para essa varivel aleatria X temos E (X ) = = 1 (1 + 3 + 6 + 8) = 4, 5 4

V ar(X ) = 2 = = 7, 25

1 (1 4, 5)2 + (3 4, 5)2 + (6 4, 5)2 + (8 4, 5)2 4

Suponha que dessa populao iremos extrair uma amostra aleatria simples de tamanho 2 e a estatstica que iremos calcular a mdia amostral. Algumas possibilidades de amostra so {1,1}, {1,3}, {6,8}, para as quais os valores da mdia amostral so 1, 2 e 7, respectivamente. Podemos ver, ento, que h uma variabilidade nos valores da estatstica e, assim, seria interessante que conhecssemos tal variabilidade. Conhecendo tal variabilidade, temos condies de saber quo infelizes podemos ser no sorteio da amostra. No exemplo acima, as amostras {1,1} e {8,8} so as que tm mdia amostral mais afastada da verdadeira mdia populacional. Se esses valores tiverem chance muito mais alta do que os valores mais prximos de E (X ), podemos ter srios problemas. Para conhecer o comportamento da mdia amostral, teramos que conhecer todos os possveis valores de X , o que equivaleria a conhecer todas as possveis amostras de tamanho 2 de tal populao. Nesse exemplo, como s temos 4 elementos na populao, a obteno de todas as amostras aleatrias simples de tamanho 2 no difcil. Lembre-se do nosso estudo de anlise combinatria: como o sorteio feito com reposio, em cada um dos sorteios temos 4 possibilidades. Logo, o nmero total de amostras aleatrias simples 4 4 = 16. Por outro lado, em cada sorteio, cada elemento da populao tem a mesma chance de ser sorteado; como so 4 elementos, cada elemento tem probabilidade 1/4 de ser sorteado. Finalmente, como os sorteios so independentes, para obter a probabilidade de um par de elementos pertencer amostra basta multiplicar as probabilidades (lembre-se que Pr(A B ) = Pr(A) Pr(B ) quando A e B so independentes). Na Tabela 1.1 a seguir listamos todas as possveis amostras, com suas respectivas probabilidades e para cada uma delas, apresentamos o valor da mdia amostral. Analisando esta tabela, podemos ver que os possveis valores de X so 1; 2; 3; 3,5; 4,5; 5,5; 6; 7; 8 e podemos construir a sua funo de distribuio de probabilidade, notando, por exemplo, que o valor 2 pode ser obtido atravs de duas amostras: (1,3) ou (3,1). Como essas amostras correspondem a eventos mutuamente exclusivos, a probabilidade de se obter uma mdia amostral igual a 2 Pr(X = 2) = Pr({1, 3} {3, 1}) = Pr({1, 3}) + Pr({3, 1}) 1 2 1 + = = 16 16 16

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS Amostra (1, 1) (1, 3) (1, 6) (1, 8) (3, 1) (3, 3) (3, 6) (3, 8) (6, 1) (6, 3) (6, 6) (6, 8) (8, 1) (8, 3) (8, 6) (8, 8) Probabilidade (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 (1/4) (1/4) = 1/16 Mdia amostral x (1 + 1)/2 = 1 (1 + 3)/2 = 2 (1 + 6)/2 = 3, 5 (1 + 8)/2 = 4, 5 (3 + 1)/2 = 2 (3 + 3)/2 = 3 (3 + 6)/2 = 4, 5 (3 + 8)/2 = 5, 5 (6 + 1)/2 = 3, 5 (6 + 3)/2 = 4, 5 (6 + 6)/2 = 6 (6 + 8)/2 = 7 (8 + 1)/2 = 4, 5 (8 + 3)/2 = 5, 5 (8 + 6)/2 = 7 (8 + 8)/2 = 8

Tabela 1.1: Distribuio amostral da mdia amostral Com o mesmo raciocnio, obtemos a seguinte funo de distribuio de probabilidade para X : x 1 2 3 3, 5 4, 5 5, 5 6 7 8 Pr(X = x) 1/16 2/16 1/16 2/16 4/16 2/16 1/16 2/16 1/16 Note que a varivel aleatria de interesse aqui X ! Da segue que E (X ) = 1 2 1 2 1 +2 +3 + 3, 5 + 16 16 16 16 2 1 2 1 5 + 5, 5 +6 +7 +8 4, 5 16 16 16 16 16 = 4, 5 =

e V ar(X ) = (1 4, 5)2 1 2 1 + (2 4, 5)2 + (3 4, 5)2 16 16 16 2 5 2 +(3, 5 4, 5)2 + (4, 5 4, 5)2 + (5, 5 4, 5)2 16 16 16 1 2 1 + (7 4, 5)2 + (8 4, 5)2 +(6 4, 5)2 16 16 16 2 2 7, 25 = = = 3, 625 = 2 2 n

Neste exemplo podemos ver que E (X ) = e V ar(X ) = 2 /2, onde 2 o tamanho da amostra. Esses resultados esto nos dizendo que, em mdia (esperana), a estatstica

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

X igual mdia da populao e que sua varincia igual varincia da populao dividida pelo tamanho da amostra. Na Figura 1.1 temos os grcos da funo de distribuio de probabilidade de X (populao) na parte (a) e de X (amostra) na parte (b). Podemos ver que a mdia de ambas 4,5 (ambas so simtricas em torno de 4,5) e que a distribuio de X tem menor disperso em torno dessa mdia. Note que essa mdia e essa varincia so calculadas ao longo de todas as possveis amostra aleatria simples de tamanho 2.

0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 6 7 8 9

(a)
0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 6 7 8 9

(b)

Figura 1.1: Funo de distribuio de probabilidade de X e de X para aas de tamanho 2 tirada da populao {1, 3, 6, 8} Consideremos, agora, a mesma situao, s que, em vez de estudarmos a mdia amostral, uma medida de posio, vamos estudar a disperso. Como visto, a varincia populacional V ar(X ) = 7, 25. Para a amostra, vamos trabalhar com dois estimadores. Um deles vai ser S 2 , denido na Equao (1.2) e o outro vai ser b2 =
n 2 1P Xi X n i=1

(1.3)

Da mesma forma que zemos para a mdia amostral, vamos calcular o valor dessas estatsticas para cada uma das amostras. Na Tabela 1.2 temos os resultados parciais e globais de interesse.

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS Amostra (1, 1) (1, 3) (1, 6) (1, 8) (3, 1) (3, 3) (3, 6) (3, 8) (6, 1) (6, 3) (6, 6) (6, 8) (8, 1) (8, 3) (8, 6) (8, 8) x 1 2 3, 5 4, 5 2 3 4, 5 5, 5 3, 5 4, 5 6 7 4, 5 5, 5 7 8 (x1 x)2 (1 1)2 (1 2)2 (1 3, 5)2 (1 4, 5)2 (3 2)2 (3 3)2 (3 4, 5)2 (3 5, 5)2 (6 3, 5)2 (6 4, 5)2 (6 6)2 (6 7)2 (8 4, 5)2 (8 5, 5)2 (8 7)2 (8 8)2 (x2 x)2 (1 1)2 (3 2)2 (6 3, 5)2 (8 4, 5)2 (1 2)2 (3 3)2 (6 4, 5)2 (8 5, 5)2 (1 3, 5)2 (3 4, 5)2 (6 6)2 (8 7)2 (1 4, 5)2 (3 5, 5)2 (6 7)2 (8 8)2
2 P

i=1

(xi x)2 0 2 12, 5 24, 5 2 0 4, 5 12, 5 12, 5 4, 5 0 2 24, 5 12, 5 2 0

S2

0 0 2 1 12, 5 6, 25 24, 5 12, 25 2 1 0 0 4, 5 2, 25 12, 5 6, 25 12, 5 6, 25 4, 5 2, 25 0 0 2 1 24, 5 12, 25 12, 5 6, 25 2 1 0 0

b2

Tabela 1.2: Distribuio amostral de 2 estimadores da varincia Podemos ver que a funo de distribuio de probabilidade de S 2 s2 0 2 4, 5 12, 5 24, 5 2 2 Pr(S = s ) 4/16 4/16 2/16 4/16 2/16 e a funo de distribuio de probabilidade de b2 Para essas distribuies temos: E (S 2 ) = 0 = e E ( b2 ) = 0 = 4 2 4 2 4 +1 + 2, 25 + 6, 25 + 12, 25 16 16 16 16 16

k 0 1 2, 25 6, 25 12, 25 2 Pr( b = k) 4/16 4/16 2/16 4/16 2/16 116 = 7, 25 = 2 = V ar(X ) 16 4 2 4 2 4 +2 + 4, 5 + 12, 5 + 24, 5 16 16 16 16 16

58 = 3, 625 16

Vemos que, em mdia, S 2 igual varincia populacional, o que no ocorre com b2 . Estes dois exemplos ilustram o fato de que qualquer estatstica amostral T uma varivel aleatria, que assume diferentes valores para cada uma das diferentes amostras e

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

10

tais valores, juntamente com a probabilidade de cada amostra, nos forneceriam a funo de distribuio de probabilidades de T , caso fosse possvel obter todas as amostra aleatria simples de tamanho n da populao. Isso nos leva seguinte denio, que um conceito central na Inferncia Estatstica. Denio 1.5 A funo de distribuio amostral de uma estatstica T a funo de distribuio de probabilidades de T ao longo de todas as possveis amostras de tamanho n. Podemos ver que a obteno da distribuio amostral de qualquer estatstica T um processo to ou mais complicado do que trabalhar com a populao inteira. Na prtica, o que temos uma nica amostra e com essa nica amostra que temos que tomar as decises pertinentes ao problema em estudo. Esta tomada de deciso, no entanto, ser facilitada se conhecermos resultados tericos sobre o comportamento da distribuio amostral.

1.6

Propriedades de estimadores

No exemplo anterior, relativo varincia amostral, vimos que E (S 2 ) = 2 e E ( b2 ) 6= 2 . Analogamente, vimos tambm que E (X ) = . Vamos entender direito o que esses resultados signicam, antes de passar a uma denio formal da propriedade envolvida. Dada uma populao, existem muitas e muitas amostra aleatria simples de tamanho n que podem ser sorteadas. Cada uma dessas amostras resulta em um valor diferente da estatstica de interesse (X e S 2 , por exemplo). O que esses resultados esto mostrando como esses diferentes valores se comportam em relao ao verdadeiro (mas desconhecido) valor do parmetro. Considere a Figura 1.2, onde o alvo representa o valor do parmetro e os tiros, indicados pelos smbolo x, representam os diferentes valores amostrais da estatstica de interesse. Nas partes (a) e (b) da gura, os tiros esto em torno do alvo, enquanto nas partes (c) e (d) isso no acontece. Comparando as partes (a) e (b), podemos ver que na parte (a) os tiros esto mais concentrados em torno do alvo, isto , tm menor disperso. Isso reete uma pontaria mais certeira do atirador em (a). Analogamente, nas partes (c) e (d), embora ambos os atiradores estejam com a mira deslocada, os tiros do atirador (c) esto mais concentrados em torno de um alvo; o deslocamento poderia at ser resultado de um desalinhamento da arma. J o atirador (d), alm de estar com o alvo deslocado, ele tem os tiros mais espalhados, o que reete menor preciso. Traduzindo esta situao para o contexto de estimadores e suas propriedades, temos o seguinte: nas partes (a) e (b), temos dois estimadores que fornecem estimativas centradas em torno do verdadeiro valor do parmetro, ou seja, as diferentes amostras fornecem valores distribudos em torno do verdadeiro valor do parmetro. A diferena que em (b) esses valores esto mais dispersos e, assim, temos mais chance de obter uma amostra infeliz, ou seja, uma amostra que fornea um resultado muito afastado do

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

11

Figura 1.2: Propriedades de estimadores valor do parmetro. Essas duas propriedades esto associadas esperana e varincia do estimador, que so medidas de centro e disperso, respectivamente. Nas partes (c) e (d), as estimativas esto centradas em torno de um valor diferente do parmetro de interesse e na parte (d), a disperso maior. Temos, assim, ilustrados os seguintes conceitos. Denio 1.6 Um estimador T dito um estimador no-viesado do parmetro se E (T ) = . Como nos exemplos vistos, essa esperana calculada ao longo de todas as possveis amostras, ou seja, a esperana da distribuio amostral de T. Nas partes (a) e (b) da Figura 1.2 os estimadores so no-viesados e nas partes (c) e (d), os estimadores so viesados. Com relao aos estimadores X, S 2 e b2 , veremos formalmente que os dois primeiros so no-viesados para estimar a mdia e a varincia populacionais, respectivamente, enquanto b2 viesado para estimar a varincia populacional. Essa a razo para se usar S 2 , e no b2 . Denio 1.7 Se T1 e T2 so dois estimadores no-viesados do parmetro , diz-se que T1 mais eciente que T2 se V ar(T1 ) < V ar(T2 ).

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

12

Na Figura 1.2, o estimador da parte (a) mais eciente que o estimador da parte (b). Uma outra propriedade dos estimadores est relacionada idia bastante intuitiva de que medida que se aumenta o tamanho da amostra, mais perto devemos car do verdadeiro valor do parmetro. Denio 1.8 Uma seqncia {Tn } de estimadores de um prmetro consistente se, para todo > 0 lim Pr {|Tn | > } = 0
n

Uma maneira alternativa de vericar se uma seqncia de estimadores consistente dada a seguir. Teorema 1.1 Uma seqncia {Tn } de estimadores de um prmetro consistente se lim V ar(Tn ) = 0
n

lim E (Tn ) =

1.7

Alguns Mtodos de Obteno de Estimadores

Denidas as propriedades desejveis de um estimador, a questo que se coloca : como conseguir estimadores? Neste curso vamos ver 2 mtodos, que, no entanto, no esgotam as possibilidades. Por exemplo, no estudo dos modelos de regresso usado o mtodo dos mnimos quadrados, que no ser abordado aqui. O contexto geral o seguinte: de uma populao representada pela varivel aleatria X extrai-se uma amostra aleatria simples X1 , X2 , . . . , Xn com o objetivo de se estimar um parmetro = (1 , 2 , . . . , r ) . A distribuio de probabilidade f da varivel X depende de tal parmetro, o que representaremos por f (x; ).

1.7.1

Mtodo dos momentos

A idia geral do mtodo dos momentos a seguinte: o estimador b ser obtido como soluo das equaes que igualam os momentos populacionais aos momentos amostrais. Denio 1.9 O momento k de ordem k de uma varivel aleatria X denido como k = E (X k ) Se X contnua, temos que k = e para o caso discreto Z

xk f (x; )dx xk f (x; )

k =

P
x

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

13

Denio 1.10 Dada uma amostra aleatria simples X1 , X2 , . . . , Xn de uma populao X, o momento amostral mk de ordem k denido como mk =
n 1P Xk n i=1 i

b o estimador para obtido pelo mtodo dos momentos se ele for Denio 1.11 soluo das equaes mk = k k = 1, 2, . . . , r Exemplo: Distribuio de Poisson Seja X P oi(). Vamos obter o estimador pelo mtodos dos momentos para . A distribuio de probabilidade de X Pr(X = x) = e foi visto que E (X ) = = 1 . Igualando b=X 1 = m1 = 1 x/ e x e x!

Exemplo: Distribuio Exponencial Seja X exp( ). Ento

f (x; ) =

b = X. e E (X ) = . Como na Poisson, o estimador pelo mtodo dos momentos ser Com a outra parametrizao f (x; ) = ex temos que E (X ) = 1 b= 1. e o estimador pelo mtodo dos momentos de X

Exemplo: Distribuio Normal Se X N (; 2 ), temos que

E (X ) = = 1 = V ar(X ) = 2 = E (X 2 ) [E (X )]2 = 2 = 2 (1 )2 = 2 Resulta que os estimadores pelo mtodo dos momentos so b = X 2 1P 2 1 P 2 Xi X = Xi X n n

b2 = m2 m2 1 =

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

14

1.7.2

Mtodo da mxima verossimilhana

pela hiptese de independncia das variveis aleatrias. O parmetro desconhecido, mas xo, ou seja, fX (x; ) depende deste nico parmetro. Depois de sorteada a amostra, os valores observados de X1 , X2 , . . . , Xn esto xos. O mtodo da mxima b que maximiza a probverossimilhana consiste em estimar o parmetro pelo valor abilidade de se observar esses valores da amostra. A ttulo de ilustrao deste conceito, vamos considerar uma amostra aleatria simples de tamanho 1 retirada de uma populao N (; 1). Nosso objetivo estimar a mdia a partir desta amostra de tamanho 1. Suponhamos que a amostra sorteada resulte na observao x = 2. Essa observao poderia ter vindo de qualquer distribuio normal com varincia 1. Na Figura 1.3 temos 3 dessas possveis distribuies: todas tm varincia 1 mas suas mdias so diferentes. Os pontos coloridos correspondem ao valor da respectiva funo de densidade no ponto observado x = 2. O mtodo de mxima verossimilhana fornece o estimador b como sendo aquele que maximiza f (2). Note que agora quem est variando o parmetro , ou seja, estamos escolhendo o melhor , que aquele que maximiza f (2). Podemos ver que o mximo ocorre quando = 2 (curva do meio - em azul).
0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00

Se X1 , X2 , . . . , Xn uma amostra aleatria simples retirada de uma populao X fX (x; ), ento X1 , X2 , . . . , Xn so variveis aleatrias (porque dependem da amostra a ser sorteada) independentes e identicamente distribudas e sua distribuio conjunta n Q fX1 ,...,Xn (x1 , x2 , . . . , xn ; ) = fX (xi ; )
i=1

-6

-4

-2

Figura 1.3: Exemplo da mxima verossimilhana - amostra de tamanho 1 da N (; 1) Vamos, agora, formalizar esse procedimento.

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

15

Denio 1.12 Sejam x1 , x2 , . . . , xn os valores observados de uma amostra aleatria simples X1 , X2 , . . . , Xn retirada de uma populao X fX (x; ). A funo de verossimilhana denida por L(|x) = L(|x1 , x2 , . . . , xn ) =
n Q

i=1

f (xi |)

O processo para encontrar o estimador de mxima verossimilhana consiste, ento, em maximizar a funo de verossimilhana. Muitas vezes esse processo de maximizao car mais simples se trabalharmos com o logaritmo natural de L(|x). Como a funo logartmica crescente, os mximos de L(|x) e lnL(|x) ocorrero no mesmo ponto. Vamos denotar por (|x) o logaritmo natural de afuno de verossimilhana, isto : (|x) = ln L(|x) Essa funo chamada funo log-verossimilhana. Exemplo: Distribuio de Poisson Seja X1 , X2 , . . . , Xn uma amostra aleatria simples da populao X P oi(). Ento, a funo de distribuio de probabilidade conjunta xi n Q Pr(X1 = x1 , . . . , Xn = xn |) = e xi ! i=1 e a funo de verossimilhana L(|x) = L(|x1 , x2 , . . . , xn ) =
n Q

Note que a funo de verossimilhana uma funo de ; os valores xi esto xos, correspondendo amostra observada. b que maximiza L(|x). O estimador de mxima verossimilhana de o valor

i=1

xi e xi !

Tomando o logaritmo natural da funo de verossimilhana obtm-se xi xi n n Q P (|x) = ln L(|x) = ln = ln e e xi ! xi ! i=1 i=1 n P ln(xi ) + ln e ln xi ! = = = ln
i=1 n P i=1 n P

(xi ln ) +

i=1

i=1

xi n

n P

[() ln e]
i=1 n P

i=1

(ln xi !)

n P

(ln xi !)

Para achar o mximo de (|x) temos que derivar em relao a :e igualar essa derivada a zero: Pn n xi d (|x) 1P b=X b = 0 xi n = 0 = i=1 b d n i=1

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS A derivada segunda


n d2 (|x) 1 P = xi < 0 d2 2 i=1

16

b = X corresponde a um ponto de mximo global, uma vez que lim L(|x) = e, portanto, 0. Exemplo: Distribuio normal Se a populao X N (; 2 ) , a funo de verossimilhana n Q (xi )2 1 2 L(; |x) = exp 2 2 2 2 i=1 e 1 (xi )2 (; |x) = ln L(; |x) = ln exp 2 2 2 2 i=1 n n X X 1 (xi )2 = ln + ln exp 2 2 2 2 i=1 i=1 n X (xi )2 2 1/2 = n ln 2 2 2 i=1
2 2 n X

n n 1 X (xi )2 = ln 2 ln 2 2 2 2 i=1 2
n

Pode-se mostrar que esse realmente um ponto de mximo global e, portanto x e b2 so os estimadoresde mxima verossimilhana da mdia e da varincia da normal. Os estimadores de mxima verossimilhana gozam de propriedades importantes que, no entanto, no sero estudadas nesse curso.

n (x n b)2 n 1P 1P i 2 = 0 + = 0 b = (xi x)2 2 2 2 2 i=1 ( 2 )2 n i=1

n 1 P b=x = 0 2 (xi ) = 0 i=1

1.8

Resumo do Captulo

Ao nal deste captulo, voc dever ser capaz de compreender perfeitamente os seguintes conceitos: A populao de uma pesquisa estatstica descrita por uma varivel aleatria X, que descreve a caracterstica de interesse. Essa varivel aleatria pode ser discreta ou contnua.

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

17

O mtodo de amostragem aleatria simples atribui, a cada amostra de tamanho n, igual probabilidade de ser sorteada. Se os sorteios dos elementos da amostra so feitos com reposio, cada sujeito da populao tem a mesma probabilidade de ser sorteado e essa probabilidade se mantm constante. Dessa forma, uma amostra aleatria simples com reposio de uma populao X um conjunto X1 , X2 , . . . , Xn de variveis aleatrias independentes e identicamente distribudas, todas com a mesma distribuio da populao X. Uma estatstica ou estimador T qualquer funo de X1 , X2 , . . . , Xn , isto , T = g(X1 , X2 , . . . , Xn ). Como o estimador depende da amostra sorteada, ele tambm uma varivel aleatria. Os estimadores descrevem caractersticas da amostra. Um parmetro uma caracterstica da populao. As caractersticas que iremos estudar so a mdia ( e X ) e a varincia ( 2 e S 2 ). Como cada estimador uma varivel aleatria, ele pode ser descrito pela sua funo de distribuio, que chamada distribuio amostral do estimador. A distribuio amostral de um estimador a distribuio ao longo de todas as possveis amostras de mesmo tamanho n. Como sempre, a mdia e a varincia de uma distribuio de probabilidades so parmetros de posio e disperso. No caso da distribuio amostral de um estimador, esses parmetros referem-se distribuio ao longo de todas as possveis amostras. Assim, a mdia de uma distribuio amostral refere-se mdia dos possveis valores do estimador ao longo de todas as possveis amostras e a varincia reete a disperso desses valores em torno dessa mdia. Um estimador no-viesado se a sua mdia igual ao parmetro que ele pretende estimar. Isso signica que os valores do estimador ao longo de todas as possveis amostras esto centrados no parmetro populacional. Dados dois estimadores no-viesados de um mesmo parmetro, T1 e T2 , diz-se que T1 mais eciente que T2 se sua varincia for menor, ou seja, se V ar(T1 ) > V ar(T2 ). Uma seqncia {Tn } de estimadores de um ( parmetro consistente se, para todo lim E (Tn ) = n > 0, lim Pr {|Tn | > } = 0 ou se lim V ar(Tn ) = 0 n
n

Mtodos de estimao: mtodos dos momentos e da mxima verossimilhana.

1.9

Exerccios

1. Obtenha o estimador de mxima verossimilhana para o parmetro da distribuio exponencial.

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

18

2. Para xar as idias sobre os conceitos apresentados neste captulo, voc ir trabalhar com amostras aleatrias simples de tamanho 3 retiradas da populao {1, 2, 4, 6, 8}. Pelo princpio da multiplicao, o nmero total de amostras 5 1 5 5 = 125 e cada uma dessas amostras tem probabilidade 1 1 1 = 125 . Iremos 5 5 5 considerar os seguintes estimadores para a mdia da populao: mdia amostral: X= mdia amostral ponderada: Xp = ponto mdio min(X1 , X2 , X3 ) + max(X1 , X2 , X3 ) 2 O que voc ir mostrar que (i) X e X p so no-viesados e que X mais eciente que X p ; (ii) viesado, mas sua varincia menor que a varincia de X e de X p . Para isso, voc ir seguir os seguintes passos: = (a) Calcule a mdia e a varincia 2 da populao. (b) Nas cinco tabelas a seguir, voc tem listadas as 125 amostras. Para cada uma das amostras, calcule os valores dos estimadores. Para as 6 primeiras amostras os clculos j esto feitos, a ttulo de ilustrao. Voc no precisa indicar todas as contas; apenas use a mquina de calcular e anote o resultado obtido. (c) Obtenha a funo de distribuio de probabilidade, explicitando os diferentes valores de cada um dos estimadores e suas respectivas probabilidades (d) Calcule a esperana e a varincia de cada um dos estimadores. (e) Verique as armativas feitas no enunciado do problema. X1 + 2X2 + X3 4 X1 + X2 + X3 3

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

19

Amostra X1 X2 X3 1 1 1 1 1 2 1 1 4 1 1 6 1 1 8 1 2 1 1 2 2 1 2 4 1 2 6 1 2 8 1 4 1 1 4 2 1 4 4 1 4 6 1 4 8 1 6 1 1 6 2 1 6 4 1 6 6 1 6 8 1 8 1 1 8 2 1 8 4 1 8 6 1 8 8

X
1+1+1 =1 3 1+1+2 =4 3 3 1+1+4 =2 3 1+1+6 =8 3 3 1+1+8 10 = 3 3 1+2+1 =4 3 3

Estimador Xp 1+21+1 =1 4 1+21+2 =5 4 4 1+21+4 = 7 4 4 1+21+6 9 = 4 4 1+21+8 11 = 4 4 1+22+1 =6 4 4

1+1 2 1+2 2 1+4 2 1+6 2 1+8 2 1+2 2

=1 =3 2 =5 2 =7 2 =9 2 =3 2

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS Amostra X1 X2 X3 2 1 1 2 1 2 2 1 4 2 1 6 2 1 8 2 2 1 2 2 2 2 2 4 2 2 6 2 2 8 2 4 1 2 4 2 2 4 4 2 4 6 2 4 8 2 6 1 2 6 2 2 6 4 2 6 6 2 6 8 2 8 1 2 8 2 2 8 4 2 8 6 2 8 8 Estimador Xp

20

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS Amostra X1 X2 X3 4 1 1 4 1 2 4 1 4 4 1 6 4 1 8 4 2 1 4 2 2 4 2 4 4 2 6 4 2 8 4 4 1 4 4 2 4 4 4 4 4 6 4 4 8 4 6 1 4 6 2 4 6 4 4 6 6 4 6 8 4 8 1 4 8 2 4 8 4 4 8 6 4 8 8 Estimador Xp

21

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS Amostra X1 X2 X3 6 1 1 6 1 2 6 1 4 6 1 6 6 1 8 6 2 1 6 2 2 6 2 4 6 2 6 6 2 8 6 4 1 6 4 2 6 4 4 6 4 6 6 4 8 6 6 1 6 6 2 6 6 4 6 6 6 6 6 8 6 8 1 6 8 2 6 8 4 6 8 6 6 8 8 Estimador Xp

22

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS Amostra X1 X2 X3 8 1 1 8 1 2 8 1 4 8 1 6 8 1 8 8 2 1 8 2 2 8 2 4 8 2 6 8 2 8 8 4 1 8 4 2 8 4 4 8 4 6 8 4 8 8 6 1 8 6 2 8 6 4 8 6 6 8 6 8 8 8 1 8 8 2 8 8 4 8 8 6 8 8 8 Estimador Xp

23

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

24

1.10

Soluo dos Exerccios


1 xn / 1 1P 1 x1 / xi e = n exp L( |x) = e ( |x) = n ln 1P xi

1. A funo de verossimilhana

A log-verossimilhana

Derivando e igualando a 0:

2. Para a populao temos que 1+2+4+6+8 = = 4, 2 5 12 + 22 + 42 + 62 + 82 (4, 2)2 = 6, 56 2 = 5

d ( |x) n 1 P b = 1 P xi = x = 0 + 2 xi = 0 d n

Completando-se as tabelas dadas, chegamos s seguintes funes de distribuio de probabilidade dos estimadores: X Pr(X = x) Clculo de E (X ) Clculo de V ar(X ) 2 x p px E (X ) 3/3 1/125 3/375 (3/3)2 (1/125) 4/3 3/125 12/375 (4/3) (3/125) 5/3 3/125 15/375 (5/3) (3/125) 6/3 4/125 24/375 (6/3)2 (4/125) 7/3 6/125 42/375 (7/3)2 (6/125) 8/3 6/125 48/375 (8/3)2 (6/125) 9/3 9/125 81/375 (9/3)2 (9/125) 10/3 9/125 90/375 (10/3)2 (9/125) 11/3 12/125 132/375 (11/3)2 (12/125) 12/3 10/125 120/375 (12/3)2 (10/125) 13/3 9/125 117/375 (13/3)2 (9/125) 14/3 12/125 168/375 (14/3)2 (12/125) 15/3 6/125 90/375 (15/3)2 (6/125) 16/3 12/125 192/375 (16/3)2 (12/125) 17/3 3/125 51/375 (17/3)2 (3/125) 18/3 10/125 180/375 (18/3)2 (10/125) 20/3 6/125 120/375 (20/3)2 (6/125) 22/3 3/125 66/375 (22/3)2 (3/125) 24/3 1/125 24/375 (24/3)2 (1/125) Soma 1575/375 22305/ (9 125)

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS Logo, E (X ) = e V ar(X ) =

25

1575 = 4, 2 = 375

2 22305 6, 56 (4, 2)2 = 2, 186667 = = 9 125 3 3

X p Pr(X p = x) Clculo de E (X p ) Clculo de V ar(X p ) 2 x p px E (X p ) 4/4 1/125 4/500 (4/4)2 (1/125) 5/4 2/125 10/500 (5/4)2 (2/125) 6/4 2/125 12/500 (6/4)2 (2/125) 7/4 4/125 28/500 (7/4)2 (4/125) 8/4 3/125 24/500 (8/4)2 (3/125) 9/4 4/125 36/500 (9/4)2 (4/125) 10/4 6/125 60/500 (10/4)2 (6/125) 11/4 6/125 66/500 (11/4)2 (6/125) 12/4 8/125 96/500 (12/4)2 (8/125) 13/4 4/125 52/500 (13/4)2 (4/125) 14/4 10/125 140/500 (14/4)2 (10/125) 15/4 4/125 60/500 (15/4)2 (4/125) 16/4 9/125 144/500 (16/4)2 (9/125) 17/4 4/125 68/500 (17/4)2 (4/125) 18/4 10/125 180/500 (18/4)2 (10/125) 19/4 4/125 76/500 (19/4)2 (4/125) 20/4 8/125 160/500 (20/4)2 (8/125) 21/4 4/125 84/500 (21/4)2 (4/125) 22/4 8/125 176/500 (22/4)2 (8/125) 23/4 2/125 46/500 (23/4)2 (2/125) 24/4 7/125 168/500 (24/4)2 (7/125) 25/4 2/125 50/500 (25/4)2 (2/125) 26/4 6/125 156/500 (26/4)2 (6/125) 28/4 4/125 112/500 (28/4)2 (4/125) 30/4 2/125 60/500 (30/4)2 (2/125) 32/4 1/125 32/500 (32/4)2 (1/125) Soma 2100/500 40200/(16 125) Logo, E (X p ) = 4, 2 = e V ar(X p ) = 40200 (4.2)2 = 2, 46 16 125

CAPTULO 1. INFERNCIA ESTATSTICA - CONCEITOS BSICOS

26

Pr( = x) Clculo de E () Clculo de V ar() x p px E (2 ) 2/2 1/125 2/250 (2/2)2 (1/125) 3/2 6/125 18/250 (3/2)2 (6/125) 4/2 1/125 4/250 (4/2)2 (1/125) 5/2 12/125 60/250 (5/2)2 (12/125) 6/2 6/125 36/250 (6/2)2 (6/125) 7/2 18/125 126/250 (7/2)2 (18/125) 8/8 13/125 104/250 (8/2)2 (13/125) 9/2 24/125 216/250 (9/2)2 (24/125) 10/2 24/125 240/250 (10/2)2 (24/125) 12/2 13/125 156/250 (12/2)2 (13/125) 14/2 6/125 84/250 (14/2)2 (6/125) 16/2 1/125 16/250 (16/2)2 (1/125) Soma 1062/250 9952/(4 125) Logo, E () = e V ar() = 1062 = 4, 248 250

9952 (4, 248)2 = 1, 858496 4 125 Na tabela a seguir apresentamos o resumo dos resultados obtidos. Parmetro Estimador populacional X Xp Mdia = 4, 2 4, 2000 4, 2000 4, 2480 2 Varincia = 6, 56 2, 1867 2, 4600 1, 8585

Conclui-se que X e X p so estimadores no-viesados de e que X mais eciente que X p , uma vez que V ar(X ) < V ar(X p ). O estimador viesado, pois E () 6= . No entanto, a varincia desse estimador menor que as varincias dos dois estimadores no-viesados. vezes, na prtica, podemos trabalhar com estimadores viesados com varincia pequena, desde que o vis no seja muito grande.

Captulo 2 Distribuio Amostral da Mdia


Neste captulo voc ir aprofundar seus conhecimentos sobre a distribuio amostral da mdia amostral. No captulo anterior analisamos, atravs de alguns exemplos, o comportamento da mdia amostral; mas naqueles exemplos, a populao era pequena e foi possvel obter todas as amostras, ou seja, foi possvel obter a distribuio amostral exata. Veremos agora resultados tericos sobre a distribuio amostral da mdia amostral, que nos permitiro fazer anlises sem ter que listar todas as amostras. Os principais resultados que estudaremos so: mdia e varincia da distribuio amostral da mdia distribuio amostral da mdia para populaes normais Teorema Limite Central distribuio amostral da varincia amostral

2.1

Mdia e varincia da distribuio amostral da mdia

No captulo anterior, vimos, atravs de exemplos, que a mdia amostral X um estimador no-viesado da mdia populacional . Na verdade, temos o seguinte resultado geral. Teorema 2.1 Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de tamanho n de uma populao representada pela varivel aleatria X com mdia e varincia 2 . Ento, E (X ) = 2 V ar(X ) = n Demonstrao: (2.1) (2.2)

27

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

28

Por denio de amostra aleatria simples, as Xi so independentes e todas tm a mesma distribuio da v.a. populacional X ; logo, E (Xi ) = e V ar(Xi ) = 2 . Da independncia resulta que Cov (Xi , Xj ) = 0 i 6= j. Por outro lado, no estudo dos vetores aleatrios, vimos que a esperana da soma de variveis aleatrias a soma das esperanas. Ento: 1 X1 + X2 + + Xn = E (X1 + X2 + + Xn ) E (X ) = E n n 1 [E (X1 ) + E (X2 ) + + E (Xn )] = n 1 1 = ( + + + ) = n = n n 1 = 2 V ar(X1 + X2 + + Xn ) V ar(X ) = V ar n " # P 1 = 2 V ar(X1 ) + V ar(X2 ) + + V ar(Xn ) + Cov (Xi , Xj ) n i6=j 1 2 1 2 2 2 2 = 2 + + + + 0 = 2 n = n n n X1 + X2 + + Xn n

importante notar que esse resultado se refere a qualquer populao X. O que ele estabelece que as mdias amostrais das diferentes amostras aleatrias simples de tamanho n tendem a acertar o alvo da mdia populacional ; lembre-se da Figura 1.2, partes (a) e (b). Alm disso, medida que o tamanho amostral n aumenta, a disperso em torno do alvo, medida por V ar(X ), vai diminuindo e tende a zero quando n . Esse teorema nor permite ver que {X n } consistente para estimar a mdia populacional . O desvio padro da distribuio amostral de qualquer estatstica usualmente chamado de erro padro. Ento, o erro padro da mdia amostral EP (X ) = . n

2.2

Distribuio amostral da mdia para populaes normais

Na prtica estatstica, vrias populaes podem ser descritas, pelo menos aproximadamente, por uma distribuio normal. Obviamente, o teorema anterior continua valendo no caso de uma populao normal, mas temos uma caracterstica a mais da distribuio amostral da mdia: ela tambm normal. Teorema 2.2 Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de tamanho n de uma populao normal, isto , uma populao representada por uma varivel aleatria

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

29

normal X com mdia e varincia 2 . Ento, a distribuio amostral da mdia amostral X normal com mdia e varincia 2 /n, ou seja 2 2 X N ; = X N ; n Na Figura 2.1 ilustra-se o comportamento da distribuio amostral da mdia amostral com base em amostras de tamanho n = 4 para uma populao normal com mdia 2 e varincia 9. A ttulo de comparao, apresenta-se a a distribuio populacional. Podemos ver que ela mais dispersa que a distribuio amostral de X, mas ambas esto centradas no verdadeiro valor populacional = 2.
0,3

X ~ N (2 ; 9 4 )
0,2

X ~ N ( 2;9 )
0,1

0,0 -8 -6 -4 -2 0 2 4 6 8 10 12

Figura 2.1: Distribuio amostral de X com base em aas de tamanho n = 4 de uma populao N (2; 9)

2.3

Exemplos

Exemplo 2.1 A capacidade mxima de um elevador de 500 kg. Se a distribuio dos pesos dos usurios N (70; 100), qual a probabilidade de que 7 pessoas ultrapassem este limite? E de 6 pessoas? Soluo Podemos considerar os 7 passageiros como uma amostra aleatria simples da populao de todos os usurios, representada pela varivel aleatria X N (70; 100). Seja,

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

30

ento, X1 , . . . , X7 uma amostra aleatria simples de tamanho n = 7. Se o peso mximo 500, para que 7 pessoas ultrapassem o limite de segurana temos que ter
7 P

i=1

Xi > 500

Mas, pelo Teorema 2.2, sabemos que

7 1P 500 Xi > X > 71, 729 7 i=1 7

100 X N 70; 7 Logo, 71, 729 70 X 70 q Pr(X > 71, 729) = Pr q >
100 7 100 7

= Pr(Z > 0, 46) = 0, 5 tab(0, 46) = 0, 5 0, 17724 = 0, 32276 500 83.333 70 q = Pr Z > Pr X > 6 100
6

Com 6 pessoas teramos que ter

= Pr(Z > 3, 27) = 0, 5 tab(3, 27) = 0.5 0.49946 = 0, 00054

Podemos ver que existe uma probabilidade alta (0,32 ou 32% de chance) de 7 pessoas ultrapassarem o limite de segurana. J com 6 pessoas, essa probabilidade bastante pequena. Assim, o nmero mximo de pessoas no elevador deve ser estabelecido como 6 ou menos. Exemplo 2.2 Uma varivel aleatria X tem distribuio normal com mdia 100 e desvio padro 10. 1. Calcule Pr(90 < X < 110) 2. Se X a mdia de uma amostra aleatria simples de 16 elementos retirados dessa populao, calcule Pr(90 < X < 110). 3. Construa, num nico sistema de coordenadas, os grcos das distribuies de X e X. 4. Que tamanho deveria ter a amostra para que Pr(90 < X < 110) = 0, 95? Soluo

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 1. Pr(90 < X < 110) = = = = 90 100 110 100 Pr <Z< 10 10 Pr(1 < Z < 1) 2 Pr(0 < Z < 1) 2 tab(1, 0) = 0, 68268

31

2. Com n = 16, resulta que X N 100; 100 16 90 100 110 100 Pr(90 < X < 110) = Pr q <Z< q
100 16 100 16

= Pr(4 < Z < 4) = 2 Pr(0 < Z < 4) = 2 tab(4, 0) 1, 00

3. Veja a Figura 2.2. Como visto, a distribuio amostral com n = 16 menos dispersa que a distribuio populacional e a podemos ver que, entre 90 e 110, temos concentrada praticamente toda a distribuio de X.
0,18 0,16 0,14 0,12 0,10 0,08 0,06 0,04 0,02 0,00 60 70 80 90 100 110 120 130 140

N(100,100/16)

N(100,100)

Figura 2.2: Distribuio amostral de X com base em amostras de tamanho n = 16 de uma populao N (100; 100)

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA 4. Queremos que Pr(90 < X < 110) = 0, 95, ou seja Pr(90 < X < 110) = 0, 95 110 100 90 100 <Z< q Pr q = 0, 95
100 n 100 n

32

n = 1, 96 n4

Pr( n < Z < n) = 0, 95 2 Pr(0 < Z < n) = 0, 95 2 tab( n) = 0, 95 tab( n) = 0, 475

A ttulo de ilustrao, apresentam-se na Figura 2.3 as distribuies amostrais de X para n = 16 e n = 4.


0,18 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 60 70 80 90 100 110 120 130 140

N(100;100/16)

N(100;100/4)

Figura 2.3: Distribuio amostral de X com base em amostras de tamanhos n = 16 e n = 4 de uma populao N (100; 100) Exemplo 2.3 A mquina de empacotar um determinado produto o faz segundo uma distribuio normal, com mdia e desvio padro 10 g. 1. Em quanto deve ser regulado o peso mdio para que apenas 10% dos pacotes tenham menos do que 500 g? 2. Com a mquina assim regulada, qual a probabilidade de que o peso total de 4 pacotes escolhidos ao acaso seja inferior a 2 kg?

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA Soluo

33

1. Seja X a varivel aleatria que representa o peso dos pacotes. Sabemos, ento, que X N (; 100). Queremos que Pr(X < 500) = 0, 10 X 500 Pr < = 0, 10 10 10 500 Pr Z < = 0, 10 10
Ento, na densidade normal padro, esquerda da abscissa 500 temos que ter 10 uma rea (probabilidade) de 0,10. Logo, essa abscissa tem que ser negativa. Usando a simetria da densidade normal temos as seguintes equivalncias: 500 Pr Z < = 0, 10 10 500 Pr Z > = 0, 10 10 500 = 0, 10 Pr Z > 10 500 Pr 0 Z = 0, 40 10 500 tab = 0, 40 10 500 = 1, 28 10 = 512, 8 g

Veja a Figura 2.4 onde so ilustradas essas equivalncias. 2. Sejam X1, X2 , X3 , X4 os pesos dos 4 pacotes da amostra. Queremos que 2000g. Isso equivalente a X < 500. Logo, X 512, 8 500 512, 8 q Pr(X < 500) = Pr q <
100 4 100 4 4 P

Xi <

i=1

= = = = = =

Pr(Z < 2, 56) Pr(Z > 2, 56) 0, 5 Pr(0 Z 2, 56) 0, 5 tab(2, 56) 0, 5 0, 49477 0, 00523

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

34

Figura 2.4: Soluo do Exemplo 3 Com a mquina regulada para 512,8g, h uma probabilidade de 0,00523 de que uma amostra de 4 pacotes apresente peso mdio inferior a 500g. Note que com um pacote apenas, essa probabilidade de 10%. Por isso, as inspees de controle de qualidade so sempre feitas com base em amostras de tamanho n > 1.

2.3.1

Lista de Exerccios 1

1. Os comprimentos das peas produzidas por determinada mquina tm distribuio normal com uma mdia de 172 mm e desvio padro de 5 mm. Calcule a probabilidade de uma amostra aleatria simples de 16 peas ter comprimento mdio (a) entre 169 mm e 175 mm; (b) maior que 178 mm; (c) menor que 165 mm. 2. Qual dever ser o tamanho de uma amostra aleatria simples a ser retirada de 2 uma populao N (150; 13 ) para que Pr( X < 6, 5) = 0, 95?

2.4

Teorema Limite Central

Os resultados vistos anteriormente so vlidos para populaes normais, isto , se uma populao normal com mdia e varincia 2 , ento a distribuio amostral de X tambm normal com mdia e varincia 2 /n, onde n o tamanho da amostra. O

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

35

teorema limite central que veremos a seguir nos fornece um resultado anlogo para qualquer distribuio populacional, desde que o tamanho da amostra seja sucientemente grande. Teorema 2.3 Teorema Limite Central Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X tal que E (X ) = e V ar(X ) = 2 . Ento, a distribuio de X converge para a distribuio normal com mdia e varincia 2 /n quando n . Equivalentemente, X
n

N (0, 1)

A interpretao prtica do teorema limite central a seguinte: para amostras grandes de qualquer populao, podemos aproximar a distribuio amostral de X por uma distribuio normal com a mesma mdia populacional e varincia igual varincia populacional dividida pelo tamanho da amostra. Quo grande deve ser a amostra para se obter uma boa aproximao depende das caractersticas da distribuio populacional. Se a distribuio populacional no se afastar muito de uma distribuio normal, a aproximao ser boa, mesmo para tamanhos pequenos de amostra. Na Figura 2.5 ilustra-se esse teorema para a distribuio exponencial, ou seja, para uma populao distribuda segundo uma exponencial com parmetro = 1. O grco superior representa a distribuio populacional e os histogramas representam a distribuio amostral de X ao longo de 5000 amostras de tamanhos 10, 50, 100 e 250. Assim, podemos ver que, embora a populao seja completamente diferente da normal, a distribuio amostral de X vai se tornando cada vez mais prxima da normal medida que n aumenta. Em termos prticos, esse teorema de extrema importncia, da ser chamado de teorema central e, em geral, amostras de tamanho n > 30 j fornecem uma aproximao razovel. Exemplo 2.4 Uma moeda lanada 50 vezes, com o objetivo de se vericar sua hones-tidade. Se ocorrem 36 caras nos 50 lanamentos, o que podemos concluir? Soluo Neste caso, a populao pode ser representada por uma varivel de Bernoulli X com parmetro p, isto , X assume o valor 1 com probabilidade p na ocorrncia de cara e assume o valor 0 com probabilidade 1 p na ocorrncia de coroa. Para uma varivel Bernoulli, temos que E (X ) = p e V ar(X ) = p(1 p). Como so feitos 50 lanamentos, o tamanho da amostra 50 (n grande!) e, pelo teorema limite central, X p) aproximadamente normal com mdia E (X ) = p e varincia V ar(X ) = p(1 . 50 Suponhamos que a moeda seja honesta, isto , que p = 1/2. Nestas condies, qual a probabilidade de obtermos 36 caras em 50 lanamentos? Com a hiptese de honestidade da moeda, o teorema limite central nos diz que 1 1 1 22 XN ; 2 50

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

36

Distribuio exponencial com mdia 1


1,2 1,0 0,8 0,6 0,4 0,2 0,0 0 1 2 3 4 5 6 7

n=10
1800 1600 1400 1200 1600 1400 1200

n=50

Frequency

1000 800 600 400 200 0 0,261

Frequency
0,761 1,261 1,761 2,261

1000 800 600 400 200 0 0,604

0,804

1,004

1,204

1,404

1,604

n=100
1400 1600 1400 1200

n=250

1200

1000

Frequency

800 600

Frequency
0,790 0,890 0,990 1,090 1,190 1,290

1000 800 600 400

400

200

200 0 0,804

0 0,690

0,854

0,904

0,954

1,004

1,054

1,104

1,154

1,204

Figura 2.5: Ilustrao do Teorema Limite Central para uma populao X exp(1)

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

37

A probabilidade de se obter 36 ou mais caras em 50 lanamentos equivalente probabilidade de X ser maior ou igual a 36 = 0, 72 e essa probabilidade 50 X 0, 5 0, 72 0, 5 q Pr(X 0, 72) = Pr 1 200
200

= Pr(Z 3, 11) = 0, 5 Pr(0 Z < 3, 11) = = 0, 5 tab(3, 11) = 0, 5 0, 49906 = 0, 00094

Note que essa probabilidade bastante pequena, ou seja, h uma pequena probabilidade de obtermos 36 ou mais caras em um lanamento de uma moeda honesta. Isso pode nos levar a suspeitar sobre a honestidade da moeda!

2.4.1

Lista de Exerccios 2

1. O fabricante de uma lmpada especial arma que o seu produto tem vida mdia de 1600 horas, com desvio padro de 250 horas. O dono de uma empresa compra 100 lmpadas desse fabricante. Qual a probabilidade de que a vida mdia dessas lmpadas ultrapasse 1650 horas?

2.5

Distribuio amostral da varincia amostral

Teorema 2.4 Seja X1 , X2 , . . . , Xn uma amostra aleatria simples extrada de uma populao com N elementos e varincia populacional 2 =
1 N N P N 1 P (Xi )2 N i=1 1 n1

No captulo anterior, consideramos dois estimadores para a varincia: S 2 e b2 . Atravs 2 de um exemplo, vimos que b um estimador viesado. Vamos demonstrar agora que S 2 no-viesado para estimar a varincia de uma populao qualquer.

onde =

Xi a mdia (esperana) populacional. Ento S 2 =

um estimador no viesado para estimar 2 .

i=1

i=1

n P

(Xi X )2

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA Demonstrao


n P

38

i=1

(Xi X )2 = =

n 2 P (Xi )2 + n X 2 X (Xi ) = i=1 i=1 n n 2 P P 2 = (Xi ) + n X 2 X Xi n

i=1 n P i=1 n P i=1 n P i=1 n P i=1

n P

(Xi + X )2 = (Xi )2 +
i=1 n P

i=1

n 2 P X 2 (Xi ) X i=1

n 2 P (Xi ) X

i=1

= Da segue que
2

2 (Xi )2 + n X 2 X nX n 2 (Xi )2 n X

n n 2 P 1 1 P 2 2 E (S ) = E (Xi X ) = (Xi ) n X E n 1 i=1 n1 i=1 n 2 P 1 2 = E (Xi ) nE X n 1 i=1 2 Mas como = E (Xi ) = E (X ) e E (Xi )2 = V ar(Xi ) = 2 e E X = V ar(X ) resulta que n P 1 2 E (S ) = V ar(Xi ) nV ar(X ) n 1 i=1 n P 2 1 2 = n n 1 i=1 n 1 2 = n 2 n1 = 2 e isso completa a prova. Teorema 2.5 Se X1 , X2 , . . . , Xn uma amostra aleatria simples extrada de uma populao X N (; 2 ) ento 2 4 V ar(S 2 ) = n1

2.6

Resumo do Captulo

Neste captulo, foram estudadas propriedades da mdia amostral X e da varincia amostral S 2 . Ao nal, voc dever ser capaz de compreender perfeitamente os seguintes resultados:

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

39

Dada uma amostra aleatria simples com reposio X1 , X2 , . . . , Xn de uma populao X com mdia e varincia 2 , a mdia amostral X um estimador noviesado de com varincia igual varincia populacional dividida pelo tamanho amostral n, isto : E (X ) = 2 V ar(X ) = n e a varincia amostral S 2 um estimador no viesado para estimar 2 , isto E (S 2 ) = 2 O desvio padro da distribuio amostral de qualquer estatstica usualmente chamado de erro padro. Ento, o erro padro da mdia amostral EP (X ) = n Nas condies anteriores e com a hiptese adicional de a populao X ser normal, a distribuio amostral de X tambm normal, isto : 2 2 X N ; = X N ; n e V ar(S 2 ) = 2 4 n1

O teorema limite central um dos mais importantes teoremas da teoria inferencial. Ele nos d informaes sobre a dsitribuio amostral de X para amostras grandes de qualquer populao. Mais precisamente, se X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X tal que E (X ) = e V ar(X ) = 2 , ento a distribuio de X converge para a distribuio normal com mdia e varincia 2 /n quando n . Equivalentemente, X
n

N (0, 1)

ou

X N (0, 1) n

2.7

Exerccios

1. Uma amostra de tamanho n = 18 extrada de uma populao normal com mdia 15 e desvio padro 2,5. Calcule a probabilidade de que a mdia amostral (a) esteja entre 14,5 e 16,0; (b) seja maior que 16,1.

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

40

2. Volte ao Exemplo 17.3. Depois de regulada a mquina, prepara-se uma carta de controle de qualidade. Uma amostra de 4 pacotes ser sorteada a cada hora. Se a mdia da amostra for inferior a 497g ou superior a 520g, a produo deve ser interrompida para ajuste da mquina, isto , ajuste do peso mdio. (a) Qual a probabilidade de uma parada desnecessria? (b) Se a mquina se desregulou para = 500g, qual a probabilidade de se continuar a produo fora dos padres desejados? 3. Uma empresa produz parafusos em duas mquinas. O comprimento dos parafusos produzidos em ambas aproximadamente normal com mdia de 20mm na primeira mquina e 25 mm na segunda mquina e desvio padro comum de 4mm. Uma caixa com 16 parafusos, sem identicao, encontrada e o gerente de produo determina que, se o comprimento mdio for maior que 23 mm, ento a caixa ser identicada como produzida pela mquina 2. Especique os possveis erros nessa deciso e calcule as suas probabilidades. 4. Denimos a varivel e = X como sendo o erro amostral da mdia, onde X a mdia de uma amostra aleatria simples de tamanho n de uma populao com mdia e desvio padro . (a) Determine E (e) e V ar(e). (b) Se a populao normal com = 20, que proporo das amostras de tamanho 100 ter erro amostral absoluto maior do que 2 unidades? (d) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos sejam inferiores a 1 unidade? 5. Uma fbrica produz parafusos especiais, para atender um determinado cliente, que devem ter comprimento de 8,5 cm. Como os parafusos grandes podem ser reaproveitados a um custo muito baixo, a fbrica precisa controlar apenas a proporo de parafusos pequenos. Para que o processo de produo atinja o lucro mnimo desejvel, necessrio que a proporo de parafusos pequenos seja no mximo de 5%. (a) Supondo que a mquina que produz os parafusos o faa de modo que os comprimentos tenham distribuio normal com mdia e desvio padro de 1,0 cm, em quanto deve ser regulada a mquina para satisfazer as condies de lucratividade da empresa? (b) Para manter o processo sob controle, programada uma carta de qualidade. A cada hora ser sorteada uma amostra de 4 parafusos e, se o comprimento mdio dessa amostra for menor que 9,0 cm, o processo de produo interrompido para uma nova regulagem da mquina. Qual a probabilidade de uma parada desnecessria? (c) Neste caso, qual deve ser o valor de para que Pr(| e | > ) = 0, 01?

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

41

(c) Se a mquina se desregulou de modo que o comprimento mdio passou a ser 9,5 cm, qual a probabilidade de se continuar o processo de produo fora dos padres desejados? 6. A diviso de inspeo do Departamento de Pesos e Medidas de uma determinada cidade est interessada em calcular a real quantidade de refrigerante que colocada em garrafas de 2 litros, no setor de engarrafamento de uma grande empresa de refrigerantes. O gerente do setor de engarrafamento informou diviso de inspeo que o desvio padro para garrafas de 2 litros de 0,05 litro. Uma amostra aleatria de 100 garrafas de 2 litros, obtida deste setor de engarrafamento, indica uma mdia de 1,985 litro. Qual a probabilidade de se obter uma mdia amostral de 1,985 ou menos, caso a armativa do gerente esteja certa? O que se pode concluir?

2.8

Soluo das Listas de Exerccios

Lista de Exerccios 1 1. Seja X = comprimento das peas; ento X N (172; 25) e n = 16 (a) Pr(169 X 175) = Pr X 172 169 172 175 172 q q q
25 16 25 16 25 16

= Pr(2, 4 Z 2, 4) = 2 Pr(0 Z 2, 4) = 2 tab(2, 4) = 2 0, 4918 = 0, 9836

(b) Pr(X > 178) = Pr Z > (c) Pr(X < 165) = Pr Z < 165 172 q
25 16

= Pr(Z > 4, 8) 0

178 172 q
25 16

= Pr(Z < 5, 6) 0

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

42

2. Temos que X N (150; 132 ) e queremos determinar n para que Pr( X < 6, 5) = 0, 95. Pr( X 150 < 6, 5) = 0, 95 Pr(0, 5 n < Z < 0, 5 n) = 0, 95 2 Pr(0 < Z < 0, 5 n) = 0, 95 Pr(0 < Z < 0, 5 n) = 0, 475 tab(0, 5 n) = 0, 475 0, 5 n = 1, 96 1, 96 n= = 3, 92 0, 5 n = (3, 92)2 16 Lista de Exerccios 2 1. Podemos aceitar que as 100 lmpadas compradas sejam uma amostra aleatria simples da populao referente s lmpadas produzidas por esse fabricante. Como n = 100 um tamanho sucientemente grande podemos usar o teo de amostra, 2502 rema limite central , que nos diz que X N 1600; 100 . Logo X 1600 1650 1600 q Pr(X > 1650) = Pr q >
2502 100 2502 100

Pr(6, 5 < X 150 < 6, 5) = 0, 95 ! 6, 5 6, 5 X 150 = 0, 95 Pr 13 < < 13 13


n n n

= = = =

Pr(Z > 2, 0) 0, 5 Pr(0 Z 2) 0, 5 tab(2, 0) 0, 5 0, 47725 = 0, 02275

2.9

Soluo dos Exerccios

,52 1. X N 15; 218

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA (a) 14, 5 15 16 15 Pr(14, 5 X 16) = Pr q Z q


2,52 18 2,52 18

43

= = = = (b)

Pr(0, 85 Z 1, 70) Pr(0, 85 Z 0) + Pr(0 < Z 1, 70) Pr(0 Z 0, 85) + Pr(0 Z 1, 70) tab(0, 85) + tab(1, 70) = 0, 75777

= Pr(Z > 1, 87) = 0, 5 Pr(0 Z 1, 87) = 0, 5 tab(1, 87) = 0, 03074 2. X N (512, 8; 100)

Pr(X > 16, 1) = Pr Z >

16, 1 15 q
2,52 18

(a) Parada desnecessria: amostra indica que o processo est fora de controle (X < 497 ou X > 520), quando, na verdade, o processo est ajustado ( = 512, 8). Neste caso, podemos usar a notao de probabilidade condicional para auxiliar na soluo do exerccio. Queremos calcular = Pr X < 497 X > 520 | X N 512, 8; 100 4 = Pr X < 497 | X N (512, 8; 25) + Pr X > 520 | X N (512, 8; 25) 497 512, 8 520 512, 8 = Pr Z < + Pr Z > 5 5 = Pr(Z < 3, 16) + Pr(Z > 1, 44) = Pr(Z > 3, 16) + Pr(Z > 1, 44) = [0, 5 Pr(0 Z 3, 16)] + [0, 5 Pr(0 Z 1, 44)] = 0, 5 tab(3, 16) + 0, 5 tab(1, 44) = 1, 0 0, 49921 0, 42507 = 0, 07572

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA (b) Agora queremos Pr 497 X 520 | X N (500; 25) = 497 500 520 500 Pr Z 5 5 Pr(0, 6 Z 4) Pr(0, 6 Z < 0) + Pr(0 Z 4) Pr(0 Z 0, 6) + Pr(0 Z 4) tab(0, 6) + tab(4, 0) 0, 72572

44

= = = = = =

Note que a probabilidade de uma parada desnecessria pequena, s custas de uma alta probabilidade de se operar fora de controle. 3. Os erros so: E1 : estabelecer que so da mquina 1, quando na verdade foram produzidos pela mquina 2 ou E2 : estabelecer que so da mquina 2, quando na verdade foram produzidos pela mquina 1. A regra de deciso a seguinte: X > 23 = mquina 2 X 23 = mquina 1 Na mquina 1 o comprimento N (20; 16) e na mquina 2, N (25; 16). 16 Pr X 23|X N 25; 16 23 25 Pr Z 1 Pr(Z 2) Pr(Z 2) = 0, 5 tab(2, 0) 0, 5 0, 47725 0, 02275 16 Pr X > 23|X N 20; 16 23 20 Pr Z > 1 Pr(Z > 3) 0, 5 tab(3, 0) 0, 5 0, 49865 0, 00135

Pr(E1 ) = = = = = = =

Pr(E2 ) = = = = = =

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA

45

4. Note que e igual a X menos uma constante e sabemos que E (X ) = e V ar(X ) = 2 . n (a) Das propriedades da mdia e da varincia, resulta que E (e) = E (X ) = = 0 2 V ar(e) = V ar(X ) = n (b) X N (; 202 ) e n = 100. Queremos Pr(|e| > 2) = Pr(e < 2) + Pr(e > 2) = Pr(X < 2) + Pr(X > 2) X X 2 2 < 20 + Pr > 20 = Pr 20 20
10 10 10 10

= = = = =

Pr(Z < 1) + Pr(Z > 1) 2 Pr(Z > 1) 2 [0, 5 Pr(0 Z 1)] 2 [0, 5 tab(1, 0)] 0, 31732

(c) Pr(|e| > ) = 0, 01 Pr(e < ) + Pr(e > ) = 0, 01 Pr(X < ) + Pr(X > ) = 0, 01 X X < 20 + Pr > 20 = 0, 01 Pr 20 20 10 10 10 10 Pr Z < + Pr Z > = 0, 01 2 2 = 0, 01 2 Pr Z > 2 Pr Z > = 0, 005 2 = 0, 005 0, 5 Pr 0 Z 2 Pr 0 Z = 0, 495 2 tab = 0, 495 2 = 2, 58 = 5, 16 2

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA (d) Pr (|e| < 1) = 0, 95 Pr(1 < X < 1) = 0, 95 ! 1 1 Pr 20 < Z < 20 = 0, 95 Pr
n n

46

1
20 n

<Z<0

2 Pr 0 Z < Pr 0 Z < 1
20 n

1
20 n

n = 1, 96 20 n = 39, 2 n 1537

+ Pr 0 Z < = 0, 95

1
20 n

= 0, 95

= 0, 475

5. Parafusos pequenos: X < 8, 5, onde X o comprimento do parafuso. (a) X N (; 1). Como Pr(X < 8, 5) = 0, 05, resulta que 8,5 tem que ser menor que , ou seja, a abscissa 8, 5 tem que estar no lado negativo da escala da normal padronizada. Pr(X < 8, 5) = 0, 05 8, 5 Pr Z < = 0, 05 1 8, 5 Pr Z > = 0, 05 1 Pr(0 Z 8, 5) = 0, 45 8, 5 = 1, 64 = 10, 14 (b) Parada desnecessria: amostra indica processo fora de controle (X < 9),

CAPTULO 2. DISTRIBUIO AMOSTRAL DA MDIA quando, na verdade, o processo est sob controle ( = 10, 14). 1 Pr X < 9 | X N 10, 14; 4 9 10, 14 = Pr Z < 0, 5 = Pr(Z < 2, 28) = Pr(Z > 2, 28) = 0, 5 Pr(0 Z 2, 28) = 0, 5 tab(2, 28) = 0, 5 0, 4887 = 0, 0113

47

(c) Mquina desregulada: X > 9; processo operando sem ajuste: X N (9, 5; 1) 1 Pr X > 9 | X N 9, 5; 4 9 9, 5 = Pr Z > 0, 5 = Pr(Z > 1) = Pr(1 < Z < 0) + Pr(Z 0) = Pr(0 < Z < 1) + Pr(Z 0) = tab(1, 0) + 0, 5 = 0, 841314 6. Armativa do gerente: = 2 e 05. Como n = 100, podemos usar o teorema = 02, 0,05 limite central . Logo, X N 2; 100 . Pr(X 1, 985) = Pr Z = = = = 1, 985 2
0,05 10

Pr(Z 3, 0) Pr(Z 3, 0) 0, 5 tab(3, 0) 0, 5 0, 49865 = 0, 00135

A probabilidade de se obter esse valor nas condies dadas pelo gerente muito pequena, o que pode nos fazer suspeitar da veracidade das armativas. provvel que, ou a mdia no seja 2 (e, sim, menor que 2), ou o desvio padro no seja 0,05 (e, sim, maior que 0,05). Esboce grcos da normal para compreender melhor esse comentrio!

Captulo 3 Distribuio Amostral da Proporo


Neste captulo voc ver uma importante aplicao do Teorema Limite Central: iremos estudar a distribuio amostral de propores. Assim, voc ver os resultados referentes aproximao da distribuio binomial pela distribuio normal, que nos permitir fazer inferncia sobre propores. Voc ver os seguintes resultados: aproximao da binomial pela normal correo de continuidade distribuio amostral da proporo amostral

3.1

Aproximao normal da distribuio binomial

V ar(Sn ) = n2 V ar(X ) e isso nos d o seguinte resultado.

No captulo anterior, vimos o Teorema Limite Central, que trata da distribuio da mdia amostral X quando n . Esse teorema nos diz que, se X uma populao com mdia e varincia 2 , ento a distribuio amostral da mdia de uma amostra aleatria simples de tamanho n se aproxima de uma distribuio normal com mdia 2 e varincia quando n . n Usando as propriedades da mdia e da varincia, podemos estabelecer esse teorema n P em termos de Sn = Xi , em vez de X. Como Sn = nX, ento E (Sn ) = nE (X ) e
i=1

distribuio normal com mdia n e varincia n 2 quando n . 48

Teorema 3.1 Teorema Limite Central Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X tal que n P E (X ) = e V ar(X ) = 2 . Ento, a distribuio de Sn = Xi converge para a
i=1

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

49

A varivel aleatria binomial foi denida como nmero de sucessos em n repeties independentes de um experimento de Bernoulli com parmetro p. Ento, uma varivel binomial a soma de n variveis independentes Bern(p). Pelo teorema acima e usando o fato de que se X Bern(p) ento E (X ) = p e V ar(X ) = p(1 p), podemos dizer que a distribuio binomial com parmetros n e p se aproxima de uma normal com mdia np e varincia np(1 p) quando n . Alguns cuidados devem ser tomados na aproximao da binomial pela normal. Um fato importante a observar que a distribuio binomial discreta, enquanto a varivel normal contnua. Veja a Figura 3.1. A o histograma representa uma varivel aleatria X com distribuio binomial com n = 12 e p = 0, 5. OS retngulos, centrados nos possveis valores de X, tm base 1 e altura igual a Pr(X = k ), de modo que a rea de cada retngulo igual a Pr(X = k ). A curva normal a representada de uma varivel aleatria Y com mdia = 12 0, 5 = 6 e varincia 2 = 12 0, 5 0, 5 = 3.
0,25

0,20

0,15

0,10

0,05

0,00 0 1 2 3 4 5 6 7 8 9 10 11 12

Figura 3.1: Aproximao normal da distribuio binomial Suponha que queiramos calcular Pr(X 8). Isso equivale a somar as reas dos 4 ltimos retngulos superiores. Pela aproximao normal, no entanto, temos que calcular a rea (probabilidade) acima do ponto 7,5, de modo a incluir os 4 retngulos. Assim, Y 6 7, 5 6 Pr(X 8) Pr(Y 7, 5) = Pr 3 3 = Pr(Z 0, 87) = 0, 5 tab(0, 87) = 0, 5 0, 30785 = 0, 19215 O valor exato, calculado pela distribuio binomial, Pr(X 8) = 0, 1938.

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

50

Vamos, agora, calcular Pr(X > 10). Isso equivale rea dos 2 retngulos superiores, centrados em 11 e 12 (este ltimo no visvel, pois Pr(X = 12) = 0, 000244); logo, pela distribuio normal temos que calcular Pr(Y 10, 5) : Y 6 10 6 Pr(X > 10) Pr(Y 10, 5) = Pr 3 3 = Pr(Z 2, 31) = 0, 5 tab(2, 31) = 0, 5 0, 48956 = 0, 01044 Se queremos Pr(X < 5), isso equivale s reas dos 4 retngulos inferiores e, portanto Y 6 56 Pr(X < 5) Pr(Y 4, 5) = Pr 3 3 = Pr(Z 0, 58) = Pr(Z 0, 58) = 0, 5 tab(0, 58) = 0, 5 0, 21904 = 0, 28096 Se queremos Pr(4 X < 8), temos a seguinte aproximao: Pr(4 X < 8) Pr(3, 5 Y 7, 5) 7, 5 6 3, 5 6 Z = Pr 3 3 = Pr(1, 44 Z 0, 87) = Pr(1, 44 Z 0) + Pr(0 Z 0, 87) = Pr(0 Z 1, 44) + Pr(0 Z 0, 87) = tab(1, 44) + tab(0, 87) = 0, 42507 + 0, 30785 = 0, 73292 interessante observar que para uma varivel binomial faz sentido calcular Pr(X = k); no caso da normal, essa probabilidade nula, qualquer que seja k. Para usar a aproximao normal para calcular, por exemplo, Pr(X = 5), devemos notar que essa probabilidade equivale rea do retngulo centrado em 5 e, em termos da curva normal,

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO temos que calcular a rea compreendida entre 4,5 e 5,5: Pr(X = 5) Pr(4, 5 Y 5, 5) 4, 5 6 5, 5 6 = Pr Z 3 3 = Pr(0, 87 Z 0, 29) = Pr(0, 29 Z 0, 87) = tab(0, 87) tab(0, 29) = 0, 30785 0, 11409 = 0, 19376

51

e o valor exato 0,193359. Esses procedimentos so chamados de correo de continuidade e na Figura 3.2 ilustra-se o procedimento geral; lembre-se que o centro de cada retngulo o valor da varivel binomial. A aproximao dada pelo teorema limite central melhor para valores grandes de n. Existe a seguinte regra emprica para nos ajudar a decidir o que grande: A distribuio binomial com parmetros n e p pode ser aproximada por uma distribuio normal com mdia = np e varincia 2 = np(1 p) se so satisfeitas as seguintes condies: 1. np 5 2. n(1 p) 5

3.1.1

Lista de Exerccios 1

Em cada um dos exerccios abaixo, verique que as condies para aproximao da binomial pela normal so satisfeitas e calcule a probabilidade pedida usando a aproximao normal. 1. X bin(18; 0, 4); Pr(X 15) e Pr(X < 2) 2. X bin(40; 0, 3); Pr(X < 10) e Pr(25 < X < 28) 3. X bin(65; 0, 9); Pr(X = 58) e Pr(60 < X 63) 4. X bin(100; 0, 2); Pr(25 X 35) 5. X bin(50; 0, 2); Pr(X > 26) e Pr(5 X < 10)

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

52

Figura 3.2: Correo de continuidade para a aproximao normal da binomial (a) Pr(X = k) (b) Pr(X k) (c) Pr(X < k) (d) Pr(X k) (e) Pr(X > k)

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

53

3.2

A distribuio amostral da proporo

Considere uma populao em que cada elemento classicado de acordo com a presena ou ausncia de determinada caracterstica. Por exemplo, podemos pensar em eleitores escolhendo entre 2 candidatos, pessoas classicadas de acordo com o sexo, trabalhadores classicados como trabalhador com carteira assinada ou no, e assim por diante. Em termos de varivel aleatria, essa populao representada por uma varivel aleatria de Bernoulli, isto : 1 se elemento possui a caracterstica de interesse X= 0 se elemento no possui a caracaterstica de interesse Vamos denotar por p a proporo de elementos da populao que possuem a caracterstica de interesse. Ento, Pr(X = 1) = p, E (X ) = p e V ar(X ) = p(1 p). Em geral, esse parmetro desconhecido e precisamos estim-lo a partir de uma amostra. Suponha, ento, que dessa populao seja extrada uma amostra aleatria simples X1 , X2 , . . . , Xn com reposio. Essas n extraes correspondem a n variveis aleatrias n P de Bernoulli independentes e, como visto, Sn = Xi tem distribuio binomial com
i=1

parmetros n e p. Note que Sn d o nmero total de sucessos nas n repeties, onde sucesso, neste caso, representa a presena da caracterstica de interesse. Os valores b de elementos na amostra possveis de Sn so 0, 1, 2, . . . , n. Com relao proporo P que possuem a caracterstica de interesse, temos que b so 0, 1 , 2 , . . . , n1 , 1 com e os valores possveis de P n n n b = k = Pr(Sn = k ) Pr P n b = Sn = X1 + X2 + + Xn P n n (3.1)

(3.2)

b nada mais que a mdia amostral Analisando a expresso (3.1), podemos ver que P de Xi Bern(p), i = 1, . . . , n. Logo, o Teorema 2.1 se aplica com E (X ) = p e V ar(X ) = p(1 p),ou seja: b) = p E (P b) = p(1 p) V ar(P n

Vemos, ento, que a proporo amostral um estimador no-viesado da proporo populacional p. A distribuio exata dada pela expresso (3.2). Como a proporo amostral uma mdia de uma amostra aleatria simples de uma populao com distribuio de Bernoulli com parmetro p, o Teorema Limite Central nos diz, ento, que a distribuio da proporo amostral se aproxima de uma nornal p) com mdia p e varincia p(1n . Como essa aproximao uma conseqncia direta da aproximao normal da binomial, as mesmas regras continuam valendo: a aproximao deve ser feita se np 5 e n(1 p) 5.

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

54

Exemplo 3.1 De um lote de produtos manufaturados, extrai-se uma amostra aleatria simples de 100 itens. Se 10% dos itens do lote so defeituosos, calcule a probabilidade de serem sorteados no mximo 12 itens defeituosos. Soluo As condies para utilizao da aproximao normal so vlidas: com n = 100 e p = 0, 1 temos que 100 0, 1 = 10 > 5 100 0, 9 = 9 > 5 Seja X = nmero de itens defeituosos na amostra. Ento, X bin(100; 0, 1) e X N (10; 9). Queremos calcular Pr(X 12). Usando a correo de continuidade e denotando por Y uma varivel aleatria N (10; 9), temos que Pr(X 12) Pr(Y 12, 5) 12, 5 10 = Pr Z 9 = Pr(Z 0, 83) = 0, 5 + tab(0, 83) = 0, 79673 O valor exato Pr(X 12) = 0, 802.

3.2.1

Lista de Exerccios 2

A conabilidade de um componente a probabilidade de que ele funcione sob as condies desejadas. Uma amostra aleatria simples de 1000 desses componentes extrada e cada componente testado. Calcule a probabilidade de obtermos pelo menos 30 itens defeituosos supondo que a conabilidade do item seja 1. 0,995 2. 0,85

3.3

Resumo do Captulo

Neste captulo estudamos dois resultados bsicos sobre a distribuio binomial; o primeiro envolve a aproximao normal e o segundo, a distribuio amostral de propores amostrais. Ao nal, voc deve compreender os seguintes resultados. Se X bin(n; p), ento probabilidades desta varivel podem ser aproximadas pelas probabilidades da distribuio N [np; np(1 p)] , desde que sejam satisfeitas as seguintes condies: np 5 n(1 p) 5

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

55

Na aproximao da binomial pela normal, deve ser usada a correo de continuidade, conforme resumido na tabela a seguir, onde X bin(n; p) e Y N [np; np(1 p)] (veja tambm a Figura 3.2): Binomial Pr(X = k) Pr(X k) Pr(X < k) Pr(X k) Pr(X > k) Aproximao Normal Pr(k 0, 5 Y k + 0, 5) Pr(Y k + 0, 5) Pr(Y < k + 0, 5) Pr(Y k 0, 5) Pr(Y k + 0, 5)

Seja uma populao descrita pela varivel aleatria X Bern(p). Ento, Pr(X = 1) = p, Pr(X = 0) = 1 p, E (X ) = p e V ar(X ) = p(1 p). Seja X1 , X2 , . . . , Xn uma amostra aleatria simples desta populao. Denindo a proporo amostral b = X1 + X2 + . . . + Xn P n p(1 p) b P N p; n

resulta que

e essa aproximao pode ser usada se np 5 e n(1 p) 5.

3.4

Exerccios

1. Use a aproximao normal para calcular as probabilidades pedidas, tendo o cuidado de vericar que as condies para essa aproximao so realmente satisfeitas. (a) Pr(X 25) se X bin(50; 0, 7)

(b) Pr(42 < X 56) se X bin(100; 0, 5) (d) Pr(X = 5) se X bin(20; 0, 4) (c) Pr(X > 60) se X bin(100; 0, 5) (e) Pr(X 12) se X bin(30; 0, 3)

(h) Pr(X > 18) se X bin(50; 0, 3) (i) Pr(X = 6) se X bin(28; 0, 2)

(g) Pr(12 X 16) se X bin(30; 0, 2)

(f) Pr(9 < X < 11) se X bin(80; 0, 1)

(j) Pr(30 X < 48) se X bin(95; 0, 4) 2. Em uma sondagem, perguntou-se a 1002 membros de determinado sindicato se eles haviam votado na ltima eleio para a direo do sindicato e 701 responderam armativamente. Os registros ociais obtidos depois da eleio mostram que 61%

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO

56

dos membros aptos a votar de fato votaram. Calcule a probabilidade de que, dentre 1002 membros selecionados aleaoriamente, no mnimo 701 tenham votado, considerando que a verdadeira taxa de votantes seja de 61%. O que o resultado sugere? 3. Supondo que meninos e meninas sejam igualmente provveis, qual a probabilidade de nascerem 36 meninas em 64 partos? Em geral, um resultado considerado no-usual se a sua probabilidade de ocorrncia pequena, digamos, menor que 0,05. no-usual nascerem 36 meninas em 64 partos? 4. Com base em dados histricos, uma companhia area estima em 15% a taxa de desistncia entre seus clientes, isto , 15% dos passageiros com reserva no aparecem na hora do vo. Para otimizar a ocupao de suas aeronaves, essa companhia decide aceitar 400 reservas para os vos em aeronaves que comportam apenas 350 passageiros. Calcule a probabilidade de que essa companhia no tenha assentos sucientes em um desses vos. Essa probabilidade alta o suciente para a companhia rever sua poltica de reserva? 5. No controle de qualidade de produtos, uma tcnica comumente utilizada a amostragem de aceitao. Segundo essa tcnica, um lote inteiro rejeitado se contiver mais do que um nmero determinado de itens defeituosos. A companhia X compra parafusos de uma fbrica em lotes de 5000 e rejeita o lote se uma amostra aleatria simples de 20 parafusos contiver pelo menos 2 defeituosos. Se o processo de fabricao tem uma taxa de 10% de defeituosos, qual a probabilidade de um lote ser rejeitado pela companhia X?

3.5

Soluo das Listas de Exerccios

Lista de Exerccios 1 1. 18 0, 4 = 7, 2 > 5 X N (7, 2; 4, 32)

18 0, 6 = 10, 8 > 5 14, 5 7, 2 Pr(X 15) Pr Z 4, 32 = Pr(Z 3, 51) = 0, 5 0, 49978 = 0, 00022 1, 5 7, 2 Pr(X < 2) Pr Z 4, 32 = Pr(Z 2, 74) = Pr(Z 2, 74) = 0, 5 0, 49693 = 0, 00307

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO 2. 40 0, 3 = 12 > 5 40 0, 7 = 28 > 5 X N (12; 8. 4) 9, 5 12 Pr(X < 10) = Pr Z 8, 4 = Pr(Z 0, 86) = Pr(Z 0, 86) = 0, 5 0, 30511 = 0, 19489 27, 5 12 25, 5 12 Z Pr(25 < X < 28) = Pr 8, 4 8, 4 = Pr(4, 66 Z 5, 35) 0

57

3. 65 0, 9 = 58, 5 > 5 65 0, 1 = 6, 5 > 5 X N (58, 5; 5, 85) 57, 5 58, 5 58, 5 58, 5 Pr(X = 58) = Pr Z 5, 85 5, 85 = Pr(0, 41 Z 0) = Pr(0 Z 0, 41) = 0, 15910

60, 5 58, 5 63, 5 58, 5 Pr(60 < X 63) = Pr Z 5, 85 5, 85 = Pr(0, 83 Z 2, 07) = 0, 48077 0, 29673 = 0, 18404 4. 100 0, 2 = 20, 0 > 5 X N (20; 16) 100 0, 8 = 80, 0 > 5 24, 5 20 35, 5 20 Pr(25 X 35) = Pr Z 4 4 = Pr(1, 13 Z 3, 88) = 0, 49995 0, 37076 = 0, 12919

5. 50 0, 2 = 10, 0 > 5 X N (10; 8)

50 0, 8 = 40, 0 > 5 26, 5 10 Pr(X > 26) = Pr Z = Pr(Z 5, 83) 0 8 4, 5 10 9, 5 10 Pr(5 X < 10) = Pr Z 8 8 = Pr(1, 94 Z 0, 18) = Pr(0, 18 Z 1, 94) = 0, 47381 0, 07142 = 0, 40239

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO Lista de Exerccios 2

58

1. Se a conabilidade 0,995, ento a probabilidade de um item ser defeituoso 0,005. Seja X = nmero de defeituosos na amostra. Ento, X N (1000 0, 005; 1000 0.005 0.995) ou seja, X N (5; 4, 975). Note que 1000 0, 005 = 5 e 1000 0, 995 = 995, de modo que podemos usar a aproximao normal. 29, 5 5 Pr(X 30) Pr Z = Pr(Z 10, 98) 0 4, 975 2. 1000 0, 85 = 850 e 1000 0, 15 = 150. X N (150; 127, 5) 29, 5 150 = Pr(Z 10, 67) 1, 0 Pr(X 30) Pr Z 127, 5

3.6
1. .

Soluo dos Exerccios


(a) np = 35 X N (35; 10, 5) 25, 5 35 Pr(X 25) = Pr Z 10, 5 = Pr(Z 2, 93) = 0, 5 0, 49831 = 0, 00169 n(1 p) = 50 n(1 p) = 15

(b) np = 50

X N (50; 25) 56, 5 50 42, 5 50 Pr(42 < X 56) = Pr Z 5 5 = Pr(1, 5 Z 1, 3) = 0, 43319 + 0, 40320 = 0, 83639 X N (50; 25) 60, 5 50 Pr(X > 60) = Pr Z 5 = Pr(Z 2, 1) = 0, 5 0, 48214 = 0, 01786 4, 5 8 5, 5 8 Pr(X = 5) = Pr Z 4, 8 4, 8 = Pr(1, 60 Z 1, 14) = Pr(1, 14 Z 1, 60) = 0, 44520 0, 37286 = 0, 072 34 n(1 p) = 12 X N (8; 4, 8) n(1 p) = 50

(c) np = 50

(d) np = 8

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO (e) np = 9 n(1 p) = 21 X N (9; 6, 3) 11, 5 9 Pr(X 12) = Pr Z = Pr(Z 1) 6, 3 = 0, 5 0, 34134 = 0, 15866

59

(f) np = 8

X N (8; 7, 2) 10, 5 8 9, 5 8 Z Pr(9 < X < 11) = Pr 7, 2 7, 2 = Pr(0, 56 Z 0, 93) = 0, 32381 0, 21226 = 0, 11155 n(1 p) = 24

n(1 p) = 72

(g) np = 6

X N (8; 4, 8) 11, 5 8 16, 5 8 Pr(12 X 16) = Pr Z 4, 8 4, 8 = Pr(1, 60 Z 3, 88) = 0, 49995 0, 44520 = 0, 05475 n(1 p) = 35 X N (15; 10, 5) 18, 5 15 Pr(X > 18) = Pr Z = 10, 5 Pr(Z 1, 08) = 0, 5 0, 35993 = 0, 140 07

(h) np = 15

(i) np = 5, 6

n(1 p) = 22, 4 X N (5, 6; 4, 48) 5, 5 5, 6 6, 5 5, 6 Pr(X = 6) = Pr Z 4, 48 4, 48 = Pr(0, 05 Z 0, 43) = 0, 01994 + 0, 16640 = 0, 18634 n(1 p) = 57

(j) np = 38

X N (38; 22, 8) 29, 5 38 47, 5 38 Pr(30 X < 48) = Pr Z 22, 8 22, 8 = Pr(1, 78 Z 1, 99) = 0, 47670 + 0, 46246 = 0, 93916

2. X = nmero de pessoas que votaram. Ento X bin(1002; 0, 61) e X N (611, 22; 238, 3758) ! 700.5 611.22 Pr(X 701) Pr Z p = Pr(Z 5.78) = 0 238.3758)

Se a proporo de votantes de 61%, a probabilidade de encontrarmos 701 ou mais votantes em uma amostra aleatria simples de 1002 muito baixa. Talvez as pessoas entrevistadas no estejam sendo sinceras, com vergonha de dizer que no votaram...

CAPTULO 3. DISTRIBUIO AMOSTRAL DA PROPORO 3. X = nmero de meninas em 64 partos; X bin(64; 0, 5) e X N (32; 16) 36.5 32 Pr(X > 36) Pr Z 4 = Pr(Z 1.13) = 0.5 0.37076 = 0.12924

60

Esse um resultado que pode ocorrer por mero acaso, ou seja, no um resultado no-usual. 4. X = nmero de passageiros que se apresentam para o vo em questo. X bin(400; 0, 85) e X N (340; 51). 350, 5 340 Pr(X > 350) = Pr Z 51 = Pr(Z 1, 47) = 0, 5 0, 42922 = 0, 070 78 Essa uma probabilidade um pouco alta; talvez valha a pena a companhia rever a poltica de reservas e aceitar menos que 400 reservas. 5. X = nmero de defeituosos na amostra; X bin(20; 0.1). Note que aqui no podemos usar a aproximao normal. uma vez que 20 0.1 = 2 < 5. Queremos Pr(X 2) = 1 Pr(X < 2) = 1 [Pr(X = 0) + Pr(X = 1)] 20 20 0 20 = 1 (0, 1) (0, 9) (0, 1)(0, 9)19 = 0 1 = 1 0, 39175 = 0, 60825

Captulo 4 Intervalos de Conana


Neste captulo voc aprender um mtodo muito importante de estimao de parmetros. Vimos anteriormente que a mdia amostral X um bom estimador da mdia populacional . Mas vimos, tambm, que existe uma variabilidade nos valores de X, ou seja, cada amostra d origem a um valor diferente do estimador. Uma maneira de informar sobre esta variabilidade atravs da estimao por intervalos. Sendo assim, neste captulo voc aprender os seguintes conceitos e mtodos: intervalo de conana margem de erro nvel de conana nvel de seignicncia intervalo de conana para a mdia de uma populao N (; 2 ) com varincia conhecida

4.1

Idias bsicas

O objetivo central da Inferncia Estatstica obter informaes para uma populao a partir do conhecimento de uma nica amostra. Em geral, a populao representada por uma varivel aleatria X, com funo de distribuio ou densidade de probabilidade fX . Dessa populao, ento, extrai-se uma amostra aleatria simples com reposio, que d origem a um conjunto X1 , X2 , . . . , Xn de n variveis aleatrias independentes e identicamente distribudas, todas com a mesma distribuio fX . Se fX depende de um ou mais parmetros, temos que usar a informao obtida a partir da amostra para estimar esses parmetros, de forma a conhecermos a distribuio. Vimos, por exemplo, que a mdia amostral X um bom estimador da mdia populacional , no sentido de que ela tende a acertar o alvo da verdadeira mdia populacional, isto , a mdia amostral um estimador no-viesado da mdia populacional. Mas vimos, tambm, que existe uma variabilidade nos valores de X, ou seja, cada amostra d origem a um valor

61

CAPTULO 4. INTERVALOS DE CONFIANA

62

diferente do estimador. Para algumas amostras, X ser maior que , para outras ser menor e para outras ser igual. Na prtica, temos apenas uma amostra e, assim, importante que se d alguma informao sobre essa possvel variabilidade do estimador. Ou seja, importante informar o valor do estimador b obtido com uma amostra especca, mas importante informar tambm que o verdadeiro valor do parmetro poderia estar num determinado intervalo, digamos, no intervalo [b ,b + ]. Dessa forma, estamos informando a nossa margem de erro no processo de estimao; essa margem de erro conseqncia do processo de seleo aleatria da amostra. O que vamos estudar agora como obter esse intervalo, de modo a acertar na maioria das vezes, isto , queremos um procedimento que garanta que, na maioria das vezes (ou das amostras possveis), o intervalo obtido conter o verdadeiro valor do parmetro. A expresso na maioria das vezes ser traduzida como probabilidade alta. Dessa forma, estaremos lidando com armativas do seguinte tipo: Com probabilidade alta (em geral, indicada por 1 ), o intervalo [b erro; b + erro] conter o verdadeiro valor do parmetro .

A interpretao correta de tal armativa a seguinte: se 1 = 0, 95, por exemplo, ento isso signica que o procedimento de construo do intervalo tal que, em 95% das possveis amostras, o intervalo [b erro; b + erro] obtido conter o verdadeiro valor do parmetro. Note que cada amostra resulta em um intervalo diferente; mas, em 95% das amostras, o intervalo contm o verdadeiro valor do parmetro. Veja a Figura 4.1. A dois dos intervalos no contm o parmetro . O valor 1 chamado nvel de conana, enquanto o valor conhecido como nvel de signicncia. O intervalo [b erro; b + erro] chamado de intervalo de conana de nvel de conana 1 . Tendo clara a interpretao do intervalo de conana, podemos resumir a frase acima da seguinte forma: h i Pr b ;b + =1 (4.1)

Mais uma vez, a probabilidade se refere probabilidade dentre as diversas possveis amostras, ou seja, a probabilidade est associada distribuio amostral de b . Note que b os limites do intervalo dependem de , que depende da amostra sorteada, ou seja, os limites do intervalo de conana so variveis aleatrias. Cada amostra d origem a um intervalo diferente, mas o procedimento de obteno dos intervalos garante probabilidade 1 de acerto.

CAPTULO 4. INTERVALOS DE CONFIANA

63

Figura 4.1: Interpretao dos Intervalos de Conana

CAPTULO 4. INTERVALOS DE CONFIANA

64

4.2

Intervalo de conana: mdia da N (; 2), 2 conhecida

Vamos agora introduzir os mtodos para obteno do intervalo de conana para a mdia de uma populao. Como visto, a mdia populacional um parmetro importante que pode ser muito bem estimado pela mdia amostral X. Para apresentar as idias bsicas, vamos considerar um contexto que pouco freqente na prtica. O motivo para isso que, em termos didticos, a apresentao bastante simples. Como o fundamento o mesmo para contextos mais gerais, essa abordagem se justica. Consideremos uma populao descrita por uma varivel aleatria normal com mdia e varincia 2 : X N (; 2 ). Vamos supor que o valor de 2 seja conhecido e que nosso interesse seja estimar a mdia a partir de uma amostra aleatria simples X1 , X2 , . . . , Xn . Como visto anteriormente, a distribuio amostral de X normal com 2 , ou seja mdia e varincia n 2 2 X N ; = X N ; n Da denio de distribuio amostral, isso signica que os diferentes valores de X obtidos a partir das diferentes possveis amostras se distribuem normalmente em torno de com 2 varincia . n Das propriedades da distribuio normal, resulta que X Z= q N (0; 1)
2 n

ou equivalentemente,

Z=

X n N (0; 1)

(4.2)

4.2.1

Notao

Note que isso vale para a distribuio normal padro, em geral. Ento, usando os resultados (4.2) e (4.3), obtemos que X z/2 = 1 Pr z/2 n

Vamos estabelecer a seguinte notao: vamos indicar por z a abscissa da curva normal padro que deixa probabilidade (rea) igual a acima dela. Veja a Figura 4.2. Temos, ento, que Pr(Z > z ) = . Essa abscissa z normalmente chamada de valor crtico. Consideremos, agora, o valor crtico z/2 ;veja a Figura 4.3. Da podemos ver que, se Z N (0; 1), ento Pr z/2 Z z/2 = 1 (4.3)

CAPTULO 4. INTERVALOS DE CONFIANA

65

Figura 4.2: Ilustrao do valor crtico z

Figura 4.3: Denio do valor crtico z/2

CAPTULO 4. INTERVALOS DE CONFIANA Mas isso equivalente a Pr z/2 X z/2 = 1 n n = 1 Pr X z/2 X + z/2 n n Pr X z/2 X + z/2 = 1 n n Note a ltima expresso; ela nos diz que =1 Pr X z/2 ; X + z/2 n n

66

(4.4)

Mas essa exatamente a forma geral de um intervalo de conana, conforme explicitado na equao (4.1). Temos, ento, a seguinte concluso: Denio 4.1 Intervalo de conana para a mdia de uma populao normal com varincia conhecida Seja X N (; 2 ) uma populao normal com varincia 2 conhecida. Se X1 , X2 , . . . , Xn uma amostra aleatria simples dessa populao, ento o intervalo de conana de nvel de conana 1 para a mdia populacional dado por X z/2 ; X + z/2 n n

4.2.2

Interpretao do intervalo de conana para

O intervalo de conana para pode ser escrito na forma [X ; X + ] onde = z/2 n a margem de erro. Como visto, essa margem de erro est associada ao fato de que diferentes amostras fornecem diferentes valores de X cuja mdia igual a . As diferentes amostras fornecem diferentes intervalos de conana, mas uma proporo de 100 (1 )% desses intervalos ir conter o verdadeiro valor de . Note que aqui fundamental a interpretao de probabilidade como freqncia relativa: estamos considerando os diferentes intervalos que seriam obtidos, caso sortessemos todas as possveis amostras. Assim, o nvel de conana est associado conabilidade do processo de obteno do intervalo: esse processo tal que acertamos (isto , o intervalo contm ) em 100 (1 )% das vezes. Na prtica, temos apenas uma amostra e o intervalo obtido com essa amostra especca, ou contm ou no contm o verdadeiro valor de . A armativa Pr X z/2 ; X + z/2 =1 n n

vlida porque ela envolve a varivel aleatria X, que tem diferentes valores para as diferentes amostras. Quando substitumos o estimador X por uma estimativa especca

CAPTULO 4. INTERVALOS DE CONFIANA

67

x obtida a partir de uma amostra particular, temos apenas um intervalo e no faz mais sentido falar em probabilidade. Para ajudar na interpretao do intervalo de conana, suponha que, com uma amostra de tamanho 25, tenha sido obtido o seguinte intervalo de conana com nvel de conana de 0,95: 2 2 = [4, 216; 5, 784] 5 1, 96 ; 5 + 1, 96 25 25 Esse intervalo especco contm ou no contm o verdadeiro valor de . O que estamos dizendo que, se repetssemos o mesmo procedimento de sorteio de uma amostra aleatria simples da populao e conseqente construo do intervalo de conana, 95% dos intervalos construdos conteriam o verdadeiro valor de . Sendo assim, errado dizer que h uma probabilidade de 0,95 de o intervalo especco [4, 216; 5, 784] conter o verdadeiro valor de . Mas certo dizer que com probabilidade 0,95 o intervalo 2 2 X 1, 96 ; X + 1, 96 25 25 contm . Note a varivel aleatria X no limite do intervalo. Exemplo 4.1 Em determinada populao, o peso dos homens adultos distribudo normalmente com um desvio padro de 16 kg. Uma amostra aleatria simples de 36 homens adultos sorteada desta populao, obtendo-se um peso mdio de 78,2 kg. Construa um intervalo de conana de nvel de conana 0,95 para o peso mdio de todos os homens adultos dessa populao. Soluo Vamos incialmente determinar o valor crtico associado ao nvel de conana de 0,95. Como 1 = 0, 95, resulta que = 0, 05 e /2 = 0, 025. Analisando a Figura 4.3, vemos que nas duas caudas da distribuio normal padro temos que ter 5% da rea ( = 0, 05); logo, em cada cauda temos que ter 2,5% (/2 = 0, 025) da rea total. Em termos da nossa tabela da distribuio normal padro (apresentada novamente ao nal da apostila como Tabela 1), isso signica que entre 0 e z0,025 temos que ter (50 2, 5)% = 47, 5% e, assim, temos que procurar no corpo da tabela o valor de 0,475 para determinar a abscissa z0,025 . Veja a Figura 4.4. Procurando no corpo da tabela da distribuio normal padro, vemos que o valor 0,475 corresponde abscissa z0,025 = 1, 96. Logo, nosso intervalo de conana 16 16 78, 2 1, 96 ; 78, 2 + 1, 96 = [72, 9733 ; 83, 4267] 36 36 Esse intervalo contm ou no o verdadeiro valor de , mas o procedimento utilizado para sua obteno nos garante que h 95% de chance de estarmos certos.

CAPTULO 4. INTERVALOS DE CONFIANA

68

Figura 4.4: Valor crtico associado ao nvel de conana 1 = 0, 95

4.2.3

Lista de Exerccios 1

1. Encontre os valores crticos da normal padro correspondentes aos seguintes nveis de conana 1 = 0, 90; 0, 99; 0, 80. 2. Encontre o nvel de conana correspondente aos seguintes valores crticos z/2 = 1, 28; 1, 80. 3. De uma populao normal com desvio padro 2, extrai-se uma amostra aleatria 36 P xi = 1236. Calcule simples de tamanho 36, que fornece o seguinte resultado:
i=1

o intervalo de conana para a mdia populacional , utilizando o nvel de signicncia = 2%.

4.3

Margem de erro

Vamos, agora, analisar a margem de erro do intervalo de conana para a mdia de uma populao normal com varincia conhecida. Ela dada por = z/2 n (4.5)

Lembrando que o erro padro o desvio padro do estimador, podemos escrever = z/2 EP (X ) (4.6)

Analisando a equao (4.5), podemos ver que ela depende diretamente do valor crtico e do desvio padro populacional e inversamente proporcional ao tamanho da amostra. Na Figura 4.5 ilustra-se a relao de dependncia da margem de erro em relao ao desvio padro populacional . Temos a duas distribuies amostrais centradas na mesma mdia e baseadas em amostras de mesmo tamanho. Nas duas distribuies a rea total das caudas sombreadas , de modo que o intervalo limitado pelas linhas verticais o intervalo de conana de nvel de conana 1 . Para a distribuio mais dispersa, isto , com maior, o comprimento do intervalo maior. Esse resultado deve

CAPTULO 4. INTERVALOS DE CONFIANA

69

ser intuitivo: se h mais variabilidade na populao, a nossa margem de erro tem que ser maior, mantidas xas as outras condies (tamanho de amostra e nvel de conana).

Figura 4.5: Margem de erro versus sigma: 1 < 2

<

Por outro lado, se mantivermos xos o tamanho da amostra e o desvio padro populacional, razovel tambm esperar que a margem de erro seja maior para um nvel de conana maior. Ou seja, se queremos aumentar a probabilidade de acerto, razovel que o intervalo seja maior. Aumentar a probabilidade de acerto signica aumentar o nvel de conana, o que acarreta em um valor crtico z/2 maior. Veja a Figura 4.6, onde ilustra-se o intervalo de conana para dois nveis de conana diferentes: 1 2 > 1 1 . O primeiro intervalo maior, reetindo o maior grau de conana.

Figura 4.6: Margem de erro versus nvel de conana: 1 2 > 1 1

>

Finalmente, mantidos o mesmo desvio padro populacional e o mesmo nvel de conana, quanto maior o tamanho da amostra, mais perto vamos cando da populao e, assim, vai diminuindo a nossa margem de erro.

CAPTULO 4. INTERVALOS DE CONFIANA

70

Exemplo 4.2 De uma populao normal com varincia 25 extrai-se uma amostra aleatria simples de tamanho n com o objetivo de se estimar a mdia populacional com um nvel de conana de 90% e margem de erro de 2. Qual deve ser o tamanho da amostra? Soluo Para um nvel de conana 0,90, o valor do nvel de signicncia = 0, 10. Ento, na cauda superior da distribuio normal padro temos que ter uma rea (probabilidade) de 0,05 e, portanto, para encontrarmos o valor de z0,05 temos que procurar no corpo da tabela o valor 0,45 (se necessrio, consulte a Figura 4.4). Resulta que z0,05 = 1, 64. Temos, ento, todos os valores necessrios: 5 1, 64 5 2 = 1, 64 n = = 4, 1 n = 16, 71 2 n Como o valor de n tem que ser um inteiro, uma estimativa apropriada n = 17 (devemos arredondar para cima para garantir um nvel de conana no mnimo igual ao desejado). Exemplo 4.3 Na divulgao dos resultados de uma pesquisa, publicou-se o seguinte texto (dados ctcios): Com o objetivo de se estimar a mdia de uma populao, estudou-se uma amostra de tamanho n = 45. De estudos anteriores, sabe-se que essa populao muito bem aproximada por uma distribuio normal com desvio padro 3, mas acredita-se que a mdia tenha mudado desde esse ltimo estudo. Com os dados amostrais obteve-se o intervalo de conana [1, 79; 3, 01], com uma margem de erro de 0,61. Quais so as informaes importantes que no foram divulgadas? Como podemos obt-las? Soluo Quando se divulga um intervalo de conana para um certo parmetro, costume publicar tambm a estimativa pontual. Nesse caso, temos que informar a mdia amostral, que pode ser achada observando que o intervalo de conana simtrico em torno da mdia. Logo, x o ponto mdio do intervalo: x= 1, 79 + 3, 01 = 2, 4 2

Outra informao importante o nvel de conana, que encontrado a partir da abscissa z/2 : 3 0, 61 45 0, 61 = z/2 z/2 = = 1, 36 3 45 Consultando a tabela da distribuio normal, vemos que tab(1, 36) = 0, 41308. Veja a Figura 4.7: o nvel de conana 2 0, 41308 = 0, 826 16 0, 83. Como dito no incio do captulo, a situao abordada aqui pouco realista. Na prtica, em geral no conhecemos o desvio padro da populao. Nos prximos captulos iremos estudar o caso mais geral em que no conhecido.

CAPTULO 4. INTERVALOS DE CONFIANA

71

Figura 4.7: Clculo do nvel de conana a partir de , , n

4.3.1

Lista de Exerccios 2

1. Considere os dois intervalos de conana a seguir, obtidos a partir de uma mesma amostra de uma populao N (; 16). Sem fazer qualquer clculo, identique para qual deles o nvel de conana maior. [13, 04; 16, 96] [12, 42; 17, 58] 2. Obtido um intervalo de conana para a mdia de uma N (; 25), o que deve ser feito para se reduzir a margem de erro pela metade se no devemos alterar o nvel de conana?

4.4

Resumo do Captulo

Como existe uma variabilidade nos valores de um estimador b ao longo das possveis amostras, uma maneira de informar sobre esta variabilidade atravs h da estimao i b b por intervalos de conana. Esses intervalos, em geral, tm a forma ; + , onde margem de erro. A obteno de um intervalo de conana feita de modo que h i Pr b ;b + =1

O valor 1 o nvel de conana, enquanto o valor o nvel de signicncia. A probabilidade se refere probabilidade dentre as diversas possveis amostras, ou seja, a probabilidade est associada distribuio amostral de b . Cada amostra d origem a um intervalo diferente, mas o procedimento de obteno dos intervalos garante probabilidade 1 de acerto, ou seja, incluso do verdadeiro valor do parmetro.

CAPTULO 4. INTERVALOS DE CONFIANA

72

A margem de erro do intervalo de conana para a mdia de uma populao normal com varincia conhecida = z/2 = z/2 EP (X ) n onde z/2 o valor crtico da densidade normal padro que deixa probabilidade /2 acima dele.

4.5

Exerccios

1. De uma populao N (; 9) extrai-se uma amostra aleatria simples de tamanho 25 P xi = 60. Desenvolva detalhadamente o intervalo de conana de 25, obtendo-se
i=1

nvel de conana 99% para a mdia da populao.

2. Determine o tamanho da amostra necessrio para se estimar a mdia de uma populao normal com = 4, 2 para que, com conana de 95%, o erro mximo de estimao seja 0, 05. 3. O peso X de um certo artigo descrito aproximadamente por uma distribuio normal com = 0, 58. Uma amostra de tamanho n = 25 resultou em x = 2, 8. Desenvolva detalhadamente o intervalo de conana de nvel de conana 0, 90. 4. De uma populao normal com = 5, retira-se uma amostra aleatria simples de tamanho 50, obtendo-se x = 42. (a) Obtenha o intervalo de conana para a mdia com nvel de signicncia de 5%. (b) Qual o erro de estimao? (c) Para que o erro seja 1, com probabilidade de acerto de 95%, qual dever ser o tamanho da amostra? 5. Os valores da venda mensal de determinado artigo tm distribuio aproximadamente normal com desvio padro de R$500,00. O gerente da loja arma vender, em mdia, R$34.700,00. O dono da loja, querendo vericar a veracidade de tal armativa, seleciona uma amostra aleatria das vendas em determinado ms, obtendo os seguintes valores: 33840, 00 32940, 00 32960, 00 32115, 00 41815, 00 32740, 00 35060, 00 33590, 00 35050, 00 33010, 00

(a) Obtenha o intervalo de conana para a venda mdia mensal com nvel de signicncia de 5%. (b) Obtenha o intervalo de conana para a venda mdia mensal com nvel de signicncia de 1%.

CAPTULO 4. INTERVALOS DE CONFIANA

73

(c) Em qual dos dois nveis de signicncia podemos armar que o gerente se baseou para fazer a armativa? 6. Intervalo de conana com limites assimtricos O tempo de execuo de determinado teste de aptido para ingresso em um estgio normalmente distribudo com desvio padro de 10 minutos. Uma amostra de 25 candidatos apresentou um tempo mdio de 55 minutos. Construa um intervalo de conana de limites L1 e L2 (L1 < L2 ) de modo que seja observada a seguinte especicao: desconana de que < L1 atribuiremos um nvel de signicncia de 5% e desconana de que > L2 atribuiremos o nvel de signicncia de 10%.

4.6

Soluo das Listas de Exerccios

Lista de Exerccios 1 1. 1 = 0, 90 = z0,05 = 1, 64 1 = 0, 80 = z0,10 = 1, 28

1 = 0, 99 = z0,005 = 2, 58

2. tab(1, 28) = /2 = 0, 39973 = = 2 0.39973 = 0.79946 0, 80 ou 80% tab(1, 80) = /2 = 0, 46407 = = 2 0.46407 = 0.92814 0, 93 ou 93% 2 = 2.33 = 0, 7767 36 Como a mdia amostral observada x =
1236 36

3. = 2% = 1 = 98% = tab(z0,01 ) = 0, 49 = z0,01 = 2, 33

= 34.333, o intervalo de conana

[34.333 0.7767; 34.333 + 0.7767] = [33, 556; 35, 110] Lista de Exerccios 2 1. Como a amostra a mesma, isso signica que a populao a mesma, bem como o tamanho de amostra, ou seja, e n so os mesmos. Vimos que um nvel de conana maior resulta em um intervalo de conana maior; logo, o segundo intervalo foi construdo com base em um nvel de conana maior do que o utilizado na construo do primeiro. 2. Mantidos xos o nvel de conana e o desvio padro populacional, vimos que a margem de erro inversamente proporcional raiz quadrada de n. Assim, para reduzir pela metade a margem de erro, temos que dobrar n, ou seja, temos que quadruplicar o tamanho amostral n.

CAPTULO 4. INTERVALOS DE CONFIANA

74

4.7

Soluo dos Exerccios

1. dado que X N (; 9). Como n = 25, sabemos que 9 X N ; 25 Com 1 = 0, 99, temos que = 0, 01 e /2 = 0, 005. Assim, temos que procurar no corpo da tabela a abscissa correspondente ao valor 0, 5 0, 005 = 0, 495,o que nos d z0,005 = 2, 58. Ento Pr(2, 58 Z 2, 58) = 0, 99 X 2, 58 = 0, 99 Pr 2, 58 q Pr 2, 58 r
9 25

9 X 2, 58 25

9 25

= 0, 99

Pr(1, 548 X 1, 548) = 0, 99 Pr(X 1, 548 X + 1, 548) = 0, 99 = 2, 4 o intervalo de conana de 99% de Como a mdia amostral obtida x = 60 25 conana [2, 4 1, 548 ; 2, 4 + 1, 548] = [0, 852 ; 3, 948] 2. Queremos | | 0, 05, com = 4, 2 e 1 = 0, 95. 1 = 0, 95 z/2 = 1, 96 Ento 4, 2 1, 96 0, 05 n 1, 96 4, 2 = 164, 64 n 0, 05 n 27106, 3296 Logo, o tamanho mnimo necessrio n = 27107. 3. dado que X N (; 0, 582 ). Como n = 25, sabemos que 0, 582 X N ; 25 Com 1 = 0, 90, temos que = 0, 10 e /2 = 0, 05. Assim, temos que procurar no corpo da tabela a abscissa correspondente ao valor 0, 5 0, 05 = 0, 45,o que nos

CAPTULO 4. INTERVALOS DE CONFIANA d z0,05 = 1, 64. Ento Pr(1, 64 Z 1, 64) = 0, 90 X 1, 64 = 0, 90 Pr 1, 64 q


0,582 25

75

0, 58 0, 58 X 1, 64 = 0, 90 Pr 1, 64 5 5 Pr(0, 19024 X 0, 19024) = 0, 90 Pr(X 0, 19024 X + 0, 19024) = 0, 90

Como a mdia amostral obtida x = 2, 8 o intervalo de conana de nvel de conana 99% [2, 8 0, 19024 ; 2, 8 + 0, 19024] = [2, 60976 ; 2, 99024] 4. = 0, 05 1 = 0, 95 z0,025 = 1, 96 (a) A margem de erro 5 = 1, 96 = 1, 3859 50 Logo, o intervalo de conana de nvel de conana 0,95 [42 1, 385 9 ; 42 + 1, 3859] = [40, 6141 ; 43, 3859] (b) Como visto em (a) a margem de erro = 1, 3859. (c) Temos que reduzir a margem de erro; logo, o tamanho da amostra ter que ser maior que 50. 5 = 1, 96 1 n n 1, 96 5 = 9, 8 n 9, 82 = 96, 04 Logo, n deve ser no mnimo igual a 97. 5. A mdia amostral x =
343120 10

= 34312.

(a) A margem de erro 500 = 1, 96 = 309, 9 10 Logo, o intervalo de conana de nvel de conana 95% [34312 309, 9 ; 34312 + 309, 9] = [34002, 1 ; 34621, 9]

CAPTULO 4. INTERVALOS DE CONFIANA (b) A margem de erro 500 = 2, 58 = 407, 93 10 Logo, o intervalo de conana de nvel de conana 95% [34312 407, 93 ; 34312 + 407, 93] = [33904, 07 ; 34719, 93]

76

(c) O gerente deve estar usando o nvel de signicncia de 1% (ou nvel de conana de 99%). 6. Veja a Figura 4.8.

Figura 4.8: Soluo do Exerccio 6 - Intervalo de conana assimtrico Temos que ter Pr(Z < z1 ) = 0, 05 Pr(Z > z1 ) = 0, 05 tab(z1 ) = 0, 45 z1 = 1, 64 z1 = 1, 64 Temos que ter Pr(Z > z2 ) = 0, 10 tab(z2 ) = 0, 40 z2 = 1, 28 Resulta, ento, que Pr(1, 64 Z 1, 28) = 0, 85 X 1, 28 = 0, 85 Pr 1, 64 n = 0, 85 Pr 1, 64 X 1, 28 n n Pr X 1, 64 X + 1, 28 = 0, 85 n n Pr X 1, 28 X + 1, 64 = 0, 85 n n

CAPTULO 4. INTERVALOS DE CONFIANA Com os dados obtidos, o intervalo de conana assimtrico 10 10 = [52, 44 ; 57, 56 55 1, 28 ; 55 + 1, 28 25 25

77

Captulo 5 Intervalos de Conana: Propores - Amostra Grande


No captulo anterior, foram apresentadas as idias bsicas da estimao por intervalos de conana. Para ilustrar o princpio utilizado na construo de tais intervalos, consideramos a situao especial de estimao da mdia de uma populao normal com varincia conhecida. Neste caso, a distribuio amostral da mdia amostral normal e foi com base nessa distribuio amostral normal que obtivemos o intervalo de conana. Neste captulo usaremos o teorema limite central, que garante que a distribuio amostral da proporo amostral pode ser aproximada por uma distribuio normal, desde que utilizemos amostras grandes.

5.1

Estimao de uma proporo populacional

O contexto de interesse o seguinte: temos uma populao em que cada elemento classicado de acordo com a presena ou ausncia de determinada caracterstica. Em termos de varivel aleatria, essa populao representada por uma varivel aleatria de Bernoulli, isto : 1 se elemento possui a caracterstica de interesse X= 0 se elemento no possui a caracaterstica de interesse Ento, Pr(X = 1) = p, E (X ) = p e V ar(X ) = p(1 p). O parmetro p tambm a proporo de elementos da populao que possuem a caractersitca de interesse. Em geral, esse parmetro desconhecido e precisamos estim-lo a partir de uma amostra. Suponha, ento, que dessa populao seja extrada uma amostra aleatria simples b de elementos na amostra que X1 , X2 , . . . , Xn com reposio. Vimos que a proporo P possuem a caracterstica de interesse, denida por b = Sn = X1 + X2 + + Xn P n n (5.1)

78

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE79 um estimador no-viesado para p com varincia
p(1p) n

. Mais precisamente,

Como a proporo amostral uma mdia de uma amostra aleatria simples de uma populao com distribuio de Bernoulli com parmetro p, o Teorema Limite Central b se aproxima de uma nornal com mdia p e varincia nos diz que a distribuio de P p(1p) . Como visto, a aproximao deve ser feita se np 5 e n(1 p) 5 e, em geral, n essas condies so satisfeitas se n 30. Note que, com n = 30, np 5 sempre que p 0, 1667; logo, essa indicao n 30 em geral funciona, desde que a caracterstica de interesse no seja extremamente rarefeita na populao (em estatstica, usa-se o termo populaes raras nos casos em que p muito pequeno). Caso haja suspeitas de que p seja muito pequeno, deve-se aumentar o tamanho da amostra. Resumindo, temos o seguinte resultado: p (1 p ) b N p; P n Usando as propriedades da distribuio normal, temos que bp P q N (0; 1)
p(1p) n

b) = p E (P b) = p(1 p) V ar(P n

ou equivalentemente

Vamos ver, agora, como usar esse resultado para obter um intervalo de conana para a verdadeira proporo populacional p.

bp P N (0; 1) np p(1 p)

(5.2)

5.2

Intervalo de conana para a proporo populacional

O procedimento de construo do intervalo de conana para a proporo populacional totalmente anlogo ao do intervalo de conana para a mdia de uma populao normal com varincia conhecida, visto no captulo anterior. Assim, iremos usar a mesma notao, a saber: vamos representar por z a abscissa da curva normal padro que deixa probabilidade (rea) acima dela. Como visto, temos o seguinte resultado, onde Z N (0; 1) : Pr(z/2 Z z/2 ) = 1 (5.3) Veja a Figura 5.1.

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE80

Figura 5.1: Denio do valor crtico z/2 da N (0; 1) Como o resultado (5.3) vale para qualquer varivel aleatria N (0; 1), podemos usar (5.2) para obter ! bp P z/2 = 1 Pr z/2 n p p(1 p) Pr z/2 r r p(1 p) b p z/2 P n r p(1 p) n ! = 1 =

e, portanto

! r p (1 p ) p (1 p ) b z/2 b + z/2 Pr P p P = 1 = n n ! r r p (1 p ) p (1 p ) b + z/2 b z/2 Pr P pP = 1 n n Como no caso da mdia, chegamos a uma expresso do seguinte tipo: b pP b+ =1 Pr P q
p(1p) . n

onde = z/2

Tanto no caso da mdia de uma populao normal com varincia conhecida, quanto no caso da proporo, a margem de erro tem a forma = z/2 EP (b )

onde EP (b ) representa o erro padro do estimador em questo. No caso da mdia, EP (b ) = EP (X ) = n

(5.4)

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE81 e no caso da proporo, b) = EP (b ) = EP (P r p(1 p) n (5.5)

Analisando as expresses (5.4) e (5.5), podemos ver uma diferena fundamental: o erro padro da proporo amostral depende do parmetro desconhecido p. Na prtica, para construir o intervalo de conana, temos que substituir esse valor por alguma estimativa. Existem 3 abordagens possveis: 1. Usar a prpria proporo amostral observada; nesse caso, o intervalo de conana seria r b(1 p b) b z/2 p P n

2. Usar o intervalo de conana conservador, ou seja, usar o maior valor possvel b) para um dado n, o que equivale a obter o intervalo de conana com para EP (P o maior comprimento possvel. Como o comprimento do intervalo diretamente p proporcional a p(1 p) ou equivalentemente, a p(1 p), vamos estudar o comportamento desta funo. Na Figura 5.2, temos o grco da funo p(1 p) para valores de p no intervalo de interesse [0, 1]. Vemos que o mximo dessa funo ocorre quando p = 0, 5. Logo, na falta de uma estimativa melhor para p, podemos tomar p = 0, 5, que fornece o maior intervalo de conana possvel, mantidas as outras condies constantes.

Figura 5.2: Grco da funo p(1 p) para 0 p 1 Neste caso, o o intervalo de conana se torna r ,5 b z/2 0, 5 0, 5 = P b z/2 0 P n n

3. Usar algum valor auxiliar p b0 ou estimativa prvia, obtida de outras fontes ou de uma amostra piloto: r b0 (1 p b0 ) d = p EP (5.6) P n

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE82 Denio 5.1 Intervalo de conana para uma proporo populacional Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao representada pela varivel X de Bernoulli com Pr(X = 1) = p Pr(X = 0) = 1 p Se o tamanho n da amostra sucientemente grande [em geral, deve-se ter np 5 e n(1 p) 5], ento o intervalo de conana aproximado para p de nvel de conana 1 dado por " # r r b0 (1 p b0 ) b p b0 (1 p b0 ) b z/2 p P ; P + z/2 n n

onde z/2 abscissa da curva normal padro que deixa rea /2 acima dela e p b0 alguma estimativa para o verdadeiro valor p.

Exemplo 5.1 Um gerente de produo deseja estimar a proporo de peas defeituosas em uma de suas linhas de produo. Para isso, ele seleciona uma amostra aleatria simples de 100 peas dessa linha de produo, obtendo 30 defeituosas. Determine o intervalo de conana para a verdaeira proporo de peas defeituosas nessa linha de produo, a um nvel de signicncia de 5%. Soluo O primeiro fato a observar que a amostra grande, o que nos permite usar a aproximao normal. Com um nvel de signicncia de = 0, 05, o nvel de conana 1 = 0, 95 e da tabela da normal padro, obtemos que z/2 = 1, 96. Como no temos estimativa prvia da proporo de defeituosas p, temos que usar a proporo amostral p b = 0, 30. Assim, a margem de erro r 0, 3 0, 7 = 1, 96 = 0, 0898 100 e o intervalo de conana [0, 30 0, 0898; 0, 30 + 0, 0898] = [0, 2102; 0, 3898]

5.3

Determinao do tamanho da amostra

Uma questo que se coloca freqentemente : qual o tamanho da amostra necessrio para se estimar uma proporo p com uma margem de erro e nvel de conana 1 ? Vamos analisar a expresso da margem de erro: r p(1 p) = z/2 n

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE83 Resolvendo para n, obtemos que n = z/2 ou

p p(1 p) z
/2

n = [p(1 p)]

Vemos, ento, que n diretamente proporcional a p(1 p), ou seja, quanto maior p(1 p), maior ser o tamanho da amostra n. Na prtica, no conhecemos p (na verdade, estamos querendo estimar esse parmetro). Ento, para determinar o tamanho de amostra necessrio para uma margem de erro e um nvel de conana dados, podemos considerar o pior caso, ou seja, podemos tomar o maior valor possvel de p(1 p) e calcular o tamanho da amostra com base nesse pior caso, que ocorre quando p = 0, 5. claro que essa uma escolha conservadora, que em alguns casos pode levar a um tamanho de amostra desnecessariamente grande. Usando esta estimativa para p, obtemos que z/2 2 n = 0, 5 Exemplo 5.2 Para estudar a viabilidade de lanamento de um novo produto no mercado, o gerente de uma grande empresa contrata uma rma de consultoria estatstica para estudar a aceitao do produto entre os clientes potenciais. O gerente deseja obter uma estimativa com um erro mximo de 1% com probabilidade 80% e pede ao consultor estatstico que fornea o tamanho de amostra necessrio. 1. De posse das informaes dadas, o consultor calcula o tamanho da amostra necessrio no pior cenrio. O que signica pior cenrio nesse caso? Qual o tamanho de amostra obtido pelo consultor? 2. O gerente acha que o custo de tal amostra seria muito alto e autoriza o consultor a realizar um estudo piloto com uma amostra de 100 pessoas para obter uma estimativa da verdadeira proporo. O resultado desse estudo piloto uma estimativa p b = 0, 76 de aceitao do novo produto. Com base nessa estimativa, o consultor recalcula o tamanho da amostra necessrio. Qual esse tamanho?

3. Selecionada a amostra com o tamanho obtido no item anterior, obteve-se uma proporo de 72% de clientes favorveis ao produto. Construa um intervalo de conana para a verdadeira proporo com nvel de conana de 90%. Soluo 1. O pior cenrio quando a populao est dividida meio-a-meio em suas preferncias, ou seja, quando p = 0, 5. Com nvel de conana de 80%, obtemos z0,10 = 1, 28. Nesse caso, r 0, 5 0, 5 0, 01 = 1, 28 = n 2 1, 28 n = 0, 25 = 4096 0, 01

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE84 2. Vamos agora utilizar p b = 0, 76 :

0, 76 0, 24 0, 01 = 1, 28 = n 2 1, 28 n = 0, 76 0, 24 = 2988, 4 0, 01

ou seja, n = 2989 3. 1 = 0, 90 = z0,05 = 1, 64 = 1, 64 e o intervalo de conana [0, 72 0, 0135; 0, 72 + 0, 0135] = [0, 7065; 0, 7335] r

0, 72 0, 28 = 0, 0135 2989

Exemplo 5.3 Uma associao de estudantes universitrios de uma grande universidade deseja saber a opinio dos alunos sobre a proposta da reitoria sobre o preo do bandejo. Para isso, seleciona aleatoriamente uma amostra de 200 estudantes, dos quais 120 so favorveis proposta da reitoria. 1. Construa um intervalo de conana para a verdadeira proporo de alunos favorveis poltica da reitoria, ao nvel de signicncia de 2%. 2. Qual a margem de erro em (1)? 3. Qual dever ser o tamanho da amostra para se ter um erro de no mximo 5%, com nvel de conana de 98%? Soluo 1. Com nvel de signicncia de 2%, o nvel de conana 98%, o que resulta em b = 120 = 0, 6. z0,01 = 2, 33. Com 120 estudantes favorveis dentre 200, temos que p 200 Logo r 0, 6 0, 4 = 2, 33 = 0, 0807 200 e o intervalo de conana [0, 6 0, 0807; 0, 6 + 0, 0807] = [0, 5193; 0, 6807] 2. A margem de erro = 0, 0807.

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE85 3. Queremos, agora, reduzir a margem de erro para 5%, mantendo o mesmo nvel de conana. Certamente teremos que aumentar o tamanho da amostra: r 0, 05

2, 33

0, 6 0, 4 0, 05 n 2, 33 p 0, 6 0, 4 n 0, 05 2 2.33 0.6 0.4 n 0.05 n 522

Se usssemos o pior cenrio, isto , p = 0, 5 teramos que ter 2 2, 33 n 0, 25 0, 05 n 543

5.4

Resumo do Captulo

No estudo da proporo amostral, a populao descrita por uma varivel aleatria de Bernoulli X tal que Pr(X = 1) = p Pr(X = 0) = 1 p em que X = 1 representa a presena da caracterstica de interesse. Dada uma amostra aleatria simples X1 , X2 , . . . , Xn de tal populao, a proporo b de elementos na amostra que possuem a caracterstica de interesse P com as seguintes propriedades: b = Sn = X1 + X2 + + Xn P n n b) = p E (P b) = p(1 p) V ar(P n

Pelo Teorema Limite Central, resulta que p(1 p) b P N p; n

e essa aproximao s deve ser usada se np 5 e n(1 p) 5.

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE86 A margem de erro do intervalo de conana para a proporo populacional r p(1 p) b) = z/2 = z/2 EP (P n

onde z/2 o valor crtico da densidade normal padro que deixa probabilidade /2 acima dele.

Na determinao do tamanho amostral necessrio para se obter determinada margem de erro ao nvel de conana 1 , podemos usar o pior cenrio, que corresponde a uma populao dividida ao meio, isto , p = 0, 5. Neste caso, o tamanho amostral dado por z 2 z 2 /2 /2 n= p(1 p) = 2

Como a margem de erro depende do parmetro a ser estimado, uma alternativa trabalhar com alguma estimativa prvia ou com a prpria estimativa usada na construo do intervalo de conana. Assim, o intervalo de conana estimado para a proporo populacional p dado por " # r r p b0 (1 p b0 ) p b0 (1 p b0 ) p b z/2 ;p b + z/2 n n

5.5

Exerccios

1. Construa um intervalo de conana para a proporo populacional para cada um dos casos listados a seguir: (a) n = 600 = 2%. Nmero de sucessos na amostra = 128

(b) n = 1200 = 10%. Nmero de sucessos na amostra = 710 estimativa prvia p b0 = 55%

2. Uma amostra de 300 habitantes de uma grande cidade revelou que 180 desejavam a uorao da gua. Encontre o intervalo de conana para a verdadeira proporo dos que no desejam a uorao da gua para

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE87 (a) um nvel de signicncia de 5%; (b) um nvel de conana de 96%. 3. Querendo estimar a proporo de peas defeituosas em uma linha de produo, examinou-se uma amostra de 100 peas, encontrando-se 32 defeituosas. Sabeb para esse tamanho de amostra tem desvio padro de 3%. se que o estimador P Calcule o intervalo de conana ao nvel de signicncia de 3%.

4. Em uma pesquisa de mercado, 57 das 150 pessoas entrevistadas armaram que comprariam determinado produto sendo lanado por uma empresa. Essa amostra suciente para se estimar a verdadeira proporo de futuros compradores, com uma preciso de 0,08 e uma conana de 90%? Em caso negativo, calcule o tamanho de amostra necessrio.

5. Uma amostra aleatria simples de 400 itens forneceu 100 itens correspondentes ao evento Sucesso. (a) Qual a estimativa pontual p b para a verdadeira proporo de Sucessos na populao? (c) Calcule o intervalo de conana para a verdadeira proporo de Sucessos na populao ao nvel de conana de 80%.

(b) Qual o erro padro estimado de p b?

6. Em uma sondagem, uma estimativa preliminar de Sucessos em uma populao de 0,35. Que tamanho deve ter uma amostra para fornecer um intervalo de conana de 95% com uma margem de erro de 0,05?

5.6
1. .

Soluo dos Exerccios


(a) = 2% 1 = 98% z0,01 = 2, 33 = 0, 213 3 p b = 128 600 r 0, 213 3(1 0, 2133) = 2, 33 = 0, 03897 600 e o intervalo de conana [0, 2133 0, 03897; 0, 2133 + 0, 03897] = [0, 17433; 0, 25227] (b) = 10% 1 = 90% z0,05 = 1, 64 710 = 0, 591 67 = p b = 1200 r 0, 55 0, 45 = 1, 64 = 0, 02355 1200

CAPTULO 5. INTERVALOS DE CONFIANA: PROPORES - AMOSTRA GRANDE88 e o intervalo de conana [0, 59167 0, 02355; 0, 59167 + 0, 02355] = [0, 56812; 0, 61522] 2. O problema pede a estimativa para a proporo dos que no querem a uorao; logo, p b = 120 = 0, 4 300 (a) = 5% 1 = 95% z0,025 = 1, 96 r 0, 4 0, 6 = 0, 05544 = 1, 96 300 e o intervalo de conana

[0, 4 0, 05544; 0, 4 + 0, 05544] = [0, 34456; 0, 045544] (b) 1 = 96% z0,02 = 2, 05 = 2, 05 e o intervalo de conana [0, 4 0, 05798; 0, 4 + 0, 05798] = [0, 34202; 0, 045798] b) = 0, 03. 3. dado que n = 100, p b = 0, 32 e EP (P = 3% z0,015 = 2, 17 r 0, 4 0, 6 = 0, 05798 300

= 2, 17 0, 03 = 0, 0651

[0, 32 0, 0651; 0, 32 + 0, 0651] = [0, 2549; 0, 3851]


57 4. p b = 150 = 0, 38. Para uma margem de erro de 0,08 e um nvel de conana de 90%, o tamanho da amostra teria que ser 2 1, 64 0, 38 0, 62 = 99, 011 n 0, 08

Como o tamanho da amostra 150, essa amostra suciente. 5. . = 0, 25 q 0,75 b (b) EP (P ) = 0,25 = 0, 02651 400 (c) 1 = 0, 80 z0,1 = 1, 28 [0, 25 1, 28 0, 021651; 0, 25 + 1, 28 0, 021651] = [0, 22229; 0, 27771] 6. p b0 = 0, 35 Logo, n 350 n 1, 96 0, 05 2 0, 35 0, 65 = 349, 59 (a) p b=
100 400

Captulo 6 Intervalo de Conana: Mdia da N (; 2), 2 Desconhecida


Neste captulo voc completar seu estudo bsico sobre intervalos de conana para a mdia de uma populao, analisando o problema de estimao da mdia de uma populao normal quando no se conhece a varincia desta populao. Voc ver que, neste caso, necessrio estimar essa varincia e isso introduz mais uma fonte de variabilidade nas nossas estimativas: com uma nica amostra, temos que estimar a mdia e a varincia da populao. O procedimento simples e anlogo aos casos anteriores vistos nos captulos amteriores; o que muda a distribuio amostral do estimador X. Em vez de usarmos a distribuio normal para determinar os valores crticos, usaremos a distribuio t de Student. Voc ver os seguintes conceitos: estimao da varincia de uma populao distribuio amostral da mdia amostral de uma populao normal com varincia desconhecida intervalo de conana para a mdia de uma populao normal com varincia desconhecida

6.1

Idias bsicas

Considere uma populao descrita por uma varivel aleatria normal com mdia e varincia 2 : X N (; 2 ). Nosso interesse estimar a mdia a partir de uma amostra aleatria simples X1 , X2 , . . . , Xn . Como visto anteriormente, a distribuio amostral de 2 X normal com mdia e varincia , ou seja n 2 2 X N (; ) = X N ; n 89

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N (; 2 ), 2 DESCONHECIDA90 Assim, se o valor de conhecido, resulta que Z= X N (0; 1) n (6.1)

e esse resultado foi utilizado na construo do intervalo de conana para a mdia de uma populao normal com varincia conhecida, fornecendo o seguinte intervalo: X z/2 ; X + z/2 n n Suponhamos, agora, que a varincia 2 no seja conhecida. Neste caso, temos que estim-la com os dados amostrais. Foi demonstrado que n n P 2 1 P 1 2 2 2 (Xi X ) = X nX S = n 1 i=1 n 1 i=1 i

um estimador no-viesado de 2 . Isso signica que, se calculssemos o valor de S 2 para cada uma das possveis amostras aleatrias simples de tamanho n, a mdia desses valores seria igual a 2 . Dessa forma, S 2 um bom estimador de 2 e podemos us-lo como uma estimativa pontual de 2 . Como o desvio padro a raiz quadrada da varincia, natural perguntar: S um bom estimador de , ou seja, S um estimador no-viesado de ? A resposta NO, mas, para grandes amostras, o vis pequeno, de modo que, em geral, usa-se S como estimador de . Sendo assim, natural pensarmos em substituir o valor de por S na expresso (6.1) e utilizarmos a estatstica X T = n S na construo de intervalos de conana para . Isso exatamente o que faremos, mas, ao introduzirmos S no lugar de , a distribuio amostral de T deixa de ser normal e passa a ser uma distribuio t de Student. A distribuio t de Student (ou simplesmente distribuio t) foi obtida por William Gosset (1876-1937), que trabalhava na Cervejaria Guinness na Irlanda. Como a cervejaria no permitia a publicao de resultados de pesquisa obtidos por seus funcionrios, Gosset publicou, sob o pseudnimo de Student, o artigo The Probable Error of a Mean na revista Biometrika (vol. 6, no. 1).

6.2

Intervalo de conana para a mdia de uma populao normal com varincia desconhecida

O intervalo de conana para a mdia de uma populao normal com varincia desconhecida obtido com base no seguinte resultado:

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N (; 2 ), 2 DESCONHECIDA91 Teorema 6.1 Se X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X N (; 2 ) , ento X T = n t(n 1) (6.2) S n n P P 2 1 1 2 ( X X ) = Xi2 nX . onde S 2 = n i 1 n1
i=1 i=1

O nmero de graus de liberdade gl = n 1 resulta do fato de que, na soma que dene S 2 , h apenas n 1 parcelas independentes, ou seja, dados S 2 e n 1 das parcelas (Xi X )2 , a nsima parcela ca automaticamente determinada. Usando a simetria da densidade t, temos o seguinte resultado: Pr tn; /2 t(n) tn; /2 = 1 (6.3) Veja a Figura 6.1.

Figura 6.1: Valores crticos da tStudent para construo do intervalo de conana da mdia de uma normal com varincia desconhecida Como o resultado (6.3) vale para qualquer distribuio t, usando o resultado (6.2) obtemos: X Pr tn1; /2 n tn1; /2 = 1 = S S S Pr tn1; /2 X tn1; /2 = 1 = n n S S =1 Pr X tn1; /2 X + tn1; /2 n n Essa ltima expresso o intervalo de conana para a mdia de uma populao normal com varincia desconhecida.

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N (; 2 ), 2 DESCONHECIDA92 Denio 6.1 Intervalo de conana para a mdia da N (; 2 ) 2 desconhecida Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X N (; 2 ) . O intervalo de conana para de nvel de conana 1 S S X tn1; /2 ; X + tn1; /2 n n onde tn1; /2 o valor crtico da distribuio tStudent com n 1 graus de liberdade que deixa rea /2 acima dele.

6.3

Margem de erro
X

Note, mais uma vez, a forma do intervalo de conana:

onde a margem de erro , agora, denida em termos do valor crtico da distribuio t e do erro padro estimado de X : S . d (X ) = tn1; /2 = tn1; /2 EP n S d (X ) = EP n (6.4)

onde

(6.5)

6.4

Amostras grandes

X n S t(n 1). Mas vimos tambm que, quando o nmero de graus de liberdade grande, as diferenas entre as distribuies t e N (0; 1) tornam-se desprezveis. Por outro lado, se a populao no normal, mas tem mdia e varincia 2 , o X se aproxima de uma teorema limite central nos diz que a distribuio de n N (0; 1) medida que n . Pode-se mostrar que esse resultado continua valendo se substitumos por seu estimador S. A concluso dessas duas observaes a seguinte: Vimos que, para populaes normais, a distribuio exata da estatstica T =

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N (; 2 ), 2 DESCONHECIDA93 Denio 6.2 Intervalo de conana para a mdia - Amostras grandes Dada uma amostra aleatria simples X1 , X2 , . . . , Xn de uma populao X com mdia e varincia 2 , ento X N (0; 1) n S para n sucientemente grande. Nesse caso, o intervalo de conana aproximado de nvel de conana 1 para S S X z/2 ; X + z/2 n n J Exemplo 6.1 De uma populao normal com mdia e varincia desconhecidas, extraise uma amostra de tamanho 15 obtendo-se x = 12 e s2 = 49. Obtenha um intervalo de conana para a verdadeira mdia populacional, utilizando o nvel de conana de 95%. Soluo Os seguintes requisitos para o IC para so satisfeitos: a populao normal e a amostra pequena. Dessa forma, temos que usar a distribuio t com n 1 = 14 graus de liberdade. Como o nvel de conana de 95%, em cada cauda da distribuio temos que ter 2,5%. Assim, devemos procurar a abscissa t14;0,025 procurando na linha correspondente a 14 graus de liberdade e na coluna correspondente rea de 0,025. Encontramos t14;0,025 = 2, 145 A margem de erro 7 = 2, 145 = 3, 8769 15

e o intervalo de conana [12 3, 8769; 12 + 3, 8769] = [8, 1231; 15, 8769] Exemplo 6.2 A seguinte amostra foi extrada de uma populao normal: 6, 6, 7, 8, 9, 9, 10, 11, 12. Construa o intervalo de conana para a mdia populacional, com nvel de signicncia de 10%. Soluo Como antes, temos uma amostra pequena de uma populao normal; logo, temos que usar a distribuio t-Student. Como n = 9, gl = n 1 = 8. A mdia amostral P xi x = n 78 6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12 = = 8, 6667 = 9 9

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N (; 2 ), 2 DESCONHECIDA94 e a varincia amostral S2

" P 2# P 1 P 1 ( xi ) (xi x)2 = x2 = = i n1 n1 n 782 1 2 2 2 2 2 2 2 2 2 6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12 = 8 9 6084 36 1 712 = = 4, 5 = 8 9 8

Como o nvel de signicncia = 10%, o nvel de conana 1 = 90%. Em cauda da distribuio t(8) temos que ter rea igual a 5%. Assim, temos que procurar na linha correspondente a 8 graus de liberdade a abscissa relativa rea superior de 0,05. Obtemos t8;0,05 = 1, 860. A margem de erro r 4, 5 = 1, 860 = 1, 395 8 e o intervalo de conana [8, 6667 1, 395; 8, 6667 + 1, 395] = [7, 2717; 10, 0617] Exemplo 6.3 A partir de uma amostra aleatria simples de tamanho n = 100, os seguintes valores foram obtidos: x = 12, 36 e s2 = 132, 56. Obtenha um intervalo de conana de nvel de conana 90% para a mdia populacional . Soluo Como o tamanho amostral grande, podemos usar a aproximao normal. Como 1 = 0, 90, em cada cauda temos que ter 5% e,assim, devemos procurar no corpo da tabela da distribuio normal o valor mais prximo de 0,45. Resulta que z0,05 = 1, 64, o que nos d a seguinte margem de erro: r 132.56 = 1.64 = 1, 8882 100 O intervalo de conana de 90% de conana [12.36 1.8882 ; 12.36 + 1.8882] = [10.472 ; 14.248]

6.5

Resumo comparativo

Para nalizar a parte relativa construo de intervalos de conana para mdias, vamos resumir os resultados vistos nos ltimos captulos. importante notar que existem procedimentos para construo de intervalos de conana para outros parmetros, tal como a varincia de uma populao normal, diferena entre mdias, etc. O procedimento anlogo; o que muda a distribuio amostral.

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N (; 2 ), 2 DESCONHECIDA95

6.5.1

IC para a mdia de populaes normais

O contexto bsico analisado o seguinte: de uma populao normal extrai-se uma amostra aleatria simples X1 , X2 , . . . , Xn com o objetivo de se obter uma estimativa intervalar para a mdia . Foram consideradas duas situaes: (i) 2 conhecida e (ii) 2 desconhecida. Em ambos os casos, a expresso para o intervalo de conana de nvel de conana 1 X com a margem de erro assumindo a forma geral = /2 EP (X ) onde /2 representa o valor crtico de alguma distribuio e EP (X ) o erro padro da mdia amostral. 2 conhecida /2 = z/2 EP (X ) = n 2 desconhecida /2 = tn1; /2 t(n 1) N (0; 1)

S EP (X ) = n Quando n > 31, pode-se usar z/2 no lugar de tn1; /2 .

6.5.2

IC para uma proporo

O contexto bsico considerado foi o seguinte: de uma populao representada por uma varivel aleatria X Bern(p) extrai-se uma amostra aleatria simples X1 , X2 , . . . , Xn com o objetivo de se estimar a proporo populacional p dos elementos que possuem determinada caracterstica de interesse. Se a amostra sucientemente grande (em geral, n > 30),o intervalo de conana para p tem a forma b P com a margem de erro com p b0 (1 p b0 ) n Aqui, p b0 uma estimativa prvia da proporo populacional p ou a prpria proporo amostral p b obtida a partir da amostra ou ainda p0 = 0, 5 para o intervalo conservador. b) = EP (P assumindo a forma geral b) = z/2 EP (P r

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N (; 2 ), 2 DESCONHECIDA96

6.5.3

Intervalo de conana para a mdia de populaes nonormais - amostra grande

Dada uma amostra aleatria simples de tamanho grande de uma populao qualquer com mdia , o intervalo de conana de nvel de conana aproximado 1 S X z/2 n Esses resultados esto resumidos na Tabela 6.1 e na Figura 6.2.

Tabela 6.1: Resumo Comparativo dos Resultados sobre Intervalos de Conana Parmetro de Interesse Estatstica Amostral Margem e sua Distribuio de erro Mdia da populao N (; 2 ) 2 desconhecida 2 conhecida X N (0; 1) n X n t(n 1) S
= z/2 n

I.C.

X
S = tn1; /2 n

Proporo [mdia Bern(p)] bp P N (0; 1) np p(1 p) (amostra grande) X N (0; 1) n S = z/2

p 0 (1p 0 ) n

b P X

Mdia de uma populao X

S = z/2 n

6.6

Exerccios

1. Para uma distribuio t de Student com 12 graus de liberdade, encontre a probabilidade (rea) de cada uma das seguintes regies (esboce um grco para auxiliar na soluo do exerccio): (a) esquerda de 1, 782; (b) direita de 1, 356; (c) direita de 2, 681;

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N (; 2 ), 2 DESCONHECIDA97

SIM

populao normal?

NO

SIM

varincia conhecida?

NO

SIM

amostra grande?

NO

~ N (0;1)

= z / 2

X ~ t (n 1) S S = t n 1; / 2 n n

X N (0;1) S s = z / 2 n n

Consulte um estatstico! No foram estudados mtodos apropriados para esta situao!

X =P X ~ Bern ( p ) S = P(1 P)

0 (1 p 0) p n

Figura 6.2: Resumo de Intervalos de Conana para a Mdia

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N (; 2 ), 2 DESCONHECIDA98 (d) entre 1, 083 e 3, 055; (e) entre 1, 356 e 2, 179. 2. Encontre os seguintes valores crticos da distribuio t de Student: (a) t15;0,05 (b) t18;0,90 (c) t25;0,975 3. Os tempos gastos por quinze funcionrios em uma das tarefas de um programa de treinamento esto listados abaixo. razovel supor, nesse caso, que essa seja uma amostra aleatria simples de uma populao normal, ou seja, razovel supor que a populao de todos os tempos de funcionrios submetidos a esse treinamento seja aproximadamente normal. Obtenha o intervalo de conana de nvel de conana de 95% para o tempo mdio populacional. 52 44 55 44 45 59 50 54 62 46 54 58 60 62 63 4. Uma amostra aleatria simples de uma populao normal apresenta as seguintes caractersticas: n = 25 x = 500 s2 = 900 Construa um intervalo de conana de nvel de conana de 98% para a mdia da populao. 5. Em uma fbrica, uma (em mm): 10 12 13 amostra de 30 parafusos apresentou os seguintes dimetros 13 14 11 13 14 11 13 14 15 14 15 13 14 12 12 11 15 16 15 14 14 15 15 16 12 10 15

Supondo que os dimetros sejam aproximadamente normais, obtenha um intervalo de conana para o dimetro mdio de todos os parafusos produzidos nessa fbrica, usando o nvel de signicncia de 2%. Para facilitar a soluo do exerccio, voc pode usar os seguintes resultados:
30 P

xi = 401

i=1

i=1

30 P

x2 i = 5443

6. Repita o exerccio anterior com os seguintes dados de uma amostra de 100 parafusos: x = 13, 78 s2 = 2, 865

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N (; 2 ), 2 DESCONHECIDA99

6.7

Soluo dos Exerccios

1. Temos que usar a Tabela 2, concentrando-nos na linha correspondente a 12 graus de liberdade. Os valores dados podem ser encontrados no corpo da tabela nesta linha. (a) direita de 1, 782 temos uma rea de 0, 05; logo, esquerda de 1, 782 a rea de 0, 95. (b) A rea abaixo de 1, 356 igual rea acima de 1, 356, que de 0, 10. Logo, esquerda de 1, 356 temos uma rea de 0, 10 e direita de 1, 356 temos uma rea de 0, 90. (c) direita de 2, 681 a rea 0, 01. (d) direita de 1, 083 a rea 0, 15; direita de 3, 055 a rea de 0, 005. Logo, a rea entre 1, 083 e 3, 055 0, 15 0, 005 = 0, 145 .

(e) Como visto no item (b), a rea direita de 1, 356 0, 90. A rea direita de 2, 179 0, 025. Logo, a rea entre 1, 356 e 2, 179 0, 90 0, 025 = 0, 875

2. . (a) t15;0,05 = 1, 753 (b) O primeiro fato a observar que t18;0,90 tem que ser negativo, pois direita dele a rea de 0, 90 > 0, 50. Se direita a rea 0,90, a rea esquerda 0,10. Pela simetria da curva, t18;0,90 = t18;0,10 . Veja a Figura 6.3. Resulta que t18;0,90 = t18;0,10 = 1, 33

Figura 6.3: Soluo do Exerccio 2 (c) Analogamente encontra-se que t25;0,975 = 2, 060

CAPTULO 6. INTERVALO DE CONFIANA: MDIA DA N (; 2 ), 2 DESCONHECIDA100 3. Contexto: Populao normal e amostra pequena; distribuio envolvida: t-Student n = 15 1 = 0, 95 t14;0,025 = 2, 145 x =

808 = 53, 8667 15 8082 1 2 44176 = 46, 5524 s = 14 15 r 46, 5524 = 2, 145 = 3, 7788 15 O intervalo de conana [53, 8667 3, 7788; 53, 8667 + 3, 7788] = [50, 088; 57, 6455] 4. Contexto: Populao normal e amostra pequena; distribuio envolvida: t-Student t24;0,01 = 2, 492 " r r # 900 = [485, 05; 514, 95] 25

500 2, 492

900 ; 500 + 2, 492 25

5. Contexto: Populao normal e amostra pequena; distribuio envolvida: t-Student = 2% t29;0,01 = 2, 462 x = s2 401 = 13, 367 30 1 4012 = 5443 = 2, 861 29 30

O intervalo de conana " # r r 2, 861 2, 861 13, 367 2, 462 ; 13, 367 + 2, 462 = [12, 607; 14, 127] 30 30 6. Como n grande, podemos usar a abscissa da distribuio normal z0,01 = 2, 33 (o valor exato t99;0,01 = 2, 3646), # " r r 2, 865 2, 865 ; 13, 78 + 2, 33 = [13, 386; 14, 174] 13, 78 2, 33 100 100

Captulo 7 Intervalo de Conana: Varincia da N (; 2)


Neste captulo voc completar seu estudo bsico sobre intervalos de conana, analisando o problema de estimao da varincia de uma populao normal. Como antes, este intervalo se basear na distribuio amostral de um estimador no-viesado para 2 , a saber, S 2 . Como a varincia um nmero no negativo, essa distribuio no simtrica e est denida apenas para valores no-negativos. Voc ver os seguintes conceitos: estimao da varincia de uma populao intervalo de conana para a varincia de uma populao normal

7.1

Idias bsicas

O contexto subjacente o seguinte: a partir de uma amostra aleatria simples X1 , X2 , . . . , Xn retirada de uma populao normal com mdia e varincia 2 queremos construir um intervalo de conana para 2 . A hiptese de normalidade da populao fundamental aqui. Assim como no caso da mdia, temos que usar a distribuio amostral de algum (n 1)S 2 estimador. Neste caso, o estimador S 2 e o resultado importate o seguinte: 2 tem distribuio qui-quadrado com n 1 graus de liberdade: (n 1)S 2 2 (n 1) 2 (7.1)

7.2

Intervalo de conana para a varincia de uma populao normal

Como no caso da distribuio tStudent, vamos denir o valor crtico 2 n; como a abscissa da distribuio qui-quadrado com n graus de liberdade que deixa probabilidade acima dela. Veja a Figura 7.1. 101

CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N (; 2 )

102

Figura 7.1: Valor crtico da distribuio qui-quadrado com n graus de liberdade Com essa denio, podemos ver que a abscissa 2 n;/2 deixa probabilidade /2 acima 2 dela [veja Figura 7.2-(a)] e a abscissa n;1/2 deixa probabilidade /2 abaixo dela [veja Figura 7.2-(b)]. Logo, 2 2 (7.2) Pr 2 n;1/2 (n) n;/2 = 1 Como o resultado (7.2) vale para qualquer distribuio qui-quadrado, podemos usar o resultado (7.1) para escrever (n 1)S 2 2 2 Pr n1;1/2 n1;/2 = 1 2 Da resulta que ! 2 1 n1;/2 = 1 = Pr 2 (n 1)S 2 (n 1)S 2 ! 2 ( n 1) S (n 1)S 2 = 1 Pr 2 2 2 n1;1/2 n1;/2 2 n1;1/2 e esse o intervalo de conana para a varincia de uma populao normal. Denio 7.1 Intervalo de conana para a varincia de uma populao normal Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X N (; 2 ) . O intervalo de conana para 2 de nvel de conana 1 # " (n 1)S 2 (n 1)S 2 ; 2 2 n1;1/2 n1;/2 onde 2 n; representa o valor crtico da distribuio qui-quadrado com n graus de liberdade que deixa probabilidade acima dele.

CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N (; 2 )

103

Figura 7.2: Valores crticos da distribuio qui-quadrado para construo de intervalos de conana

CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N (; 2 )

104

Note que o intervalo de conana construdo de tal forma a dividir o nvel de signicncia em duas partes iguais, mesmo a distribuio no sendo simtrica. Exemplo 7.1 De uma populao normal com mdia e varincia desconhecidas, extraise uma amostra de tamanho 15 obtendo-se x = 12 e s2 = 49. Obtenha um intervalo de conana para a varincia populacional, utilizando o nvel de conana de 95%. Soluo O requisito para o IC para 2 satisfeito, uma vez que a populao normal. Temos que usar a distribuio 2 com n 1 = 14 graus de liberdade. Como o nvel de conana de 95%, em cada cauda da distribuio temos que ter 2,5%. Assim, para a cauda superior, devemos procurar a abscissa 2 14;0,025 procurando na linha correspondente a 14 graus de liberdade e na coluna correspondente rea de 0,025. Encontramos 2 14;0,025 = 26, 119 Para a cauda inferior, devemos procurar a abscissa 2 14;0,975 procurando na linha correspondente a 14 graus de liberdade e na coluna correspondente rea de 0,975. Encontramos 2 14;0,975 = 5, 629 O intervalo de conana 14 49 14 49 ; = [26, 26; 121, 87] 26, 119 5, 629

Exemplo 7.2 A seguinte amostra foi extrada de uma populao normal: 6, 6, 7, 8, 9, 9, 10, 11, 12. Construa o intervalo de conana para a varicia populacional, com nvel de signicncia de 10%. Soluo Temos uma amostra de uma populao normal; logo, podemos usar a distribuio 2 . Como n = 9, gl = n 1 = 8. A mdia amostral P xi x = n 6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12 78 = = = 8, 6667 9 9 e a varincia amostral " P 2# P P 1 1 ( xi ) (xi x)2 = x2 = S2 = i n1 n1 n 782 1 2 2 2 2 2 2 2 2 2 6 + 6 + 7 + 8 + 9 + 9 + 10 + 11 + 12 = 8 9 6084 36 1 712 = = 4, 5 = 8 9 8

CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N (; 2 )

105

Como o nvel de signicncia = 10%, o nvel de conana 1 = 90%. Em cauda da distribuio 2 8 temos que ter rea igual a 5%. Assim, temos que procurar na linha correspondente a 8 graus de liberdade as abscissas relativas rea superior de 0,05 e de 2 0,95. Obtemos 2 8;0,05 = 15, 507 e 8;0,95 = 2, 733. O intervalo de conana 7 4, 5 7 4, 5 ; = [2, 03; 11, 53] 15, 507 2, 733

7.3

Exerccios

1. Seja X uma varivel aleatria com distribuio qui-quadrado com 17 graus de liberdade. Encontre o valor da abscissa k tal que: (a) Pr(X > k) = 0, 2 (b) Pr(X < k) = 0, 2 (c) Pr(X < k) = 0, 90 2. Os tempos gastos por quinze funcionrios em uma das tarefas de um programa de treinamento esto listados abaixo. razovel supor, nesse caso, que essa seja uma amostra aleatria simples de uma populao normal, ou seja, razovel supor que a populao de todos os tempos de funcionrios submetidos a esse treinamento seja aproximadamente normal. Obtenha o intervalo de conana de nvel de conana de 95% para a varincia populacional. 52 44 55 44 45 59 50 54 62 46 54 58 60 62 63 3. Uma amostra aleatria simples de uma populao normal apresenta as seguintes caractersticas: x = 500 s2 = 900 n = 25 Construa um intervalo de conana de nvel de conana de 98% para a mdia da populao. 4. Em uma fbrica, uma (em mm): 10 12 13 amostra de 30 parafusos apresentou os seguintes dimetros 13 14 11 13 14 11 13 14 15 14 15 13 14 12 12 11 15 16 15 14 14 15 15 16 12 10 15

Supondo que os dimetros sejam aproximadamente normais, obtenha um intervalo de conana para o dimetro mdio de todos os parafusos produzidos nessa fbrica, usando o nvel de signicncia de 2%. Para facilitar a soluo do exerccio, voc pode usar os seguintes resultados:
30 P

xi = 401

i=1

i=1

30 P

x2 i = 5443

CAPTULO 7. INTERVALO DE CONFIANA: VARINCIA DA N (; 2 )

106

7.4

Soluo dos Exerccios

1. Na linha correspondente a 17 graus de liberdade, devem ser consultadas as seguintes colunas: (a) = 0, 2 = k = 21, 615 (c) = 0, 1 = k = 24, 769

(b) = 0, 8 = k = 12, 002 2. Contexto: Populao normal 2 14;0,025 = 26, 119 n = 15 1 = 0, 95 2 14;0,975 = 5, 629 x = s2 808 = 53, 8667 15 8082 1 44176 = 46, 5524 = 14 15

Intervalo de conana: 14 46, 5524 14 46, 5524 ; = [24, 95; 1157, 78] 26, 119 5, 629 3. Contexto: Populao normal n = 25 s = 900
2

1 = 0, 98

Intervalo de conana: 24 900 24 900 ; = [502, 56; 1989, 68] 42, 98 10, 856 4. Contexto: Populao normal n = 30 = 2% 1 = 0, 98 x = s2 2 29;0,01 = 49, 588 2 29;0,99 = 14, 258

2 24;0,01 = 42, 980 2 24;0,99 = 10, 856

401 = 13, 367 30 1 4012 = 5443 = 2, 861 29 30

Intervalo de conana: 29 2, 861 29 2, 861 ; = [1, 67; 5, 82] 49, 588 14, 258

Captulo 8 Testes de Hipteses


Na teoria de estimao, vimos que possvel, atravs de estatsticas amostrais adequadas, estimar parmetros de uma populao, dentro de um certo intervalo de conana. Nos testes de hipteses, ao invs de se construir um intervalo de conana no qual se espera que o parmetro da populao esteja contido, testa-se a validade de uma armao sobre um parmetro da populao. Ento, num teste de hiptese, procurase tomar decises a respeito de uma populao, com base em informaes obtidas de amostras desta mesma populao. Neste captulo voc aprender os seguintes conceitos: hipteses nula e alternativa erros tipo I e II estatstica de teste regra de deciso regio crtica funo caracterstica de operao poder do teste

8.1

Noes bsicas

Vamos trabalhar com alguns exemplos para ilustrar os conceitos bsicos que precisamos para construir testes de hipteses estatsticos.

8.1.1

Exemplo 1

Um detetive de polcia encarregado da investigao de um crime. Baseado nas evidncias encontradas, o detetive suspeita inicialmente do mordomo e precisa decidir, ento, se prende ou libera o mordomo. Por outro lado, o mordomo pode ser culpado ou inocente. Assim, h 4 possibilidades, resumidas no Quadro 1, que podem ocorrer quando o detetive tomar sua deciso: 107

CAPTULO 8. TESTES DE HIPTESES

108

prender o mordomo, quando, na verdade, o mordomo o assassino deciso correta prender o mordomo, quando, na verdade, o mordomo inocente deciso errada liberar o mordomo, quando, na verdade, o mordomo o assassino deciso errada liberar o mordomo, quando, na verdade, o mordomo inocente deciso correta Quadro 1 Possibilidades sobre a deciso do detetive Detetive Prende Libera Mordomo Inocente Errado OK Culpado OK Errado Se o problema do detetive fosse de origem estatstica, a primeira providncia que ele teria que tomar seria formular uma hiptese nula, que uma armao sobre um parmetro da populao. A hiptese nula, normalmente designada por H0 , uma armao que estabelecida com o objetivo de ser testada; ela pode ser rejeitada ou no. Normalmente, a hiptese nula formulada de tal forma que o objetivo rejeit-la. No exemplo, como o detetive suspeita do mordomo, a formulao mais adequada H0 : mordomo inocente Se as evidncias so sucientes para se rejeitar a hiptese nula, ento aceita-se a hiptese alternativa, normalmente designada por H1 , que ser aceita se a hiptese nula for rejeitada. No exemplo, como s existem 2 possibilidades, temos que H1 : mordomo culpado Observe que o mtodo aplicado para se testar a hiptese nula. A hiptese alternativa ser aceita se e somente se a hiptese nula for rejeitada, ou seja, a estratgia tomar uma deciso com relao hiptese nula. Depois de examinar todas as evidncias, o detetive deve rejeitar H0 (e concluir que o mordomo culpado) ou no rejeitar H0 (e concluir que o mordomo inocente). Note que as concluses so sempre estabelecidas em termos da hiptese nula. Como j visto, o detetive pode cometer dois tipos de erro: erro tipo I: rejeitar a hiptese nula quando verdadeira; erro tipo II: no rejeitar a hiptese nula quando falsa. No Quadro 2 a seguir temos a ilustrao dessas situaes.

CAPTULO 8. TESTES DE HIPTESES Quadro 2 Possibilidades para a deciso Deciso Rejeitar H0 No rejeitar H0 Possibi- H0 verdadeira Erro I OK lidades H0 falsa OK Erro II

109

Evidentemente, o erro tipo I pode ser evitado se nunca rejeitarmos a hiptese nula. No exemplo, isso signica que o detetive nunca cometeria o erro de condenar um homem inocente. De forma anloga, o erro tipo II pode ser evitado se sempre rejeitarmos a hiptese nula e, no exemplo, o detetive nunca liberaria um assassino. A teoria estatstica de testes de hipteses trata de regras de deciso, baseadas em probabilidades, que tentam balancear esses dois tipos de erro.

8.1.2

Exemplo 2

Uma empresa compra anis de vedao de dois fabricantes. Segundo informaes dos fabricantes, os anis do fabricante 1 tm dimetro mdio de 14 cm com desvio padro de 1,2 cm e os anis do fabricante 2 tm dimetro mdio de 15 cm com desvio padro de 2,0 cm. Ambos os processos de produo geram anis com dimetros cuja distribuio aproximadamente normal. Uma caixa com 16 anis sem identicao encontrada pelo gerente do almoxarifado. Embora ele suspeite que a caixa seja oriunda do fabricante 1, ele decide fazer uma medio dos anis e basear sua deciso no dimetro mdio da amostra: se o dimetro mdio for maior que 14,5 cm, ele identicar a caixa como oriunda do fabricante 2; caso contrrio, ele identicar a caixa como oriunda do fabricante 1. Esse um problema tpico de deciso empresarial. Vamos analisar esse processo decisrio sob o ponto de vista estatstico, estudando os possveis erros e suas probabilidades de ocorrncia. Uma primeira observao que existem apenas duas possibilidades para a origem dos anis de vedao. Como ele suspeita que a caixa venha do fabricante 1, vamos estabelecer a hiptese nula de forma que o resultado desejado seja rejeit-la. Denimos, ento, a hiptese nula como sendo H0 : anis vm do fabricante 2 e, obviamente, a hiptese alternativa ser H1 : anis vm do fabricante 1 Se denotamos por X a varivel aleatria que representa o dimetro dos anis, essas hipteses se traduzem como H0 : X N (15; 2, 02 ) H1 : X N (14; 1, 22 )

CAPTULO 8. TESTES DE HIPTESES

110

A regra de deciso do gerente baseada na mdia amostral observada para os 16 anis encontrados. Como dito, nossa deciso deve ser expressa sempre em termos de H0 . Logo, a regra de deciso x 14, 5 = rejeito H0 x > 14, 5 = no rejeito H0 Os erros associados a essa regra de deciso so: Erro I: rejeitar H0 quando H0 verdadeira Erro II: no rejeitar H0 quando H0 falsa Se H0 verdadeira, a amostra vem de uma populao normal com mdia 15 e desvio padro 2,0. Nesse caso, a mdia amostral com base em amostra de tamanho 16 2,0 tambm normal com mdia 15 e desvio padro . Se H0 falsa, a amostra vem de 16 uma populao normal com mdia 14 e desvio padro 1,2. Nesse caso, a mdia amostral com base em amostra de tamanho 16 tambm normal com mdia 14 e desvio padro 1,2 . 16 Ento, as probabilidades associadas aos erros podem ser expressas em termos de probabilidade condicional: 2, 02 Pr(Erro I ) = Pr X 14, 5|X N 15; 16 1, 22 Pr(Erro II ) = Pr X > 14, 5|X N 14; 16 Na Figura 8.1 a probabilidade associada ao erro I corresponde rea sombreada de cinza claro, enquanto a rea sombreada de cinza escuro corresponde probabilidade do erro tipo II. Vamos calcular essas probabilidades. Em geral, a probabilidade do erro tipo I denotada por e a probabilidade do erro tipo II por . Assim, = Pr(Erro I) = 2, 02 = Pr X 14, 5|X N 15; 16 14, 5 15 = Pr Z 2
4

= = = =

Pr(Z 1, 00) Pr(Z 1, 00) 0, 5 tab(1, 00) = 0, 5 0, 34134 0, 15866

CAPTULO 8. TESTES DE HIPTESES

111

Figura 8.1: Probabilidades dos erros I e II para o Exemplo 2 = Pr(Erro II) = 1, 22 = Pr X > 14, 5|X N 14; 16 14, 5 14 = Pr Z > 1.2
4

= Pr(Z > 1, 67) = 0, 5 tab(1, 67) = 0, 04746

importante voc entender a sutileza da notao. A deciso do gerente tem que ser tomada em funo do resultado amostral observado; assim, usamos a notao x. Lembre-se que usamos letras minsculas para representar o valor observado de uma varivel aleatria. Quando falamos da probabilidade do erro ou mesmo da regra de deciso em termos gerais, estamos considerando o procedimento decisrio geral. Como esse procedimento depende da amostra sorteada, temos que expressar as probabilidades dos erros e a regra de deciso levando em conta as possveis amostras, ou seja, temos que levar em conta a varivel aleatria X que descreve a mdia amostral de uma possvel amostra aleatria simples de tamanho n. No exemplo, a regra de deciso geral : se X > 14, 5 o gerente classica como produo do fabricante 2. Assim, se a caixa em questo tiver uma mdia de, por exemplo, 14,4 o gerente classicar a caixa como produzida pelo fabricante 1.

8.1.3

Exemplo 3

Para resumir os resultados do exemplo anterior, podemos construir o seguinte quadro:

CAPTULO 8. TESTES DE HIPTESES

112

Gerente decide que origem do Fabricante 1 Fabricante 2 Fabricante 2 Erro I ( = 0, 15866) OK Verdadeiro 1 OK Erro II ( = 0, 04746) Vemos a que a probabilidade do erro tipo I maior. Analisando a Figura 8.1 podemos ver tambm que, se mudarmos a regra de deciso escolhendo um valor de corte diferente de 14,5, essas probabilidades se alteraro. Aumentando , diminui e viceversa. Vamos, agora, estabelecer uma nova regra de deciso de modo que a probabilidade do erro tipo I passe a ser 0,05. A nossa regio de rejeio, ou regio crtica, continua tendo a forma X k. Pela Figura 8.1, vemos que k tem que ser menor que 14,5. 2 2, 0 Pr X k | X N 15; 16 k 15 Pr Z 2 4 k 15 Pr Z 0, 5 k 15 0, 5 tab 0, 5 k 15 tab 0, 5 k 15 0, 5 k = 0, 05 = 0, 05 = 0, 05 = 0, 05 = 0, 05 = 0, 45 = 1, 64 = 14, 18

Com essa nova regra de deciso, o erro tipo II passa a ter probabilidade = Pr(Erro II) = 1, 22 = Pr X > 14, 18|X N 14; 16 ! 14, 18 14 = Pr Z > 1,2
4

= Pr(Z > 0, 6) = 0, 5 tab(0, 6) = 0, 27425

8.1.4

Exemplo 4

Suponha, agora, que o gerente queira igualar as probabilidades de erro. Qual a regra de deciso?

CAPTULO 8. TESTES DE HIPTESES

113

= 2, 02 1, 22 = Pr X > k | X N 14; Pr X k | X N 15; 16 16 k 15 k 14 Pr Z 2.0 = Pr Z > 1.2


4 4

k 14 k 15 = 0, 5 0, 3 0, 3k 4, 5 0, 5k + 7 0, 8k = 11, 5 k = 14, 375

Neste caso, as probabilidades dos erros tipo I e II so 2, 02 = = Pr X 14, 375 | X N 15; 16 14, 375 15 = Pr Z 0, 5 = Pr(Z 1, 25) = Pr(Z 1, 25) = 0, 5 tab(1, 25) = 0, 10565

8.1.5

Exemplo 5

O procedimento de se xar a probabilidade do erro tipo I o mais utilizado pois, em geral, na prtica a situao no to simples como a escolha entre duas decises. Suponha, nos dois exemplos acima, que a empresa compre anis de diversos fabricantes mas, pelas caractersticas de produo do fabricante 2, os anis produzidos por ele sejam especiais para a empresa. Assim, importante identicar corretamente a origem, caso eles sejam oriundos do fabricante 2. Nesta situao, nossas hipteses passariam a ser: H0 : H1 : anis so produzidos pelo fabricante 2 anis no so produzidos pelo fabricante 2

Queremos que a probabilidade seja pequena; assim, podemos xar como 0,05 ou mesmo 0,01. De posse do valor dessa probabilidade, poderamos estabelecer a regio crtica ou regio de rejeio. A diferena fundamental aqui est no clculo da probabilidade do erro tipo II: no existe um nico valor de , j que, sob H1 , a distribuio pode ter qualquer mdia.

CAPTULO 8. TESTES DE HIPTESES

114

8.1.6

Exemplo 6

Considere a seguinte regra de deciso sobre a honestidade de uma moeda. Se em trs lanamentos aparecerem 3 coroas, decidimos rejeitar a hiptese de que a moeda honesta. Como devemos estabelecer as hipteses nula e alternativa? Como devemos proceder para calcular e ? Em termos gerais, a questo que se coloca se a moeda honesta ou no. Como regra geral, neste curso deveremos sempre denir a hiptese nula de modo que ela represente um nico valor do parmetro de interesse. Ou seja, a hiptese nula deve ser uma hiptese simples. Neste exemplo, a distribuio em questo uma binomial com parmetros n = 3 e p desconhecido. Moeda honesta signica p = 1 . Logo, nossas 2 hipteses devem ser: H0 : p = H1 1 2 1 : p 6= 2

Seja X = nmero de coroas nos trs lanamentos. Ento, X bin(3; p). Nossa regra de deciso rejeitar H0 se X = 3. A probabilidade do erro tipo I 1 = Pr X = 3|X bin 3; 2 1 1 1 1 = = 2 2 2 8 No possvel calcular = Pr(no rejeitar H0 |H0 falsa), pois a hiptese alternativa (aquela que devemos considerar quando H0 no aceita) no estipula um valor nico para p. Mas neste exemplo simples, podemos obter uma expresso para em funo de p. Note que = = = = Pr [X < 3|X bin(3; p)] 1 Pr [X 3|X bin(3; p)] 1 Pr [X = 3|X bin(3; p)] 1 p3

8.1.7

Lista de Exerccios 1

1. Estabelea as hipteses nula e alternativa para as seguintes situaes: (a) Depois de uma pane geral no sistema de informao de uma empresa, o gerente administrativo deseja saber se houve alterao no tempo de processamento de determinada atividade. Antes da pane, o tempo de processamento podia ser aproximado por uma varivel aleatria normal com mdia de 100 minutos e desvio padro de 10 minutos. O gerente acredita que a pane no tenha alterado a variabilidade do processo.

CAPTULO 8. TESTES DE HIPTESES

115

(b) O dono de uma mdia empresa decide investigar a alegao de seus empregados de que o salrio mdio na sua empresa menor que o salrio mdio nacional, que de 900 reais. (c) Uma empresa fabricante de balas arma que o peso mdio de suas balas de pelo menos 2 gramas. 2. Considere uma populao normal com varincia 225, da qual se extrai uma amostra aleatria simples de tamanho 25. Deseja-se testar as seguintes hipteses: H0 : = 40 H1 : = 45 (a) Se a regio crtica RC : X > 43 calcule as probabilidades dos erros tipo I e II. (b) Determine a regio crtica da forma X > k tal que a probabilidade do erro tipo I seja 0,10. Nesse caso, qual a probabilidade do erro tipo II?

8.2

Conceitos bsicos

O contexto em que se baseia a teoria de teste de hiptese basicamente o mesmo da teoria de estimao por intervalo de conana. Temos uma populao representada por uma varivel aleatria X cuja distribuio de probabilidade depende de algum parmetro . O interesse agora est em testar a veracidade de alguma armativa sobre .

8.2.1

Hiptese nula

A hiptese nula, representada por H0 , a hiptese bsica que queremos testar. Em geral, denimos a hiptese nula de modo que o nosso objetivo seja rejeitar H0 . Nesse texto consideraremos apenas hipteses nulas simples, isto , hipteses que estabelecem que o parmetro de interesse igual a um determinado valor. A forma geral H0 : = 0 Alguns exemplos so: H0 : = 6 H0 : p = 0, 5 H0 : 2 = 25

O procedimento de teste de hiptese resultar em uma regra de deciso que nos permitir rejeitar ou no rejeitar H0 .

CAPTULO 8. TESTES DE HIPTESES

116

8.2.2

Hiptese alternativa

A hiptese alternativa, representada por H1 , a hiptese que devemos considerar no caso de rejeio da hiptese nula. A forma mais geral de H1 a hiptese bilateral H1 : 6= 0 Em algumas situaes, podemos ter informao que nos permita restringir o domnio da hitese alternativa. Por exemplo, se uma empresa farmacutica est testando um novo medicamento para enxaqueca no intuito de reduzir o tempo entre a ingesto do medicamento e o alvio dos sintomas, uma possvel hiptese alternativa H1 : < 10 Temos, ento, hipteses unilaterais esquerda H1 : < 0 e hipteses unilaterais direita: H1 : > 0 A escolha entre essas formas de hiptese alternativa se faz com base no conhecimento sobre o problema sendo considerado.

8.2.3

Estatstica de teste, erros e regra de deciso

Assim como na construo dos intervalos de conana, iremos usar uma estatstica amostral apropriada para construir o nosso teste de hiptese e nesse contexto, essa estatstica chamada estatstica de teste. As estatsticas de teste usuais so a mdia b, que sero usadas na construo de testes sobre amostral X e a proporo amostral P a mdia e a proporo populacionais, respectivamente. O procedimento de deciso denido em termos da hiptese nula H0 : as decises possveis so (i) rejeitar ou (ii) no rejeitar H0 . Conforme resumo apresentado no quadro abaixo, existem duas possibilidades de erro: Erro tipo I: rejeitar H0 quando H0 verdadeira Erro tipo II: no rejeitar H0 quando H0 falsa A deciso sobre a hiptese nula tomada com base em uma regra que estabelece um conjunto de valores, chamado regio crtica ou regio de rejeio, de modo que se, o valor observado da estatstica amostral cair nesse regio, rejeitaremos H0 ; caso contrrio, no rejeitaremos H0 . Vamos denotar por RC a regio crtica.

8.2.4

Regio crtica e nvel de signicncia

Em geral, a denio da regio crtica feita da seguinte forma: RC o conjunto de valores cuja probabilidade de ocorrncia pequena sob a hiptese de veracidade de H0 .

CAPTULO 8. TESTES DE HIPTESES

117

Vamos considerar o seguinte exemplo: se, ao lanarmos uma moeda 30 vezes, obtivermos 28 caras, iremos desconar da hiptese de honestidade da moeda, porque a probabilidade de obtermos 28 caras ou mais em 30 lanamentos de uma moeda honesta 0,000000433996, uma probabilidade bastante pequena. claro que o evento 28 caras ou mais em 30 lanamentos um evento possvel (acertar a sena no jogo da mega-sena tambm ...) mas, sob o ponto de vista do teste de hiptese, a obteno de tal evento ser uma evidncia de que a nossa hiptese nula de honestidade da moeda no muito plausvel. Nesse caso, no diremos que a moeda no honesta (no podemos dizer que impossvel acertar a sena!); nossa concluso que no h evidncia suciente para apoiar a hiptese nula. (Situao anloga ocorre quando um jri diz que o ru no culpado.) A denio de probabilidade pequena se faz atravs da escolha do nvel de signicncia do teste, que a probabilidade do erro tipo I, isto : = Pr(erro tipo I) = Pr(rejeitar H0 | H0 verdadeira) Em geral, o valor de pequeno e as escolhas mais comuns so = 0, 05 e = 0, 01. Denido o nvel de signicncia , podemos estabelecer a regio crtica usando a distribuio amostral da estatstica de teste.

8.2.5

Funo caracterstica de operao e poder do teste

No procedimento de teste de hiptese, as decises possveis so rejeitar ou no rejeitar H0 . Denem-se, assim, as seguintes funes em termos das probabilidades de cada uma delas. A funo caracterstica de operao denida como () = Pr(no rejeitar H0 | ) Dene-se a funo poder do teste como Q() = 1 () = Pr(rejeitar H0 | ) Estas funes (probabilidades) esto condicionadas ao verdadeiro e desconhecido valor do parmetro . Se este valor estiver no conjunto de valores denidos pela hiptese alternativa, ento Q() corresponde a uma probabilidade de acerto: ela mede a probabilidade de se rejeitar H0 quando H0 falsa. Por outro lado, se a hiptese nula H0 : = 0 , ento Q(0 ) = = = = = 1 (0 ) 1 Pr(no rejeitar H0 | 0 ) 1 Pr(no rejeitar H0 | H0 verdadeira) Pr(rejeitar H0 | H0 verdadeira)

CAPTULO 8. TESTES DE HIPTESES

118

8.3

Exemplo 7

Consideremos uma populao representada por uma varivel aleatria normal com mdia e varincia 400. Deseja-se testar H0 : = 100 H1 : 6= 100 com base em uma amostra aleatria simples de tamanho n = 16. Para tal, dene-se a seguinte regio crtica: RC : X < 85 ou X > 115 1. Calcule a probabilidade do erro tipo I. 2. Calcule a funo poder do teste para os seguintes valores de : 75, 80, 85, 90, 95, 100, 105, 110, 115, 120, 125. Quanto vale a funo poder do teste quando = 100? Soluo Como queremos fazer um teste sobre a mdia da populao, natural usarmos X como estatstica de teste. Como a populao normal com mdia e varincia 400, sabemos que X tambm normal com mdia e varincia 400 = 25. 16 1. Sob a hiptese nula, = 100. Ento, = Pr(rejeitar H0 | H0 verdadeira) = Pr X < 85 X > 115 | X N (100; 25) = Pr X < 85 | X N (100; 25) + Pr X > 115 | X N (100; 25) 85 100 115 100 = Pr Z < + Pr Z > 5 5 = Pr(Z < 3) + Pr(Z > 3) = 2 Pr(Z > 3) = 2 [0, 5 tab(3)] = 0, 0027 2. A funo poder dada por 1 () = 1 Pr(no rejeitar H0 | ) = 1 Pr(85 X 115 | ) = 1 Pr 85 X 115 | X N (; 25) 85 115 = 1 Pr Z 5 5 Vamos ilustrar o clculo para = 75 : 1 (75) = 1 Pr(2 Z 8) = 1 [tab(8) tab(2)] = 0, 97725

CAPTULO 8. TESTES DE HIPTESES De forma anloga obtemos a seguinte tabela: 1 () 75 0,97725 80 0,84134 85 0,50000 90 0,15866 95 0,02278 100 0,00270 105 0,02278 110 0,15866 115 0,50000 120 0,84134 125 0,97725

119

Observe que, para = 100, valor da hiptese nula, a funo poder igual probabilidade do erro tipo I (nvel de signicncia). interessante notar tambm que quanto mais distante do valor 0 = 100, maior o poder do teste, ou seja, h uma probabilidade mais alta de se rejeitar H0 quando o valor alternativo est bem distante de 0 .

8.4

Exemplo 8

Considere a situao do exemplo anterior, com as seguintes diferenas: o tamanho da amostra n = 100 e a regio crtica passa a ser RC : X < 94 ou X > 106 Note que razovel estreitar a regio crtica, j que a amostra maior. Vamos calcular e a funo poder do teste para os mesmos valores. Soluo Como antes, a funo poder dada por Q() = 1 Pr(no rejeitar H0 | ) = 1 Pr(94 X 106 | ) = 1 Pr 94 X 106 | X N (; 4) 94 106 = 1 Pr Z 2 2

CAPTULO 8. TESTES DE HIPTESES com os seguintes valores: 75 80 85 90 95 100 105 110 115 120 125 Q() 1,00000 1,00000 0,99999 0,97725 0,30854 0,00270 0,30854 0,97725 0,99999 1,00000 1,00000

120

Note que esse teste tem o mesmo nvel de signicncia do exemplo anterior: = Q(100) = 0, 0027. Na Figura 8.2 temos o grco da funo poder para os dois exemplos. Note que o poder do teste baseado em uma amostra de tamanho 100 sempre maior que o poder do teste baseado em uma amostra de tamanho 16.
1,2 1,0 0,8 0,6

n=100

n=16
0,4 0,2 0,0 50 60 70 80 90 100 110 120 130

Figura 8.2: Comparao do poder de dois testes

8.4.1

Lista de Exerccios 2

1. Considere uma populao normal com varincia 225, da qual se extrai uma amostra aleatria simples de tamanho 25. Deseja-se testar as seguintes hipteses: H0 : = 40 H1 : 6= 40

CAPTULO 8. TESTES DE HIPTESES (a) e para isso dene-se a seguinte regio crtica: RC : X > 46 ou X < 34 (b) Calcule a probabilidade do erro tipo I. (c) Obtenha a expresso geral para a funo poder do teste.

121

(d) Calcule o poder do teste para os seguintes valores de : 20, 22, 24, . . . , 56, 58, 60. (e) Esboce o grco da funo poder.

8.5

Resumo do Captulo

Neste captulo estudamos os conceitos bsicos da teoria de testes de hipteses, em que o interesse est em testar a validade de uma armao sobre um parmetro da populao. Ento, num teste de hiptese, procura-se tomar decises a respeito de uma populao, com base em informaes obtidas de amostras desta mesma populao. Ao nal deste captulo voc deve ser capaz de entender perfeitamente os seguintes conceitos. A hiptese nula, representada por H0 , a hiptese bsica que queremos testar. Nesse texto consideraremos apenas hipteses nulas simples do tipo H0 : = 0 A hiptese alternativa, representada por H1 , a hiptese que devemos considerar no caso de rejeio da hiptese nula. A forma mais geral de H1 a hiptese bilateral, mas podemos ter hipteses unilaterais esquerda e hipteses unilaterais direita: H1 : < 0 H1 : > 0 H1 : 6= 0 A estatstica de teste a estatstica amostral apropriada para construir o nosso teste de hiptese. As estatsticas de teste usuais so a mdia amostral X e a b, que sero usadas na construo de testes sobre a mdia e proporo amostral P a proporo populacionais, respectivamente. O procedimento de deciso denido em termos da hiptese nula H0 , com as seguintes decises possveis (i) rejeitar H0 ou (ii) no rejeitar H0 .

Os erros possveis no processo de decio baseado em um teste de hiptese so Erro tipo I: rejeitar H0 quando H0 verdadeira Erro tipo II: no rejeitar H0 quando H0 falsa A regio crtica ou regio de rejeio o conjunto de valores da estatstica de teste que levam rejeio de H0 ; a regio crtica ser denotada por RC .

CAPTULO 8. TESTES DE HIPTESES

122

Em geral, a denio da regio crtica feita xando-se a probabilidade do erro tipo I; essa probabilidade chamada nvel de signicncia e ser indicada pela letra grega alfa: . A funo caracterstica de operao denida como () = Pr(no rejeitar H0 | ) Para valores de fora da regio crtica, essa probabilidade corresponde probabilidade de um acerto. A funo poder do teste denida como Q() = 1 () = Pr(rejeitar H0 | ) Para valores de dentro da regio crtica, essa probabilidade corresponde probabilidade de um acerto.

8.6

Exerccios

1. Considere uma populao normal com varincia 64, da qual se extrai uma amostra aleatria simples de tamanho 16. Deseja-se testar as seguintes hipteses: H0 : = 23 H1 : = 28 (a) Se a regio crtica RC : X > 25, 5 calcule as probabilidades dos erros tipo I e II. (b) Determine a regio crtica da forma X > k tal que a probabilidade do erro tipo I seja 0,05. Nesse caso, qual a probabilidade do erro tipo II? 2. Desejando-se testar as hipteses H0 : = 45 H1 : < 45 sobre a mdia de uma populao normal com varincia 36, estabeleceu-se a seguinte regio crtica com base em amostra aleatria simples de tamanho n = 16: RC : X < 41, 25 (a) Calcule a probabilidade do erro tipo I. (b) Calcule o poder do teste para os seguintes valores de : 30, 31, . . . , 59, 60. (c) Esboce o grco da funo poder plotando os pontos (; Q()).

CAPTULO 8. TESTES DE HIPTESES

123

3. Para uma populao representada por uma varivel de Bernoulli com parmetro p, deseja-se testar a hiptese H0 : p = 0, 5 H1 : p 6= 0, 5 Com base em uma amostra de tamanho 10, estabelecida a seguinte regio crtica: RC : X = 0, 1, 2, 8, 9, 10 onde X = nmero de sucessos na amostra. (a) Determine o nvel de signicncia . (b) Calcule o poder do teste para os seguintes valores de p : 0, 2; 0, 4; 0, 6; 0, 8. Esboce o grco da funo poder.

8.7
1. .

Soluo das Listas de Exerccios

Lista de Exerccios 1

(a) Antes da pane: T N (100; 100) Depois da pane: T N (; 100) H0 : = 100 H1 : 6= 100 (b) razovel supor que o gerente queira negar a armao dos empregados. Assim, podemos estabelecer: H0 : 900 H1 : < 900 (c) . H0 : 2 H1 : < 2 X N (; 225) 2. n = 25 X N ; 225 ou X N (; 9) 25

CAPTULO 8. TESTES DE HIPTESES (a) = Pr(X > 43 | X N (40; 9)) 43 40 = Pr Z > 3 = Pr(Z > 1, 00) = 0, 5 tab(1, 00) = 0, 15866 = Pr(X 43 | X N (45; 9) 43 45 = Pr Z 3 = Pr(Z 0, 67) = Pr(Z 0, 67) = 0, 5 tab(0, 67) = 0, 25143 (b) . = 0, 10 Pr X > k | X N (40; 9) = 0, 10 k 40 Pr Z > = 0, 10 3 k 40 tab = 0, 40 3 k 40 = 1, 28 3 k = 43, 84 = Pr(X 43, 84 | X N (45; 9) 43.84 45 = Pr Z 3 = Pr(Z 0, 39) = Pr(Z 0, 39) = 0, 5 tab(0, 39) = 0, 34827 Lista de Exerccios 2 X N (; 225) X N ; 225 ou X N (; 9) 1. 25 n = 25

124

CAPTULO 8. TESTES DE HIPTESES (a) . = Pr X < 34 | X N (40; 9) + Pr X > 46 | X N (40; 9) 34 40 46 40 = Pr Z < + Pr Z > 3 3 = Pr(Z < 2) + Pr(Z > 2) = 2 Pr(Z > 2) = 2 [0, 5 tab(2, )] = 0, 0455 (b) . Q() = Pr(rejeitar H0 | ) = Pr X < 34 | X N (; 9) + Pr X > 46 | X N (; 9) 34 46 = Pr Z < + Pr Z > 3 3 (c) . Vamos fazer os clculos para = 20, 22, 58, 60. 46 20 34 20 + Pr Z > Q(20) = Pr Z < 3 3 = Pr(Z < 4, 67) + Pr(Z > 8, 67) 1+0=1 34 60 46 60 Q(60) = Pr Z < + Pr Z > 3 3 = Pr(Z < 8, 67) + Pr(Z > 4, 67) = Pr(Z > 8, 67) + Pr(Z < 4, 67) = Q(20) 46 22 34 22 + Pr Z > Q(22) = Pr Z < 3 3 = Pr(Z < 4, 00) + Pr(Z > 8, 00) 1+0=1 34 58 46 58 Q(58) = Pr Z < + Pr Z > 3 3 = Pr(Z < 8, 00) + Pr(Z > 4, 00) = Pr(Z > 8, 00) + Pr(Z < 4, 00) = Q(22)

125

Podemos ver que a funo poder simtrica; assim, s precisamos calcular Q() para = 20, 22, 24, . . . , 38, 40. Os resultados esto na tabela a seguir e o grco est na Figura 8.3.

CAPTULO 8. TESTES DE HIPTESES

126

20 22 24 26 28 30 32 34 36 38 40

Q() 0,99999847 0,99996833 0,99957094 0,99616962 0,97724987 0,90878883 0,74750899 0,50003167 0,25292160 0,09504160 0,04550026

60 58 56 54 52 50 48 46 44 42

Q() 0,99999847 0,99996833 0,99957094 0,99616962 0,97724987 0,90878883 0,74750899 0,50003167 0,25292160 0,09504160

1,2 1,0 0,8 0,6 0,4 0,2 0,0 0 10 20 30 40 50 60 70

Figura 8.3: Soluo da Lista de Exerccios 1

8.8

Soluo dos Exerccios


64 ou X N (; 4) X N ; 16 = Pr X > 25, 5 | X N (23; 4) 25, 5 23 = Pr Z > 2 = Pr(Z > 1, 25) = 0, 5 tab(1, 25) = 0, 10565

X N (; 64) 1. n = 16 (a)

CAPTULO 8. TESTES DE HIPTESES = Pr(X 25, 5 | X N (28; 4) 25, 5 28 = Pr Z 2 = Pr(Z 1, 25) = Pr(Z > 1, 25) = 0, 10565 (b) = 0, 05 Pr X > k | X N (23; 4) = 0, 05 k 23 Pr Z > = 0, 05 2 k 23 tab = 0, 45 2 k 23 = 1, 64 2 k = 26, 28 = Pr(X 26, 28 | X N (28; 4) 26, 28 28 = Pr Z 2 = Pr(Z 0, 86) = Pr(Z 0, 86) = 0, 5 tab(0, 86) = 0, 19489 2. X N (; 36) n = 16 36 X N ; 16 ou X N (; 2, 25) A funo poder do teste Q() = Pr(rejeitar H0 |) = Pr(X < 41, 25|X N (; 1, 52 ) 41, 25 = Pr Z < 1, 5

127

CAPTULO 8. TESTES DE HIPTESES e = Q(45). Na tabela a seguir so dados os valores de Q(). 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 Q() 1,0000000 1,0000000 1,0000000 1,0000000 0,9999993 0,9999845 0,9997673 0,9976967 0,9848699 0,9331928 0,7976717 0,5661838 0,3085375 0,1216726 0,0333764 0,0062097 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 Q() 0,0007711 0,0000632 0,0000034 0,0000001 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000 0,0000000

128

Na Figura 8.4 temos o esboo do grco da funo poder.


1,2 1,0 0,8 0,6 0,4 0,2 0,0 20 25 30 35 40 45 50 55 60 65

Figura 8.4: Funo poder do teste para o Exerccio 2 3. Sabemos que X bin(10; p).

CAPTULO 8. TESTES DE HIPTESES (a) = Pr(X = 0 | p = 0, 5) + Pr(X = 1 | p = 0, 5) + Pr(X = 2 | p = 0, 5) + Pr(X = 8 | p = 0, 5) + Pr(X = 9 | p = 0, 5) + Pr(X = 10 | p = 0, 5) = 0, 510 + 10 (0, 5) (0, 5)9 + 10 (0, 5)2 (0, 5)8 + 1 2 10 10 8 2 9 10 (0 , 5) + (0 , 5) + (0 , 5) (0 , 5) (0, 5)10 8 9 10 = 0, 000976563 + 0, 009765625 + 0, 043945313 + 0, 043945313 + 0, 009765625 + 0, 000976563 = 0, 109375 (b) Q(0, 2) = Pr(X = 0 | p = 0, 2) + Pr(X = 1 | p = 0, 2) + Pr(X = 2 | p = 0, 2) + Pr(X = 8 | p = 0, 2) + Pr(X = 9 | p = 0, 2) + Pr(X = 10 | p = 0, 2) 10 9 + (0 , 2) (0 , 8) (0, 2)2 (0, 8)8 + = 0, 810 + 10 1 2 10 10 10 8 2 9 (0 , 8) + (0 , 8) + (0 , 2) (0 , 2) (0, 2)10 8 9 10 = 0, 107374182 + 0, 268435456 + 0, 301989888 +0, 00007373 + 0, 00000410 + 0, 00000010 = 0, 677877453 Analogamente obtm-se a seguinte tabela: p 0, 1 0, 2 0, 3 0, 4 0, 5 0, 6 0, 7 0, 8 0, 9 Veja a Figura 8.5. Q(p) 0,9298095 0,6778775 0,3843732 0,1795843 0,1093750 0,1795843 0,3843732 0,6778775 0,9298095

129

CAPTULO 8. TESTES DE HIPTESES

130

1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 0,0 0,2 0,4 0,6 0,8 1,0

Figura 8.5: Funo poder do teste para o Exerccio 3

Captulo 9 Teste de Hiptese: Mdia da N (; 2) - 2 Conhecida


Neste captulo iremos aplicar os conceitos bsicos sobre a teoria de teste de hiptese a uma situao especca. Nosso interesse estar concentrado na mdia de uma populao normal. Assim como no caso dos intervalos de conana, iremos iniciar nossos estudos supondo que a varincia dessa populao seja conhecida. Como j dito, essa situao no muito comum na prtica, mas, em termos didticos, a apresentao dos conceitos ca simplicada. Entendendo bem a construo de um teste de hiptese para esse caso particular, a apresentao para as outras situaes bastante semelhante, mudando apenas a distribuio amostral. Neste captulo veremos os seguintes conceitos aplicados mdia de uma populao normal com varincia conhecida: hipteses nula e alternativa erros tipo I e II estatstica de teste regra de deciso regio crtica funo caracterstica de operao poder do teste valor P Vamos apresentar inicialmente trs exemplos que ilustraro as diversas possibilidades que podem surgir na prtica.

131

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA132

9.1

Exemplo 1

Depois de uma pane geral no sistema de informao de uma empresa, o gerente administrativo deseja saber se houve alterao no tempo de processamento de determinada atividade. Antes da pane, o tempo de processamento podia ser aproximado por uma varivel aleatria normal com mdia de 100 minutos e desvio padro de 10 minutos. O gerente acredita que a pane no tenha alterado a variabilidade do processo. Uma amostra de 16 tempos de processamento aps a pane revela uma mdia de 105,5 minutos. Ao nvel de signicncia de 5%, qual a concluso sobre a alterao do tempo mdio de processamento?

9.1.1

Hipteses nula e alternativa

O interesse do gerente comparar os tempos antes e depois da pane. Antes da pane, o tempo mdio de processamento era de 100 minutos. Como ele no sabe o tipo de alterao que possa ter ocorrido, ele precisa saber se o tempo mdio depois da pane diferente do tempo anterior. Isso nos leva s seguintes hipteses nula e alternativa: H0 : = 100 H1 : 6= 100

9.1.2

Estatstica de teste

Seja X a varivel aleatria que representa o tempo de processamento. Ento, pelos dados do problema, temos que X N (; 100). Antes da pane, = 100. Como a populao normal, sabemos que a distribuio da mdia amostral tambm normal e como no deve ter havido alterao na variabilidade do processo, resulta que o desvio padro de 10 minutos em qualquer situao. Logo, 100 X N ; 16 ou equivalentemente, Z= X N (0; 1) 2, 5

9.1.3

Nvel de signicncia e regio crtica

Pelo enunciado do problema, o nvel de signicncia de 5%. Isso signica que a probabilidade do erro tipo I 0,05. Como visto, o erro tipo I consiste em rejeitar a hiptese nula quando ela verdadeira. Logo, = Pr(rejeitar H0 | H0 verdadeira) = 0, 05

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA133 Quando H0 verdadeira, a estatstica de teste tem a seguinte distribuio: 100 H0 verdadeira = X N 100; 16 ou equivalentemente, Z0 = X 100 q N (0; 1)
100 16

A nossa regio crtica consiste nos valores de X com probabilidade pequena de ocorrerem sob essa hiptese. Ou seja, a regio crtica consiste nos valores de X muito afastados da mdia suposta de = 100. Como a hiptese alternativa bilateral, muito afastado signica muito maior ou muito menor do que = 100. Veja a Figura 9.1.

Figura 9.1: Regio crtica para o teste bilateral de H0 : = 100 Ento, nossa regio crtica X > 100 + k e isso equivalente a X 100 > k ou X 100 < k ou X < 100 k

Usando a funo mdulo, podemos escrever: X 100 > k RC :

e o valor da constante k determinado pelo nvel de signicncia: 0, 05 = Pr X 100 > k | X N (100; 6, 25)

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA134

9.1.4

Determinao da regio crtica

Para determinar a regio crtica, basta encontrar o valor da constante k tal que Pr X 100 > k | X N (100; 6, 25) = 0, 05 = Pr X 100 > k | X N (100; 6, 25) + Pr X 100 < k | X N (100; 6, 25) = 0, 05 = k k Pr Z > + Pr Z < = 0, 05 = 2, 5 2, 5 k k Pr Z > + Pr Z > = 0, 05 = 2, 5 2, 5 k = 0, 025 = Pr Z > 2, 5 k tab = 0, 475 = 2, 5 k = 1, 96 = 2, 5 k = 4, 9 A regio crtica RC : X > 104, 9 ou X < 95, 1

Como o valor da estatstica de teste para a amostra observada est na regio crtica, devemos rejeitar a hiptese nula, ou seja, as evidncias amostrais indicam uma alterao do tempo de processamento da tarefa aps a pane.

9.1.5

Poder

A funo poder do teste denida como () = Pr(rejeitar H0 |) Em termos da nossa regio crtica podemos escrever () = Pr X > 104, 9 | X N (; 6, 25) + Pr X < 95, 1 | X N (; 6, 25) 104, 9 95, 1 = Pr Z > + Pr Z < 2, 5 2, 5 Calculando () para diferentes valores de obtemos o grco exibido na Figura 9.2.

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA135

1,05 1,00 0,95 0,90 0,85 0,80 0,75 0,70 0,65 0,60 0,55 0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00

85

90

95

100

105

110

115

Figura 9.2: Funo poder - Exemplo 1

9.2

Exemplo 2

Na mesma situao do exemplo anterior, bastante razovel supor que o gerente esteja interessado apenas no caso de aumento do tempo de processamento. Anal, se o tempo diminuir, isso signica que a tarefa vai ser executada mais rapidamente, o que representa um ganho. Ento, as duas possibilidades so: 100 > 100 OK! Problema!

Para denir qual a hiptese nula, vamos usar o seguinte procedimento. Como dito no captulo anterior, neste curso s trabalharemos com hipteses nulas simples, isto , hipteses nulas que envolvam igualdade do parmetro a um determinado valor: = 0 . Assim, em um teste unilateral, a hiptese alternativa deve ser aquela que no envolve o sinal de igualdade. No nosso exemplo, essa a hiptese > 100. A hiptese nula, tendo que ser uma hiptese simples, passa a ser = 100, ou seja: H0 : = 100 H1 : > 100 A estatstica de teste continua sendo 100 X N ; 16 O que muda a regio crtica, que agora passa a ser RC : Veja a Figura 9.3. X > 100 + k

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA136

Figura 9.3: Regio crtica para o teste de H0 : = 100 com alternativa unilateral direita H1 : > 100 Como o nvel de signicncia 5%, isso signica que 0, 05 = Pr X > 100 + k | X N (100; 6, 25)

e o valor da constante calculado como Pr X > 100 + k | X N (100; 6, 25) = 0, 05 = 100 + k 100 Pr Z > = 0, 05 = 2, 5 k = 0, 45 = tab 2, 5 k = 1, 64 = 2, 5 k = 4, 1 e isso nos leva regio crtica RC : X > 104, 1

Como no exemplo anterior, temos que rejeitar a hiptese nula de que o tempo de processamento no se alterou, j que o valor observado da estatstica amostral est na regio crtica. A funo poder do teste () = Pr(X > 104, 1|) cujo grco encontra-se na Figura 9.4. Note que para valores de menores do que 100 a probabilidade de rejeitar H0 zero, o que razovel, pois com uma hiptese unilateral

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA137

1,2 1,0 0,8 0,6 0,4 0,2 0,0 80 85 90 95 100 105 110 115

Figura 9.4: Funo poder - Exempo 2 direita, s rejeitamos a hiptese nula para valores muito maiores do que 100. Se o valor observado da estatstica de teste menor do que 100, claro que no devemos rejeitar H0 .

9.3

Exemplo 3

O dono de uma mdia empresa decide investigar a alegao de seus empregados de que o salrio mdio na sua empresa menor que o salrio mdio nacional. Para isso, ele analisa uma amostra de 25 salrios, obtendo uma mdia de 894,53 reais. De informaes obtidas junto ao sindicato patronal, ele sabe que, em nvel nacional, o salrio mdio de 900 reais, com desvio padro de 32 reais. Supondo que seja razovel aproximar a distribuio dos salrios por uma distribuio normal com o mesmo desvio padro nacional, vamos construir um teste de hiptese apropriado, com um nvel de signicncia de 10%. O problema aqui consiste em decidir se os salrios so menores ou no do que a mdia nacional de 900 reais, ou seja, as situaes de interesse so < 900 900 Como no exemplo anterior, a hiptese alternativa aquela que no envolve o sinal de igualdade. Logo, nossas hipteses so: H0 : = 900 H1 : < 900 e a estatstica de teste 322 X N ; 25

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA138 O proprietrio deve rejeitar a hiptese nula se a mdia amostral for muito menor do que 900, ou seja, a regio crtica RC : Veja a Figura 9.5. X < 900 k

Figura 9.5: Regio crtica para o teste de H0 : = 900 com alternativa unilateral esquerda H1 : < 900 O valor de k determinado pelo nvel de signicncia: Pr X < 900 k | X N (900; 6, 42 ) = 0, 10 = 900 k 900 Pr Z < = 0, 10 = 6, 4 k Pr Z < = 0, 10 = 6, 4 k = 0, 10 = Pr Z > 6, 4 k tab = 0, 40 = 6, 4 k = 1, 28 = 6, 4 k = 8, 192 Logo, a regio crtica RC : X < 891, 808 Veja na Figura 9.6 a funo poder deste teste: para valores maiores do que 900, a probabilidade de rejeitar a hiptese nula zero.

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA139

1,1 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 860 870 880 890 900 910 920 930 940

Figura 9.6: Funo poder - Exemplo 3

9.4

Procedimento geral para construo do teste de hiptese sobre a mdia de uma N (; 2) - 2 conhecida

Os trs exemplos acima ilustram o procedimento para construo de um teste de hiptese sobre a mdia de uma populao normal com varincia conhecida. De posse de uma amostra aleatria simples X1 , X2 , . . . , Xn extrada de uma populao X N (; 2 ), nosso interesse est em testar a hiptese nula H0 : = 0 a um nvel de signicncia . Dependendo do conhecimento sobre o problema, a hiptese alternativa pode tomar uma das trs formas: H1 : 6= 0 H1 : > 0 H1 : < 0

Em qualquer dos casos, a estatstica de teste a mdia amostral; se a varincia 2 conhecida, sabemos que 2 X N ; n A regra de deciso consiste em rejeitar a hiptese nula se o valor de X estiver longe do valor 0 . No caso da hiptese alternativa bilateral, estar longe signica ser muito maior ou muito menor que 0 ; para a alternativa unilateral direita, estar longe signica ser muito maior do que 0 e para a alternativa unilateral esquerda, longe signica ser muito menor que 0 . As expresses muito menor e muito maior cam perfeitamente denidas a partir do valor do nvel de signicncia . Veja a Figura 9.7, em que nas partes (a), (b) e (c) ilustra-se a regio crtica para as trs hipteses

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA140 alternativas. Como antes, vamos denotar por z a abscissa da curva normal padro que deixa rea (probabilidade) acima dela.

9.4.1

Teste bilateral

Consideremos as hipteses H0 : = 0 H1 : 6= 0 A regio crtica [veja a Figura 9.7-(a)] RC : X > 0 + k ou X < 0 k

e se a hiptese nula verdadeira, 2 X N 0 ; n Com nvel de signicncia = Pr(erro I), temos que ter: Pr(rejeitar H0 | H0 verdadeira) = = 2 2 Pr X > 0 + k | X N 0 ; + Pr X < 0 k | X N 0 ; = = n n ! ! 0 k 0 0 + k 0 + Pr Z < = = Pr Z > Pr Z > Pr Z > Pr Z > k
n

k
n

! ! !

+ Pr Z < + Pr Z > = = 2 k

k
n

k
n

= =

= =

k
n

= z/2 =

k = z/2 n Logo, a regio crtica X > 0 + z/2 n ou X > 0 z/2 n

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA141

Figura 9.7: Regio crtica para o teste de hiptese sobre a mdia de uma normal com varincia conhecida (a) teste bilateral (b) teste unilateral direita (c) teste unilateral esquerda

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA142

9.4.2

Teste unilateral direita

Consideremos as hipteses H0 : = 0 H1 : > 0 A regio crtica [veja a Figura 9.7-(b)] RC : e se a hiptese nula verdadeira, 2 X N 0 ; n Com nvel de signicncia = Pr(erro I), temos que ter: Pr(rejeitar H0 | H0 verdadeira) = = 2 = = Pr X > 0 + k | X N 0 ; n ! 0 + k 0 = = Pr Z > Pr Z > k
n

X > 0 + k

k
n

= =

= z =

k = z n Logo, a regio crtica X > 0 + z n

9.4.3

Teste unilateral esquerda


H0 : = 0 H1 : < 0

Consideremos as hipteses

A regio crtica [veja a Figura 9.7-(c)] RC : X < 0 k

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA143 e se a hiptese nula verdadeira, 2 X N 0 ; n Com nvel de signicncia = Pr(erro I), temos que ter: Pr(rejeitar H0 | H0 verdadeira) = = 2 Pr X < 0 k | X N 0 ; = = n ! 0 k 0 Pr Z < = = Pr Z < Pr Z > k
n

k
n

k
n

= =

= =

= z =

k = z n Logo, a regio crtica X < 0 z n

9.4.4

Teste de hiptese versus intervalo de conana

interessante notar a expresso que aparece na regio crtica para o teste bilateral; ela a mesma obtida para a margem de erro do intervalo de conana para a mdia de uma populao normal com varincia conhecida: = z/2 n Podemos ver, assim, que existe uma relao entre os dois procedimentos; na verdade, em um teste de hiptese bilateral, rejeitamos a hiptese nula H0 se o valor observado da estatstica de teste no estiver no intervalo de conana.

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA144

9.5

Valor P

Nos exemplos acima, a determinao da regio crtica foi feita com base no nvel de signicncia, isto , xado o nvel de signicncia encontramos o valor k que denia os limites entre valores provveis (aqueles que levam no rejeio de H0 ) e pouco provveis (aqueles que levam rejeio de H0 ). Um outro procedimento bastante usual, especialmente quando so utilizados programas computacionais, consiste em calcular a probabilidade de se obter um valor to ou mais desfavorvel que o valor observado, se H0 for verdadeira. Essa probabilidade chamada valor P . Vamos ilustrar esse conceito considerando novamente os trs exemplos anteriores.

9.5.1

Teste bilateral - Valor P para o Exemplo 1

O valor obtido com os dados amostrais para a estatstica de teste x = 105, 5. Como o teste bilateral, valores longe de 100 so aqueles muito menores ou muito maiores que 100. O procedimento visto consistiu em dividir a probabilidade do erro tipo I igualmente nas duas caudas da distribuio normal e dessa forma identicamos a regio crtica. Vamos, agora, calcular o valor P para o nosso exemplo; ele a probabilidade de obtermos um valor to ou mais extremo que o valor observado. Como o valor observado est direita da mdia, devemos calcular a seguinte probabilidade: P = Pr(X 105, 5 | H0 verdadeira) 100 = Pr X 105, 5 | X N 100; 16 105.5 100 = Pr(Z 2, 2) = 0, 5 tab(2, 2) = Pr Z 2.5 = 0, 0139 Vamos analisar a Figura 9.8, onde est ilustrado esse valor. O valor amostral observado para X x = 105, 5 = 100 + 5, 5. Como o teste bilateral, se tivssemos obtido o valor x = 100 5, 5, esse valor tambm seria considerado to afastado de 100 quanto 105,5. Assim, para testes bilaterais, temos que considerar a probabilidade nas duas caudas da distribuio. O que esse resultado est nos dizendo o seguinte: se H0 for verdadeira, a probabilidade de obtermos um valor distante de 100 por 5,5 unidades em qualquer direo 2 0, 0139 = 0, 0278. Essa probabilidade chamada valor P. No exemplo, vemos que o valor P pequeno, o que signica que pouco provvel obtermos um valor to extremo quando H0 verdadeira. Logo, razovel supormos que a hiptese nula no seja verdadeira, a mesma concluso obtida ao trabalharmos com o nvel de signicncia de 5%. Na verdade, rejeitaramos a hiptese nula para qualquer nvel de signicncia maior que 0,0278.

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA145

Figura 9.8: Valor P para o teste bilateral do Exemplo 1

9.5.2

Teste unilateral direita - Exemplo 2

Como o teste unilateral direita, valores extremos so aqueles muito maiores que 100. Como visto acima, P = 0, 0139 Neste caso no temos que multiplicar por 2, pois o teste unilateral. Como o valor P muito pequeno, temos evidncia suciente para rejeitar a hiptese nula. Essa mesma deciso seria tomada para qualquer nvel de signicncia menor que 0,0139.

9.5.3

Teste unilateral esquerda - Exemplo 3

No Exemplo 3, temos um teste bilateral esquerda; logo, o valor P P = Pr X 894, 53 | X N (900; 6, 4) 894.53 900 = Pr Z 6.4 = Pr(Z 0, 85) = Pr(Z 0, 85) = 0, 5 tab(0, 85) = 0, 1977 Essa no uma probabilidade pequena; ou seja, razovel obter um valor to ou mais extremo que 894,53 quando H0 verdadeira. Assim, os dados no fornecem evidncia suciente para rejeitarmos a hiptese nula. Com base nesses exemplos, podemos concluir o seguinte:

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA146 Devemos rejeitar a hiptese nula H0 ao nvel de signicncia sempre que o valor P for menor ou igual a ,ou seja: Rejeitamos H0 P

Os programas de estatstica calculam valores P mais exatos do que aqueles obtidos atravs da tabela. Nas aplicaes e exerccios deste curso devemos arredondar os resultados necessrios para 2 casas decimais para podermos utilizar a tabela da distribuio normal.

9.6

Exemplo 4

Uma amostra de tamanho n = 25 extrada de uma populao normal com varincia 256, obtendo-se x = 23. Deseja-se testar a hiptese H0 : = 18 Determine a regio crtica ao nvel de signicncia de 1% e encontre o valor P quando 1. H1 : 6= 18 2. H1 : > 18 Soluo 1. A regio crtica Com = 0, 01 temos que ter: 256 256 + Pr X < 18 k | X N 18; = 0, 01 = Pr X > 18 + k | X N 18; 25 25 18 + k + 18 18 k 18 Pr Z > + Pr Z < = 0, 01 = 3, 2 3, 2 k k + Pr Z < = 0, 01 = Pr Z > 3, 2 3, 2 k k Pr Z > + Pr Z > = 0, 01 = 3, 2 3, 2 k Pr Z > = 0, 005 = 3, 2 k = 0, 495 = tab 3, 2 k = 2, 58 = 3, 2 k = 8, 256 RC : X > 18 + k ou X < 18 k

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA147 Logo, a regio crtica X > 26, 256 ou X < 9, 744 O valor P 256 2 Pr X 23 | X N 18; 25 23 18 2 Pr Z 3, 2 2 Pr(Z 1, 56) 2 [0, 5 tab(1, 56)] 2 [0, 5 0, 4406] 0, 1188

P = = = = = =

Rejeitamos H0 a qualquer nvel de signicncia 0, 1188. Logo, ao nvel de signicncia de 1% (ou mesmo 5%) no podemos rejeitar H0 . Note que o valor da estatstica de teste, x = 23, est fora da regio crtica. 2. A regio crtica RC : X > 18 + k Com = 0, 01 temos que ter: 256 Pr X > 18 + k | X N 18; = 0, 01 = 25 18 + k + 18 Pr Z > = 0, 01 = 3, 2 k = 0, 01 = Pr Z > 3, 2 k tab = 0, 49 = 3, 2 k = 2, 33 = 3, 2 k = 7, 456 Logo, a regio crtica X > 25, 456 O valor P

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA148 256 Pr X 23 | X N 18; 25 23 18 Pr Z 3, 2 Pr(Z 1, 56) [0, 5 tab(1, 56)] [0, 5 0, 4406] 0, 0594

P = = = = = =

Rejeitamos H0 a qualquer nvel de signicncia 0, 0594. Logo, ao nvel de signicncia de 1% no podemos rejeitar H0 . Note que o valor da estatstica de teste, x = 23, est fora da regio crtica.

9.7

Exerccios

1. Uma amostra aleatria simples de tamanho n = 9 extrada de uma populao normal com desvio padro 3,1 apresentou mdia igual a x = 13, 35. Deseja-se testar H0 : = 12, 8 H1 : 6= 12, 8 (a) Determine a regio crtica correspondente ao nvel de signicncia = 0, 02. (b) Com base na regio crtica encontrada no item anterior, estabelea a concluso, tendo o cuidado de usar um fraseado que no seja puramente tcnico. (c) Calcule o valor P e interprete o resultado obtido. (d) Esboce o grco da funo poder, calculando () para os seguintes valores de : 8 9 10 11 12 13 14 15 16 17 18 2. Uma empresa fabricante de balas arma que o peso mdio de suas balas de pelo menos 2 gramas. Pela descrio do processo de produo, sabe-se que o peso das balas distribui-se normalmente com desvio padro de 0,5 grama. Uma amostra de 25 balas apresenta peso mdio de 1,98 gramas. O que se pode concluir sobre a armao do fabricante? Use um nvel de signicncia de 5%. 3. Em uma linha de produo, peas so produzidas de modo que o comprimento seja normalmente distribudo com desvio padro de 0,5 cm. Ajustes peridicos so feitos na mquina para garantir que as peas tenham comprimento apropriado de 15 cm, pois as peas muito curtas no podem ser aproveitadas (as peas longas podem ser cortadas). A cada hora so extradas 9 peas da produo, medindo-se seu comprimento. Estabelea uma regra de deciso para denir se o processo est operando adequadamente. Use o nvel de signicncia de 0,1%.

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA149 4. Depois de desenvolver um algoritmo para acelerar a execuo de determinada tarefa rotineira em um escritrio de contabilidade, o analista de sistema analisa uma amostra de 25 tempos, obtendo uma mdia 46,5 segundos. Dos dados passados, ele sabe que o tempo de execuo aproximadamente normal com mdia de 48,5 segundos e desvio padro de 5 segundos. Use o mtodo do valor P para decidir se o algoritmo do analista realmente melhorou o desempenho do sistema. 5. Uma propaganda arma que o consumo mdio de gasolina de determinada marca de automvel de 12 litros por 100 quilmetros rodados, com desvio padro de 1,0 litro. Um teste com 36 automveis desta marca acusa um consumo mdio de 12,4 litros por 100 quilmetros rodados. O que se pode concluir sobre a propaganda?

9.8

Soluo dos Exerccios


n=9 x = 13, 35 (a) = 0, 02 = z/2 = 2, 33

1. X N (; 3, 12 )

RC : X > 12, 8 + k ou X < 12, 8 k 3, 12 Pr X > 12, 8 + k X < 12, 8 k | X N 12, 8; = 0, 02 9 ! ! 12, 8 k 12, 8 12, 8 + k 12, 8 + Pr Z < = 0, 02 Pr Z > 3,1 3,1
3 3

Pr(Z > 0, 96774k) + Pr(Z < 0, 96774k ) = 0, 02 2 Pr(Z > 0, 96774k) = 0, 02 Pr(Z > 0, 96774k) = 0, 01 0, 96774k = 2, 33 k = 2, 41 A regio crtica X > 15, 21 ou X < 10, 39 (b) O valor observado x = 13, 35 no est na regio crtica. Logo, no h evidncia amostral suciente para rejeitarmos a hiptese de que a mdia da populao seja 12,8. (c) . 3, 12 P = 2 Pr X 13, 35 | X N 12, 8; 9 ! 13, 35 12, 8 = 2 Pr Z 3,1
3

= 2 Pr(Z 0, 53) = 2 [0, 5 tab(0, 53)] = 0, 4038

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA150 O valor P bastante alto; logo a hiptese nula s seria rejeitada para nveis de signicncia maiores que 0,40. Isso evidncia de que no se pode rejeitar a hiptese nula em qualquer nvel de signicncia razovel. (d) () = Pr(rejeitar H0 |) 3, 12 3, 12 = Pr X > 15, 21|X N ; + Pr X < 10, 38|X N ; 9 9 Na tabela abaixo temos o valor de () para diferentes valores de (voc pode obter valores um pouco diferentes, por causa de arredondamentos!). Veja tambm a Figura 9.9. 8 9 10 11 12 13 14 15 16 17 18 () 0,98937 0,90914 0,64347 0,27428 0,05942 0,02184 0,12104 0,41948 0,77772 0,95839 0,99653

Por exemplo: 3, 12 3, 12 (8) = Pr X > 15, 21|X N 8; + Pr X < 10, 38|X N 8; 9 9 ! ! 10, 38 8 15, 21 8 + Pr Z < = Pr Z > 3,1 3,1
3 3

= Pr(Z > 6, 98) + Pr(Z < 2, 30) = [0, 5 tab(6, 98)] + [0, 5 + tab(2, 30] = 0, 5 0, 5 + 0, 5 + 0, 4893 = 0, 9893 2. Seja X a varivel aleatria que representa o peso das balas. Ento X N (; 0, 25). Como n = 25, resulta que X N (; 0, 01)

A armativa do fabricante 2. Logo, a negao de tal armao < 2. Como essa ltima expresso no contm o sinal de igualdade, ela se torna a hiptese alternativa. Ento, nossas hipteses so: H0 : = 2 H1 : < 2

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA151

1,2 1,0 0,8 0,6 0,4 0,2 0,0 0 5 10 15 20

Figura 9.9: Funo poder - Exerccio 1 A regio crtica RC : X < 2 k Pr[X < 2 k | X N (2; 0, 01)] = 0, 05 = k Pr Z < = 0, 05 = 0, 1 k = 0, 05 = Pr Z > 0, 1 k tab = 0, 45 = 0, 1 k = 1, 64 = 0, 1 k = 0, 164 A regio crtica X < 2 0, 164 = 1, 836 Como o valor observado x = 1, 98 no se encontra na regio crtica, no podemos rejeitar a hiptese nula. Ou seja, os dados no trazem evidncia de que o fabricante esteja mentindo. 3. O problema na produo surge quando < 15. Logo, nossas hipteses so: H0 : = 15 H1 : < 15 A regio crtica RC : X < 15 k

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA152 0, 52 = 0, 001 = Pr X < 15 k|X N 15; 9 ! 15 k 15 = 0, 001 = Pr Z < 0,5
3

Pr(Z > 6k) = 0, 001 = tab(6k) = 0, 499 = 6k = 3, 09 = k = 0, 515 Ento se X < 14, 485 o processo deve ser interrompido para um novo ajuste. 4. A inteno do analista reduzir o tempo; logo, o interesse dele que < 48, 5. A negao dessa armativa 48, 5. Logo, nossas hipteses so: H0 : = 48, 5 H1 : < 48, 5 A estatstica amostral 55 X N ; 25 O valor obtido x = 46, 5, que resulta no seguinte valor P : 55 P = Pr X < 46, 55|X N 48, 5; 25 46, 5 48, 5 = Pr Z < 1 = Pr(Z < 2, 0) = Pr(Z > 2, 0) = 0, 5 tab(2, 0) = 0, 02275

Podemos armar que o tempo de execuo reduziu, a qualquer nvel de signicncia inferior 2, 275%. Note que rejeitamos a hiptese nula ao nvel de signicncia de 5%, mas no a 1%! 5. Se o consumo for menor ou igual a 12 litros por 100 km, no h problema com a propaganda. O problema surge se o consumo for superior. Logo, nossas hipteses so: H0 : = 12 H1 : > 12 Supondo que o consumo X possa ser aproximado por uma distribuio normal, temos que 1 X N ; 36

CAPTULO 9. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 CONHECIDA153 Vamos calcular o valor P : 1 P = Pr X > 12, 4|X N 12; 36 12, 4 12 = Pr Z > 1
6

= Pr(Z > 2, 4) = 0, 5 tab(2, 4) = 0, 0082

A propaganda parece ser enganosa, pois a probabilidade de se obter um consumo mdio de 12,4 litros por 100 km pequena se o consumo realmente for de 12 litros por 100 km. Note que H0 rejeitada para qualquer nvel de signicncia 0, 82%, o que inclui os nveis de signicncia usuais de 1% e 5%.

Captulo 10 Teste de Hiptese: Propores Amostra Grande


No captulo anterior voc aprendeu a construir testes de hipteses sobre a mdia de uma populao normal com varincia 2 conhecida. O procedimento baseou-se na distribuio amostral da mdia amostral que, com as hipteses de normalidade e conhecimento da varincia populacional, sabemos ser normal com a mesma mdia e varincia 2 . Neste captulo iremos fazer uso do Teorema Limite Central para construir testes de n hipteses sobre propores com base em amostras grandes. Vimos que, para amostras grandes, a distribuio amostral da proporo amostral pode ser aproximada por uma distribuio normal e, assim, o procedimento de teste de hiptese ser idntico ao estudado no captulo anterior. Veremos, ento, os seguintes conceitos aplicados proporo populacional: hipteses nula e alternativa estatstica de teste erros tipo I e II regra de deciso regio crtica valor P

10.1

Contexto bsico

O contexto de interesse o seguinte: temos uma populao em que cada elemento classicado de acordo com a presena ou ausncia de determinada caracterstica. Em termos de varivel aleatria, essa populao representada por uma varivel aleatria de Bernoulli, isto : 1 se elemento possui a caracterstica de interesse X= 0 se elemento no possui a caracterstica de interesse 154

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE155 Ento, Pr(X = 1) = p, E (X ) = p e V ar(X ) = p(1 p). O parmetro p tambm a proporo de elementos da populao que possuem a caractersitca de interesse. Em geral, esse parmetro desconhecido e queremos testar hipteses feitas sobre seu possvel valor. Suponha, ento, que dessa populao seja extrada uma amostra aleatria simples b de elementos na amostra que X1 , X2 , . . . , Xn com reposio. Vimos que a proporo P possuem a caracterstica de interesse, denida por b = Sn = X1 + X2 + + Xn P n n
p(1p) n

(10.1)

um estimador no-viesado para p com varincia

. Mais precisamente,

Como a proporo amostral uma mdia de uma amostra aleatria simples de uma populao com distribuio de Bernoulli com parmetro p, o Teorema Central do Limite b se aproxima de uma nornal com mdia p e nos diz, ento, que a distribuio de P p(1p) varincia n . Como visto, a aproximao deve ser feita se np 5 e n(1 p) 5 e, em geral, essas condies so satisfeitas se n 30. Resumindo, temos o seguinte resultado: p(1 p) b P N p; n ou, equivalentemente: bp P q N (0; 1)
p(1p) n

b) = p E (P b) = p(1 p) V ar(P n

Vamos ver, agora, como usar esse resultado para construir testes de hipteses sobre a verdadeira proporo populacional p.

10.2

Teste de hipteses sobre propores


H0 : p = p0

A hiptese nula que consideraremos ser uma hiptese simples:

As hipteses alternativas possveis so Bilateral : Unilateral direita : Unilateral esquerda : H1 : p 6= p0 H1 : p > p0 H1 : p < p0

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE156 Como no caso da mdia, a escolha das hipteses nula e alternativa deve ser feita levando-se em conta que a hiptese nula deve ser uma hiptese simples. Assim, voc deve traduzir a situao de interesse do problema em desigualdades envolvendo a proporo p. A hiptese alternativa a desigualdade que no inclui o sinal de =. A estatstica de teste bp P Z=q N (0; 1)
p(1p) n

Dado um nvel de signicncia , a regio crtica denida como o conjunto de valores da estatsttca de teste que tm probabilidade pequena de ocorrerem sob a veracidade da hiptese nula. Assim, a regio crtica denida como o conjunto de valores de b p0 P Z0 = r N (0; 1) p0 (1 p0 ) n com pequena probabilidade de ocorrncia: Z0 > k ou Z0 < k Z0 > k Z0 < k (teste bilateral) (teste unilateral direita) (teste unilateral esquerda)

O valor k encontrado impondo-se a condio de a probabilidade do erro tipo I ser igual a : Pr (rejeitar H0 | H0 verdadeira) =

10.2.1

Teste bilateral
Pr(rejeitar H0 | H0 verdadeira) = = Pr [Z0 > k | Z0 N (0; 1)] + Pr [Z0 < k | Z0 N (0; 1)] = = Pr [Z0 > k | Z0 N (0; 1)] + Pr [Z0 > k | Z0 N (0; 1)] = = Pr [Z0 > k | Z0 N (0; 1)] = = 2 k = z/2

Com nvel de signicncia = Pr(erro I), temos que ter:

ou seja, a regio crtica : Z0 > z/2 b p0 P ou Z0 < z/2 r p0 (1 p0 ) n (10.2)

Em termos da proporo amostral, temos o seguinte: Z0 > z/2 r Z0 < z/2 b > p0 + z/2 > z/2 P

p0 (1 p0 ) n r b P p0 b < p0 z/2 p0 (1 p0 ) < z/2 P r n p0 (1 p0 ) n

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE157 ou seja, a regio crtica r b > p0 + z/2 p0 (1 p0 ) P n

ou

10.2.2

Testes unilaterais

b < p0 z/2 P

p0 (1 p0 ) n

(10.3)

Com desenvolvimento anlogo obtemos as seguintes regies crticas: q p0 ) b Teste unilateral direita: Z0 > z ou P > p0 + z p0 (1n Teste unilateral esquerda: Z0 < z ou

10.3

Valor P

b < p0 z P

(10.4)

p0 (1p0 ) n

Como j visto no captulo anterior, o valor P a probabilidade de se obter um valor to ou mais extremo (na direo da hiptese alternativa) que o valor observado da estatstica de teste. Denotando por z0 o valor observado da estatstica de teste, temos as seguintes possibilidades: P = 2 Pr(Z0 > | z0 |) (teste bilateral) P = Pr(Z0 > | z0 |) (teste unilateral direita ou esquerda) (10.5)

Valores pequenos de P indicam que o valor observado pouco provvel de ocorrer sob a hiptese nula; logo, valores pequenos de P levam rejeio da hiptese nula. A hiptese nula rejeitada a qualquer nvel de signicncia P.

10.4

Exemplo 1
H0 : p = 0, 35 H1 : p 6= 0, 35

Uma amostra de 64 elementos usada para testar

Estabelea a regio crtica para o nvel de signicncia de 1%. Se a proporo amostral para esta amostra p b = 0, 26, calcule o valor P. Soluo Com = 0, 01 e um teste bilateral, resulta que z0,005 = 2, 59. A estatstica de teste b 0, 35 P Z0 = q =
0,350,65 64

e a regio crtica

Z0 > 2, 58

ou

Z0 < 2, 58

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE158 Em termos da proporo amostral, temos que b 0, 35 P b > 0, 503 82 Z0 > 2, 58 q > 2, 58 P
0,350,65 64 0,350,65 64

e a regio crtica

b 0, 35 P b < 0, 19618 < 2, 58 P Z0 < 2, 58 q b > 0, 504 P ou b < 0, 196 P

O valor observado da estatstica de teste


0.350.65 64

Como o teste bilateral, o valor P calculado como P = = = =

0.26 0.35 z0 = q = 1, 5095 1, 51 2 Pr [Z0 > 1, 51 | Z0 N (0; 1)] 2 [0, 5 tab(1, 51)] 2 [0, 5 0, 43448] 0, 13104

Como o valor P grande, no se rejeita a hiptese nula, ou seja, a probabilidade de se obter um valor to extremo quanto o observado alta, se H0 for verdadeira. A hiptese nula s seria rejeitada para nveis de signicncia maiores que 13,1%.

10.5

Exemplo 2

Um fabricante arma que no mximo 10% dos seus produtos so defeituosos. Um rgo de defesa do consumidor testa uma amostra de 81 desses itens, detectando 13,8% de defeituosos. 1. Encontre a regio crtica para um nvel de signicncia de 5%. 2. Calcule o valor P. Soluo A armativa de interesse para o fabricante p 0, 10. A negao de tal armativa (questionamento do rgo de defesa do conumidor) p > 0, 10. Logo, nossas hipteses so: H0 : p = 0, 10 H1 : p > 0, 10 Note que todas as propores esto na forma decimal! No trabalhe com percentagens!

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE159 A estatstica de teste b 0, 10 P Z0 = q =


0,100,90 81

1. Com = 0, 05 e um teste unilateral, resulta que z0,05 = 1, 64 e a regio crtica Z0 > 1, 64 O valor observado da estatstica de teste 0, 138 0, 10 = 1, 14 z0 = q
0,100,90 81

que no pertence regio crtica. Ou seja, os dados no fornecem evidncia contra o fabricante. 2. P = Pr [Z0 > 1, 14 | Z0 N (0; 1)] = 0, 5 tab(1, 14) = 0, 12714 Logo, rejeitamos H0 apenas para nveis de signicncia maiores que 12,7%. Assim, aos nveis de signicncia usuais, no devemos rejeitar H0 , o que uma evidncia de que o fabricante est dizendo a verdade.

10.6

Resumo do Captulo

Neste captulo voc estudou o procedimento para construo de um teste de hiptese sobre a proporo de uma populao com base em uma amostra aleatria simples de tamanho n grande. Assim, temos uma amostra aleatria simples X1 , X2 , . . . , Xn de uma populao X Bern(p), com n sucientemente grande. A hiptese nula, representada por H0 , a hiptese bsica que queremos testar e neste contexto sempre ter a forma H0 : p = p0 A hiptese alternativa, representada por H1 , a hiptese que devemos considerar no caso de rejeio da hiptese nula. A forma mais geral de H1 a hiptese bilateral, mas podemos ter hipteses unilaterais esquerda e hipteses unilaterais direita: H1 : p < p0 H1 : p > p0 H1 : p 6= p0 Para denir a hiptese alternativa, escreva, primeiro, as situaes de interesse do problema em forma de desigualdades. A hiptese alternativa ser sempre a desigualdade que no envolve o sinal de igualdade.

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE160 A estatstica de teste bp P

Z=r

p(1 p) n

N (0; 1)

A regra de deciso se baseia no valor da estatstica de teste sob a hiptese nula: Z0 = r p0 (1 p0 ) n b p0 P N (0; 1)

Valores pouco provveis desta estatstica levam rejeio da hiptese nula. Assim, a regra de deciso rejeitar H0 para valores na(s) cauda(s) da distribuio normal padro. Com nvel de signicncia , temos as seguintes possibilidades: Z0 > z/2 Z0 > z Z0 < z ou Z0 < z/2 (teste bilateral) (teste unilateral direita) (teste unilateral esquerda)

O valor P a probabilidade de se obter um valor to ou mais extremo (na direo da hiptese alternativa) que o valor observado da estatstica de teste. Denotando por z0 o valor observado da estatstica de teste, temos as seguintes possibilidades: P = 2 Pr(Z0 > | z0 |) (teste bilateral) P = Pr(Z0 > | z0 |) (teste unilateral direita ou esquerda) Valores pequenos de P indicam que o valor observado pouco provvel de ocorrer sob a hiptese nula; logo, valores pequenos de P levam rejeio da hiptese nula. A hiptese nula rejeitada a qualquer nvel de signicncia P.

10.7

Exerccios

1. Em uma pesquisa com 800 estudantes universitrios, 385 armaram possuir computador. Teste a hiptese de que pelo menos 50% dos estudantes universitrios possuem computador. Use = 0, 10. 2. Uma pesquisa entre 700 trabalhadores revela que 12,3% obtiveram seus empregos atravs de indicaes de amigos ou parentes. Teste a hiptese de que mais de 10% dos trabalhadores conseguem seus empregos por indicao de amigos ou parentes, utilizando 5% como nvel de signicncia. 3. O nvel de aprovao da qualidade das refeies servidas em um restaurante universitrio era de 20%, quando houve uma movimentao geral dos estudantes que forou a direo do restaurante a fazer mudanas. Feitas as mudanas, sorteia-se uma amostra de 64 estudantes usurios do restaurante e 25 aprovam a qualidade da comida. Voc diria, ao nvel de signicncia de 5%, que as mudanas surtiram efeito?

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE161 4. Deseja-se testar a honestidade de uma moeda. Para isso, lana-se a moeda 200 vezes, obtendo-se 115 caras. Qual a sua concluso sobre a honestidade da moeda? Para responder a essa questo, calcule e interprete o valor P. 5. A direo de um grande jornal nacional arma que 25% dos seus leitores so da classe A. Se, em uma amostra de 740 leitores, encontramos 156 da classe A, qual a concluso que tiraramos sobre a armativa da direo do jornal?

10.8
1. p b=

Soluo dos Exerccios


385 800

= 0, 48125

A armativa de interesse pelo menos 50% dos estudantes possuem computador, ou seja, p 0, 5. Logo, as hipteses so H0 : p = 0, 50 H1 : p < 0, 50 O valor observado da estatstica de teste 0, 48125 0, 5 q = 1, 0607 z0 =
0,50,5 800

= 0, 10 = z0,1 = 1, 28

e a regio crtica

Como o valor observado no pertence regio crtica, no podemos rejeitar a hiptese nula. Ou seja, os dados trazem evidncia de que a proporo de estudantes que possuem computador de pelo menos 50%. 2. A armativa de interesse mais de 10% dos trabalhadores conseguem seus empregos por indicao de amigos ou parentes, ou seja, p > 0, 10, cuja negativa p 0, 10. Logo, as hipteses so H0 : p = 0, 10 H1 : p > 0, 10 Com = 5% e um teste unilateral, z0,05 = 1, 64. O valor observado da estatstica de teste 0, 123 0, 1 = 2, 0284 z0 = q
0,10,9 700

Z0 < 1, 28

e a regio crtica

Z0 > 1, 64 Como o valor observado da estatstica de teste pertence regio crtica, rejeita-se a hiptese nula de que 10% ou menos dos trabalhadores conseguem seus empregos por indicao de parentes ou amigos.

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE162 3. O interesse vericar se p > 0, 20. Logo, H0 : p = 0, 20 H1 : p > 0, 20 Como = 5% e o teste unilateral, resulta que z0,05 = 1, 64. Logo, a regio crtica Z0 > 1, 64 O valor observado da estatstica de teste
25 0.20 q z0 = 64 = 3, 8125 0.20.8 64

que est na regio crtica; logo, rejeita-se a hiptese nula, ou seja, as evidncias amostrais indicam que houve melhora com as mudanas. 4. As hipteses so H0 : p = 0, 5 H1 : p 6= 0, 5 e a estatstica de teste b 0, 5 P Z0 = q
0,50,5 200

O valor observado da estatstica de teste


115

e o valor P para o teste bilateral P = 2 Pr [Z0 > 2, 12 | Z0 N (0; 1)] = 2 [0, 5 tab(2, 12)] = 0, 034 Como o valor P pequeno, a probabilidade de obtermos 115 caras em 200 lanamentos de uma moeda honesta pequena, o que nos leva a suspeitar da honestidade da moeda. A hiptese nula seria rejeitada para qualquer nvel de signicncia 3, 4%. 5. Com as informaes disponveis, nossas hipteses so: H0 : p = 0, 25 H1 : p 6= 0, 25

q Z0 = 200

0,50,5 200

0, 5

= 2, 1213 2, 12

CAPTULO 10. TESTE DE HIPTESE: PROPORES - AMOSTRA GRANDE163 e a estatstica de teste b 0, 25 P Z0 = q


156 740

0,250,75 740

O valor observado da estatstica de teste Z0 = q

0,250,75 740

0, 25

= 2, 46

e o valor P para o teste bilateral

P = 2 Pr [Z0 > 2, 46 | Z0 N (0; 1)] = 2 [0, 5 tab(2, 46)] = 0, 0139 Como o valor P bastante pequeno, devemos rejeitar a hiptese nula de que a proporo de leitores da classe A igual a 25%.

Captulo 11 Teste de Hiptese: Mdia da N (; 2) - 2 Desconhecida


Neste captulo voc completar seu estudo bsico de testes de hipteses sobre a mdia de uma populao, analisando a situao relativa a uma populao normal quando no se conhece a varincia desta populao. Assim como no caso do intervalo de conana, para testar hipteses relativas mdia de tal populao, necessrio estimar essa varincia e isso introduz mais uma fonte de variabilidade no procedimento: com uma nica amostra, queremos testar hipteses sobre a mdia, mas precisamos tambm estimar a varincia da populao. O procedimento simples e anlogo aos casos estudados nos catulos anteriores; o que muda a distribuio amostral da estatstica de teste. Em vez de usarmos a distribuio normal para determinar os valores crticos, usaremos novamente a distribuio t de Student. Veremos, ento, os seguintes conceitos aplicados mdia de uma populao normal com varincia desconhecida: hipteses nula e alternativa estatstica de teste regra de deciso regio crtica valor P

11.1

Contexto bsico

Considere uma populao descrita por uma varivel aleatria normal com mdia e varincia 2 : X N (; 2 ). Nosso interesse testar hipteses sobre a mdia a

164

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 DESCONHECIDA165 partir de uma amostra aleatria simples X1 , X2 , . . . , Xn . Como visto anteriormente, se a varincia 2 no conhecida, ento temos que usar a estatstica T = X n S

cuja distribuio t de Student com n 1 graus de liberdade. De posse desta estatstica de teste, o procedimento de construo do teste idntico ao visto nos trs ltimos captulos: identicadas a hiptese nula (sempre na forma de uma hiptese simples = 0 ) e a hiptese alternativa, a regio crtica formada pelos valores da estatstica de teste pouco provveis sob H0 . O nvel de signicncia e o tipo de hiptese alternativa permitem a identicao precisa do que so valores pouco provveis: so valores na(s) cauda(s) da distribuio de T quando a hiptese nula verdadeira. Vamos formalizar o procedimento geral e em seguida apresentaremos alguns exemplos de aplicao.

11.2

Procedimento geral para construo do teste de hiptese sobre a mdia de uma N (; 2) - 2 desconhecida

Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X cuja distribuio N (; 2 ). Nosso interesse testar alguma hiptese sobre a mdia desta populao. Em geral, a varincia 2 no conhecida e, portanto, vamos estim-la por n n P 2 1 P 1 2 2 2 (Xi X ) = X nX S = n 1 i=1 n 1 i=1 i Lembre-se que S 2 um estimador no-viesado de 2 .

11.2.1

Hiptese nula e hiptese alternativa

A hiptese nula que iremos considerar ser H0 : = 0 As possveis formas da hiptese alternativa so: Bilateral : Unilateral direita : Unilateral esquerda : H1 : 6= 0 H1 : > 0 H1 : < 0

Como antes, a escolha entre essas trs possibilidades se faz com base no conhecimento do problema. Se no temos informao alguma sobre a alternativa, temos que usar um teste bilateral. A escolha entre os dois tipos de hipteses unilaterais feita de modo que,

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 DESCONHECIDA166 ao escrevermos as hipteses do problema em linguagem simblica, a hiptese alternativa no inclua o sinal de igualdade. Hipteses do problema < 0 0 0 > 0 Hipteses estatsticas H0 : = 0 H1 : < 0

H0 : = 0 H1 : > 0

11.2.2

Estatstica de teste, erros, regra de deciso

Como o teste sobre a mdia de uma populao normal, a estatstica amostral que deve ser utilizada X . Como a varincia populacional no conhecida, sabemos que T = X
S n

t(n 1)

e essa a nossa estatstica de teste. O procedimento de deciso denido em termos da hiptese nula H0 e as decises possveis so (i) rejeitar ou (ii) no rejeitar H0 . Conforme j visto, existem duas possibilidades de erro: Erro tipo I: rejeitar H0 quando H0 verdadeira Erro tipo II: no rejeitar H0 quando H0 falsa A regra de deciso consiste em denir a regio crtica RC como o conjunto de valores cuja probabilidade de ocorrncia pequena sob a hiptese de veracidade de H0 . Logo, nossa regra de deciso se baseia na estatstica de teste T0 = X 0
S n

t(n 1)

Como a estatstica de teste segue uma distribuio t de Student, valores com pequena probabilidade de ocorrncia esto nas caudas da distribuio. Isso equivale a valores de X distandes de 0 . Assim, a regio crtica para cada tipo de hiptese alternativa denida como segue: Alternativa bilateral: Alternativa unilateral direita: Alternativa unilateral esquerda: T0 > k ou T0 < k T0 > k T0 < k

Na Figura 11.1 ilustra-se a regio crtica para cada tipo de hiptese alternativa.

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 DESCONHECIDA167

Figura 11.1: Regio crtica para o teste sobre a mdia de uma normal com varincia desconhecida

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 DESCONHECIDA168

11.2.3

Nvel de signicncia e regio crtica

O procedimento usual de teste de hiptese consiste em se xar o nvel de signicncia , que, por denio, a probabilidade de se cometer o erro tipo I: = Pr(erro tipo I) = Pr(rejeitar H0 |H0 verdadeira) Assim, para cada tipo de hiptese alternativa a regio crtica identicada impondo-se a condio Pr(T RC |H0 verdadeira) = Hiptese bilateral A regio crtica calculada como: Pr [T0 > k | T0 t(n 1)] + Pr [T0 < k | T0 t(n 1)] = = Pr [T0 > k | T0 t(n 1)] + Pr [T0 > k | T0 t(n 1)] = = Pr [T0 > k | T0 t(n 1)] = 2 Usando a notao tn; para denotar a abscissa da distribuio t de Student com n graus de liberdade que deixa rea (probabilidade) acima dela, resulta a seguinte regio crtica para o teste bilateral: T0 > tn1; /2 ou T0 < tn1; /2 (11.1)

Essa regio crtica tambm pode ser escrita de outra forma usando a seguinte equivalncia: X 0 S T0 > tn1; /2 > tn1; /2 X > 0 + tn1; /2 S n n T0 < tn1; /2 X 0
S n

S < tn1; /2 X < 0 tn1; /2 n

Teste unilateral direita A regio crtica calculada como: Pr [T0 > k | T0 t(n 1)] = = k = tn1; ou seja, a regio crtica T0 > tn1; ou equivalentemente S X > 0 + tn1; n (11.2)

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 DESCONHECIDA169 Teste unilateral esquerda De forma anloga, obtm-se a seguinte regio crtica para o teste unilateral esquerda: T0 < tn1; ou equivalentemente S X < 0 tn1; n (11.3)

11.3

Exemplos

A ttulo de comparao com a situao do penltimo captulo, em que supusemos a varincia conhecida, vamos considerar os mesmos exemplos, mas agora tratando a varincia dada como sendo a varincia amostral S 2 .

11.3.1

Exemplo 1

Depois de uma pane geral no sistema de informao de uma empresa, o gerente administrativo deseja saber se houve alterao no tempo de processamento de determinada atividade. Antes da pane, o tempo de processamento podia ser aproximado por uma varivel aleatria normal com mdia de 100 minutos. Uma amostra de 16 tempos de processamento aps a pane revela uma mdia x = 105, 5 minutos e um desvio padro s = 10 minutos. Ao nvel de signicncia de 5%, qual a concluso sobre a alterao do tempo mdio de processamento? Soluo Como visto, as hipteses do problema so = 100 6= 100 Como a segunda expresso no envolve o sinal de igualdade, ela se torna a hiptese alternativa: H0 : = 100 H1 : 6= 100 Como a varincia no conhecida, temos que usar a distribuio t de Student com n 1 = 16 1 = 15 graus de liberdade. Para um teste bilateral com nvel de signicncia de 5%, a abscissa de interesse aquela que deixa rea de 0,025 acima. Consultando a Tabela 2 dada no nal desta apostila, resulta t15; 0,025 = 2, 131 A estatstica de teste T0 = X 100
10 16

t(15)

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 DESCONHECIDA170 e a regio crtica T0 > 2, 131 ou T0 < 2, 131 O valor observado da estatsitca de teste t0 = 105, 5 100
10 16

= 2, 2

Como esse valor pertence regio crtica, rejeitamos a hiptese nula e conclumos que houve alterao no tempo de processamento aps a pane. Em termos da mdia amostral, a regio crtica 10 10 X > 100 + 2, 131 ou X < 100 2, 131 16 16 ou X > 105, 33 ou X < 94, 673 Compare com a regio crtica obtida no caso da normal (Exemplo 23.1): X > 104, 9 ou X < 95, 1

Com o mesmo nvel de signicncia, a regio crtica no caso de varincia desconhecida mais extrema, reetindo a maior variabilidade da distribuio t.

11.3.2

Exemplo 2

Na mesma situao do exemplo anterior, vamos considerar o caso em que o gerente esteja interessado apenas no aumento do tempo de processamento. Neste caso, as hipteses so: 100 > 100 OK! Problema!

Para denir qual a hiptese nula, vamos usar o mesmo procedimento. Em um teste unilateral, a hiptese alternativa deve ser aquela que no envolve o sinal de igualdade. No nosso exemplo, essa a hiptese > 100. A hiptese nula, tendo que ser uma hiptese simples, passa a ser = 100, ou seja: H0 : = 100 H1 : > 100 Como antes, a estatstica de teste T0 = mas a regio crtica passa a ser T0 > t15; 0,05 X 100
10 16

t(15)

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 DESCONHECIDA171 Consultando a tabela da distribuio t, resulta que t15; 0,05 = 1, 753 o que nos leva a regio crtica T0 > 1, 753 ou 10 X > 100 + 1, 753 = 104, 38 16 Essa tambm uma regio mais extrema que aquela encontrada para o caso da normal: X > 104, 1. E novamente rejeitamos a hiptese nula, ou seja, as evidncias amostrais indicam um aumento do tempo de processamento da tarefa aps a pane.

11.3.3

Exemplo 3

O dono de uma mdia empresa decide investigar a alegao de seus empregados de que o salrio mdio na sua empresa menor que o salrio mdio nacional. Para isso, ele analisa uma amostra de 25 salrios, obtendo uma mdia de 894,53 reais e desvio padro de 32 reais. De informaes obtidas junto ao sindicato patronal, ele sabe que, em nvel nacional, o salrio mdio de 900 reais. Supondo que seja razovel aproximar a distribuio dos salrios por uma distribuio normal, vamos construir um teste de hiptese apropriado, com um nvel de signicncia de 10%. Soluo O problema aqui consiste em decidir se os salrios so menores ou no do que a mdia nacional de 900 reais, ou seja, as situaes de interesse so < 900 900 Como no exemplo anterior, a hiptese alternativa aquela que no envolve o sinal de igualdade. Logo, nossas hipteses so: H0 : = 900 H1 : < 900 A regio crtica denida em termos da estatstica de teste T0 = como T0 < t24; 0,10 Com nvel de signicncia de 10%, a abscissa de interesse aquela que deixa rea de 10% acima dela em uma distribuio t com 24 graus de liberdade: t24;0,10 = 1, 318 X 900
32 25

t(24)

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 DESCONHECIDA172 Logo, a regio crtica T0 < 1, 318 32 X < 900 1, 318 = 891, 56 25 Como o valor observado de 894,53 reais no est na regio crtica, no rejeitamos H0 , ou seja, as evidncias amostrais apontam que os salrios da empresa no so menores que a mdia nacional. Comparando com a regio crtica do caso normal, X < 891, 808, vemos, novamente, que no caso da t a regio mais extrema. ou

11.4

Poder do teste
() = Pr(rejeitar H0 |)

A denio da funo poder do teste exatamente a mesma:

O problema aqui que, para calcular (), precisamos de um programa computacional que calcule probabilidades da distribuio t para qualquer valor da abscissa. A ttulo de ilustrao, vamos calcular o poder do Exemplo 1 para o valor alternativo = 95 : X 95 t(15) Pr X > 105, 73 | 16 10 X 95 t(15) + Pr X < 94, 673 | 16 10 X 95 105, 73 95 Pr > 16 16 10 10 X 95 94, 673 95 < 16 + Pr 16 10 10 Pr [t(15) > 4, 292] + Pr [t(15) < 0, 1308] 0, 00032 + 0, 44884 = 0, 44916

(95) =

= =

Os valores 0.00032 e 0.44884 foram obtidos com um programa computacional estatstico.

11.5

Valor P

Assim como no caso da funo poder, o clculo do valor P requer programas conmputacionais que calculem probabilidades da distribuio t para qualquer abscissa. Mas a interpretao do valor P continua sendo a mesma: valores pequenos de P indicam eventos pouco provveis de ocorrerem quando H0 verdadeira. Assim, continua valendo a seguinte regra de deciso:

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 DESCONHECIDA173 Devemos rejeitar a hiptese nula H0 ao nvel de signicncia sempre que o valor P for menor ou igual a ,ou seja: Rejeitamos H0 P No Exemplo 1, o valor P P = = = = X 100 2 Pr X > 105, 5 | 16 t(15) 10 105, 5 100 2 Pr t(15) > 16 10 2 Pr [t(15) > 2, 2] 2 0, 02195 = 0, 0439

Como P < 0, 05, rejeitamos H0 ao nvel de signicncia de 5%.

11.6

Exerccios

1. Uma amostra aleatria simples de tamanho n = 9 extrada de uma populao normal apresentou mdia igual a x = 13, 35 e desvio padro s = 3, 1. Deseja-se testar H0 : = 12, 8 H1 : 6= 12, 8 (a) Determine a regio crtica correspondente ao nvel de signicncia = 0, 02. (b) Com base na regio crtica encontrada no item anterior, estabelea a concluso, tendo o cuidado de usar um fraseado que no seja puramente tcnico. 2. Uma empresa fabricante de balas arma que o peso mdio de suas balas de pelo menos 2 gramas. Pela descrio do processo de produo, sabe-se que o peso das balas distribui-se normalmente. Uma amostra de 25 balas apresenta peso mdio de 1,98 gramas e um desvio padro de 0,5 grama.. O que se pode concluir sobre a armao do fabricante? Use um nvel de signicncia de 5%. 3. Em uma linha de produo, peas so produzidas de modo que o comprimento seja normalmente distribudo. Ajustes peridicos so feitos na mquina para garantir que as peas tenham comprimento apropriado de 15 cm, pois as peas muito curtas no podem ser aproveitadas (as peas longas podem ser cortadas). A cada hora so extradas 9 peas da produo, medindo-se seu comprimento. Uma dessas amostras apresenta comprimento mdio de 14,5 cm e desvio padro de 0,5 cm. Use o nvel de signicncia de 0,1% para testar a hiptese de que o processo esteja operando adequadamente.

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 DESCONHECIDA174 4. Depois de desenvolver um algoritmo para acelerar a execuo de determinada tarefa rotineira em um escritrio de contabilidade, o analista de sistema analisa uma amostra de 25 tempos, obtendo uma mdia 46,5 segundos e desvio padro de 5 segundos. Dos dados passados, ele sabe que o tempo de execuo aproximadamente normal com mdia de 48,5 segundos. Use o nvel de signicncia de 5% para decidir se o algoritmo do analista realmente melhorou o desempenho do sistema. 5. Uma propaganda arma que o consumo mdio de gasolina de determinada marca de automvel de 12 litros por 100 quilmetros rodados. Um teste com 36 automveis desta marca acusa um consumo mdio de 12,4 litros por 100 quilmetros rodados com desvio padro de 1 litro por quilmetro rodado. O que se pode concluir sobre a propaganda? Use o nvel de signicncia de 10%.

11.7

Soluo dos Exerccios


T0 > +2, 896 ou T0 < 2, 896

1. n = 9, = 0, 02 t8; 0,01 = 2, 896. Logo, a regio crtica

O valor observado da estatstica de teste t0 = 13.35 12.8


3.1 3

= 0, 53226

que no pertence regio crtica; logo, no podemos rejeitar H0 . 2. A armativa do fabricante 2. Logo, a negao de tal armao < 2. Como essa ltima expresso no contm o sinal de igualdade, ela se torna a hiptese alternativa. Ento, nossas hipteses so: H0 : = 2 H1 : < 2 n = 25; = 0, 05 = t24; 0,05 = 1, 711. Logo, a regio crtica T0 < 1, 711 O valor observado da estatstica de teste t0 = 1.98 2.0
0.5 5

= 0, 2

que no pertence regio crtica; logo, no podemos rejeitar H0 , ou seja, as evidncias amostrais indicam que as balas pesam pelo menos 2 gramas.

CAPTULO 11. TESTE DE HIPTESE: MDIA DA N (; 2 ) - 2 DESCONHECIDA175 3. O problema na produo surge quando < 15. Logo, nossas hipteses so: H0 : = 15 H1 : < 15 n = 9, = 0, 001 = t8; 0,001 = 4, 501. A regio crtica e o valor observado desta estatstica de teste 14.5 15 t0 = = 3, 0 0.5
3

T0 < 4, 501

Como o valor observado t0 = 3, 0 no est na regio crtica, no podemos rejeitar H0 , ou seja, as evidncias amostrais indicam que o processo est operando adequadamente. 4. A inteno do analista reduzir o tempo; logo, o interesse dele que < 48, 5. A negao dessa armativa 48, 5. Logo, nossas hipteses so: H0 : = 48, 5 H1 : < 48, 5

n = 25, = 0, 05 = t24; 0,05 = 1, 711. Logo, a regio crtica e o valor observado desta estatstica 46.5 48.5 t0 = = 2, 0 5
5

T0 < 1, 711

Como o valor observado t0 = 2, 0 pertence regio crtica, devemos rejeitar H0 , ou seja, as evidncias amostrais indicam que o analista foi bem-sucedido em reduzir o tempo de execuo. 5. Se o consumo for menor ou igual a 12 litros por 100 km, no h problema com a propaganda. O problema surge se o consumo for superior. Logo, nossas hipteses so: H0 : = 12 H1 : > 12 Supondo que o consumo X possa ser aproximado por uma distribuio normal, podemos usar a distribuio t(35). Com = 10%, t35; 0,10 = 1, 306 e a regio crtica T0 > 1, 306 O valor observado desta estatstica de teste 12.4 12 t0 = = 2, 4 1
6

Como o valor observado t0 = 2, 4 est na regio crtica, devemos rejeitar H0 , ou seja, a propaganda parece ser enganosa.

Captulo 12 Teste de Hiptese: Varincia da N (; 2)


Neste captulo completaremos o estudo de teste de hiptese sobre parmetros de uma populao, analisando o caso da varincia de uma populao normal. Assim como na construo de intervalos de conana, nossa estatstica de teste tem distribuio quiquadrado e a regio crtica, como antes, ser formada pelos valores pouco provveis desta estatstica de teste sob a hiptese nula.

12.1

Contexto bsico

Considere uma populao descrita por uma varivel aleatria normal com mdia e varincia 2 : X N (; 2 ). Nosso interesse testar hipteses sobre a a varincia 2 a partir de uma amostra aleatria simples X1 , X2 , . . . , Xn . Como visto anteriormente, a estatstica (n 1)S 2 2 = 2 tem distribuio qui-quadrado com n 1 graus de liberdade. De posse desta estatstica de teste, o procedimento de construo do teste idntico ao visto nos ltimos captulos: identicadas a hiptese nula (sempre na forma de uma hiptese simples 2 = 2 0 ) e a hiptese alternativa, a regio crtica formada pelos valores da estatstica de teste pouco provveis sob H0 . O nvel de signicncia e o tipo de hiptese alternativa permitem a identicao precisa do que so valores pouco provveis: so valores na(s) cauda(s) da distribuio de 2 quando a hiptese nula verdadeira. Vamos formalizar o procedimento geral e em seguida apresentaremos alguns exemplos de aplicao.

176

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N (; 2 )

177

12.2

Procedimento geral para construo do teste de hiptese sobre a varincia de uma N (; 2)

Lembre-se que S 2 um estimador no-viesado de 2 .

Seja X1 , X2 , . . . , Xn uma amostra aleatria simples de uma populao X cuja distribuio N (; 2 ). Nosso interesse testar alguma hiptese sobre a varincia 2 , que estimada por n n P 2 1 P 1 2 2 2 S = (Xi X ) = X nX n 1 i=1 n 1 i=1 i

12.2.1

Hiptese nula e hiptese alternativa


H0 : 2 = 2 0

A hiptese nula que iremos considerar ser

As possveis formas da hiptese alternativa so: Bilateral : Unilateral direita : Unilateral esquerda : H1 : 2 6= 2 0 2 H1 : > 2 0 H1 : 2 < 2 0

Como antes, a escolha entre essas trs possibilidades se faz com base no conhecimento do problema. Se no temos informao alguma sobre a alternativa, temos que usar um teste bilateral. A escolha entre os dois tipos de hipteses unilaterais feita de modo que, ao escrevermos as hipteses do problema em linguagem simblica, a hiptese alternativa no inclua o sinal de igualdade. Hipteses do problema 2 < 2 0 2 2 0 2 > 2 0 2 2 0 Hipteses estatsticas H0 : 2 = 2 0 H1 : 2 < 2 0 H0 : 2 = 2 0 H1 : > 0

12.2.2

Estatstica de teste, erros, regra de deciso

Como o teste sobre a varincia de uma populao normal, a estatstica amostral a ser utilizada (n 1)S 2 2 (n 1) 2

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N (; 2 )

178

O procedimento de deciso denido em termos da hiptese nula H0 e as decises possveis so (i) rejeitar ou (ii) no rejeitar H0 . Conforme j visto, existem duas possibilidades de erro: Erro tipo I: rejeitar H0 quando H0 verdadeira Erro tipo II: no rejeitar H0 quando H0 falsa A regra de deciso consiste em denir a regio crtica RC como o conjunto de valores cuja probabilidade de ocorrncia pequena sob a hiptese de veracidade de H0 . Logo, nossa regra de deciso se baseia na estatstica de teste
2 X0 =

(n 1)S 2 2 (n 1) 2 0

Os valores com pequena probabilidade de ocorrncia esto nas caudas da distribuio. Assim, a regio crtica para cada tipo de hiptese alternativa denida como segue: Alternativa bilateral: Alternativa unilateral direita: Alternativa unilateral esquerda:
2 2 X0 > kS ou X0 < kI 2 X0 > kS 2 X0 < kI

Na Figura 12.1 ilustra-se a regio crtica para cada tipo de hiptese alternativa.

12.2.3

Nvel de signicncia e regio crtica

O procedimento usual de teste de hiptese consiste em se xar o nvel de signicncia , que, por denio, a probabilidade do erro tipo I: = Pr(erro tipo I) = Pr(rejeitar H0 |H0 verdadeira) Assim, para cada tipo de hiptese alternativa a regio crtica identicada impondo-se a condio Pr(X RC |H0 verdadeira) = Hiptese bilateral A regio crtica calculada como: Pr X0 > kS | X0 2 (n 1) + Pr X0 < kI | X0 2 (n 1) =

Mesmo a distribuio qui-quadrado no sendo simtrica, prtica usual dividir a probabilidade de erro em partes iguais, ou seja, os limites da regio crtica so denidos de modo que Pr X0 > kS | X0 2 (n 1) = 2 2 Pr X0 < kI | X0 (n 1) = 2

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N (; 2 )

179

Figura 12.1: Regio crtica para testes de hipteses sobre a varincia de uma N (; 2 )

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N (; 2 )

180

Usando a notao 2 n; para denotar a abscissa da distribuio qui-quadrado com n graus de liberdade que deixa rea (probabilidade) acima dela, resulta a seguinte regio crtica para o teste bilateral:
2 > 2 X0 n1;/2

ou

2 X0 < 2 n1;1/2

(12.1)

Teste unilateral direita A regio crtica calculada como: Pr X0 > kS | X0 2 (n 1) = = kS = 2 n1; ou seja, a regio crtica
2 X0 > 2 n1;

(12.2)

Teste unilateral esquerda De forma anloga, obtm-se a seguinte regio crtica para o teste unilateral esquerda:
2 X0 < 2 n1;1

(12.3)

12.3

Exemplo 1

Uma amostra aleatria simples de tamanho n = 16 foi retirada de uma populao normal, obtendo-se s2 = 32, 1. Ao nvel de signicncia de 5% pode-se dizer que 2 6= 20? Soluo As hipteses so H0 : 2 = 20 H1 : 2 6= 20 Com 15 graus de liberdade, teste bilateral e nvel de signicncia de 5%, os valores crticos necessrios so 2 15;0,975 = 6, 262 2 15;0,025 = 27, 488 e a regio crtica
2 > 27, 488 X0

ou

2 X0 < 6, 262

O valor observado da estatstica de teste x2 0 = 15 32, 1 = 24, 075 20

que no pertence regio crtica. Logo, no se rejeita a hiptese nula, ou seja, no podemos armar que 2 6= 20.

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N (; 2 )

181

12.4

Exemplo 2 (Bussab&Morettin - Exerccio 40 p. 353)

Um escritrio de investimento acredita que o rendimento das diversas aes movimentadas por ele foi de 24% ao longo dos ltimos anos. Uma nova estratgia implementada para melhorar o desempenho, bem como garantir uma maior uniformidade nos rendimentos das diversas aes. No passado, o desvio padro do rendimento era da ordem de 5%. Uma amostra de 8 empresas forneceu os seguinjtes rendimentos (dados em %): 23,6; 22,8; 25,7; 24,8; 26,4; 24,3; 23,9; 25. Quais seriam as concluses? Quais so as hipteses necessrias para a soluo deste problema? Soluo Temos que supor que os rendimentos tm distribuio normal. As hipteses de interesse so > 24 e 2 < 25. Logo, as hipteses estatsticas so H0 : = 24 H1 : > 24 Os dados fornecem
8 P

H0 : 2 = 25 H1 : 2 < 25

xi = 196, 5 e

i=1

i=1

x = s2

196, 5 = 24, 5625 8 1 9, 45875 = [4835, 99 8 24, 5625] = = 1, 35125 7 7

8 P

x2 i = 4835, 99

Como o tamanho da amostra pequeno e tanto a mdia como varincia so de2 sconhecidas, as estatsticas de teste so T0 e X0 . Os valores crticos, para um nvel de signicncia de 5%, so t7;0,05 = 1, 895 e s regies crticas so T0 > 1, 895
2 X0 < 2, 167

7;0,95 = 2, 167

Os valores observados das estatsticas de teste so t0 = x2 0 24, 5625 24 8 = 1, 3687 < 1, 895 1, 35125 7 1, 35125 = 0, 37835 < 2, 167 = 25

Vemos, ento, que t0 no pertence regio crtica e, portanto, no podemos dizer que o rendimento mdio aumentou. Por outro lado, x2 0 pertence regio crtica e, portanto, os dados indicam que houve reduo na variabilidade dos rendimentos das aes negociadas pelo escritrio.

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N (; 2 )

182

Tabela 1 Distribuio Normal Padro Corpo da tabela d a probabilidade p tal que

p = P (0 < Z < Z c )
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4 4,1 4,2 4,3 4,4 4,5 0 0,00000 0,03983 0,07926 0,11791 0,15542 0,19146 0,22575 0,25804 0,28814 0,31594 0,34134 0,36433 0,38493 0,40320 0,41924 0,43319 0,44520 0,45543 0,46407 0,47128 0,47725 0,48214 0,48610 0,48928 0,49180 0,49379 0,49534 0,49653 0,49744 0,49813 0,49865 0,49903 0,49931 0,49952 0,49966 0,49977 0,49984 0,49989 0,49993 0,49995 0,49997 0,49998 0,49999 0,49999 0,49999 0,50000 1 0,00399 0,04380 0,08317 0,12172 0,15910 0,19497 0,22907 0,26115 0,29103 0,31859 0,34375 0,36650 0,38686 0,40490 0,42073 0,43448 0,44630 0,45637 0,46485 0,47193 0,47778 0,48257 0,48645 0,48956 0,49202 0,49396 0,49547 0,49664 0,49752 0,49819 0,49869 0,49906 0,49934 0,49953 0,49968 0,49978 0,49985 0,49990 0,49993 0,49995 0,49997 0,49998 0,49999 0,49999 0,49999 0,50000 2 0,00798 0,04776 0,08706 0,12552 0,16276 0,19847 0,23237 0,26424 0,29389 0,32121 0,34614 0,36864 0,38877 0,40658 0,42220 0,43574 0,44738 0,45728 0,46562 0,47257 0,47831 0,48300 0,48679 0,48983 0,49224 0,49413 0,49560 0,49674 0,49760 0,49825 0,49874 0,49910 0,49936 0,49955 0,49969 0,49978 0,49985 0,49990 0,49993 0,49996 0,49997 0,49998 0,49999 0,49999 0,50000 0,50000 3 0,01197 0,05172 0,09095 0,12930 0,16640 0,20194 0,23565 0,26730 0,29673 0,32381 0,34849 0,37076 0,39065 0,40824 0,42364 0,43699 0,44845 0,45818 0,46638 0,47320 0,47882 0,48341 0,48713 0,49010 0,49245 0,49430 0,49573 0,49683 0,49767 0,49831 0,49878 0,49913 0,49938 0,49957 0,49970 0,49979 0,49986 0,49990 0,49994 0,49996 0,49997 0,49998 0,49999 0,49999 0,50000 0,50000 4 0,01595 0,05567 0,09483 0,13307 0,17003 0,20540 0,23891 0,27035 0,29955 0,32639 0,35083 0,37286 0,39251 0,40988 0,42507 0,43822 0,44950 0,45907 0,46712 0,47381 0,47932 0,48382 0,48745 0,49036 0,49266 0,49446 0,49585 0,49693 0,49774 0,49836 0,49882 0,49916 0,49940 0,49958 0,49971 0,49980 0,49986 0,49991 0,49994 0,49996 0,49997 0,49998 0,49999 0,49999 0,50000 0,50000 5 0,01994 0,05962 0,09871 0,13683 0,17364 0,20884 0,24215 0,27337 0,30234 0,32894 0,35314 0,37493 0,39435 0,41149 0,42647 0,43943 0,45053 0,45994 0,46784 0,47441 0,47982 0,48422 0,48778 0,49061 0,49286 0,49461 0,49598 0,49702 0,49781 0,49841 0,49886 0,49918 0,49942 0,49960 0,49972 0,49981 0,49987 0,49991 0,49994 0,49996 0,49997 0,49998 0,49999 0,49999 0,50000 0,50000 6 0,02392 0,06356 0,10257 0,14058 0,17724 0,21226 0,24537 0,27637 0,30511 0,33147 0,35543 0,37698 0,39617 0,41309 0,42785 0,44062 0,45154 0,46080 0,46856 0,47500 0,48030 0,48461 0,48809 0,49086 0,49305 0,49477 0,49609 0,49711 0,49788 0,49846 0,49889 0,49921 0,49944 0,49961 0,49973 0,49981 0,49987 0,49992 0,49994 0,49996 0,49998 0,49998 0,49999 0,49999 0,50000 0,50000 7 0,02790 0,06749 0,10642 0,14431 0,18082 0,21566 0,24857 0,27935 0,30785 0,33398 0,35769 0,37900 0,39796 0,41466 0,42922 0,44179 0,45254 0,46164 0,46926 0,47558 0,48077 0,48500 0,48840 0,49111 0,49324 0,49492 0,49621 0,49720 0,49795 0,49851 0,49893 0,49924 0,49946 0,49962 0,49974 0,49982 0,49988 0,49992 0,49995 0,49996 0,49998 0,49998 0,49999 0,49999 0,50000 0,50000 8 0,03188 0,07142 0,11026 0,14803 0,18439 0,21904 0,25175 0,28230 0,31057 0,33646 0,35993 0,38100 0,39973 0,41621 0,43056 0,44295 0,45352 0,46246 0,46995 0,47615 0,48124 0,48537 0,48870 0,49134 0,49343 0,49506 0,49632 0,49728 0,49801 0,49856 0,49896 0,49926 0,49948 0,49964 0,49975 0,49983 0,49988 0,49992 0,49995 0,49997 0,49998 0,49999 0,49999 0,49999 0,50000 0,50000 9 0,03586 0,07535 0,11409 0,15173 0,18793 0,22240 0,25490 0,28524 0,31327 0,33891 0,36214 0,38298 0,40147 0,41774 0,43189 0,44408 0,45449 0,46327 0,47062 0,47670 0,48169 0,48574 0,48899 0,49158 0,49361 0,49520 0,49643 0,49736 0,49807 0,49861 0,49900 0,49929 0,49950 0,49965 0,49976 0,49983 0,49989 0,49992 0,49995 0,49997 0,49998 0,49999 0,49999 0,49999 0,50000 0,50000

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N (; 2 )

183

Tabela 2 Valores crticos da distribuio t -Student

Pr(t (n) > t ) =

g.l. n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 40 50

0,150 1,963 1,386 1,250 1,190 1,156 1,134 1,119 1,108 1,100 1,093 1,088 1,083 1,079 1,076 1,074 1,071 1,069 1,067 1,066 1,064 1,063 1,061 1,060 1,059 1,058 1,058 1,057 1,056 1,055 1,055 1,054 1,054 1,053 1,052 1,052 1,050 1,047

0,100 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,309 1,309 1,308 1,307 1,306 1,303 1,299

0,050 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,696 1,694 1,692 1,691 1,690 1,684 1,676

rea na cauda superior: 0,025 0,010 0,005 12,706 31,821 63,657 4,303 6,965 9,925 3,182 4,541 5,841 2,776 3,747 4,604 2,571 3,365 4,032 2,447 3,143 3,707 2,365 2,998 3,499 2,306 2,896 3,355 2,262 2,821 3,250 2,228 2,764 3,169 2,201 2,718 3,106 2,179 2,681 3,055 2,160 2,650 3,012 2,145 2,624 2,977 2,131 2,602 2,947 2,120 2,583 2,921 2,110 2,567 2,898 2,101 2,552 2,878 2,093 2,539 2,861 2,086 2,528 2,845 2,080 2,518 2,831 2,074 2,508 2,819 2,069 2,500 2,807 2,064 2,492 2,797 2,060 2,485 2,787 2,056 2,479 2,779 2,052 2,473 2,771 2,048 2,467 2,763 2,045 2,462 2,756 2,042 2,457 2,750 2,040 2,453 2,744 2,037 2,449 2,738 2,035 2,445 2,733 2,032 2,441 2,728 2,030 2,438 2,724 2,021 2,423 2,704 2,009 2,403 2,678

0,002 159,153 15,764 8,053 5,951 5,030 4,524 4,207 3,991 3,835 3,716 3,624 3,550 3,489 3,438 3,395 3,358 3,326 3,298 3,273 3,251 3,231 3,214 3,198 3,183 3,170 3,158 3,147 3,136 3,127 3,118 3,109 3,102 3,094 3,088 3,081 3,055 3,018

0,001 318,309 22,327 10,215 7,173 5,893 5,208 4,785 4,501 4,297 4,144 4,025 3,930 3,852 3,787 3,733 3,686 3,646 3,610 3,579 3,552 3,527 3,505 3,485 3,467 3,450 3,435 3,421 3,408 3,396 3,385 3,375 3,365 3,356 3,348 3,340 3,307 3,261

CAPTULO 12. TESTE DE HIPTESE: VARINCIA DA N (; 2 )


T a b e la d a Q u i- Q u a d r a d o D is t r ib u i o q u i- q u a d r a d o V a lo r e s c r t ic o s d e c 2 t a is q u e

184

Pr

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

2 n

2 n ;

)=

2 n ;

g .l. n

= 0 ,9 9 0 0 ,0 0 0 0 ,0 2 0 0 ,1 1 5 0 ,2 9 7 0 ,5 5 4 0 ,8 7 2 1 ,2 3 9 1 ,6 4 6 2 ,0 8 8 2 ,5 5 8 3 ,0 5 3 3 ,5 7 1 4 ,1 0 7 4 ,6 6 0 5 ,2 2 9 5 ,8 1 2 6 ,4 0 8 7 ,0 1 5 7 ,6 3 3 8 ,2 6 0 8 ,8 9 7 9 ,5 4 2 0 ,9 8 0 0 ,0 0 1 0 ,0 4 0 0 ,1 8 5 0 ,4 2 9 0 ,7 5 2 1 ,1 3 4 1 ,5 6 4 2 ,0 3 2 2 ,5 3 2 3 ,0 5 9 3 ,6 0 9 4 ,1 7 8 4 ,7 6 5 5 ,3 6 8 5 ,9 8 5 6 ,6 1 4 7 ,2 5 5 7 ,9 0 6 8 ,5 6 7 9 ,2 3 7 9 ,9 1 5 1 0 ,6 0 0 1 1 ,2 9 3 1 1 ,9 9 2 1 2 ,6 9 7 1 3 ,4 0 9 1 4 ,1 2 5 1 4 ,8 4 7 1 5 ,5 7 4 1 6 ,3 0 6 0 ,9 7 5 0 ,0 0 1 0 ,0 5 1 0 ,2 1 6 0 ,4 8 4 0 ,8 3 1 1 ,2 3 7 1 ,6 9 0 2 ,1 8 0 2 ,7 0 0 3 ,2 4 7 3 ,8 1 6 4 ,4 0 4 5 ,0 0 9 5 ,6 2 9 6 ,2 6 2 6 ,9 0 8 7 ,5 6 4 8 ,2 3 1 8 ,9 0 7 9 ,5 9 1 1 0 ,2 8 3 1 0 ,9 8 2 1 1 ,6 8 9 1 2 ,4 0 1 1 3 ,1 2 0 1 3 ,8 4 4 1 4 ,5 7 3 1 5 ,3 0 8 1 6 ,0 4 7 1 6 ,7 9 1 0 ,9 5 0 0 ,0 0 4 0 ,1 0 3 0 ,3 5 2 0 ,7 1 1 1 ,1 4 5 1 ,6 3 5 2 ,1 6 7 2 ,7 3 3 3 ,3 2 5 3 ,9 4 0 4 ,5 7 5 5 ,2 2 6 5 ,8 9 2 6 ,5 7 1 7 ,2 6 1 7 ,9 6 2 8 ,6 7 2 9 ,3 9 0 1 0 ,1 1 7 1 0 ,8 5 1 1 1 ,5 9 1 1 2 ,3 3 8 1 3 ,0 9 1 1 3 ,8 4 8 1 4 ,6 1 1 1 5 ,3 7 9 1 6 ,1 5 1 1 6 ,9 2 8 1 7 ,7 0 8 1 8 ,4 9 3 0 ,9 0 0 0 ,0 1 6 0 ,2 1 1 0 ,5 8 4 1 ,0 6 4 1 ,6 1 0 2 ,2 0 4 2 ,8 3 3 3 ,4 9 0 4 ,1 6 8 4 ,8 6 5 5 ,5 7 8 6 ,3 0 4 7 ,0 4 2 7 ,7 9 0 8 ,5 4 7 9 ,3 1 2 1 0 ,0 8 5 1 0 ,8 6 5 1 1 ,6 5 1 1 2 ,4 4 3 1 3 ,2 4 0 1 4 ,0 4 1 1 4 ,8 4 8 1 5 ,6 5 9 1 6 ,4 7 3 1 7 ,2 9 2 1 8 ,1 1 4 1 8 ,9 3 9 1 9 ,7 6 8 2 0 ,5 9 9 0 ,8 0 0 0 ,0 6 4 0 ,4 4 6 1 ,0 0 5 1 ,6 4 9 2 ,3 4 3 3 ,0 7 0 3 ,8 2 2 4 ,5 9 4 5 ,3 8 0 6 ,1 7 9 6 ,9 8 9 7 ,8 0 7 8 ,6 3 4 9 ,4 6 7 1 0 ,3 0 7 1 1 ,1 5 2 1 2 ,0 0 2 1 2 ,8 5 7 1 3 ,7 1 6 1 4 ,5 7 8 1 5 ,4 4 5 1 6 ,3 1 4 1 7 ,1 8 7 1 8 ,0 6 2 1 8 ,9 4 0 1 9 ,8 2 0 2 0 ,7 0 3 2 1 ,5 8 8 2 2 ,4 7 5 2 3 ,3 6 4 0 ,2 0 0 1 ,6 4 2 3 ,2 1 9 4 ,6 4 2 5 ,9 8 9 7 ,2 8 9 8 ,5 5 8 9 ,8 0 3 1 1 ,0 3 0 1 2 ,2 4 2 1 3 ,4 4 2 1 4 ,6 3 1 1 5 ,8 1 2 1 6 ,9 8 5 1 8 ,1 5 1 1 9 ,3 1 1 2 0 ,4 6 5 2 1 ,6 1 5 2 2 ,7 6 0 2 3 ,9 0 0 2 5 ,0 3 8 2 6 ,1 7 1 2 7 ,3 0 1 2 8 ,4 2 9 2 9 ,5 5 3 3 0 ,6 7 5 3 1 ,7 9 5 3 2 ,9 1 2 3 4 ,0 2 7 3 5 ,1 3 9 3 6 ,2 5 0 0 ,1 0 0 2 ,7 0 6 4 ,6 0 5 6 ,2 5 1 7 ,7 7 9 9 ,2 3 6 1 0 ,6 4 5 1 2 ,0 1 7 1 3 ,3 6 2 1 4 ,6 8 4 1 5 ,9 8 7 1 7 ,2 7 5 1 8 ,5 4 9 1 9 ,8 1 2 2 1 ,0 6 4 2 2 ,3 0 7 2 3 ,5 4 2 2 4 ,7 6 9 2 5 ,9 8 9 2 7 ,2 0 4 2 8 ,4 1 2 2 9 ,6 1 5 3 0 ,8 1 3 3 2 ,0 0 7 3 3 ,1 9 6 3 4 ,3 8 2 3 5 ,5 6 3 3 6 ,7 4 1 3 7 ,9 1 6 3 9 ,0 8 7 4 0 ,2 5 6 0 ,0 5 0 3 ,8 4 1 5 ,9 9 1 7 ,8 1 5 9 ,4 8 8 1 1 ,0 7 0 1 2 ,5 9 2 1 4 ,0 6 7 1 5 ,5 0 7 1 6 ,9 1 9 1 8 ,3 0 7 1 9 ,6 7 5 2 1 ,0 2 6 2 2 ,3 6 2 2 3 ,6 8 5 2 4 ,9 9 6 2 6 ,2 9 6 2 7 ,5 8 7 2 8 ,8 6 9 3 0 ,1 4 4 3 1 ,4 1 0 3 2 ,6 7 1 3 3 ,9 2 4 3 5 ,1 7 2 3 6 ,4 1 5 3 7 ,6 5 2 3 8 ,8 8 5 4 0 ,1 1 3 4 1 ,3 3 7 4 2 ,5 5 7 4 3 ,7 7 3 0 ,0 2 5 5 ,0 2 4 7 ,3 7 8 9 ,3 4 8 1 1 ,1 4 3 1 2 ,8 3 3 1 4 ,4 4 9 1 6 ,0 1 3 1 7 ,5 3 5 1 9 ,0 2 3 2 0 ,4 8 3 2 1 ,9 2 0 2 3 ,3 3 7 2 4 ,7 3 6 2 6 ,1 1 9 2 7 ,4 8 8 2 8 ,8 4 5 3 0 ,1 9 1 3 1 ,5 2 6 3 2 ,8 5 2 3 4 ,1 7 0 3 5 ,4 7 9 3 6 ,7 8 1 3 8 ,0 7 6 3 9 ,3 6 4 4 0 ,6 4 6 4 1 ,9 2 3 4 3 ,1 9 5 4 4 ,4 6 1 4 5 ,7 2 2 4 6 ,9 7 9 0 ,0 2 0 5 ,4 1 2 7 ,8 2 4 9 ,8 3 7 1 1 ,6 6 8 1 3 ,3 8 8 1 5 ,0 3 3 1 6 ,6 2 2 1 8 ,1 6 8 1 9 ,6 7 9 2 1 ,1 6 1 2 2 ,6 1 8 2 4 ,0 5 4 2 5 ,4 7 2 2 6 ,8 7 3 2 8 ,2 5 9 2 9 ,6 3 3 3 0 ,9 9 5 3 2 ,3 4 6 3 3 ,6 8 7 3 5 ,0 2 0 3 6 ,3 4 3 3 7 ,6 5 9 3 8 ,9 6 8 4 0 ,2 7 0 4 1 ,5 6 6 4 2 ,8 5 6 4 4 ,1 4 0 4 5 ,4 1 9 4 6 ,6 9 3 4 7 ,9 6 2 0 ,0 1 0 6 ,6 3 5 9 ,2 1 0 1 1 ,3 4 5 1 3 ,2 7 7 1 5 ,0 8 6 1 6 ,8 1 2 1 8 ,4 7 5 2 0 ,0 9 0 2 1 ,6 6 6 2 3 ,2 0 9 2 4 ,7 2 5 2 6 ,2 1 7 2 7 ,6 8 8 2 9 ,1 4 1 3 0 ,5 7 8 3 2 ,0 0 0 3 3 ,4 0 9 3 4 ,8 0 5 3 6 ,1 9 1 3 7 ,5 6 6 3 8 ,9 3 2 4 0 ,2 8 9 4 1 ,6 3 8 4 2 ,9 8 0 4 4 ,3 1 4 4 5 ,6 4 2 4 6 ,9 6 3 4 8 ,2 7 8 4 9 ,5 8 8 5 0 ,8 9 2

1 0 ,1 9 6 1 0 ,8 5 6 1 1 ,5 2 4 1 2 ,1 9 8 1 2 ,8 7 9 1 3 ,5 6 5 1 4 ,2 5 6 1 4 ,9 5 3

Você também pode gostar