Você está na página 1de 5

conceitos estatísticos necessários para tais interpretações.

Colocaremos questões como as listadas acima. Analisaremos


os resultados da pesquisa do Star Tribune e, no processo,
aprenderemos muito sobre pesquisas em geral.

1.10.1 Visão geral


Instituto Federal do Espírito Santo
Coordenadoria de Matemática A partir desta LISTA 07, começamos a trabalhar com a
Disciplina: Estatística II verdadeira essência da inferência estatística na medida
em que usamos dados amostrais para fazer inferências
LISTA 07 sobre populações. Especificamente, usaremos dados
amostrais para obter estimativas de parâmetros
Professor: André Salazar populacionais. Por exemplo, O texto “Resultados da
Pesquisa fotopolicial” inclui resultados de pesquisa que
Aluno:__________________________________
consistem em 829 adultos de Minnesota, 51% dos
Data: ___/ ___/ _____ quais se opõem ao uso de câmeras para aplicação de
multas de trânsito. Com base na estatística amostral
de 51%, estimaremos a porcentagem de adultos na
POPULAÇÃO TOTAL de Minnesota que se opõe à
1.10 Estimativas e Tamanhos Amostrais
legislação do "fotopolicial".

As DUAS MAIORES aplicações da inferência


Resultados da Pesquisa "fotopolicial": o que eles
estatística envolvem o uso de dados amostrais para (1)
revelam .
ESTIMAR O VALOR DE UM PARÂMETRO
POPULACIONAL e (2) TESTAR ALGUMA
AFIRMAÇÃO (ou hipótese) SOBRE UMA
O Star Tribune, um jornal de St. Paul, Mineápolis (EUA), POPULAÇÃO. A partir desta LISTA 07, introduzimos
patrocinou uma pesquisa destinada a revelar opiniões sobre métodos para estimar valores dos seguintes, e
o "fotopolicial" que usa câmeras posicionadas de modo a importantes, parâmetros populacionais: proporções,
flagrarem motoristas que desrespeitam o sinal vermelho. As médias e variâncias. Apresentaremos, também,
câmeras fotografam as placas dos carros que passam com o
métodos para a determinação dos tamanhos amostrais
sinal vermelho, e os donos dos carros são notificados por
necessários para estimar esses parâmetros.
correio das infrações de tráfego cometidas. O jornal
patrocinou a pesquisa por causa da legislação de Minnesota,
Começaremos nosso estudo optando pela proporção
ainda pendente, que aprovaria o uso de câmeras para
pelas seguinte razões:
aplicar multas por violações de trânsito. (Agradecimentos a
Beth Hentges, que forneceu a informação do jornal.)
1. Todos nós vemos, frequentemente, proporções na
Os pesquisadores entrevistaram 829 adultos de Minnesota
mídia.
e verificaram que 51% se opunham à legislação sobre o
2. As pessoas tendem a se interessar mais por dados
"fotopolicial". Esses resultados de pesquisas, como a maioria
expressos como proporções (porcentagens, por
deles, dão origem a questões interessantes, como:
exemplo).
3. As proporções são, em geral, mais fáceis de se
- Dado que apenas 829 adultos foram entrevistados, podemos
trabalhar do que médias ou variâncias.
concluir alguma coisa sobre a população de todos os adultos
de Minnesota? Em caso afirmativo, o que podemos concluir?
1.10.2 Estimação de uma Proporção Populacional
- Dado que apenas 829 adultos foram entrevistados, quão
Eis o principal motivo desta seção: dada uma
precisos são os resultados?
proporção amostral, estimar o valor da proporção
populacional p . Por exemplo, O texto “Resultados da
- O tamanho da amostra de 829 sujeitos é grande o bastante
para produzir resultados significativos ? Pesquisa fotopolicial” inclui resultados de pesquisa que
consistem em entrevistas com 829 adultos, 51% dos
- Como foram selecionados os respondentes da pesquisa? quais se opõem ao sistema de fotopolicial, que usa
Será que foram escolhidos de modo a serem representativos câmeras para multar motoristas que desrespeitam o
da população? sinal vermelho. A estatística amostral de 51% pode ser
representada como a proporção amostral de 0,51.
As pesquisas tornaram-se um importante componente da vida Usando o tamanho amostral de n  829 e a proporção
americana. Elas afetam diretamente os shows de televisão amostral de 0,51, prosseguiremos para estimar a
que assistimos, os produtos que o compramos, os políticos proporção p de TODOS OS ADULTOS DE
que elegemos e as roupas que vestimos. Embora as pesquisas MINNESOTA que se opõem à legislação de fotopolicial.
sejam, agora, parte integrante de nossas vidas, é uma
infelicidade que a maioria de nós não seja capaz de Esta seção considerará apenas casos em que a
interpretar seus resultados. Este capítulo apresenta os DISTRIBUIÇÃO NORMAL pode ser usada para
aproximar a distribuição amostral de proporções CONSIDERANDO QUE TENHAMOS UMA AMOSTRA
amostrais. Na secção 1.7 (LISTA 06), vimos que, em ALEATÓRIA SIMPLES e que as outras suposições, já
um procedimento binomial com n tentativas e comentadas, sejam satisfeitas, podemos agora
probabilidade p , se np  5 e nq  5 , então a prosseguir em direção ao nosso maior objetivo: usar a
amostra como base para estimar o valor da proporção
variável aleatória binomial tem uma distribuição de
populacional p . Para diferenciar da proporção
probabilidade que pode ser aproximada por uma
distribuição normal (Lembre-se que q  1  p ). Essas populacional, introduzimos uma nova notação p̂ (lê-se:
condições estão incluídas entre as seguintes p chapéu) para a proporção amostral.
suposições que se aplicam aos métodos desta
secção. Notação para Proporções

p = proporção populacional
Suposições:
x
pˆ  proporção amostral de x sucessos em uma
1. A amostra é uma amostra aleatória simples. n
amostra de tamanho n .
2. As condições para a distribuição binomial são
satisfeitas. Isto é, há um número fixo de tentativas, as
qˆ  1  pˆ proporção amostral de fracassos em uma
tentativas são independentes, há duas categorias de
resultados e as probabilidades permanecem constantes amostra de tamanho n .
para cada tentativa.
3. A Distribuição Normal pode ser usada para
aproximar a distribuição de proporções amostrais,
porque os requisitos np  5 e nq  5 são satisfeitos. 1.10.3 Proporção, Probabilidade e Porcentagem
(Como p e q serão, certamente, desconhecidos,
usamos a proporção amostral para estimar seus Embora esta seção se concentre na proporção
valores. Também há procedimentos específicos para populacional p , os procedimentos discutidos aqui
lidar com situações nas quais a distribuição normal também se aplicam a probabilidades e porcentagens,
NÃO é uma aproximação adequada. embora as porcentagens devam ser convertidas em
proporções removendo-se o sinal de "por cento" e
Observação: dividindo-se por 100. Por exemplo, 51% pode ser
expresso na forma decimal como 0,51. O símbolo " p "
se obtém uma amostra aleatória simples de n pode, portanto, representar uma proporção, uma
valores se toda amostra possível de tamanho n probabilidade, ou o equivalente decimal de uma
tem a mesma chance de ser escolhida. Esta porcentagem. Por exemplo, se você pesquisa 200
exigência de seleção aleatória significa que os métodos estudantes de estatística e verifica que 80 deles
desta seção NÃO PODEM SER USADOS com qualquer compraram calculadoras científica Cassio, então a
outro tipo de amostragem, como estratificada, por x 80
conglomerado ou de conveniência. Devemos ter proporção amostral é pˆ    0,400 e
bastante claro este ponto: n 200
qˆ  1  pˆ  1  0,400 que é igual a 0,600 . Em vez de
Dados coletados sem cuidado podem ser absolutamente
sem valor, mesmo que a amostra seja muito grande.
x
calcular o valor de , o valor de p̂ é, algumas vezes,
n
.............................................................................................. já conhecido porque a proporção amostral ou a
porcentagem são dadas diretamente no texto do
problema. Por exemplo, se é relatado que 829 adultos
Sabemos que DIFERENTES AMOSTRAS produzem
de Minnesota foram pesquisados e 51% deles se
RESULTADOS DIFERENTES. Os métodos desta
manifestaram contrários à legislação do fotopolicial,
seção supõem que essas diferenças amostrais sejam
devidas a flutuações aleatórias do acaso, e não a então pˆ  0,51e qˆ  0,49 .
algum método infundado de amostragem. Se você
fosse realizar uma pesquisa acerca da legislação que Se desejamos estimar a proporção populacional com
trata de dirigir alcoolizado e selecionasse uma amostra um único valor, a melhor estimativa é p̂ . Como
envolvendo exclusivamente donos de bares e
restaurantes, ou mesmo pessoas que dependem dos
p̂ consiste em único valor, é chamado estimativa
lucros neste ramo para manutenção de sua renda pontual.
salarial, certamente não deveria usar os resultados
para fazer qualquer estimativa da proporção de
TODOS os adultos americanos. A amostra de donos de Definição 17: Uma estimativa pontual é um único
bares, e demais associados, é, provavelmente, uma valor (ou ponto) usado para aproximar um parâmetro
amostra tendenciosa, no sentido de que não é populacional.
representativa de todos os americanos.
Um intervalo de confiança é associado a um nível de
A proporção amostral p̂ é a melhor estimativa confiança, tal como 0,95 (ou 95%). O nível de
pontual da proporção populacional p . confiança nos dá a taxa de sucesso do procedimento
usado para construir o intervalo de confiança. O
intervalo de confiança é, muitas vezes, expresso como
Usamos p̂ como a estimativa pontual de p porque ele uma probabilidade ou área 1   (letra grega
é não-viesado (conforme estudamos na LISTA 04) e é minúscula alfa). O valor de  é o complemento do
o mais consistente dos estimadores que poderiam ser nível de confiança. Para um nível de confiança de 0,95
usados. Ele é não-viesado no sentido de que a
(ou 95%),   0,05 . Para um nível de confiança de
Distribuição das Proporções Amostrais tende a se
centralizar em torno de p ; isto é, as proporções 0,99 (ou 99%),   0,01.
amostrais p̂ não tendem sistematicamente a
Definição 19: O nível de confiança é a probabilidade
subestimar p , nem tendem sistematicamente a
1   (em geral, expressa o valor equivalente, em
superestimar p . A proporção amostral p̂ é o porcentagem) que é a proporção de vezes que o
estimador mais consistente no sentido de que o Desvio intervalo de confiança realmente contém o parâmetro
Padrão das Proporções Amostrais tende a ser menor populacional, supondo que o processo de estimação
do que os Desvios Padrões de quaisquer outros seja repetido um grande número de vezes. (O nível de
estimadores não-viesados. confiança é, também, chamado grau de confiança,
ou coeficiente de confiança.)
Atividade Comentada

34. (Respostas de Pesquisas sobre o Fotopolicial) As escolhas mais comuns para o nível de confiança
No texto “Resultados da Pesquisa fotopolicial” vimos são 90% (com   0,10 ), 95% (com   0,05 ), e
que 829 adultos de Minnesota foram pesquisados, e 99% (com   0,01). A escolha de 95% é mais
que 51% deles se opunham ao uso das câmeras para
comum porque resulta em um bom equilíbrio entre
se aplicarem multas de trânsito. Usando o resultado da
precisão (conforme refletido na largura do intervalo de
pesquisa, ache a melhor estimativa pontual da
confiança) e confiabilidade (conforme expresso pelo
proporção de TODOS os adultos de Minnesota que se
nível de confiança).
opõem ao uso das câmeras.
Eis um exemplo de intervalo de confiança com base
nos dados amostrais dos 829 adultos de Minnesota,
1.10.4 Por que precisamos de Intervalos de
51% dos quais se opõem ao uso de câmeras no
Confiança?
trânsito.

A estimativa de intervalo de confiança de 0,95 (ou


Na Atividade Comentada 34, precedente, vimos que
95%) da proporção populacional p é
0,51 era nossa melhor estimativa pontual da
proporção populacional p , mas NÃO temos qualquer 0,476  p  0,544 .
indicação de QUÃO BOA era nossa melhor
estimativa. Se tivéssemos uma amostra de apenas 20
adultos de Minnesota e 12 se opusessem ao uso de 1.10.5 Interpretação de um Intervalo de Confiança
câmeras, nossa melhor estimativa pontual seria a
12 Devemos ser cuidadosos para interpretar corretamente
proporção amostral de  0,6 , mas NÃO os intervalos de confiança. Há uma interpretação
20 correta e muitas diferentes e criativas interpretações
ESPERARÍAMOS que essa estimativa pontual erradas do intervalo de confiança 0,476  p  0,544 .
FOSSE MUITO BOA porque se baseou um uma
amostra MUITO PEQUENA. Como a estimativa
pontual tem a falha de NÃO revelar quão boa ela é, Correta: "Estamos 95% confiantes de que o intervalo
os estatísticos desenvolveram outro tipo de estimativa. de 0,476 a 0,544 realmente contém o
Esta estimativa, chamada de intervalo de confiança verdadeiro valor de p ." Isto significa que, se
ou estimativa intervalar, consiste em uma faixa (ou selecionássemos MUITAS DIFERENTES
intervalo) de valores em vez de apenas um único valor. AMOSTRAS de tamanho 829 e
construíssemos os intervalos de confiança
Definição 18: Um intervalo de confiança (ou correspondentes A CADA UMA DELAS, 95%
estimativa intervalar) é uma faixa (ou um intervalo) DELES realmente conteriam o valor da
de valores usada para estimar o verdadeiro valor de um proporção populacional p . (Note que nessa
parâmetro populacional. Um intervalo de confiança é, interpretação correta o nível de 95% se refere
algumas vezes, abreviado como IC. à taxa de sucesso do processo em uso para
estimar a proporção populacional, e não se
refere à própria proporção populacional).
Errada: "Há uma chance de 95% de que o verdadeiro apresentados no texto “Resultados da Pesquisa
valor de p estará entre 0,476 e 0,544." fotopolicial” (com 51% dos 829 entrevistados se
opondo às câmeras), mas os outros 19 intervalos de
Em qualquer ponto específico no tempo, há um valor confiança representam amostras hipotéticas. Com 95%
de p fixo e constante, a proporção de adultos de de confiança, esperamos que 19 das 20 amostras
resultem em intervalos que realmente contenham o
Minnesota que se opõe ao uso de câmeras. Se usamos verdadeiro valor de p , e a Figura 1.10.5.1 ilustra isso
dados amostrais para determinar limites específicos,
tais como 0,476 e 0,544, esses limites incluirão, ou com 19 dos 20 intervalos de confiança contendo p ,
não, a proporção populacional p , e não podemos enquanto um intervalo de confiança não o contém.
dizer se incluem ou não sem conhecermos o
verdadeiro valor de p . Mas é errado dizer que p tem Cuidado: Intervalos de confiança podem ser usados
uma chance de 95% de estar entre os limites
informalmente para comparar diferentes conjuntos de
especificados de 0,476 e 0,544, porque p é uma dados, mas os intervalos de confiança que se
superpõem não devem se usados para tirar conclusões
CONSTANTE FIXA (embora desconhecida) e não uma
variável aleatória. Ou p está entre os limites ou não; formais e finais sobre igualdade de proporções. A
análise de superposição entre dois intervalos de
não há probabilidade envolvida. confiança individuais está associada a armadilhas.
(Veja "On judiging the Significance of Differences by
Esse é um conceito confuso; assim, para ajudara na
sua compreensão, considere um exemplo mais
Examining the Overlap Between Confidence Intervals",
simples, no qual queremos achar a probabilidade de de Schenker e Gentleman, The American Statistician,
um bebê ser uma menina. Se o bebê já nasceu, mas o Vol. 55, N° 3. Outras técnicas, estudadas em capítulos
médico ainda não anunciou o sexo, não podemos dizer seguintes ao tema de estudo desta LISTA 07, descreve
que haja uma probabilidade 0,5 de que o bebê seja procedimentos para se determinar se populações têm
uma menina, porque o bebê já é, ou não, uma menina. ou não proporções iguais, e esses procedimentos não
Não há chance envolvida, porque o sexo já foi terão as armadilhas associadas a conclusões que se
determinado. Analogamente, uma proporção baseiem em intervalos de confiança que se superpõem.
populacional p já está determinada, e os limites do Não use intervalos de confiança que se superpõe
como base para tirar conclusões finais sobre a
intervalo de confiança contêm p , ou não, de modo que
igualdade de proporções.
é errado dizer que há uma chance de 95% de que
p esteja entre 0,476 e 0,544. 1.10.6 Valores Críticos

Um nível de confiança de 95% nos diz que o processo Os métodos desta seção, e muitos dos outros métodos
em uso resultará, a longo prazo, em limites de estatísticos encontrados em capítulos seguintes,
intervalo de confiança que contenham a verdadeira incluem o uso de um escore padrão z , que pode ser
proporção populacional 95% das vezes. Suponha que a usado para distinguir entre estatísticas amostrais que
verdadeira proporção de todos os adultos de Minnesota têm chance de ocorrer e aquelas que não têm. Tal
que se opõe ao uso de câmeras seja p  0,520 . escore z é chamado valor crítico (definido abaixo).
Então, o intervalo de confiança obtido dos dados Valores críticos se baseiam nas seguintes
amostrais apresentados contém a proporção observações.
populacional, porque a verdadeira proporção
populacional de 0,520 está entre 0,476 e 0,544. A Observações:
Figura1.10.5.1 ilustra esse fato.
1. Sabemos, com base na Seção 1.5.2 (LISTA 04), que
sob certas condições, a Distribuição Amostral das
Proporções pode ser aproximada por uma
Distribuição Normal, como na Figura 1.10.6.1,
mostrada a seguir.

2. Proporções amostrais têm uma chance relativamente


pequena (com probabilidade representada por  ) de
cair em uma das caudas sombreadas de cinza-escuro
da Figura 1.10.6.1.

3. Representando a área de cada cauda sombreada



por , vemos que há uma probabilidade total  de
2
Figura 1.10.5.1: Intervalos de Confiança a partir de 20 que uma proporção amostral caia em UMA DAS DUAS
amostras diferentes. caudas sombreadas de cinza-escuro.

4. Pela regra dos complementos, Estudada na Teoria


A Figura 1.10.5.1 mostra o primeiro intervalo de das Probabilidades (Ensino médio ou Estatística I) há
confiança para os verdadeiros dados da pesquisa
uma probabilidade 1   de que uma proporção 35. (Encontrando um Valor Crítico) Ache o valor
amostral caia na região sombreada de cinza-claro da crítico z / 2 correspondente ao nível de confiança de
Figura 1.10.6.1.
95%.
5. O escore z que separa a região da cauda direita é
comumente denotado por z / 2 , e é chamado de valor
crítico porque está na fronteira que separa proporções
amostrais que têm chance de ocorrer das que não têm.

Figura 1.10.6.1: Valores Críticos z / 2 na Distribuição


Normal Padrão.

Essas observações podem ser formalizadas com a


notação e definição seguintes.
Notação para Valor Crítico

O valor crítico z / 2 é o valor positivo que está na



fronteira vertical que separa uma área de na cauda
2
direita da distribuição normal padronizada (O valor de -

z / 2 está na fronteira vertical para a área de na
2

cauda esquerda.). O índice é, simplesmente, um
2

lembrete de que o escore z separa uma área de na
2
cauda direita da distribuição normal padronizada.

Definição 20: Um valor crítico é um número na


fronteira que separa estatísticas amostrais que têm
chance de ocorrer daquelas que não têm. O número
z / 2 é um valor crítico que é um escore z com a

propriedade de separar uma área de na cauda
2
direita da distribuição normal padronizada. (Veja Figura
1.10.6.1).

Atividade Comentada

Você também pode gostar