Você está na página 1de 22

Introduo Inferncia Estatstica

65

Introduo Inferncia estatstica estimao intervalar ou intervalos de confiana


1 Introduo
Nas seces anteriores estudmos o comportamento da Mdia e da Proporo amostral, como estimadores, respectivamente, do valor mdio de uma Populao e da proporo com que os elementos da Populao verificam determinada caracterstica. Verificmos que, quando se consideram amostras diferentes, embora da mesma dimenso, a mdia ou a proporo variam de amostra para amostra, mas apresentam um comportamento caracterstico, de uma distribuio aproximadamente simtrica, com pequena variabilidade, acentuando-se estas caractersticas medida que a dimenso da amostra aumenta. Por exemplo, no caso da estimao do valor mdio, o facto de a mdia variar de amostra para amostra, no nos permite saber, recolhida uma amostra, se a mdia dessa amostra uma boa estimativa do valor mdio da populao subjacente amostra (como temos feito vrias vezes, estamos a identificar populao com a varivel em estudo, cujo valor mdio se pretende conhecer), isto , no podemos atribuir nenhuma confiana a essa estimativa do valor mdio.

2 Intervalo de confiana para o valor mdio


No estudo da distribuio de amostragem da mdia, conclumos ainda que quando se faz amostragem sem reposio e as Populaes tm dimenso razoavelmente grande, ou no caso de a amostragem ser com reposio, Populaes com qualquer dimenso, e as amostras tambm tm dimenso grande (maior ou igual a 30), a distribuio de amostragem da Mdia pode ser aproximada pela distribuio Normal (Teorema Limite Central). Este comportamento da distribuio de amostragem da Mdia tem consequncias muito importantes, no que diz respeito ao problema da estimao do parmetro valor mdio, j que vamos aproveit-lo para encarar este problema de um outro ngulo. Em vez de procurarmos um valor estimativa pontual, como aproximao do valor do parmetro desconhecido, vamos procurar obter um intervalo estimativa intervalar ou intervalo de confiana, que com uma determinada confiana contenha o valor do parmetro. Vamos ento procurar um intervalo aleatrio [A, B] que, com uma grande probabilidade, por exemplo 0.95, contenha o parmetro : P([A, B] conter ) = 0.95 Ora, precisamente na construo destes intervalos de confiana, que vamos aproveitar o facto de a distribuio de amostragem da Mdia poder ser aproximada
Maria Eugnia Graa Martins - DEIO

66

Introduo Inferncia Estatstica

pelo modelo Normal, com valor mdio igual ao valor mdio da Populao (parmetro que estamos a estimar) e desvio padro igual a /n, onde o desvio padro da populao. Como o desvio padro da Populao quase sempre desconhecido, vamos tambm estim-lo a partir do desvio padro amostral, s, pelo que um valor aproximado para o desvio padro da mdia, tambm conhecido como erro padro, s/n. Ento, tendo em considerao as propriedades da distribuio Normal, podemos escrever: P(-1.96

X S/ n

1.96) 0.95

(1)

O valor 1.96 pode ser obtido consultando uma tabela, a calculadora ou a folha de Excel. De (1) vem P(-1.96 S/ n x +1.96 S/ n )0.95 ou P( x -1.96 S/ n

x +1.96 S/

n )0.95

Ento o intervalo aleatrio que andvamos procula


[ x 1.96 S/

n, x

+ 1.96 S/

n]

Repare-se que o intervalo anterior aleatrio, j que o valor da mdia e do desvio padro variam, dependendo da amostra que se recolher. Se recolhermos duas amostras diferentes, ambas da mesma dimenso, vamos obter valores diferentes para a mdia e para o desvio padro. Dizemos que este intervalo um intervalo de confiana, com uma confiana ou um nvel de confiana de 95%. Afinal, o que significa um intervalo de 95 % de confiana? Significa que se recolhermos muitas amostras de dimenso n, calcularmos as mdias e os desvios padres dessas amostras e construirmos os intervalos de confiana respectivos, utilizando a expresso anterior, cerca de 95% desses intervalos contero o valor mdio , enquanto que os restantes 5% no contero o parmetro . No temos a certeza que um dado intervalo, em particular, contenha o parmetro desconhecido, mas estamos confiantes que assim acontea, isto estamos 95% confiantes que o intervalo que calculmos a partir da amostra seleccionada (na prtica s seleccionamos uma amostra), contenha o valor do parmetro. Se na expresso (1) da probabilidade, mudarmos a probabilidade de 0.95 para 0.90, por exemplo, ento em vez de 1.96, devemos considerar 1.645:

Introduo Inferncia Estatstica

67

Assim, um intervalo de confiana, com 90% de confiana ter o seguinte aspecto [ x 1.645 S/ n ,

+ 1.645 S/ n ]

A forma geral do intervalo de confiana ser, [ x z S/ n ,

+ z S/ n ]

onde o valor de z depender da confiana com que se pretende construir o intervalo. Alguns valores (obtidos a partir da distribuio da Normal(0,1)), incluindo os j considerados anteriormente, so:
Confiana 90% 95% 97.5% 99% 99.5% 99.9% 99.95% 99.995% z 1.645 1.960 2.326 2.576 3,090 3.291 3.891 4.417

Como se verifica a partir da tabela anterior, quanto maior for a confiana, maior o valor de z, pelo que maior ser a amplitude do intervalo.
Como diminuir a amplitude de um intervalo de confiana?

De um modo geral pretende-se construir um intervalo com pequena amplitude, pois nos d uma maior preciso. Como se depreende da forma desse intervalo, para diminuir a sua amplitude, que dada por maneiras: ou diminuir a confiana (o que faz com que diminua o valor de z), o que no aconselhvel; ou aumentar a dimenso da amostra considerada para calcular o intervalo. Por exemplo, se aumentar 4 vezes a dimenso da amostra, a amplitude do intervalo reduz-se a metade.

2 z

s n

podemos faz-lo de duas

Maria Eugnia Graa Martins - DEIO

68

Introduo Inferncia Estatstica

Nas consideraes anteriores estamos a admitir que a dimenso da amostra inicial j suficientemente grande, de modo que a estimativa s para o desvio padro da populao no se altera significativamente quando utilizamos mais informao (uma amostra de maior dimenso) para a calcular. Como casos extremos de intervalos de confiana, temos: o intervalo de confiana, com uma confiana 0%, que se reduz a um ponto, que no mais do que a estimativa pontual do valor mdio, ou seja a mdia calculada a partir da amostra considerada; e temos ainda o intervalo com uma confiana de 100%, que a recta real (porque vem o valor de z igual a infinito). Obviamente que nenhum destes intervalos de grande utilidade!

Margem de erro
A metade da amplitude de um intervalo de confiana, costume chamar margem de erro.
Exemplo Considerando a populao dos deputados da X Legislatura, suponhamos que estvamos interessados em estimar o parmetro idade mdia da populao. Seleccionou-se uma amostra aleatria (com reposio) de dimenso 30 e registaramse as idades dos elementos seleccionados. Os valores obtidos apresentam-se na seguinte tabela:
46 34 54 48 40 41 40 49 54 71 50 70 36 39 55 56 60 53 32 50 47 55 30 52 54 52 42 44 48 31

A mdia e o desvio padro das idades anteriores so, respectivamente, 47.8 e 10.2 anos. Ento, um intervalo de 95% de confiana para a idade mdia da populao [47.8 1.96 10.2/ 30 , 47.8 + 1.96 10.2/ 30 ] ou seja [44.2, 51.4], um intervalo com uma confiana de 95%. Repare-se que o intervalo anterior contm o parmetro em estudo (esta uma situao de excepo, em que a populao to pequena, que facilmente se obtm o valor do parmetro valor mdio da Idade). Chamamos a ateno para que, se no conhecssemos o valor do parmetro em estudo, no poderamos garantir que o intervalo que calculmos anteriormente o contivesse. Apenas estamos confiantes em que isso acontecesse, pois se calculssemos 100 amostras de dimenso 30, como a anterior, espervamos que cerca de 95 dos intervalos que se poderiam construir com as mdias e desvios padres dessas amostras, contivessem o parmetro em estudo.

Introduo Inferncia Estatstica

69

Exemplo Considere a populao constituda pelos empregados da empresa X, em Anexo. Suponha que estamos interessados em estudar o parmetro altura mdia. a) Seleccione uma amostra de dimenso 30 e calcule um intervalo de 95% de confiana para o parmetro em estudo. b) Seleccione mais 99 amostras de dimenso 30, e a partir de cada uma delas construa um intervalo de 95% de confiana. c) Quantos dos intervalos considerados anteriormente contm o valor do parmetro? Comente.

Resoluo: a) A seguir apresenta-se a amostra seleccionada pelo processo de amostragem com reposio 153 154 160 177 163 160 173 170 174 161 173 161 169 174 154 165 164 170 165 165 156 157 169 158 159 160 157 160 173 170

Mdia = 164.13 Desvio padro = 6.95 Intervalo de 95% de confiana [164.13 1.96 x

6 .95 30

, 164.13 + 1.96 x

6 .95 30

[161.65, 166.62] b) Seleccionmos mais 99 amostras aleatrias, para as quais calculmos a mdia e o desvio padro e os respectivos intervalos de confiana, pelo mesmo processo que o calculado na alnea anterior. Apresentamos esses intervalos graficamente, na figura seguinte:

Maria Eugnia Graa Martins - DEIO

70

Introduo Inferncia Estatstica

150

155

160 164.57

170

175

180

Na figura anterior, a seta indica a posio do valor do parmetro a estimar, ou seja a altura mdia da populao. c) Verificamos que trs dos intervalos construdos no contm o valor do parmetro (Esperarvamos encontrar um valor prximo de 5).

Introduo Inferncia Estatstica

71

3 Intervalo de confiana para a proporo


No estudo da distribuio de amostragem da proporo, conclumos que quando se faz amostragem sem reposio e as Populaes tm dimenso razoavelmente grande, ou no caso de a amostragem ser com reposio, Populaes com qualquer dimenso, e as amostras tambm tm dimenso grande (maior ou igual a 30), a distribuio de amostragem da Proporo amostral pode ser aproximada pela distribuio Normal (Teorema Limite Central). Este comportamento da distribuio de amostragem da Proporo, tal como vimos anteriormente para a Mdia, tem consequncias muito importantes, no que diz respeito ao problema da estimao do parmetro proporo populacional, j que vamos aproveit-lo para encarar este problema de um outro ngulo. Em vez de procurarmos um valor estimativa pontual, como aproximao do valor do parmetro desconhecido, vamos procurar obter um intervalo estimativa intervalar ou intervalo de confiana, que com uma determinada confiana contenha o valor do parmetro. Representando por

a proporo amostral, estimador do parmetro p, sabemos do

mdulo 2 Introduo Estimao que, se a recolha da amostra for feita com reposio de uma Populao de dimenso qualquer, ou sem reposio de uma populao de grande dimenso, e se a dimenso, n, da amostra for grande, ento P(

p P p(1 p) n

z) (z)

Por um processo perfeitamente idntico ao considerado para obter o intervalo de confiana para o valor mdio, em que no caso em que a varincia 2 da populao, desconhecida, a substitumos pela varincia amostral, tambm aqui, substitumos na . Temos assim o intervalo de confiana para a varincia da populao p(1-p), o p por p proporo

-z [p

(1- p ) p , p n

+z

(1- p ) p ] n

Fazendo a analogia com o que se passa com o intervalo de confiana para o valor mdio, no intervalo anterior, a proporo

, substituiu a mdia, e considerou-se p (1p

) como estimador da varincia populacional p(1-p). p


Observao: Ao contrrio do que usual, em que se considera a varivel aleatria com letra maiscula e um seu valor observado com letra minscula, no caso da proporo no costume fazer essa distino. Assim, representa-se indiferentemente por

tanto a varivel aleatria como um seu valor observado, dependendo do contexto em que est a ser utilizado a sua interpretao como varivel aleatria ou valor dessa varivel aleatria. O valor de z depende da confiana com que se quer construir o intervalo, como vimos para o caso do valor mdio.

Maria Eugnia Graa Martins - DEIO

72

Introduo Inferncia Estatstica

No caso particular de um intervalo de 95% de confiana, temos

- 1.96 [p

(1- p ) p , p n

+ 1.96

(1- p ) p ] n

Em que condies que se pode utilizar o intervalo anterior?

Dissemos anteriormente que era necessrio que a dimenso da amostra fosse suficientemente grande. No entanto, tambm j vimos que quanto maior for a variabilidade presente na populao de onde se recolhe a amostra, maior ter de ser a dimenso dessa amostra. Uma regra emprica aconselha-nos a considerar

10 e n(1 - p ) 10 np
O intervalo anterior, obtido a partir de uma amostra de dimenso n, tem amplitude igual a

2 1.96

(1 - p ) p n
(1 - p ) p , chamamos margem de n

Como j referimos para o intervalo de confiana para o valor mdio, a metade da amplitude do intervalo, ou seja quantidade 1.96
erro da sondagem.

Exemplo Suponha que para a populao dos empregados da empresa X se pretende estimar a proporo de mulheres casadas. Seleccione uma amostra de dimenso 30 e obtenha uma estimativa pontual e uma estimativa intervalar ou intervalo de 95% de confiana para essa proporo.

Resoluo: Para facilitar o estudo, utilizmos uma folha de Excel e convertemos as categorias da caracterstica populacional estado civil, da seguinte forma: Casada Casado Divorciada 1 0 0 Solteira Solteiro Divorciado 0 0 0

Obtivemos uma populao de 0s e 1s, em que um elemento da populao assumia o valor 1 sempre que a caracterstica em estudo se verificava. Seleccionada uma amostra aleatria, com reposio, de dimenso 30, obtivemos os seguintes valores:

Introduo Inferncia Estatstica

73

0 0 0

1 0 0

0 0 0

0 1 0

1 0 0

0 0 0

0 0

1 1

0 0

0 0

0 0

1 1

Proporo de mulheres casadas na amostra= 7/30 = 0.233 Este valor uma estimativa pontual da proporo p de mulheres casadas na populao, cujo valor 0.2268 (Mais uma vez estamos numa situao em que foi fcil calcular o valor do parmetro, atendendo a que a populao tinha uma dimenso muito pequena).. Um intervalo de 95% de confiana para a proporo de mulheres casadas na populao [0.233 1.96 x

0. 233 (1 0. 233) , 0.233 + 1.96 x 30

0. 233 (1 0. 233) ], 30

ou seja [0.082, 0.384]. O intervalo anterior tem uma margem de erro de 0.151.
Exemplo O Dirio de Notcias na sua edio do dia 25 de Fevereiro de 1998, referia, relativamente a uma sondagem realizada em colaborao com a TSF/Universidade Moderna, que a confiana dos portugueses aambarcada pelos docentes, logo seguidos pelos mdicos, adiantando ainda que os polticos e sindicalistas partilham os ltimos lugares. Apresentamos de seguida um excerto desse artigo.

Barmetro de profisses
Em relao s seguintes profisses com importncia na vida nacional, diga se tem ou no confiana na sua aco

Profisso Professores Mdicos Juzes Militares Jornalistas Padres Empresrios Polcias Sindicalistas Polticos

No tem confiana 9.1% 9.7% 26.9% 30.9% 30.8% 31.8% 33.5% 38.6% 49.6% 57.5%

Tem confiana 85.1% 85.0% 64.7% 61.6% 58.2% 55.2% 53.6% 51.8% 39.4% 30.9%

No sabe/No responde 5.8% 5.3% 8.4% 7.4% 11.1% 13.0% 13.0% 9.6% 11.0% 11.7%

Ficha tcnica: Esta sondagem foi encomendada pelo DN e pela TSF ao Centro de Sondagens da Universidade Moderna. O trabalho de campo decorreu entre os dias 12 e 17 de Fevereiro de 1998. Os inquritos foram realizados em 25 freguesias de Portugal continental. A amostra foi seleccionada aleatoriamente e, para cada uma das freguesias, foi feito um estudo demogrfico com base nos dados do Censos 91 e do Stape. Foram validados 1303 inquritos. O processo de informao utilizado foi a recolha directa (porta a porta), atravs de um inqurito estruturado onde estava anexado o boletim com o nome de vrias profisses com importncia na vida nacional. Foi feita uma primeira validao pelos monitores, no local, a 10 por cento dos inquritos e, posteriormente, foram validados outros 20 por cento telefonicamente. O

Maria Eugnia Graa Martins - DEIO

74

Introduo Inferncia Estatstica

erro mximo, para um nvel de confiana de 95%, de 2.71. A anlise dos resultados da responsabilidade do DN. a) O valor de 85.1% apresentado para os Professores uma estatstica ou um parmetro? b) Construa um intervalo de 95% de confiana para a percentagem da populao que tem confiana nos Professores. c) O intervalo anterior contm necessariamente a percentagem de indivduos da populao que tm confiana nos Professores? d) Calcule a margem de erro dos intervalos de confiana, para a confiana associada s diferentes profisses consideradas. e) Qual o valor mximo obtido para as margens de erro obtidas na alnea anterior? Isso estar de acordo com o que vem especificado na ficha tcnica? Resposta alnea d) 85.1% 0.0193 85.0% 0.0194 64.7% 0.0259 61.6% 0.0264 58.2% 0.0268 55.2% 0.0270 53.6% 0.0271 51.8% 0.0271 39.4% 0.0265 30.9% 0.0251 Reparou que: a margem de erro mxima para um valor da proporo prximo de

) = 1.96 0.5? Efectivamente se se fizer o estudo da funo f(p


que ela assume um valor mximo para

(1- p ) p , verifica-se n

=0.5. p

Qual a dimenso da amostra que se deve recolher para obter um intervalo com um nvel de confiana de 95% e com uma determinada preciso?
Pretende-se que a margem de erro do intervalo de confiana seja menor ou igual que um valor d. Ento, temos de resolver a seguinte desigualdade, em relao a n:

1.96
de onde vem n

(1- p ) p d n
2

1.96 ) p(1- p d

(1)

Introduo Inferncia Estatstica

75

Como, de um modo geral, no se conhece o valor da proporo amostral, antes de recolher a amostra, considera-se o valor mximo para a expresso obtm quando o valor da proporo 0.5. Vem ento n

(1- p ) , p

que se

1.96 2d

(2)

No caso do exemplo anterior, a margem de erro relativamente aos portugueses que confiam nos professores, de 1.93%. Se se pretendesse uma margem de erro no superior a 1.5%, teramos de considerar uma amostra de dimenso 2165, se entrarmos em considerao com o valor da estimativa 0.851, na frmula (1). Se desconhecssemos uma estimativa para a proporo, entraramos com a frmula (2) para calcular o valor da dimenso da amostra e obteramos como valor necessrio para a dimenso da amostra 4269!

Qual a dimenso da amostra que se deve recolher para obter um intervalo com uma determinada preciso, com um nvel de confiana de 100(1-)%?
A confiana de um intervalo costuma exprimir-se na forma anterior, onde uma probabilidade relativamente pequena. Assim, se =5%, temos um intervalo de 95% de confiana. Se representarmos a funo densidade da Normal(0,1), o valor de z que aparece no intervalo de confiana genrico

-z [p

(1- p ) p , p n

+z

(1- p ) p ] n

no mais do que o quantil de probabilidade 1-/2, como se apresenta a seguir:

pelo que se se pretende um intervalo de 100(1-)% de confiana, com uma preciso no inferior a d, a expresso (2) anterior, para a dimenso n da amostra necessria, toma a forma: n

z1 / 2 2d

Maria Eugnia Graa Martins - DEIO

76

Introduo Inferncia Estatstica

Ainda sobre intervalos de confiana


A interpretao do que um intervalo de confiana nem sempre feita correctamente. Vamos aproveitar o seguinte dilogo para ficarmos com as ideias um pouco mais claras sobre este assunto. Suponhamos que um candidato Cmara de Lisboa, o Dr. Gentil Alves, pretendia saber qual a percentagem p, de eleitores (lisboetas) que pensavam votar nele. Encomendou um estudo empresa Sondagem, tendo esta questionado 785 lisboetas, escolhidos aleatoriamente, e verificado que a percentagem destes eleitores que pensavam votar no candidato era 56%. Se este valor dava um certo alento ao Dr. Gentil Alves para se candidatar, no o deixava, no entanto, descansado! Ele sabia que se fosse recolhida outra amostra, embora da mesma dimenso, quase de certeza obteria outro valor como estimativa de p e quem que lhe garantia que no era um valor inferior a 50%, o que o deixaria infelicssimo! Como interpretar este valor de 56%? O Prof. Amvel, um amigo estatstico do Dr. Gentil Alves, ajudou-o nesta tarefa. Relatamos a seguir a conversa que se passou entre ambos. Dr. Gentil Alves Bom dia Amvel, ests bem? Olha, ando um pouco preocupado com esta questo da candidatura Cmara de Lisboa. Numa sondagem realizada ontem, deram-me uma percentagem de 56% de eleitores a votarem em mim. Mas com que confiana que eu posso interpretar este resultado? Posso estar seguro que tenho a maioria? Prof. Amvel Para te ser franco, a confiana que podes ter nesse resultado nula! Tu prprio sabes que se tivessem sido outros eleitores escolhidos para a sondagem, quase certamente no obterias 56%. Mas no fiques muito preocupado, pois eu vou adiantarte mais alguma coisa. O valor de 56% vai-me servir para obter um intervalo de 95% de confiana. Deixa-me fazer aqui umas contas que j te telefono. Dr. Gentil Alves Est bem. Muito obrigado. Prof. Amvel C estou eu novamente. Com esse valor que me adiantaste constru o intervalo (52.5%; 59.5%), que um intervalo de 95% de confiana para a percentagem de lisboetas que pensam votar em ti. Ests contente? Dr. Gentil Alves Significa isso que existe uma probabilidade de 95% desse intervalo conter essa percentagem (p) de eleitores que pensam votar em mim? Prof. Amvel Nada disso! Dr. Gentil Alves Ento 95% a probabilidade de p estar contido no intervalo? Prof. Amvel Que horror! Porventura o p uma varivel aleatria? Nem o p nem o intervalo que eu te dei. Assim no podemos falar na probabilidade do p estar contido no intervalo, nem do intervalo conter o p! Os 95% de confiana significam o seguinte: o processo que se utiliza para calcular os intervalos, como o que te apresentei, um processo tal que se o utilizasse com todas as amostras possveis (da mesma dimenso) que posso seleccionar da populao, cerca de 95% das vezes produziria intervalos que contm o p e cerca de 5% das vezes intervalos que no o contm. No que diz respeito a um intervalo particular, como o que te dei, ficaremos sempre na

Introduo Inferncia Estatstica

77

dvida se um dos que contm p ou no! Temos f que sim, pois j era preciso ter azar irmos obter um dos poucos intervalos que no contm p. Dr. Gentil Alves Muito bem. Compreendi o que disseste, mas ento porque que no construo intervalos com, por exemplo, 99% de confiana? Assim, s 1% dos intervalos possveis de construir que no conteriam o p, no verdade? Prof. Amvel Muito bem observado! Mas nunca ouviste dizer que sem ovos no se fazem omeletes ou que no h almoos grtis? Pois ! A contrapartida para, com a mesma dimenso da amostra, termos intervalos de 99% de confiana, que a margem de erro vem maior, isto , vamos ter intervalos com maior amplitude, o que significa uma menor preciso. Em ltimo caso construiramos intervalos com uma confiana de 100%! Sabes ao que chegvamos? A R! No tens nenhuma dvida de que o intervalo est em R, pois no? No nos adianta nada! J agora, com o valor de 56% obtido na amostra que a Sondagem recolheu, um intervalo de 99% de confiana seria (51.4%; 60.6%). Assim, enquanto que com o primeiro intervalo temos uma margem de erro de 3.5%, agora a margem de erro passou para 4.5%. Ficaste esclarecido? Dr. Gentil Alves Penso que sim. S mais uma questo. Haveria algum processo de, com a confiana de 99%, obter um intervalo com a margem de erro que obtive para o intervalo de 95% de confiana? Prof. Amvel Mais uma vez ests a colocar uma questo interessante. Efectivamente, podemos, mantendo a confiana, diminuir a margem de erro, agora custa de recolhermos uma amostra de maior dimenso. Nada se faz sem custos, como ests a ver. Por exemplo, admitindo que a percentagem de lisboetas, que pensam votar em ti, no se alteraria muito se se recolhesse uma amostra de maior dimenso, ento teria de ser recolhida uma amostra de 1335 lisboetas, em vez de 785 (estou a considerar que a propro de votos a teu favor, obtida ao questionar os 1335 lisboetas, aproximadamente igual a 56%). Dr. Gentil Alves Muito obrigada por estes esclarecimentos. Vou mesmo avanar com a minha candidatura.

Passados 8 dias realizaram-se as eleies. O Dr. Gentil Alves o novo presidente da Cmara de Lisboa.

Maria Eugnia Graa Martins - DEIO

78

Introduo Inferncia Estatstica

Exerccios
3.1 Para cada uma das seguintes situaes diga se o parmetro de interesse um valor mdio ou uma proporo: a) Numa sondagem perguntou-se a cada um de 100 estudantes quantas horas por semana, gastavam a ver televiso. b) Numa sondagem perguntou-se a cada um de 100 estudantes se passavam mais de 8 horas por semana, a ver televiso. c) Numa sondagem, perguntou-se a 100 agregados familiares qual a percentagem do oramento familiar que era gasto com a renda da casa. d) Num estudo sobre o consume de bebidas alcolicas, investigou-se junto de 50 restaurantes, qual a percentagem de bebidas alcolicas, de entre as bebidas consumidas por semana. e) Junto dos mesmos restaurantes da alnea anterior, verificou-se que 35% dos restaurantes vendiam semanalmente mais bebidas alcolicas, que no alcolicas. 3.2 Num Censo, em que a dimenso da amostra igual dimenso da populao, o erro padro da mdia (ou da proporo amostral) igual a zero. Explique porqu. 3.3 Suponha (Adaptado de Rossman, 2001) que pretende conhecer o tempo mdio de sono que os alunos da sua escola dormiram, na ltima noite. Considere os seguintes diagramas que apresentam os tempos de sono de alunos da escola, referentes a 4 amostras:

Introduo Inferncia Estatstica

79

a) As seguintes estatsticas descritivas foram calculadas com base nas amostras anteriores. Complete a tabela.
Amostra n Dimenso da amostra 30 10 10 30 Mdia 6.6 6.6 6.6 6.6 Desvio padro amostral 0.82 0.82 1.59 1.59

b) O que que todas as amostras tm em comum? c) Qual a caracterstica que sobressai quando comparamos as distribuies correspondentes s amostras 1 e 2? d) Qual a caracterstica que sobressai quando comparamos as distribuies correspondentes s amostras 1 e 3? Na seguinte tabela apresentamos os intervalos de confiana para as amostras de dimenso 30 (consegue obter os intervalos de confiana correspondentes s amostras de dimenso 10?):
Amostra n Dimenso da amostra 30 10 10 30 Mdia 6.6 6.6 6.6 6.6 Desvio padro amostral 0.82 0.82 1.59 1.59 Int. confiana (6.31; 6.89) (6.03; 7.17)

Qual das 2 amostras produz uma estimativa para o tempo mdio de sono, mais precisa? Qual a influncia da variabilidade apresentada pela amostra, para a amplitude do intervalo de confiana?
3.4 Suponha que na sua escola, cada um dos 50 alunos de Matemtica para as Cincias Sociais, foi encarregue de recolher informao junto de 10 adultos, se eram a favor do referendo da Constituio Europeia. O histograma construdo com as 50 propores obtidas ter um aspecto que faz lembrar o modelo normal? Justifique. 3.5 Suponha que na sua escola, cada um dos 45 alunos de Matemtica A. Foi encarregue de recolher informao, junto de 30 alunos de outras escolas, se eram a favor do Novo Estatuto para o Aluno. O histograma construdo com as 45 propores obtidas ter um aspecto que faz lembrar o modelo normal? Justifique. 3.6 Na correco de certo tipo de exames, feitos a nvel nacional, em que cada exame constitudo por uma parte fechada e uma parte aberta, utiliza-se um leitor ptico para corrigir a parte fechada. Cada exame tem 50 questes, e a probabilidade de a mquina ler erradamente uma destas questes p, a qual constante de questo para questo e de exame para exame. Desconhece-se este valor de p. a) Admitindo que em 10 destes exames, a mquina leu erradamente 15 questes, obtenha uma estimativa pontual para p. b) Utilizando o resultado da alnea anterior: i) Obtenha um intervalo, com uma confiana de 95%, para p; ii) Qual a margem de erro do intervalo que obteve? c) A empresa que vende as mquinas de leitura ptica diz que a percentagem de erros que a mquina comete, anda volta de 1%. Tendo em conta o intervalo de confiana obtido na alnea anterior, pensa que a empresa tem razo no que afirma? Justifique a sua resposta. (Se na alnea anterior no conseguiu determinar o intervalo de confiana pretendido, admita o seguinte intervalo (1.5%; 4.5%)).

Maria Eugnia Graa Martins - DEIO

80

Introduo Inferncia Estatstica

3.7 - Uma fbrica de calado para adultos, pretende comear a produzir sapatos para criana. Encarregou uma empresa de sondagens, de lhe fazer um estudo sobre qual seria o tamanho mdio (em cm) do p de crianas de determinada classe etria. Mesmo antes da empresa apresentar as concluses, o dono da fbrica (que h muitos anos tinha tido uma disciplina de Estatstica) teve acesso seguinte tabela de frequncias e correspondente histograma, dos valores calculados para as mdias de 500 amostras, de dimenso 30, recolhidas pela empresa: Classes Freq.rel. [31,075-31,225[ 0,0020 [31,225-31,375[ 0,0075 [31,375-31,525[ 0,0250 [31,525-31,675[ 0,0735 [31,675-31,825[ 0,1410 [31,825-31,975[ 0,2005 [31,975-32,125[ 0,2250 [32,125-32,275[ 0,1635 [32,275-32,425[ 0,0990 [32,425-32,575[ 0,0445 [32,575-32,725[ 0,0130 [32,725-32,875[ 0,0040 [32,875-33,025[ 0,001 5

Ento, na posse destes elementos, pediu ao filho, que tinha frequentado a disciplina de MACS do 11 ano, que lhe respondesse s seguintes questes: a) Este histograma pretende representar a distribuio de amostragem, aproximada, de uma certa varivel. Que varivel? b) Utilizando a tabela anterior, obtenha um valor aproximado para o valor mdio da distribuio de amostragem da Mdia, para amostras de dimenso 30 (considere o valor aproximado s unidades). c) Tendo em considerao que a estatstica Mdia X , um estimador centrado do valor mdio da populao X, de onde se retiram as amostras, sugira um valor para o valor mdio , da populao X, constituda pelo tamanho do p, das crianas da classe etria considerada. d) Sabendo que o desvio padro de X , igual a , onde o desvio padro 30 da populao X, utilize a tabela dada para sugerir um valor para este desvio padro . e) Como o histograma anterior sugere, e o Teorema Limite Central justifica, a distribuio de amostragem da Mdia pode ser aproximada por uma distribuio Normal (para amostras de dimenso n, suficientemente grande, ou seja, n30). Admitindo que um dos valores obtidos para a mdia de uma das 500 amostras de dimenso 30 consideradas, foi 32.125, obtenha um intervalo de 95% de confiana para o valor mdio do comprimento do p. (Se na alnea d) no conseguiu determinar o valor de , admita que igual a 1.5). f) Admitindo que a populao X tem distribuio normal, com o valor mdio e desvio padro obtidos, respectivamente, nas alneas c) e e), calcule a probabilidade de uma criana, escolhida ao acaso, da classe etria em estudo, ter um comprimento do p superior a 32.5 cm. (Se no resolveu as alneas c) e e) considere os valores 32 cm e 1.5 cm, respectivamente para valor mdio e desvio padro de X.

Introduo Inferncia Estatstica

81

3.8 Nas ltimas eleies legislativas, passada uma hora do fecho das mesas de voto, apareceram os resultados para o concelho de Sintra, dando uma percentagem de votos para JS e FS, respectivamente de 39% e 42%, com uma margem de erro de 3.5% e uma confiana de 95%. a) O locutor afirmou, ao apresentar aqueles resultados, que os candidatos estavam empatados tecnicamente. Explique, por palavras suas, o que quereria o locutor dizer. b) Passadas duas horas a margem de erro, diminuiu para 2.5%. Admitindo que a confiana era a mesma, d uma explicao para a diminuio da margem de erro. c) Numa sondagem realizada antes das eleies, JS tinha encomendado uma sondagem, que lhe dava a vitria, quando afinal veio a perder as eleies. Teremos que deixar de acreditar nas sondagens? 3.9 Uma sondagem da TSF/DN publicada na edio do DN de 2 de Julho de 2004, dizia: Portugueses querem referendo Maioria mostra-se favorvel eleio de um presidente e de um governo da Unio Europeia. E tambm quer exrcito comum Os portugueses manifestam tendncia para o federalismo europeu: a maioria defende um presidente e um governo europeus, eleitos pelos cidados. So igualmente favorveis criao de um exrcito da Unio Europeia (UE). E, na anlise que fazem sobre o futuro comunitrio, dizem ainda que querem referendar a prxima reforma institucional da UE. A maioria j ouviu falar do Tratado de Nice, mas est longe de saber o que ele contempla. Talvez por isso, a larga maioria no sabe se o documento deve ou no ser aprovado pelos deputados. O Barmetro de Junho do DN/TSF/Marktest no incluiu qualquer pergunta directa sobre o federalismo europeu, mas os portugueses acabaram por pronunciar-se nesse sentido. Seno vejamos: 62 por cento dos inquiridos mostrou-se favorvel eleio de um presidente da UE e 53 por cento disse tambm estar a favor de um governo europeu. uma tese defendida equitativamente por mulheres e homens no que diz respeito eleio de um presidente europeu. Nota-se, contudo, alguma diferena quando a questo a eleio de um governo europeu. Aqui, j so os homens que se mostram mais favorveis. Sobre um e outro assunto , claramente, a classe mdia a maior defensora de um executivo europeu. Quando questionados sobre a criao de um exrcito na UE, uma questo que at aqui tem levantado alguma polmica, 45 por cento dos inquiridos afirmam ser defensores desta ideia. Embora o nmero daqueles que se opem no seja muito inferior - 36 por cento. Significativa tambm a percentagem dos que no sabem o que responder - 19 por cento. Esta hiptese acolhe mais adeptos entre os entrevistados do sexo masculino (53 por cento) e na faixa etria que poder ser contemplada pelas incorporaes (igualmente 53 por cento). E se a maioria dos portugueses refere j ter ouvido falar do Tratado de Nice, tambm so peremptrios a afirmar que no fazem a mais pequena ideia das suas linhas gerais: 65 por cento sublinha que no sabe o que est consagrado no documento. Uma resposta que justifica a elevada percentagem (62 por cento) daqueles que no sabe se os deputados devem ou no aprovar o Tratado. A larga maioria dos inquiridos (60 por cento) defende, por outro lado, que as mudanas na organizao da Unio Europeia devem ser referendadas no nosso Pas. O que no deixa de ser curioso, j que as duas experincias anteriores (aborto e regies) revelaram uma grande falta de participao dos cidados. S 18 por cento tem opinio contrria e 22 por cento optou por no responder a esta questo. O alargamento da Unio Europeia aos pases do Centro e de Leste do continente merece o acordo da maioria (64 por cento), que se mostram convencidos de que essa reestruturao

Maria Eugnia Graa Martins - DEIO

82

Introduo Inferncia Estatstica

interna vai tirar poderes a Portugal no seio da UE (46 por cento). Mais de dois teros (67 por cento) considera tambm que o processo de alargamento poder reduzir a atribuio de fundos comunitrios para Portugal. Embora no seja referido no artigo anterior, segundo a notcia da TSF, a sondagem envolveu 813 indivduos adultos, dos quais 421 eram mulheres e foi realizada via telefone. referido no artigo que 62% dos inquiridos se mostra favorvel eleio de um presidente da UE. a) Este valor de 62% uma estatstica ou um parmetro? b) Seria possvel ter obtido este valor, se a percentagem de portugueses adultos que se mostra favorvel eleio de um presidente da UE fosse 65%? c) Tendo em conta o resultado obtido pela sondagem da TSF/DN, acha plausvel que a proporo de portugueses que se mostra favorvel eleio de um presidente da UE seja 68%? Porqu?

3.10 No dia x do ms y do ano z realizar-se-o as Eleies Autrquicas. Relativamente cidade de Lisboa, h dois candidatos sobre os quais se criaram mais expectativas, nomeadamente TT e MM. Suponha que, no dia das eleies, passado uma hora sobre o fecho das urnas, altura em que comeam a contar os votos para cada candidato, surgiram os primeiros resultados nos canais televisivos. Relativamente a um daqueles candidatos, o candidato TT, apresentaram o seguinte resultado: - O candidato TT tem, neste momento, uma percentagem de 48.4%, com um erro mximo de 3.45% e uma confiana de 95%. 1. Explique, por palavras suas, o que significa o resultado anterior. 2. Qual a amplitude do intervalo de confiana, que pode construir com os resultados apresentados no enunciado do problema, para a percentagem de lisboetas que votaram no candidato TT? 3. Acha razovel admitir que o candidato TT, ao ouvir aquele resultado, pense que tem alguma Chance de ganhar a Cmara de Lisboa, admitindo que para ganhar essa Cmara eram necessrios, pelo menos, 50% de votos favorveis? 4. Passadas trs horas do fecho das urnas, o resultado anunciado para o candidato TT era: - O candidato TT tem, neste momento, uma percentagem de 49.8%, com um erro mximo de 1.23% e uma confiana de 95%. a) Compare a amplitude do intervalo de confiana considerado na alnea 2, com a amplitude do intervalo de confiana, que pode construir com os resultados agora anunciados. b) Como que interpreta o resultado a que chegou na alnea anterior? 5. Quando todos os votos tiverem sido escrutinados, obtm o resultado para a percentagem de eleitores que votaram no candidato TT, na forma de um intervalo de confiana, ou na forma de um valor? Explique porqu. 3.11 - Numa altura em que se discutia o problema dos touros de morte, em Portugal, nomeadamente por causa das festas de Barrancos, uma conhecida estao de televiso props a seguinte questo aos telespectadores, no final do telejornal de uma 6 feira: Se a favor dos touros de morte, em Portugal, envie uma mensagem para 7771 Se contra os touros de morte, em Portugal, envie uma mensagem para 7772 No telejornal do dia seguinte, sbado, apresentaram a seguinte notcia, como sendo o resultado da sondagem efectuada: 72% dos portugueses so a favor dos touros de morte, em Portugal, enquanto que 28% so contra! Acontece que o jornal Expresso, desse sbado, publicou o seguinte resultado de uma sondagem, encomendada a uma conceituada empresa de sondagens: 81% dos portugueses so contra os touros de morte, em Portugal!

Introduo Inferncia Estatstica

83

1. Alguma das amostras consideradas para obter os resultados anteriores, pode ser considerada enviesada? Isso poder explicar a discrepncia obtida, nas duas sondagens, relativamente s percentagens obtidas para os portugueses, que so contra os touros de morte? 2. Qual dos resultados anteriores, 28% ou 81%, estar mais perto da percentagem de portugueses que so contra os touros de morte em Portugal? Explique porqu 3. Admitindo que o resultado obtido pela empresa de sondagens, foi baseado numa amostra aleatria de dimenso 150, obtenha um intervalo de 95% de confiana para a percentagem de portugueses que so contra os touros de morte, em Portugal. 4. Calcule a margem de erro do intervalo obtido anteriormente. O que que aconselharia a algum, que lhe perguntasse como poderia obter um intervalo de confiana, com uma margem de erro inferior?

3.12 O Sr. Silva, fabricante de camisas para homem, recebeu uma encomenda proveniente de Macau. Ficou um pouco preocupado, pois quando visitou este territrio, na sua viagem de lua-de-mel, apercebeu-se que os homens tinham, de um modo geral, os braos mais curtos. Sendo assim, no poderia utilizar os moldes habituais. Pediu, ento, a uma empresa de sondagens que lhe fornecessem uma estimativa do comprimento mdio dos braos dos naturais de Macau. A empresa apresentou um estudo, que se pode resumir da seguinte forma: Sr. Silva Apresentando os nossos cumprimentos, vimos apresentar os resultados do nosso estudo: recolhemos uma amostra de dimenso 70, de outros tantos indivduos adultos, do sexo masculino, a quem medimos o tamanho do brao, tendo obtido como mdia dos 70 valores observados, o valor 52 cm. Reiterando os nossos cumprimentos, aproveitamos para dizer que segue, em anexo, a factura do trabalho prestado. Atenciosamente o gerente (assinatura irreconhecvel) O Sr. Silva ficou um pouco menos preocupado, mas continuava sem saber o que fazer: 1. Efectivamente, qual a confiana que poderia atribuir estimativa obtida? Se tivesse sido outra a amostra obtida, seria de esperar obter o mesmo valor para a mdia? Explique porqu. 2. O Sr. Silva resolveu questionar a empresa e esta forneceu-lhe os seguintes intervalos de confiana para o tamanho mdio do brao dos naturais de Macau, com uma confiana de 50% e 75%, respectivamente, e obtidos a partir da mesma amostra: [51.4, 52.6] e [51.0, 53.0]. a. Qual a margem de erro dos intervalos anteriores? b. Se fosse o Sr. Silva, qual o intervalo que escolhia? O de menor amplitude ou o de maior amplitude? Explique porqu. 3.13 Lanou-se uma moeda 50 vezes e saiu cara 20 vezes. Tem a certeza que a moeda no equilibrada? Justifique. Sugesto: Construa um intervalo de 95% de confiana para a probabilidade de sair cara. 3.14 Pretende-se determinar um intervalo de confiana para a proporo p, de peas defeituosas produzidas por determinada mquina. Pretende-se que a preciso seja grande, pelo que no queremos que a margem de erro seja superior a 3%. Temse a informao de que a mquina em questo costuma produzir cerca de 2% de peas defeituosas, mas no se tem a garantia que este valor no esteja um pouco alterado. Qual a dimenso da amostra que deve recolher para construir o intervalo pretendido?

Maria Eugnia Graa Martins - DEIO

84

Introduo Inferncia Estatstica

3.15 (continuao de 3.14) Considere de novo o exerccio 3.14, mas admita que a percentagem de peas defeituosas que a mquina costuma produzir, anda volta de 20%. Qual a dimenso da amostra que se deve recolher? 3.16 (continuao de 3.14 e 3.15) Admita agora que no tinha qualquer informao sobre a percentagem de peas defeituosas produzidas pela mquina. Qual a dimenso da amostra que teria de recolher? Compare o valor obtido para a dimenso da amostra com os valores obtidos em 3.14 e 3.15. Comente os resultados obtidos. 3.18 Suponha que num curso com 350 raparigas e 150 rapazes quer seleccionar uma amostra de 50 alunos. a) Pode-se considerar que a populao de onde est a seleccionar a amostra, tem dimenso suficientemente grande para poder ser considerada uma populao infinita? b) Considere a amostragem com reposio. Calcule o valor mdio e o desvio padro do estimador da proporo amostral de raparigas. Pode continuar a utilizar o mesmo valor mdio e/ou o mesmo desvio padro para o estimador da proporo amostral de raparigas, se a amostragem for feita sem reposio? c) Qual a distribuio de amostragem, aproximada, da proporo de raparigas numa amostra de dimenso 50? d) Qual a probabilidade, aproximada, do nmero de raparigas na amostra, estar entre 25 e 35? e) Se quisesse garantir na amostra, com uma probabilidade de 0.5, 25 raparigas, quantos alunos devia seleccionar?

Introduo Inferncia Estatstica

85

Lista de algumas funes usadas no Excel:


Ingls And() Average() Count() Counta() Countblank() Countif() If() Int() Max() Min() Mod() Or() Product() Rand() Portugus E() Media() Contar() Contar.val() Contar.vazio() Contar.se() Se() Int() Maximo() Minimo() Resto() Ou() Produto() Aleatrio() Devolve verdadeiro se todos os argumentos forem verdadeiros e devolve falso se algum dos argumentos for falso Calcula a mdia dos valores existentes num conjunto de clulas Conta as clulas com valores numricos, incluindo datas e frmulas cujos resultados so nmeros Conta todas as clulas no vazias Conta as clulas vazias Conta as ocorrncias verificadas num conjunto de clula, que obedecem a um critrio Executa uma de duas aces possveis, em funo do resultado da condio Devolve a parte inteira de um nmero Devolve o maior valor de um conjunto de clulas Devolve o menor valor de um conjunto de clulas Devolve o resto de uma diviso Devolve verdadeiro se um dos argumentos for verdadeiro e devolve falso se todos os argumentos forem falsos Multiplica os valores de um conjunto de clulas, ignorando as clulas vazias e/ou com texto Devolve um nmero pseudo-aleatrio (no intervalo (0,1)) Devolve um nmero pseudo-aleatrio no intervalo especificado Devolve um nmero arredondado, na posio indicada indicada Roundup() Sum() Sumif() Arred.para.cima() Devolve um nmero arredondado, por excesso, na posio indicada Soma() Soma.se() Soma os valores de um conjunto de clulas Soma as ocorrncias verificadas num conjunto de clulas que obedecem a um critrio Multiplica dois conjuntos de clulas e devolve a soma total dos produtos Procura um valor na coluna mais esquerda de uma tabela e devolve um valor na mesma linha na coluna indicada

Randbetween() Aleatrioentre() Round() Rounddown() Arred()

Arred.para.baixo() Devolve um nmero arredondado, por defeito, na posio

Sumproduct() Somarproduto() Vlookup() Procv()

Maria Eugnia Graa Martins - DEIO

86

Introduo Inferncia Estatstica

Bibliografia
Graa Martins, M. E. (2005) Introduo Probabilidade e Estatstica. Sociedade Portuguesa de Estatstica. Graa Martins, M.E. et al (2001) Estatstica 10 ano de escolaridade, Edio do Ministrio da Educao Departamento do Ensino Secundrio. Graa Martins. M. E. and al (1999) Introduo s Probabilidades e Estatstica. Universidade Aberta. Graa Martins, M.E. e Loura, M. E. (2001) Matemtica para as Cincias Sociais Anexo para apoio interpretao do programa. Moore, D. (1977) Statistics. Concepts and Controversies. W.H. Freeman and Company, New York. Moore, D. and al (1992) Perspectives in Contemporary Statistics. The Mathematical Association of America. Moore, D. and al (1993) Introduction to the Practice of Statistics. W.H. Freeman and Company, New York. Murteira, B. (1993) Anlise Exploratria de Dados. Estatstica Descritiva. McGraw-Hill de Portugal. Rossman, A. and al (2001) Workshop Statistics. Discovery with data. Key College Publishing/Spinger-Verlag. New York, Inc. Tannenbaum, P. and al (1998) Excursions in Modern Mathematics. Prentice Hall. Velleman, P. and al (2004) Intro Stats. Pearson Education, Inc.

Artigos da revista TEACHING STATISTICS


AGEEL, M.I. Spreadsheets as a Simulation Tool for Solving Probability Problems, Vol 24, 2, 51-54. Hodgson, T., and Borkowski, J. - Why Stratify? Vol 20, 1, 68-71. NEVILLE, H. Handling Continuous Data in Excel, Vol 25, 2, 42-45. NEVILLE, H. Charts in Excel, Vol 26, 2, 49-53.

Pginas na Internet
INSTITUTO NACIONAL DE ESTATSTICA E ESCOLA SECUNDRIA TOMAZ PELAYO PROJECTO ALEA http://www.alea.pt (Desta pgina recomenda-se, em especial, o dossier didctico ESTATSTICA COM EXCEL da autoria de Lus Miguel Cunha). INSTITUTO NACIONAL DE ESTATSTICA www.ine.pt/ Tem informao sobre Portugal, ao nvel da freguesia. EUROSTAT europa.eu.int/comm/eurostat/ Tem informao relativa aos diversos pases da Europa.

Você também pode gostar