Você está na página 1de 59

Estatstica

Prof.R.Dyodi

Sumrio

Captulo 3 - Inferncia Estatstica ............................................................................................ 2


3.1. Estimadores ..................................................................................................................... 2
3.2. Intervalos de Confiana ................................................................................................. 7
3.3. Erro amostral e Tamanho da Amostra ...................................................................... 19
3.4. Teste de Hipteses....................................................................................................... 23
3.5. Probabilidade de Significncia, Nvel Descritivo do Teste ou p-valor .................. 31
3.6. Teste de Hipteses para Propores com Qui-Quadrado ..................................... 32
3.7. Regresso e Correlao .............................................................................................. 35
3.8. Amostragem .................................................................................................................. 57

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 1

Estatstica

Prof.R.Dyodi

Captulo 3 - Inferncia Estatstica


Ao estudar a estatstica descritiva, o nosso objetivo era resumir um conjunto de dados
atravs das medidas resumo. A inferncia estatstica muito parecida com a estatstica
descritiva, mas neste caso, estamos trabalhando com amostras. No mundo real, muitas vezes
fica difcil de analisar todos os dados de uma populao e, para contornar a situao, utilizamse amostras desta populao. No entanto, as pessoas devem saber analisar se os resultados
da amostra foram ou no condizentes com o valor real da populao. Ento, utiliza-se a
inferncia estatstica para podermos inferir algo sobre a populao atravs da amostra.
Antes de iniciar o estudo sobre o tema, quero alertar para um problema prtico que
ocorre na hora da prova. Alm do assunto ser muito parecido com o da estatstica descritiva, a
inferncia utiliza a distribuio normal como principal instrumento. Assim, como saber no
decorrer da prova que se trata de inferncia, de probabilidade ou de estatstica descritiva, uma
vez que as frmulas so diferentes e a escolha errada ocasionar um erro na questo? A
minha dica o seguinte: se o enunciado mencionar a palavra amostra devemos trabalhar
com a inferncia estatstica; se o enunciado mencionar populao, ou no mencionar
nada, usaremos as frmulas dos captulos 1 e 2.
3.1. Estimadores
Enquanto as caractersticas da populao so chamadas de parmetros, as
caractersticas da amostra so chamadas de estatsticas (ou estimativas). Por exemplo, a
mdia dos pesos de uma populao de cachorros num canil igual a 10kg (como estamos
calculando a mdia da populao, temos um parmetro); por outro lado, a estatstica mdia
amostral de uma certa amostra dessa populao igual a 9kg. Dizemos que o parmetro
mdia da populao igual a 10kg e a estatstica mdia amostral igual a 9kg.
O primeiro ponto fundamental entender que os parmetros no mudam de valor,
enquanto a estatstica (ou estimativa) poder variar de valor em cada amostra diferente. Como
assim?
Suponha que uma populao seja constituda de 4 pessoas: Alessandro, Bruno, Carla
e Dbora. Queremos analisar os pesos deste grupo de pessoas (Alessandro possui 80 kg,
Bruno 90kg, Carla 50kg e Dbora 60kg). O parmetro mdia da populao igual a 70kg, no
importa quantas vezes faamos a pesagem dos 4 elementos. Agora, se utilizssemos
amostras, a estatstica mdia amostral ir variar de valor dependendo da amostra: escolher
Bruno, Carla e Dbora gerar um resultado diferente para a estatstica mdia amostral do
resultado obtido se escolhssemos Alessandro, Bruno e Carla.
Alessandro: 80 kg
Bruno: 90 kg
Carla: 50 kg
Dbora: 60 kg
Mdia da populao:
Amostra 1 (Alessandro e Bruno):
Amostra 2 (Bruno e Carla):
Amostra 3 (Dbora e Carla):
Perceberam que no caso de amostras, a mdia pode variar? Para cada amostra
diferente, temos que calcular a mdia novamente.

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 2

Estatstica

Prof.R.Dyodi

Para calcular o valor da estatstica, precisamos de um estimador (que nada mais do


que uma frmula algbrica). Veremos agora quais so os principais estimadores utilizados,
comparando-os com as frmulas do captulo 1:
Populao possui parmetros

Amostra possui estatsticas (ou estimativas),


que so calculadas atravs de um estimador

Mdia:

Varincia 1 frmula:

Varincia 1 frmula:

Varincia 2 frmula:

Mdia:

Varincia 2 frmula:

Proporo:

Proporo:

Onde Y o total de elementos portadores da


caracterstica na populao

Onde Y o total de elementos portadores da


caracterstica na amostra

Que tipo de informao podemos tirar do quadro acima? Em 1 lugar, as notaes


utilizadas para populaes e amostras so diferentes. Mas, Dyodi...acho que isso muito
detalhe! No deve cair na prova, ainda mais que eu no sou formado em estatstica.... Cai na
prova sim e bom decorar. Pare um pouco, respire, estamos quase no final da apostila. No
desista, pois se voc estudou tudo direitinho at aqui, eu posso dizer que milhares de
candidatos j ficaram para trs. J vamos ver um exerccio cobrado pela ESAF para candidatos
que no possuem formao em estatstica.
Em 2 lugar, as frmulas de mdia e proporo so iguais tanto para amostras quanto
para populao. Isso quer dizer que podemos utilizar a mesma frmula tanto para a estatstica
descritiva quanto para a inferncia estatstica. Assim, a nica frmula nova que devemos
decorar a da varincia amostral. Viu como os assuntos esto interligados e muitas frmulas
utilizadas neste captulo voc j tinha decorado desde o captulo 1? A sua persistncia ser
recompensada!
Exerccio resolvido sobre parmetros e estimadores:
(ESAF - 2006 - Sefaz CE - Analista de TI)
A mdia aritmtica discreta de uma populao qualquer dada pela seguinte formulao:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 3

Estatstica

Prof.R.Dyodi

Letra C
Resoluo:
Como o enunciado menciona populao, estamos trabalhando com estatstica descritiva. A
notao utilizada para a mdia de uma populao letra grega , ento podemos descartar as
alternativas B e D. A letra A no tem nada a ver e a letra E representa a varincia amostral com
notao errada e denominador errado, restando a letra C que a alternativa correta.
Exerccio resolvido sobre varincia amostral:
(FCC - 2010 - Sefaz SP APOF)
Seja uma amostra aleatria simples extrada de uma populao, com tamanho 10 e
representada por Xi; i = 1, 2, ... , 10. Sabe-se que

A varincia desta amostra apresenta o valor de


(A) 67,3
(B) 63,0
(C) 61,0
(D) 59,7
(E) 57,0
Letra E
Resoluo:
Voc se lembra do que eu disse sobre decorar a 2 frmula de varincia no captulo 1? O
mesmo vale para a varincia amostral, e este um tipo de exerccio que s pode ser resolvido
com a 2 frmula.
Sabemos que a questo trata de inferncia estatstica porque o enunciado citou a palavra
amostra. A 2 frmula da varincia amostral :

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 4

Estatstica

Prof.R.Dyodi

Ento,

Exerccio resolvido sobre varincia amostral:


(ESAF - 2009 - Sefaz SP APOF)
Considerando que as observaes apresentadas na questo anterior constituem uma amostra
aleatria simples X1, X2, ..., Xn de uma varivel aleatria X, determine o valor mais prximo da
varincia amostral, usando um estimador no tendencioso da varincia de X. Considere que:

a) 90,57
b) 96,85
c) 94,45
d) 92,64
e) 98,73
Letra B
Resoluo:
A questo quer saber qual o valor da varincia. A chave do sucesso neste caso saber se
devemos utilizar o denominador n ou o denominador n-1 para o clculo. Como o enunciado
pediu a varincia amostral, devemos utilizar o n-1.
Alm disso, como o enunciado tambm forneceu valores de somatrio, j sabemos de antemo
que precisamos utilizar a 2 frmula da varincia. Assim:

A alternativa correta a letra B.


Exerccio resolvido sobre varincia amostral:
(ESAF - 2009 - Receita Federal Analista)
Obtenha o valor mais prximo da varincia amostral da seguinte distribuio de frequncias,
onde representa o i-simo valor observado e a respectiva frequncia.

a) 1,5.
b) 1,225.
c) 1,429.
d) 1,39.
e) 1, 4.
Letra A
Resoluo:
O enunciado pediu o valor da varincia amostral, ento devemos utilizar o denominador n-1.
Vamos calcular os somatrios para podermos utilizar a 2 frmula da varincia.
Sabemos que a varivel assume os seguintes valores: 5, 6, 7, 8 e 9.

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 5

Estatstica

Prof.R.Dyodi

O valor 5 aparece duas vezes, o valor 6 aparece seis vezes, e assim por diante. Ento:

Exerccio resolvido sobre varincia amostral:


(ESAF 2012 Receita Federal Analista)
A varincia da amostra formada pelos valores 2, 3, 1, 4, 5 e 3 igual a
a) 3.
b) 2.
c) 1.
d) 4.
e) 5.
Letra B
Resoluo:
Falou em varincia amostral, n-1 no denominador.
Como so seis nmeros, n igual a 6.

Voc deve estar se perguntando por que o denominador da varincia amostral igual a
(n 1) ao invs de n. Quando utilizamos um estimador para determinar o valor da estatstica
desejada, queremos que o estimador possua algumas propriedades. Qualquer pessoa pode
criar um estimador, mas ele ser bom para inferir algo sobre a populao? Para dizer se um
estimador bom, ele deve possuir certas caractersticas:

O estimador deve ser consistente


O estimador deve ser no viesado, ou no tendencioso

Um estimador no viesado, ou no tendencioso, quando o clculo de sua esperana


resulta no valor do parmetro em anlise da populao. Se a mdia da populao for igual a 4,
a esperana do estimador mdia amostral deve ser igual a 4, por exemplo.
Um estimador consistente quando ele no viesado e, alm disso, a sua varincia se
aproxima de zero quando o nmero de elementos da amostra tende ao infinito.
Em provas da rea fiscal, creio que no deve haver cobrana sobre as caractersticas dos
estimadores. Mas, como isso j foi tema de questo no concurso do ICMS/RJ em 2008, vou

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 6

Estatstica

Prof.R.Dyodi

dizer o que acho que voc deve levar para a prova, com a ressalva de que muito pouco
provvel que aparea em seu exame:

Todos os estimadores que esto na tabela so consistentes, no viesados e de


varincia mnima
Um estimador mais eficiente do que outro quando sua varincia menor do que a do
outro estimador
Na varincia amostral, se, ao invs de (n 1), o denominador for igual a n, o estimador
passa a ser viesado, ou tendencioso, e inconsistente

Exerccio resolvido sobre caractersticas dos estimadores:


(FGV - 2008 - Sefaz RJ Auditor)
Considere uma Amostra Aleatria Simples de n unidades extradas de uma populao na qual
a caracterstica, X, estudada tem distribuio Normal com mdia e varincia
, ambas
desconhecidas, mas finitas. Considere, ainda, as estatsticas mdia da amostra,

. Ento, correto afirmar que:

, e a varincia da amostra
(A) e
so, ambos, no tendenciosos para a estimao da mdia e da varincia da
populao, respectivamente.
(B) no-tendencioso, mas
tendencioso para a estimao da mdia e da varincia da
populao, respectivamente.
(C) tendencioso, mas
no-tendencioso para a estimao da mdia e da varincia da
populao, respectivamente.
(D) e
so, ambos, tendenciosos para a estimao da mdia e da varincia da populao,
respectivamente.
(E) e
so, ambos, no-tendenciosos para a estimao da mdia e da varincia da
populao, mas apenas X consistente.
Letra B
Resoluo:
Sabemos que um estimador consistente, no viesado e de varincia mnima. Logo,
podemos descartar as letras C e D.
Como o denominador igual a n,
passa a ser viesado (tendencioso) e inconsistente.
A nica alternativa que pode ser assinalada a letra B.
3.2. Intervalos de Confiana
No tpico anterior eu fiz questo de ressaltar a importncia de saber diferenciar as
notaes dos parmetros e estimadores. Isso ser de grande valia para todo o resto do nosso
estudo. Muitas vezes teremos que utilizar , , e na mesma frmula. Um pequeno deslize
aqui poder levar ao erro da questo.
Aprendemos que o objetivo da inferncia estatstica inferir algo sobre a populao
atravs dos dados de uma amostra e o intervalo de confiana um dos meios para que
possamos inferir algo sobre a populao. A metodologia do intervalo de confiana consiste
basicamente em calcular um intervalo, atravs dos dados amostrais, para o verdadeiro valor do
parmetro. Para clarear as idias, vamos analisar um exemplo.
Suponha que estamos fazendo uma pesquisa que ir revolucionar o mercado de
alimentos. Podemos ganhar muito dinheiro com isso, mas precisamos saber qual a mdia de
peso dos jovens entre 20 e 30 anos de todo o Brasil. Concordam que praticamente
impossvel fazer essa pesquisa com TODOS os jovens entre 20 e 30 anos do pas inteiro?
Esse problema muito comum na vida real: impossvel obter um parmetro da
populao, por questes de tempo, dinheiro, logstica etc. Voltando ao exemplo, vamos deixar
de ganhar dinheiro? No, lgico que no! Basta colhermos uma amostra representativa e

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 7

Estatstica

Prof.R.Dyodi

assim podemos inferir algo sobre a populao. Podemos continuar nossa pesquisa sobre o
mercado de alimentos!
Percebam o seguinte: no temos a mnima idia de qual a mdia de peso da
populao, qual o valor correto. Lembrem-se de que a mdia da populao um parmetro,
ou seja, um valor que no varia. No entanto, colhendo uma certa amostra, podemos calcular
o valor dessa mdia amostral. At a tudo bem, pessoal? Ok, vamos em frente.
Selecionamos 5000 pessoas com idade entre 20 e 30 anos de todo o pas e
calculamos a mdia de seus pesos. Com essa mdia amostral calculada, podemos construir
um intervalo de confiana para a mdia populacional. Por exemplo:
Mdia populacional: no temos a menor idia de qual seja o seu valor
Mdia amostral: 70 kg
Intervalo de confiana de 90%: [60;80] kg
O que esse intervalo quer dizer? Esse intervalo quer dizer que temos 90% de chance
de a mdia populacional estar entre 60 e 80 quilos. Ns no sabemos qual o valor da mdia
populacional. No entanto, se pudssemos calcular o seu verdadeiro valor, podemos afirmar
que temos 90% de chance de esse valor estar entre 60 e 80 quilos.
Perceberam para que serve o intervalo de confiana? um modo de poder afirmar algo
sobre a populao, apenas com base em uma amostra. Agora, vamos aprender como se
constri um intervalo de confiana.
Para dar continuidade ao nosso estudo, devemos saber quais so os fatores que
influenciam no clculo do intervalo:

O nvel de confiana desejado intuitivo pensar que construir um intervalo com


90% de confiana deve ser diferente do que construir um intervalo com 80% de
confiana; quanto maior o nvel de confiana, maior o intervalo;
Varincia da populao um intervalo para uma populao com baixa variabilidade
ser diferente de um intervalo para uma populao com alta variabilidade; alm disso,
pode acontecer de no termos nenhuma informao sobre a variabilidade da
populao;
Tamanho da amostra tambm intuitivo pensar que construir um intervalo para
uma amostra pequena difere da construo do intervalo para amostras
consideravelmente grandes.

Para concursos da rea fiscal, os exerccios podero cobrar intervalos de confiana


para a mdia e para a proporo populacionais. Vamos aprender o passo a passo de cada
uma.
Se voc estiver cansado, pare um pouco e volte daqui a pouco. Essa uma parte da
matria que necessita de mais concentrao. Apesar de ser fcil, ela s se torna fcil depois
que voc parar de se confundir com o que ser dito. um pouco besta isso que eu falei, mas
assim mesmo! A matria simples, mas pode confundir muitos candidatos que no estudaram
direito os captulos anteriores. O intervalo de confiana para a mdia populacional ser
estudado em 1 lugar, e depois faremos o passo a passo para os intervalos da proporo
populacional.
1 caso: Intervalos para a mdia populacional
Sabemos que a mdia populacional ( ) um parmetro, isto , no muda de valor. A
mdia sempre ser aquilo e acabou! Agora, a mdia amostral ( ) ir variar de valor sempre
que uma amostra diferente for escolhida. Alguns valores so mais provveis de acontecer do
que outros, mas eles iro variar. Para ilustrar isso, suponha o seguinte conjunto de dados
(populao):
{1,5,5,5,5,6,15}

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 8

Estatstica

Prof.R.Dyodi

A mdia populacional igual a 6. Se tomarmos uma amostra de 3 valores, mais


provvel que o valor fique mais prximo de 5-6, mas pode ocorrer de ser maior ou menor do
que isso. Tudo que varia de valor pode ser considerado uma varivel, com uma certa
distribuio de probabilidades, ou seja, cada um dos valores possveis possui uma certa
probabilidade de ocorrer.
Ento, podemos ver que possui uma distribuio de probabilidades, ou seja, pode
ser considerada uma varivel aleatria. U, mas no um nmero? Se a amostra for
{5,5,5}, no ser igual a 5? Ento como voc pode dizer que a mdia amostral uma
varivel aleatria? Como voc pode dizer que ela tem uma distribuio de probabilidades?
Esse o ponto que confunde muita gente: uma varivel aleatria que possui uma
distribuio de probabilidade (nvel macro), mas para cada amostra escolhida, possvel
calcular (nvel micro). A mdia amostral deve ser vista sob estes 2 aspectos na resoluo
dos exerccio: uma varivel aleatria de maneira geral, e um valor para uma amostra
especfica.
Ok, Dyodi. Entendi. Mas que distribuio essa? Eu preciso saber?.
Surpresa! A distribuio de a distribuio normal. No tente entender, apenas saiba
que existe um teorema chamado Teorema do Limite Central que diz que possui uma
distribuio normal. isso que necessitamos saber.
Para mostrar o passo a passo, devemos saber que o modo de resolver os exerccios
ir variar dependendo das informaes fornecidas. Vamos ver numa tabela comparativa quais
so as possibilidades:
A varincia da populao conhecida
Utilizaremos a distribuio normal

A varincia da populao desconhecida


Utilizaremos a distribuio t de Student

A distribuio de ainda pode variar dependendo de outros fatores:

Se a populao possui uma distribuio normal ou no


Se o tamanho da amostra considerado grande ou pequeno
Se a populao finita ou infinita
Se h reposio ou no

No entanto, nunca vi questes sobre estes outros fatores em uma prova que no seja
especfica para o cargo de estatstico. Por este motivo, creio que devemos nos concentrar
apenas na tabela acima.
Iniciaremos com o caso de varincia populacional conhecida.
Quando a varincia da populao (

) conhecida, ter a seguinte distribuio:

A informao do quadro acima uma das chaves para o sucesso nas questes
de inferncia. Por favor, decorem esta informao. Assim, podemos dizer que possui uma
distribuio normal com os seguintes parmetros:
Mdia de :
Varincia de :
Isso quer dizer que a distribuio da mdia amostral ser uma normal com mdia igual
ao valor do parmetro em anlise e com varincia igual varincia da populao dividida pelo
nmero de elementos da amostra. Se a populao tiver varincia igual 9, por exemplo, e for
escolhida uma amostra com 10 elementos, a mdia amostral ter a distribuio a seguir:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 9

Estatstica

Prof.R.Dyodi

Observao: No estranhe o fato de ser desconhecido, porque isso faz todo o sentido. Se
conhecssemos o verdadeiro valor de , no haveria lgica em tentar inferir algo sobre .
Na verso antiga deste material, eu fiz a demonstrao de como chegar no intervalo de
confiana. No entanto, creio que este no o nosso objetivo. Queremos apenas resolver as
questes, pontuar de maneira rpida e efetiva, certo? Ento o que vamos fazer! Deixarei as
demonstraes de lado e vamos direto para a resoluo.
assim que voc vai decorar o intervalo de confiana:
Intervalo de confiana para a mdia populacional:
1 termo: mdia amostral mais ou menos

2 termo: z

3 termo: desvio padro de (lembrem-se da informao chave)

Pronto, acabou. Este o intervalo de confiana para a mdia populacional.

Dyodi, que valor de z esse?.


Esse valor ns vamos buscar nos dados do enunciado, na tabela normal. No tem que
fazer clculo nenhum. Vamos resolver as questes para ficar mais claro.
Exerccio resolvido sobre intervalo de confiana para mdias:
(FCC - 2012 ISS SP - Auditor)
Desejando-se estimar a mdia dos salrios de uma populao, que deve ser considerada de
tamanho infinito, com desvio padro conhecido e igual a R$ 100,00, selecionou-se uma
amostra aleatria de 100 elementos da populao que forneceu os resultados apresentados na
tabela abaixo:

Sabendo que x y = 2, e utilizando para a estimativa pontual de a mdia aritmtica dos 100
salrios apresentados, calculada considerando que todos os valores includos num intervalo
de classe so coincidentes com o ponto mdio do intervalo, um intervalo de confiana para ,
com coeficiente de confiana de 95%, , em reais, dado por
Se Z tem distribuio normal padro, ento:
P(Z < 0,84) = 0,80, P(Z < 1,5) = 0,933, P(Z < 1,96) = 0,975, P(Z < 2,5) = 0,994
(A) (3410,40; 3449,60)
(B) (3409,40; 3450,60)
(C) (3400,40; 3439,60)

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 10

Estatstica

Prof.R.Dyodi

(D) (3420,60; 3459,40)


(E) (3410,00; 3450,00)
Letra A
Resoluo:
Parece confuso? No confuso, precisamos ter frieza na hora da prova.
O que a questo pede? Ela pede um intervalo de confiana para a mdia. Ento, precisamos
encontrar:

Agora, vamos ver quais dados o enunciado forneceu.


O enunciado disse que a amostra tem 100 elementos:
O enunciado tambm disse que o desvio padro populacional conhecido e igual a 10:

Como o nvel de confiana de 95%, o valor de z igual a 1,96 (2,5% para a direita e 2,5%
para a esquerda).

Gente, a nica coisa que est faltando o valor de ! Todo o resto foi fornecido pelo
enunciado!
O enunciado diz que a mdia dos 100 salrios apresentados, ento vamos calcular. O 1
passo encontrar o valor de x e y.
Sabemos que:

Resolvendo o sistema:

Clculo da mdia:

Assim, o nosso intervalo de confiana ser:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 11

Estatstica

Prof.R.Dyodi

Exerccio resolvido sobre intervalo de confiana para mdias:


Ateno: Para resolver questo, utilize os valores que julgar mais apropriados (observar
sempre a melhor aproximao) da tbua da distribuio normal padro.

(FCC 2013 Sefaz SP Auditor)


A tabela abaixo apresenta a distribuio de frequncias de uma amostra aleatria de tamanho
100 da varivel X, que representa os percentuais de aumento do IPTU do ano de 2013
relativamente ao ano de 2012, num determinado municpio.

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 12

Estatstica

Prof.R.Dyodi

Suponha que X tem distribuio normal com mdia desconhecida, , e desvio padro
conhecido e igual a 5%. Utilizando para a estimativa pontual de a mdia aritmtica dos 100
valores apresentados (na tabela acima), calculada considerando que todos os valores includos
num intervalo de classe so coincidentes com o ponto mdio do intervalo, um intervalo de
confiana para , com confiana de 95%, dado por
(A) (15,64% ; 17,64%)
(B) (15,66% ; 17,62%)
(C) (15,60% ; 17,68%)
(D) (15,34% ; 17,94%)
(E) (15,68% ; 17,60%)
Letra B
Resoluo:
Novamente, a questo pede o intervalo de confiana para a mdia. Temos que lembrar que o
intervalo dado por

Quais foram as informaes do enunciado?


Desvio padro populacional conhecido e igual a 5:
Tamanho da amostra igual a 100:
Intervalo com nvel de confiana de 95%:
direita)

(2,5% para a esquerda e 2,5% para a

Ento, s nos resta encontrar o valor de :

O intervalo pedido :

Exerccio resolvido sobre intervalo de confiana para mdias:


(FGV - 2010 - SEAD AP Auditor)
Uma amostra aleatria simples de tamanho 400 de uma varivel populacional normalmente
distribuda com mdia desconhecida e varincia igual a 25 foi observada e indicou uma
mdia amostral igual a 12,52. O intervalo de 95% de confiana para dado por:
Dados:
Se Z tem distribuio normal padro, P[0 < Z < 1,64] = 0,45 ;P[0 < Z < 1,96] = 0,475; P[0 < Z < 2,33] = 0,49

(A) (12,03, 13,01)


(B) (11,65, 13,39)

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 13

Estatstica

Prof.R.Dyodi

(C) (10,99, 15,05)


(D) (10,44, 15,60)
(E) ( 9,99 , 16,05)
Letra A
Resoluo:
O enunciado diz que a varincia populacional conhecida e seu valor igual a 25. Alm disso,
o enunciado informa que a mdia amostral igual a 12,52.
Resumindo as informaes do enunciado (faam isso na hora da prova):

A nica coisa que falta para definirmos o nosso intervalo o valor de z. Que valor esse?
Como o nvel de confiana igual a 95%, queremos encontrar
Utilizando os dados do exerccio, podemos observar que
Observe graficamente:

.
.

O intervalo (rea hachurada) dado por:

Pode acontecer de a questo fornecer o valor do intervalo e pedir para voc encontrar
o valor do tamanho da amostra ou o valor do desvio padro, mas a metodologia ser a mesma.
Vamos ver como funciona?
Exerccio resolvido sobre intervalo de confiana para mdias:
(FCC - 2010 - Dnocs Economia)
Seja X uma varivel aleatria normalmente distribuda representando o salrio dos
empregados em um determinado ramo de atividade. Uma amostra aleatria de 100
empregados foi selecionada e apurou-se um intervalo de confiana de 95% para a mdia de X
como sendo [760,80; 839,20], supondo a populao de tamanho infinito e sabendo-se que o
desvio padro populacional igual a R$ 200,00. Caso o tamanho da amostra tivesse sido de
1.600 e obtendo-se a mesma mdia anterior, o intervalo de confiana de 95% apresentaria
uma amplitude igual a
(A) R$ 78,40.
(B) R$ 39,20.
(C) R$ 49,00.
(D) R$ 58,80.
(E) R$ 19,60.
Letra E

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 14

Estatstica

Prof.R.Dyodi

Resoluo:
Em 1 lugar, vamos passar as informaes para o papel:

Sabemos que o intervalo de confiana dado por

. Ento, a mdia amostral ficar

exatamente no meio do intervalo (isso meio lgico, porque a mdia amostral possui uma
distribuio normal, que simtrica).
Uma maneira rpida de encontrar o meio do intervalo somar os 2 extremos e dividir por 2.
Assim,

Como igual a 800, o termo

deve ser igual a 39,20. O valor de z no foi fornecido pelo

enunciado, mas possvel calcul-lo, pois temos o valor de n e o valor de

Se o valor da mdia amostral no se alterar, mas o tamanho da amostra subir para 1600, para
um mesmo nvel de confiana, o novo intervalo ficaria assim:

Portanto, a amplitude do novo intervalo seria igual a 19,6.


Exerccio resolvido sobre intervalo de confiana para mdias:
(FCC - 2011 - Infraero - Analista Superior Estatstico)
A populao das medidas dos comprimentos de um tipo de cabo considerada normalmente
distribuda e de tamanho infinito.
Seja a mdia desta populao com uma varincia populacional igual a 2,56
. Uma
amostra aleatria de 64 cabos apresentou um intervalo de confiana de (1 ), em metros, igual
a [61,6 ; 62,4]. Se na distribuio normal padro (Z) a probabilidade
, ento z
igual a
(A) 0,80.
(B) 1,20.
(C) 1,60.
(D) 2,00.
(E) 2,40.
Letra D
Resoluo:
O enunciado nos forneceu as seguintes informaes:

Como o enunciado forneceu o intervalo de confiana, vamos calcular o valor de :

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 15

Estatstica

Se o valor da mdia amostral igual a 62, o termo

Prof.R.Dyodi

deve ser igual a 0,4.

Exerccio resolvido sobre intervalo de confiana para mdia:


(FCC - 2006 - Bacen - Analista - rea 4)
A distribuio dos valores dos aluguis dos imveis em uma certa localidade bem
representada por uma curva normal com desvio padro populacional de R$ 200,00. Por meio
de uma amostra aleatria de 100 imveis neste local, determinou-se um intervalo de confiana
para a mdia destes valores, com um determinado nvel de confiana, como sendo [R$ 540,00
; R$ 660,00]. A mesma mdia amostral foi obtida com um outro tamanho de amostra, com o
mesmo nvel de confiana anterior, sendo o novo intervalo [R$560,00; R$ 640,00]. Nos dois
casos considerou-se infinito o tamanho da populao. O tamanho da amostra considerada no
segundo caso foi de
(A) 225
(B) 256
(C) 324
(D) 400
(E) 625
Letra A
Percebam que temos dois exerccio neste enunciado. Primeiro trabalhamos com uma amostra
de tamanho 100. Depois, trabalhamos com outra amostra, de tamanho a ser definido.
Informaes do enunciado:
desvio padro populacional de R$ 200,00:
amostra de tamanho 100:
intervalo: [R$ 540,00 ; R$ 660,00]
Se o valor da mdia amostral igual a 600, o termo

deve ser igual a 60.

Agora, vamos para a 2 parte do exerccio.


O enunciado diz que na 2 amostra, obtivemos a mesma mdia amostral com o mesmo nvel
de confiana. Ento:

E o novo intervalo de confiana dado por: [R$560,00; R$ 640,00]


Se a mdia amostral 600, o termo

deve ser igual a 40.

Quando a varincia populacional desconhecida, no podemos mais utilizar a


distribuio normal, mas o procedimento ser muito semelhante. Se a varincia populacional

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 16

Estatstica

Prof.R.Dyodi

for desconhecida, o exerccio ir fornecer o valor da varincia amostral (


no lugar de . Alm disso utilizaremos a distribuio t de Student.

que ser utilizada

Quer ver como fcil?


Como era o intervalo de confiana para a mdia, com varincia populacional
conhecida?

Agora, quando a varincia populacional desconhecida, o intervalo fica assim:

Como no conhecemos o desvio padro populacional, devemos utilizar o valor


amostral mesmo. Como diz o ditado: quem no tem co, caa com gato. bem a lgica do
negcio mesmo. Alm disso, ao invs de usar o valor z da normal padro, vamos utilizar o
valor t da distribuio t de Student.
Nos exerccios, para encontrar o valor de t nas informaes do enunciado, sempre
vamos procurar o nmero de graus de liberdade igual a (n-1). Vamos treinar:
Exerccio resolvido sobre intervalo de confiana para mdias:
(FCC - 2012 - TRE SP - Analista Estatstica)
As medidas dos comprimentos de uma pea fabricada por uma empresa apresentam uma
distribuio normal com desvio padro desconhecido. Uma amostra aleatria de 9 peas
apresentou uma mdia igual a 85 cm e um desvio padro igual a 15 cm. Considerando a
populao de tamanho infinito e
o quantil da distribuio t de Student para teste unicaudal
tal que P(t >
) = 0,005 com n graus de liberdade, obteve-se, com base nessa amostra, um
intervalo de confiana de 99% para a mdia populacional. Este intervalo de confiana, em cm,
igual a

(A) [67,50 ; 102,50].


(B) [68,20 ; 101,80].
(C) [68,75 ; 101,25].
(D) [69,15 ; 100,85].
(E) [69,50 ; 100,50].
Letra B
Resoluo:
Da leitura do enunciado, podemos tirar as seguintes informaes:

Como temos 9 elementos na amostra, o nmero de graus de liberdade (n 1) ser igual a 8.


Assim o valor de t tabelado igual a 3,36.
O intervalo ser dado por:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 17

Estatstica

Prof.R.Dyodi

Intervalo de confiana para mdias populacionais


A varincia da populao conhecida
A varincia da populao desconhecida
Utilizaremos a distribuio normal
Utilizaremos a distribuio t de Student

Observao: quando n > 30, tambm poder


ser usada a distribuio normal. Na prtica, o
enunciado da questo ir dizer qual
distribuio usar

2 caso: Intervalos para a proporo populacional


Assim como no caso da mdia, a proporo populacional
um parmetro e a
proporo amostral ( ) possui uma distribuio de probabilidades, que ser a seguinte:

A informao no quadro acima uma das chaves para o sucesso nas questes
de inferncia.
Podemos dizer que possui uma distribuio normal com os seguintes parmetros:
Mdia de :
Varincia de :
Agora, vamos fazer aquele esqueminha para voc decorar o intervalo de confiana no
caso de proporo?
1 termo: proporo amostral mais ou menos

2 termo: z

3 termo: desvio padro de

Pronto, este o nosso intervalo de confiana para a proporo populacional!

Dyodi, tem um problema com esse intervalo...Para o clculo do intervalo, de acordo


com a frmula, a gente precisa saber o valor de p. No entanto, esse valor desconhecido, no
? E agora, como fazer?.
Temos 2 solues possveis:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 18

Estatstica

Prof.R.Dyodi

Quando o exerccio mencionar varincia mxima, utilize


(a FGV j
cobrou isso)
Caso contrrio, utilize
(a maioria das questes utiliza esta soluo)

Exerccio resolvido sobre intervalo de confiana para propores:


(FCC - 2009 - Sefaz SP Auditor)
Em uma pesquisa de tributos de competncia estadual, em 2008, realizada com 400
recolhimentos escolhidos aleatoriamente de uma populao considerada de tamanho infinito,
80% referiam-se a determinado imposto. Deseja-se construir um intervalo de confiana de
95,5% para a estimativa dessa proporo. Considerando normal a distribuio amostral da
frequncia relativa dos recolhimentos desse imposto e que na distribuio normal padro a
probabilidade P (
) = 95,5%, o intervalo
(A) [0,70; 0,90]
(B) [0,72; 0,88]
(C) [0,74; 0,86]
(D) [0,76; 0,84]
(E) [0,78; 0,82]
Letra D
Resoluo:
Da leitura do enunciado, obtemos as seguintes informaes:

O intervalo da proporo populacional dado por:

Fazendo a aproximao de

, o intervalo igual a

3.3. Erro amostral e Tamanho da Amostra


Um outro modo de realizar a inferncia estatstica ocorre quando desejamos definir o
tamanho da amostra para que a diferena entre a mdia amostral e o valor do parmetro no
ultrapassem um valor mximo predefinido, que chamaremos de erro amostral ( ). Vou explicar
melhor.
Por exemplo, queremos analisar a nota dos alunos de uma grande universidade
brasileira. Para isso, selecionaremos uma amostra dessa populao de alunos. Queremos
tambm que o resultado dessa amostra seja bem representativa, ou seja, queremos que a
mdia das notas da amostra no difira demais da verdadeira mdia populacional (vamos supor
que 1 ponto est de bom tamanho). Para que isso acontea, qual o tamanho da amostra que
devemos selecionar, ou seja, quantos alunos devemos selecionar para que a nossa condio
seja satisfeita?
Este o caso das questes de erro amostral. A diferena entre o valor amostral e o
verdadeiro valor populacional chamada de erro amostral. No nosso exemplo, queremos que
essa diferena no seja maior do que 1 ponto. Assim, se a verdadeira mdia populacional for
igual a 7, a mdia da nossa amostra tem que estar entre 6 e 8. Para que isso acontea, qual o
tamanho da amostra?

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 19

Estatstica

Prof.R.Dyodi

Em outras palavras, devemos calcular qual tamanho de amostra ser necessrio para
que o erro amostral no ultrapasse certo valor predefinido, com um nvel de confiana . E
como vamos fazer isso?
Voc se lembra do intervalo de confiana para a mdia?

Basta voc igualar o valor do erro mximo que o enunciado pede com a parte circulada
abaixo:

Assim:

Vamos treinar!
Exerccio resolvido sobre erro amostral para mdias:
(FCC - 2007 - ISS SP Auditor)
Uma varivel aleatria X tem distribuio normal com mdia e desvio padro 100. O tamanho
da amostra para que a diferena, em valor absoluto, entre a mdia amostral e seja menor do
que 2, com coeficiente de confiana de 89%,
Dados: P(0 < Z < 1) = 0,341 , P(0 < Z < 1,6) = 0,445 , P(0 < Z < 2) = 0,477

(A) 1.000
(B) 2.200
(C) 2.800
(D) 3.600
(E) 6.400
Letra E
Resoluo:
Sabemos que a questo trata de erro amostral porque ela cita a diferena, em valor absoluto,
entra e mdia amostral e .
Os dados que o enunciado fornece so os seguintes:

Como temos o nvel de confiana, e utilizando os dados do exerccio, pode-se observar que

Fazendo a igualdade:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 20

Estatstica

Prof.R.Dyodi

Isso rpido ou no ?!
Gabarito letra E.
Exerccio resolvido sobre erro amostral:

Para resolver questo, considere as informaes dadas a seguir:


Se Z tem distribuio normal padro, ento:
P(Z < 0,75) = 0,773; P(Z < 1,25) = 0,894; P(Z < 1,4) = 0,919; P(Z < 1,75) = 0,96: P(Z < 2,05) = 0,98; P(Z < 2,4) = 0,992

(FCC - 2012 - TRT 6a - Analista Estatstica)


Seja X o consumo mensal de gua por residncia de um bairro de determinada cidade. Sabese que X tem distribuio Normal com = 10
e =2
. Seja a mdia amostral de uma
amostra de n residncias, selecionadas aleatoriamente e com reposio. Sabendo que P
|
|
, o valor de n
(A) 64.
(B) 36.
(C) 25.
(D) 16.
(E) 9.
Letra C
Resoluo:
Falou em diferena entre mdia amostral e mdia populacional, estamos diante de uma
questo de erro amostral.
Os dados fornecidos pelo enunciado so:

Como temos o nvel de confiana, e utilizando os dados do enunciado:

Obs: para quem ficou em dvida sobre como achar este valor de z, faa o desenho da normal,
treine! Agora vocs j possuem toda essa base.
Fazendo a igualdade:

No caso de propores, o procedimento idntico. O erro amostral dado por:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 21

Estatstica

Prof.R.Dyodi

O intervalo de confiana para propores era igual a:

Da mesma maneira que fizemos para a mdia, devemos igualar o erro mximo pedido
pelo enunciado com a parte circulada abaixo:

Assim:

Exerccio resolvido sobre erro amostral para propores:


(FCC - 2011 - TRT 1a - Analista Estatstico)
A proporo p dos funcionrios do sexo feminino de um rgo pblico de 20%. Colheu-se
uma amostra aleatria simples (AAS) com reposio de 64 funcionrios desse rgo e
calculou-se a proporo amostral, , de funcionrios do sexo feminino na amostra. Fazendo-se
uso da aproximao pela normal para a distribuio de , a probabilidade de que essa
proporo difira de p em menos do que 10%
Dados: P (Z < 0,28) = 0,61; P (Z < 1,28) = 0,9; P (Z < 1,5) = 0,933; P (Z < 1,96) = 0,975; P (Z < 2) = 0,977.

(A) 0,875.
(B) 0,895.
(C) 0,912.
(D) 0,944.
(E) 0,954.
Letra E
Resoluo:
Sabemos que a questo se trata de erro amostral porque ela diz a probabilidade de que essa
proporo ( ) difira de p em menos do que 10%.
Neste caso, o enunciado nos fornece o valor de n, que igual a 64, e quer que encontremos o
nvel de confiana :
Os dados fornecidos so:

Fazendo a igualdade:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 22

Estatstica

Prof.R.Dyodi

Pelos dados da normal padro fornecidos pelo enunciado, temos que:

A alternativa correta a letra E.


3.4. Teste de Hipteses
Algumas vezes, temos a intuio sobre alguma caracterstica da populao, mas no
temos certeza se a nossa intuio est certa. Qual o procedimento que deve ser feito?
Podemos colher uma amostra e testar a nossa teoria. O teste de hipteses consiste
basicamente nesse procedimento. Dependendo do resultado do teste, podemos descartar ou
no a nossa teoria.
Para testar uma teoria, do que iremos precisar? Em 1 lugar, lgico, precisaremos de
uma teoria que consideramos verdade (chamaremos esta teoria de hiptese nula). Alm disso,
precisaremos de uma teoria alternativa, ou seja, se o nosso teste der errado, essa hiptese
alternativa aquela que ser considerada verdadeira. E, por fim, precisaremos de um critrio
que possa nos dizer se possvel, ou no, considerar a nossa hiptese nula como verdade.
Vou utilizar um exemplo simples que eu costumo utilizar em sala de aula. Imagine que
eu tive um sonho revelador esta noite e que neste sonho eu me tornava um lutador de MMA
(para contextualiz-los, sou um japons magrinho de 1,65m de altura rsrs). Hmmm, acho que
eu tenho potencial mesmo! Vou fazer um teste antes de abandonar o servio pblico!. Como
eu acredito que posso ser um lutador de MMA, esta ser a minha hiptese nula:

Por outro lado, e se o teste no der certo? Qual ser a hiptese que considerarei como
verdadeira? Logicamente, a hiptese alternativa ser:

Agora, s nos resta estabelecer o critrio para dizer se aceito ou rejeito a minha
hiptese nula. Um critrio possvel seria: aguentar em p uma luta de 15 minutos na academia
do bairro. Assim, se eu conseguir aguentar esta luta de 15 minutos, aceito a minha hiptese
nula e rejeito a hiptese alternativa. Contudo, se eu no aguentar a luta em p, rejeito a
hiptese nula e aceito a hiptese alternativa.
A idia por trs do teste de hiptese esta!
Vamos reparar numa coisa: podemos cometer dois erros na realizao do teste. Como
assim, Dyodi?. Vamos detalhar, no se preocupe. Imagine que eu nasci com o DNA de lutador
e realmente tenho um dom para o MMA (note que eu no sei desse fato, e por isso estou
realizando o teste). Acontece que eu acabei dando azar e o adversrio que enfrentei era um
lutador espetacular, o novo Anderson Silva. Consequentemente, no aguentei os 15 minutos
em p. O que aconteceu neste caso?
Aconteceu que eu realmente tenho potencial para o MMA (fato que eu no sei), mas o
meu teste deu errado e rejeitamos a hiptese nula. Em outras palavras, a hiptese nula

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 23

Estatstica

Prof.R.Dyodi

verdadeira mas eu a rejeito. Perceberam que eu cometi um erro? Chamaremos este erro de
erro tipo I.
Outro erro possvel: no levo o menor jeito para o esporte, mas acabo enfrentando um
adversrio menor do que eu, um completo mo de alface, e nocauteio no 1 minuto de luta. O
que aconteceu neste caso?
Aconteceu que eu fiquei me achando o cara! Rsrs! Mas, alm disso, a hiptese nula
falsa, mas acabei aceitando-a. Temos aqui o que chamamos de erro tipo II.
Entenderam a lgica da coisa? Vamos trabalhar agora com a matria que vai cair na
sua prova. Para a rea fiscal, o teste de hiptese pode ser sobre a mdia ou sobre propores.
Suponha que uma pessoa tenha a intuio de que a mdia dos pesos dos porcos de
um chiqueiro igual a 100 kg (este valor populacional desconhecido para ns). Colhendo
uma amostra de porcos, verificou-se que a mdia amostral foi igual a 90 kg. E agora,
descartamos a nossa hiptese ou ela pode ser considerada vlida? A resposta da pergunta a
base do teste de hipteses.
Quando realizamos um teste de hipteses, o 1 passo definir qual hiptese
queremos testar (chamaremos de hiptese nula) e definir tambm qual ser a hiptese
alternativa, ou seja, qual ser a hiptese que iremos aceitar caso a nossa hiptese no
seja vlida. No exemplo acima:

Observe que formulamos 3 possibilidades para a hiptese alternativa, que so as 3


possibilidades que podero cair na sua prova. Existem outras possibilidades, mas eu nunca as
vi sendo cobradas para cargos que no so especficos na rea de estatstica. A forma como
definimos a hiptese alternativa influenciar todo o procedimento do teste de hipteses.
Antes de continuarmos, devemos lembrar que poderemos cometer dois tipos de erro:
erro tipo I e erro tipo II.
Erro tipo I: ocorre quando a hiptese nula verdadeira, mas ela rejeitada
Erro tipo II: ocorre quando a hiptese nula falsa, mas ela aceita
Dyodi, e quando a hiptese nula verdadeira e eu a aceito? E quando ela falsa e eu
a rejeito?. Bom, isso no erro e sim o procedimento certo, correto?
Exerccio resolvido sobre teste de hipteses:
(ESAF - 2006 - SUSEP - Analista Tecnico de Controle e Fiscalizao)
Em uma distribuio de sinistro S, formulando-se a hiptese de que no h diferena entre a
freqncia esperada e a observada (hiptese nula: Ho). Donde, segundo um determinado nvel
de significncia, podemos afirmar que ocorreu
a) um erro do tipo I, se for aceita a hiptese Ho.
b) um erro do tipo II, se for rejeitada a hiptese Ho.
c) um erro do tipo I, se for aceita a hiptese Ho, sendo esta correta.
d) um erro do tipo II, se for rejeitada a hiptese Ho, sendo esta correta.
e) um erro do tipo I, se for rejeitada a hiptese Ho, sendo esta correta.
Letra E
Resoluo:
Se o erro for do tipo I, a hiptese nula rejeitada. Assim, descartamos as letras A e C.
Se o erro for do tipo II, a hiptese nula aceita. Assim, descartamos as letras B e D.
A alternativa E corresponde definio que demos na teoria.

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 24

Estatstica

Prof.R.Dyodi

De que maneira a hiptese alternativa influencia o teste de hipteses? Primeiramente,


devemos saber que sempre trabalharemos com o erro tipo I. Isso quer dizer que sempre
iremos considerar a hiptese nula como verdadeira, e que cometeremos um erro se
rejeitarmos a hiptese quando ela for verdadeira. Gostaria de reiterar que isso serve para as
provas de fiscal, ok? Para provas que cobram a estatstica de maneira mais aprofundada, os
exerccios podem cobrar o erro tipo II tambm.
Rejeitando a hiptese nula, estaremos aceitando a hiptese alternativa. Ento, se
fixarmos uma probabilidade mxima ( ) de cometermos o erro tipo I, que chamaremos de nvel
de significncia, conseguimos construir um critrio, uma regio crtica, para optar pela
rejeio ou no de :

Se os dados da amostra indicarem que os valores obtidos pertencem regio


crtica, rejeitaremos ;
Se os dados da amostra indicarem que os valores obtidos no pertencem
regio crtica, no rejeitaremos .

Vamos visualizar o problema. Imagine uma rea protegida por um campo de fora e
quem ultrapassar esse campo de fora recebe um choque mortal. Quem estiver fora do campo
de fora no sofre nada, mas se ultrapassar vai morrer! a mesma coisa do teste de
hipteses: ultrapassou o campo de fora (regio crtica) a hiptese nula rejeitada; no
ultrapassou, a hiptese nula aceita.
Em 1 lugar, veremos o procedimento do teste para mdias. Lembrando que
possuem distribuio normal, suponha que o nvel de significncia fixado igual a 1%. Observe
como fica a construo da regio crtica (rea hachurada):

Temos um exemplo de regio


crtica para uma hiptese
alternativa
. A regio crtica
regio na qual rejeitamos
e
aceitamos . Por isso ela deve
ficar no lado esquerdo da
distribuio.

Temos um exemplo de regio


crtica para uma hiptese
alternativa
. A regio crtica
regio na qual rejeitamos
e
aceitamos . Por isso ela deve
ficar no lado direito da
distribuio.

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 25

Estatstica

Prof.R.Dyodi

Temos um exemplo de regio


crtica para uma hiptese
alternativa
. A regio crtica
regio na qual rejeitamos
e
aceitamos . Uma vez que o erro
pode ser cometido em ambas as
direes, e regio crtica deve
ficar nos lados esquerdo e direito.
Como
, cada uma das
reas hachuradas deve valer 0,5%.

Observao: Da mesma maneira como ocorreu no intervalo de confiana, utilizaremos a


distribuio normal se a varincia da populao for conhecida e a distribuio t de Student se a
varincia da populao for desconhecida.
Para a construo da regio crtica quando a varincia populacional conhecida,
devemos trabalhar com a normal padro Z. Assim, podemos achar o valor de z, tal que

Em outras palavras, o valor de z que vai definir onde comea a regio crtica obtido
atravs da tabela normal, dos dados do enunciado. Este valor de z chamado de
. Nas
figuras acima, este valor representa o z que define onde comea a rea hachurada.
Agora, s nos resta converter o valor da amostra em Z para descobrirmos se o valor
obtido atravs da amostra pertence ou no regio crtica. Este valor convertido ser chamado
de
.
Vamos ver como as questes sobre teste de hipteses so simples e rpidas:
Exerccio resolvido sobre teste de hipteses:
(FCC - 2010 - Dnocs Economia)
Em um teste de hiptese estatstico, sendo H0 a hiptese nula e H1 a hiptese alternativa, o
nvel de significncia do teste consiste na probabilidade de
(A) aceitar H0 dado que H0 verdadeira.
(B) rejeitar H0 dado que H0 falsa.
(C) aceitar H0, independentemente se H0 verdadeira ou falsa.
(D) aceitar H0 dado que H0 falsa.
(E) rejeitar H0 dado que H0 verdadeira.
Letra E
Resoluo:
Conforme a explicao, nvel de significncia a mesma coisa que a probabilidade de cometer
o erro tipo I. Assim, o gabarito s pode ser a letra E.
Exerccio resolvido sobre teste de hipteses para mdias:
(FCC - 2009 - Sefaz SP Auditor)

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 26

Estatstica

Prof.R.Dyodi

O gerente de uma indstria de determinado componente eletrnico garante que a vida mdia
do produto fabricado igual a 100 horas. Um comprador desta indstria decide testar a
afirmao do gerente e faz um teste estatstico formulando as hipteses H0: = 100 e H1 :
, sendo que H0 a hiptese nula, H1 a hiptese alternativa e a mdia da
populao considerada de tamanho infinito com uma distribuio normal. O desvio padro
populacional igual a 10 horas e utilizou-se a informao da distribuio normal padro (Z),
segundo a qual a probabilidade P(Z 1,64) = 5%. H0 foi rejeitada com base em uma amostra
aleatria de 64 componentes em um nvel de significncia de 5%. Ento, o valor da mdia
amostral foi, em horas, no mximo,
(A) 94,75
(B) 95,00
(C) 96,00
(D) 96,50
(E) 97,95
Letra E
Resoluo:
Como a hiptese alternativa do tipo
, sabemos que a regio crtica fica do lado
esquerdo da distribuio normal. Devemos encontrar o valor de z tal que
, pois o
nvel de significncia do teste igual a 5%.
Com os dados do enunciado, sabemos que

Agora, s nos resta encontrar o valor de


, que ser obtido pela converso de em Z,
e considerando a hiptese nula como verdadeira. Assim:

Como o enunciado disse que


foi rejeitada, o valor de
crtica, ou seja, deve ser menor do que -1,64. Ento

deve pertencer regio

Exerccio resolvido sobre teste de hipteses para mdia:


(FCC - 2006 - Sefaz SP Auditor)
Seja X uma varivel aleatria representando o valor arrecadado de um determinado tributo.
Suponha que X tem distribuio normal (populao de tamanho infinito) com mdia e desvio
padro de 500 reais. Desejando-se testar
H0 : = 1.000 reais (hiptese nula)
H1 : 1.000 reais (hiptese alternativa)
tomou-se uma amostra aleatria de 400 valores de X, obtendo-se para a mdia amostral o
valor de 1.060 reais. Seja o nvel de significncia do teste e suponha que a regio de rejeio

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 27

Estatstica

de H0 {| |
}, onde
) = . Tem-se que

Prof.R.Dyodi

representa o escore da curva normal padro tal que P(| |

(A) Se H0 foi rejeitada, existe um nvel de significncia ( > ) tal que H0 no seria rejeitada.
(B) Para qualquer nvel de significncia , H0 ser rejeitada, uma vez que 1.060 1.000.
(C) H0 no ser rejeitada para
.
(D) H0 ser rejeitada para
.
(E) Para
, H0 no ser rejeitada.
Letra D
Resoluo:
Como a hiptese alternativa do tipo 1.000, sabemos que a regio crtica fica do lado
direito e do lado esquerdo do grfico.
Percebam que o enunciado no nos disse qual o nvel de significncia, ento no temos o
valor de
.
Obs: a questo chama o
de
. Este sobre 2 significa que a regio crtica fica nos
dois lados do grfico, coisa que j sabamos de antemo.
Vamos encontrar o valor de

Agora, vamos analisar as alternativas.


Alternativa A: Se a hiptese nula foi rejeitada para um nvel de significncia , qualquer outro
nvel de significncia MAIOR do que tambm rejeitaria a hiptese nula. O nosso campo de
fora, a regio crtica iria aumentar de tamanho! Item incorreto.
Alternativa B: bullshit! Pessoal, toda alternativa que afirmar que sempre vai rejeitar, que sempre
no vai rejeitar, sem fornecer condio nenhuma, est falando besteira, pra no colocar outra
palavra mais feia aqui.
Alternativa C: Item errado, vamos ver como ficaria o nosso esquema.

Se o
for igual a 3, realmente a nossa hiptese nula no rejeitada. Mas olhe
novamente para a alternativa: o item fala de
menor do que 3. Aquela rea hachurada
iria aumentar de tamanho, se aproximando do eixo central. Assim, em algum nvel de
significncia, o valor de 2,4 ficaria dentro da regio crtica. Por este motivo, a letra C fica
incorreta.

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 28

Estatstica

Alternativa D: Perfeito! Observem abaixo como o nosso

Alternativa E: Se a hiptese nula rejeitada para


qualquer
maior do que 2.

Prof.R.Dyodi

fica dentro da regio crtica.

igual a 2, ela tambm o ser para

Para a construo da regio crtica quando a varincia populacional desconhecida,


devemos trabalhar com a distribuio t de Student. Assim, podemos achar o valor de t, tal que

Agora, s nos resta converter o valor da amostra em T para descobrirmos se o valor


obtido atravs da amostra pertence ou no regio crtica. Este valor convertido ser chamado
de
.
Exerccio resolvido sobre teste de hipteses para mdias:
(FCC - 2010 - Metro - Analista Trainee Estatstica)
Um grande fabricante de certo produto afirma que as unidades produzidas por sua empresa
pesam em mdia 10 kg. Considera-se que os pesos das unidades produzidas so
normalmente distribudos. Para testar a hiptese do fabricante, selecionou-se aleatoriamente 9
unidades do produto apurando-se uma mdia correspondente igual a 9 kg com a soma dos
quadrados dos pesos destas 9 unidades igual a 761
. Foram formuladas as hipteses H0:
= 10 kg (hiptese nula) contra H1: < 10 kg (hiptese alternativa). Utilizando o teste t de
Student, obtm-se que o valor da estatstica t (t calculado) a ser comparado com o t tabelado
igual a
(A) -1,50.
(B) -1,40.
(C) -1,25.
(D) -1,00.
(E) -0,75.
Letra A
Resoluo:
Vamos por partes. Os dados fornecidos pelo enunciado so:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 29

Estatstica

Prof.R.Dyodi

Percebe-se que a varincia populacional no foi fornecida, ento devemos trabalhar com a
distribuio t de Student.
Como o enunciado forneceu uma soma de quadrados, utilizaremos a segunda frmula da
varincia para calcular a varincia amostral :

Assim, o valor

igual a:

No caso de propores, o procedimento ser idntico ao utilizado para os testes de hipteses


para mdias, com a nica diferena de que a distribuio normal da proporo possui
parmetros diferentes da distribuio normal da mdia. Vamos ver atravs de um exerccio:
Exerccio resolvido sobre teste de hipteses para propores:
(FCC - 2009 - TRT 7a - Analista Estatstica)
Em uma cidade realizada uma pesquisa sobre a preferncia dos eleitores com relao a um
determinado candidato, que afirma ter 60% da preferncia. Uma amostra aleatria de tamanho
600 foi extrada da populao, considerada de tamanho infinito, sendo que 330 eleitores
manifestaram sua preferncia pelo candidato. Com base nesta amostra, deseja-se testar a
hiptese H0 : p = 60% (hiptese nula) contra H1 : p 60% (hiptese alternativa), em que p a
proporo dos eleitores que tm preferncia pelo candidato. Para a anlise considerou-se
normal a distribuio amostral da frequncia relativa dos eleitores que tm preferncia pelo
candidato e que na distribuio normal padro Z a probabilidade P(|Z| 1,96) = 95% e P(|Z|
2,58) = 99%.
A concluso que H0
(A) no rejeitada tanto ao nvel de significncia de 1% como ao nvel de significncia de 5%.
(B) rejeitada ao nvel de significncia de 5%.
(C) rejeitada ao nvel de significncia de 1%.
(D) no rejeitada para algum nvel de significncia superior a 5%.
(E) rejeitada para algum nvel de significncia inferior a 1%.
Letra B
Resoluo:
O enunciado nos fornece as seguintes informaes:

Como a hiptese alternativa do tipo


de significncia , ser do tipo:

O valor de

, temos que a nossa regio crtica, para um nvel

ser igual a:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 30

Estatstica

Prof.R.Dyodi

Agora, para sabermos se a hiptese deve ou no ser rejeitada, devemos ver se


pertence ou no regio crtica.
Para um nvel de significncia de 5%,
valor de
pertence regio crtica e

. Ento, o
rejeitada.

Para um nvel de significncia de 1%,


valor de
no pertence regio crtica e

. Ento, o
no rejeitada.

3.5. Probabilidade de Significncia, Nvel Descritivo do Teste ou p-valor


Probabilidade de significncia, nvel descritivo do teste ou p-valor so denominaes
diferentes para uma mesma metodologia. Em provas, pode aparecer como qualquer uma das
trs.
Trata-se de um mtodo alternativo para o teste de hipteses, com a diferena que no
ser preciso construir uma regio crtica.
Voc se lembra do
e do
nos teste de hipteses? O p-valor apenas
uma probabilidade de ocorrer um valor mais extremo do que o
ou
. Assim, se
o
for igual a 2, o p-valor o valor da probabilidade
. Se o
for igual a
-3, o p-valor o valor da probabilidade
.
Quando o exerccio fornecer o valor do nvel de significncia do teste, a hiptese nula
ser rejeitada quando o p-valor for menor do que o nvel de significncia.
Condies
Se p-valor < nvel de significncia
Se p-valor > nvel de significncia

Resultado do teste de hipteses


Devemos rejeitar a hiptese nula
Devemos aceitar a hiptese nula

Exerccio resolvido sobre p-valor:


(FCC - 2012 ISS SP - Auditor)
Testes realizados pela industria Cookwell indicam que seu forno de microondas tem
probabilidade 0,1 de apresentar a 1a falha antes de 1000 horas de uso. Um novo mtodo de
produo est sendo implantado e os tcnicos garantem que a probabilidade acima deve
diminuir. Com o objetivo de verificar esta afirmao, tomou-se uma amostra de 144 aparelhos e
os resultados indicaram 9 com a 1a falha antes de 1000 horas de uso. O valor do nvel
descritivo do teste, calculado atravs da proporo amostral, supondo que a mesma tem
distribuio aproximadamente normal e no considerando qualquer correo de continuidade,
,
Se Z tem distribuio normal padro, ento:
P(Z < 0,84) = 0,80, P(Z < 1,5) = 0,933, P(Z < 1,96) = 0,975, P(Z < 2,5) = 0,994

(A) 0,6%.
(B) 1%.
(C) 2,5%.
(D) 6%.
(E) 6,7%.
Letra E
Resoluo:
Como o enunciado cobra o valor do nvel descritivo do teste, a nossa 1 tarefa encontrar o
valor de
.

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 31

Estatstica

Prof.R.Dyodi

Observe que a nossa hiptese nula a seguinte:


Ento,

3.6. Teste de Hipteses para Propores com Qui-Quadrado


Existe um tipo de questo sobre teste de hipteses que frequentemente visto em
provas especficas de estatstico. No entanto, a FCC j cobrou o tema na prova do ICMS/SP
em 2009 e a FGV tambm j cobrou o tema em 2006 na prova do ICMS/MS. Trata-se do teste
de hipteses para propores com qui-quadrado.
Sei que voc j est muito cansado, mas estamos quase no final do curso. Prepare o
flego para o ltimo sprint. O tema em questo simples e fcil, alm de ser cobrado sempre
da mesma maneira em provas. o tipo de questo que o concurseiro sempre torce para cair
na prova, pois no tem como errar (para quem estudou, lgico) e normalmente os candidatos
se assustam s de ouvir falar em qui-quadrado.
Neste tipo de teste, as hipteses nula e alternativa sero:

Alm disso, utilizaremos

Outro dado importante: o nmero de graus de liberdade ser igual a

Quando
Quando
Dyodi, no entendi merd* nenhuma! Como assim ou no proporcional? O que ou
no proporcional? Me explica melhor, por favor?. Lgico que sim, vamos l.
Imagine que, durante a semana, eu beba coca-zero da seguinte maneira (o nmero
representa a quantidade de garrafas 600ml):
Segunda
3

Tera
3

Quarta
3

Quinta
3

Sexta
3

Sbado
3

Domingo
3

Eu pergunto: a quantidade de garrafas 600ml de coca-zero que eu bebo por semana


depende do dia da semana? Neste caso, no depende do dia da semana. Em outras palavras,
a quantidade de coca-zero proporcional aos dias da semana.
Observe um outro caso:
Segunda
0

Tera
0

Quarta
0

Quinta
0

Sexta
0

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Sbado
10

Domingo
11

Pgina 32

Estatstica

Prof.R.Dyodi

Fao a mesma pergunta: a quantidade de garrafas 600ml de coca-zero que eu bebo


por semana depende do dia da semana? Neste caso, est claro que a quantidade ingerida de
refrigerante depende do dia da semana. Durantes os dias teis, no bebo nada. No entanto,
nos finais de semana o refrigerante liberado. A quantidade ingerida no proporcional em
relao aos dias da semana.
Um ltimo caso:
Segunda
2

Tera
4

Quarta
2

Quinta
4

Sexta
1

Sbado
5

Domingo
3

E agora? proporcional ou no? Alguns podem achar que sim, enquanto outros
podem achar que no. Perceberam que analisar apenas pelo olho muito subjetivo? O teste
qui-quadrado uma maneira de analisar o problema com objetividade, seguindo certos
critrios.
A maneira mais fcil de entender o mecanismo atravs de um exerccio, ento vamos
a ele.
Exerccio resolvido sobre teste de hipteses para propores com qui-quadrado:
(FCC - 2012 - TRE SP - Analista Estatstica)
Em uma cidade foi realizada uma pesquisa entre 600 eleitores, escolhidos aleatoriamente, com
relao preferncia entre 2 candidatos X e Y para o cargo de prefeito. Esta pesquisa
forneceu 2 grupos de eleitores, sendo 375 homens e 225 mulheres. Cada eleitor forneceu uma
e somente uma resposta, na pesquisa, se preferia X ou Y.

O objetivo verificar, com relao a estes eleitores, se a preferncia pelos candidatos depende
do sexo, utilizando o teste quiquadrado a um determinado nvel de significncia .
Dados:
Valores crticos da distribuio qui-quadrado [P(qui-quadrado com n graus de liberdade) < valor
tabelado = 95%]

correto afirmar que


(A) o valor do qui-quadrado observado igual a 4,0.
(B) existe um nvel de significncia inferior a 5% tal que a concluso que depende do sexo.
(C) o valor do qui-quadrado observado igual a 3,2 e o nmero de graus de liberdade igual a
2.
(D) no existe um nvel de significncia tal que a concluso que depende do sexo.
(E) para qualquer nvel de significncia inferior a 5%, a concluso que independe do sexo.
Letra E
Resoluo:
Neste tipo de teste, vimos que a hiptese nula sempre diz que as propores populacionais
so todas iguais. Neste exemplo, isso quer dizer que a preferncia por um dos candidatos
independe se a pessoa escolhida for homem ou mulher. Homens e mulheres pertencem a uma
mesma populao, ou seja, a preferncia pelo candidato X ser proporcionalmente igual tanto
para o grupo de homens como para o grupo de mulheres.
Observe a tabela:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 33

Estatstica

Prof.R.Dyodi

Existem 600 pessoas na amostra e 1/3 preferem o candidato X enquanto 2/3 preferem o
candidato Y.
Considerando a hiptese nula verdadeira, 1/3 dos homens e 1/3 das mulheres preferem o
candidato X enquanto que 2/3 dos homens e 2/3 das mulheres preferem o candidato Y.
Agora, o macete da questo inserir os valores esperados entre parnteses ao lado dos
valores observados:

(125)

(250)

(75)

(150)

Para calcular o valor da estatstica


basta elevar a diferena entre o valor observado e o valor
esperado e dividir pelo valor esperado:

Para concluir a questo, devemos comparar o qui-quadrado calculado com o qui-quadrado


tabelado. O qui-quadrado tabelado depende do nmero de graus de liberdade:

Observe que quando contamos as linhas e colunas, no devemos incluir o valor dos totais, mas
somente as linhas e colunas que representam realmente os dados.
Como qui-qudrado calculado < qui-qudrado tabelado, a hiptese nula no rejeitada para um
nvel de significncia de 5% ou menor.

Exerccio resolvido sobre teste de hipteses para propores com qui-quadrado:


(FCC - 2009 - Sefaz SP Auditor)
Espera-se que o nmero de reclamaes tributrias em um rgo pblico durante determinada
semana seja igual a 25, em qualquer dia til. Sabe-se que nesta semana ocorreram 125
reclamaes com a seguinte distribuio por dia da semana:

Para decidir se o nmero de reclamaes tributrias correspondente no depende do dia da


semana, a um nvel de significncia , calculado o valor do qui-quadrado ( ) que se deve
comparar com o valor do qui-quadrado crtico tabelado com 4 graus de liberdade. O valor de
( )
(A) 1,20
(B) 1,90

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 34

Estatstica

Prof.R.Dyodi

(C) 4,75
(D) 7,60
(E) 9,12
Letra D
Resoluo:
Neste tipo de teste, vimos que a hiptese nula sempre diz que as propores populacionais
so todas iguais. Neste exemplo, isso quer dizer que todas as reclamaes vieram de uma
mesma populao, de modo que o seu valor esperado igual para todos os dias da semana.
Como ocorreram 125 reclamaes em 5 dias teis, espera-se que ocorra 25 reclamaes em
cada dia da semana.

(25)

(25)

O exerccio pede apenas o valor

(25)

(25)

(25)

que igual a

3.7. Regresso e Correlao


Muitas vezes, gostaramos de analisar 2 variveis conjuntamente para saber se existe
alguma relao entre elas. Para fins de concurso, os dois procedimentos para uma anlise
bivariada (2 variveis em estudo) so a correlao e a regresso.
A correlao uma medida que quantifica o grau de associao entre duas variveis.
A regresso um procedimento que busca encontrar uma equao matemtica para
descrever o relacionamento entre as duas variveis.
Um dispositivo til para verificar se h relao entre as variveis o diagrama de
disperso. Observe os diagramas de disperso abaixo:

Enquanto o diagrama do lado esquerdo nos mostra uma relao linear entre X e Y, o
diagrama do lado direito nos mostra que as variveis X e Y no possuem uma relao linear.
Cuidado, no ter uma relao linear no significa que as variveis no possuem nenhum
tipo de relao. No entanto, estamos interessados apenas em estudar as relaes lineares.
Exerccio resolvido sobre regresso e correlao:
(FCC - 2012 ISS SP - Auditor)

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 35

Estatstica

Prof.R.Dyodi

Considere as seguintes afirmaes:


I. Um dispositivo til quando se quer verificar a associao entre duas variveis quantitativas
o grfico de disperso entre essas duas variveis.
II. (suprimido)
III. (suprimido)
IV. (suprimido)
(A) I e II.
(B) I e III.
(C) II e IV.
(D) I.
(E) II e III.
Letra D
Resoluo:
Sem muitos comentrios. Vimos nos exemplos acima que o diagrama de disperso nos ajuda a
avaliar o grau de associao entre duas variveis.
Exerccio resolvido sobre regresso e correlao:
(FCC 2013 Sefaz SP Auditor)
Considere:
I. (suprimido)
II. Um dispositivo til quando se deseja verificar se existe correlao linear entre duas variveis
o grfico de colunas justapostas.
III. (suprimido)
IV. (suprimido)
Est correto o que se afirma APENAS em
(A) I.
(B) II.
(C) III.
(D) I e IV.
(E) IV.
Resoluo:
Para analisar a correlao linear entre duas variveis, o correto seria utilizar um diagrama de
disperso. Item incorreto.
Vamos iniciar com o estudo sobre a regresso linear, e posteriormente estudaremos a
correlao linear.
A regresso linear consiste basicamente em traar uma linha reta que melhor
represente o conjunto de pontos do diagrama de disperso. A reta no precisa passar por cima
de todos os pontos do diagrama, mas isso no a impede de representar bem a relao entre as
variveis.
Os conceitos de populao e amostra tambm se aplicam ao estudo sobre regresso.
Imagine que temos todos os dados da populao sobre as variveis X e Y. Desta maneira,
escolhendo um critrio, seria possvel traar a reta que melhor representasse a relao entre
as duas variveis. No entanto, como no temos os dados da populao na maioria das vezes,
devemos encontrar uma reta que represente bem a relao populacional baseada em uma
amostra das duas variveis. Observe alguns resultados possveis:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 36

Estatstica

Prof.R.Dyodi

Ento, o nosso objetivo encontrar uma reta, com base em dados amostrais, que
melhor possa representar a relao populacional entre as variveis X e Y. Agora, voc deve se
fazer a seguinte pergunta: Mas se eu no conheo a reta de regresso populacional, como
vou saber se a reta que eu tracei representa bem a populao?. Por conta deste problema,
criou-se um mtodo chamado de Mtodo dos Mnimos Quadrados, que consiste basicamente
em minimizar o quadrado dos desvios em relao reta de regresso populacional. Observe:

A utilizao do Mtodo dos Mnimos Quadrados no significa que, necessariamente, a


reta encontrada ir representar bem a populao. No entanto, a sua utilizao nos permite
dizer que a reta encontrada a melhor reta possvel de se encontrar com aquela amostra.
Perceba que so duas coisas diferentes.
Assim, podemos dizer que uma estimativa de , que uma estimativa de e
que uma estimativa de . Alm disso, o desvio a diferena entre e e o mtodo dos
.
mnimos quadrados busca minimizar o
Exerccio resolvido sobre regresso linear:
(ESAF - 2009 - Receita Federal Auditor)
Na anlise de regresso linear simples, as estimativas e dos parmetros e da reta de
regresso podem ser obtidas pelo mtodo de Mnimos Quadrados. Nesse caso, os valores
dessas estimativas so obtidos atravs de uma amostra de n pares de valores Xi Yi com (i =1,
2, ....,n), obtendo-se: = + X i , onde a estimativa de Yi = + Xi . Para cada par de
valores Xi Yi com (i =1, 2, ...,n) pode-se estabelecer o desvio ou resduo aqui denotado por
entre a reta de regresso Yi e sua estimativa . Sabe-se que o Mtodo de Mnimos
Quadrados consiste em adotar como estimativas dos parmetros e os valores que
minimizam a soma dos quadrados dos desvios . Desse modo, o Mtodo de Mnimos
Quadrados consiste em minimizar a expresso dada por:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 37

Estatstica

Prof.R.Dyodi

Questo anulada

Resoluo:
Pelo mtodo dos mnimos quadrados, devemos minimizar o somatrio (
ser escrito da seguinte forma:
(

) , que pode

Questo muito simples para quem estudou, mas muito enrolada para quem nunca viu o
assunto.
A resposta correta seria a letra B, mas a banca esqueceu de tirar o parntese da alternativa...
A maioria das questes sobre regresso versa sobre o clculo dos parmetros .
Eu costumo brincar em sala de aula que, neste caso, elas podem aparecer em trs nveis
diferentes: jnior, fcil e mdio. Comearemos pelo nvel jnior, que no demanda nenhum
conhecimento que vocs j no tenham adquirido.
Nvel Jnior:
Neste nvel, a questo basicamente pede que encontremos uma equao para a reta,
dado que o enunciado fornece dois pontos que passam por ela. Assim, se a equao da reta
, teremos que calcular o valor do coeficiente angular (sempre ser o
for do tipo

termo que est multiplicando a varivel, ou seja, ser o ) e o valor do intercepto .

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 38

Estatstica

Prof.R.Dyodi

Conhecendo dois pontos que pertencem reta, podemos encontrar o valor dos
parmetros .

O valor de ser encontrado por substituio.


S gostaria de fazer uma pequena observao: algumas vezes, pode parecer que o
enunciado s forneceu um ponto pertencente reta. Se fosse assim, no teramos como sair
do lugar. O 2 ponto provavelmente estar implcito no enunciado. Como assim, Dyodi?. Uma
informao importante diz que a reta calculada pelo mtodo dos mnimos quadrados sempre
passar pelo ponto . Isso ser utilizado em alguns exerccios.
Exerccio resolvido sobre regresso linear:
(FCC - 2012 - TRF 2a - Analista Estatstica)
Pelo grfico correspondente reta obtida pelo mtodo dos mnimos quadrados com base em
10 pares de observaes (X1,Y1), (X2,Y2), . . . ,(X10,Y10), verifica-se que a reta passa pelo
ponto (2 , 100). O modelo adotado foi Yi =
+ Xi +
, em que Yi representa o valor da
varivel dependente na i-sima observao, Xi o valor da varivel explicativa na i-sima
observao e o erro aleatrio com as respectivas hipteses consideradas para a regresso
linear simples.
e
so os parmetros do modelo, cujas estimativas foram obtidas pelo
mtodo dos mnimos quadrados. Dado que as mdias das observaes de Xi e Yi so iguais a
10 e 75, respectivamente, ento a previso do valor de Y, quando X = 16, igual a
(A) 60,75.
(B) 56,25.
(C) 50,75.
(D) 48,25.
(E) 40,75.
Letra B
Resoluo:
Sabemos que a reta passa pelo ponto (2, 100).
Alm disso, sabemos que a reta de mnimos quadrados sempre passar por , que igual
a (10, 75).

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 39

Estatstica

Prof.R.Dyodi

Ento, o valor de ser igual a

Para facilitar a visualizao, sempre bom fazer um esboo da reta de regresso passando
pelos dois pontos. Deste modo, pelo menos teremos certeza se o sinal encontrado para
(positivo ou negativo) est certo ou errado. Como a inclinao para baixo, o sinal de deve
ser negativo.

Escolhendo qualquer um dos pontos e substituindo o valor de na equao, encontramos o


valor de :

Assim, a equao da reta ser:

Ento, quando X for igual a 16, Y ser igual a:

Em relao aos nveis fcil e mdio, devemos decorar algumas frmulas. No me


xingue e no fique desesperado, por favor! Sei que vocs precisam decorar muitas coisas para
a prova, mas o sacrifcio necessrio. Alm disso, voc deve concordar que essa apostila
bem menor do que o livro de Tributrio, de Constitucional, Administrativo...
Para facilitar a decoreba, inventei alguns mnemnicos para a frmula de

Nvel Fcil:
O nvel fcil aparece quando o enunciado nos fornece o valor de e pede para que
calculemos o valor de , ou vice-versa. Neste caso precisamos apenas decorar a frmula do .
Frmula do alfa: AY, BiXo No!

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 40

Estatstica

Prof.R.Dyodi

Nvel Mdio:
No nvel mdio, alm da frmula do , devemos saber a frmula do .
Frmula do beta: Bem, XiXi no YoYo da XuXa2!

Frmula alternativa do beta (decore-a tambm): XYXY No! XuXa No!

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 41

Estatstica

Prof.R.Dyodi

A frmula a ser utilizada para encontrar o valor de ir depender dos dados do


exerccio.
Dyodi, na boa...No vou decorar as duas frmula no!. Para quem for fazer provas da
FCC, eu digo que a frmula alternativa do beta a que mais cai em provas, mas eu aconselho
a decorar somente a 1 frmula.
H?! Voc t louco?! Se a 2 frmula a que mais cai em provas, porque voc
aconselha a decorar somente a 1?.
Eu s coloquei a 2 frmula para auxili-los na visualizao, mas saibam que quem
decora a 1 consegue chegar na 2. Mais uma vez, aqui podemos utilizar todo o conhecimento
j adquirido nas aulas passadas! Para que decorar uma coisa que voc j sabe? Vou provar
que quem estudou direitinho at aqui sabe desenvolver a 2 frmula sem decor-la. Assim,
peo que vocs observem a 1 e a 2 frmulas da varincia (lembram disso, n?):

Se a varincia calculada pelas duas frmulas tem que dar o mesmo resultado, ento as
duas frmulas se equivalem, correto? Notem que o denominador igual nas duas frmulas.
Concluso: as partes circuladas tem que ser iguais!
Agora, vamos ver como a 2 frmula do beta pode ser desenvolvida sabendo apenas a
1:

Ok, Dyodi. Mas e o numerador?. Pessoal,


no a mesma coisa que

no a mesma coisa que 2.2? Ento

Ento, por analogia:

Espero ter ajudado desta maneira. Mas, para quem preferir decorar, sempre existem os
mnemnicos.
Exerccio resolvido sobre regresso linear:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 42

Estatstica

Prof.R.Dyodi

(FCC - 2011 - Copergas - Analista Economia)


A tabela abaixo apresenta os lucros (varivel Y), em milhes de reais, de uma companhia no
perodo de 5 anos (varivel X):

A previso de lucro para o ano 6, em milhes de reais, calculada quando se ajusta aos dados a
reta de mnimos quadrados, igual a
(A) 7,6.
(B) 7,7.
(C) 7,8.
(D) 7,9.
(E) 8,0.
Letra A
Resoluo:
Pelos valores da tabela, conseguimos descobrir mais valores de somatrio:

Trata-se de uma questo de regresso de nvel mdio, ou seja, devemos utilizar as frmulas de
alfa e beta.
Em 1 lugar, devemos encontrar o valor de beta:

Com o valor de beta, podemos calcular o valor de alfa:

Assim, a nossa reta de regresso :

Agora, s nos resta encontrar o lucro no ano 6, ou seja, o valor de Y quando X for igual a 6:

Exerccio resolvido sobre regresso:


(FCC - 2010 - Bahiagas - Analista de Processos Organizacionais Economia)
Uma empresa utiliza o modelo
= + t + (t = 1, 2, 3, . . . ) para estimar o seu faturamento
no ano (1999 + t).
representa o faturamento da empresa no ano (1999 + t) em milhes de
reais. e so parmetros desconhecidos e o erro aleatrio com as respectivas hipteses
consideradas para o modelo de regresso linear simples. Com base nas observaes dos

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 43

Estatstica

Prof.R.Dyodi

faturamentos anuais de 2000 at 2009 e utilizando o mtodo dos mnimos quadrados obtevese a e b (estimativas de e , respectivamente). O grfico abaixo corresponde equao da
reta y = a + bt :

O valor da mdia aritmtica das observaes

de 2000 at 2009, em milhes de reais,

(A) 3,2.
(B) 3,6.
(C) 4,0.
(D) 4,4.
(E) 4,8.
Letra E
Resoluo:
No fique com medo de a questo utilizar a varivel t no lugar de X, a mesma coisa!
Temos aqui uma questo do nvel jnior, ou seja, o enunciado fornece uma grfico com dois
pontos pertencentes reta.

Substituindo este valor em qualquer uma dos pontos:

Assim, a nossa reta de regresso :

O enunciado nos pede o valor da mdia aritmtica das observaes de


seja, ele quer saber o valor de .

de 2000 at 2009, ou

Sabemos que a reta de regresso sempre passa pelo ponto . Ento, basta encontrarmos
o valor de (a questo trabalha com t no lugar de X) e substituir na reta de regresso. Alm
disso, o valor de t foi definido da seguinte maneira:
Uma empresa utiliza o modelo
= + t + (t = 1, 2, 3, . . . ) para estimar o seu faturamento
no ano (1999 + t). Como os dados vo de 2000 at 2009, t varia de 1 at 10.

Portanto:

Exerccio resolvido sobre regresso:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 44

Estatstica

Prof.R.Dyodi

(FCC - 2010 - Sefaz SP APOF)


Com base em um estudo de correlao e regresso, obteve-se o grfico abaixo
correspondente equao da reta deduzida pelo mtodo dos mnimos quadrados (Y = aX +
b), utilizando 10 pares de observaes (Xi ,Yi), i = 1, 2, 3, ..., 10. A mdia aritmtica das
observaes de Y apresentou o valor de 6,5.

A mdia aritmtica das observaes de X


(A) 3,00
(B) 3,25
(C) 3,50
(D) 3,75
(E) 4,00
Letra A
Resoluo:
Mais uma questo do nvel jnior, com um grfico fornecendo dois pontos da reta.
Notem que, neste caso, a questo inverteu as posies de alfa e beta! Nesta questo, o alfa
o coeficiente angular.

Substituindo o valor de em qualquer um dos pontos:

A nossa reta de regresso :

Sabemos que a reta de regresso sempre passa pelo ponto


valor de , basta substituir o valor de na reta de regresso.

. Ento, para encontrar o

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 45

Estatstica

Prof.R.Dyodi

Exerccio resolvido sobre regresso:


(FCC - 2009 - Sefaz SP Auditor)
O grfico abaixo demonstra a evoluo da receita tributria anual no estado de So Paulo
desde 1999, com os valores arrecadados em bilhes de reais.

Para estimar a receita tributria em um determinado ano com base no comportamento sugerido
pelo grfico, adotou-se o modelo Yt
; t = 1, 2, 3 ..., sendo Yt = ln (RTt), em que
RTt a receita tributria no ano (1998 + t) em bilhes de reais e ln o logaritmo neperiano (ln e
= 1).
so parmetros desconhecidos e o erro aleatrio com as respectivas hipteses
consideradas para o modelo de regresso linear simples. Utilizando o mtodo dos mnimos
quadrados, com base nas observaes de 1999 a 2008, obteve-se para a estimativa de o
valor de 0,12, sabendo-se que:

A previso da receita tributria para 2009, em bilhes de reais, em funo da equao obtida
pelo mtodo dos mnimos quadrados igual a
(A)
(B)
(C)
(D)
(E)
Letra B
Resoluo:
Temos aqui uma questo de nvel fcil, ou seja, o enunciado j fornece o valor de alfa ou beta
e s precisamos encontrar o outro.
Vamos esquematizar os dados:

Utilizando a frmula do alfa:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 46

Estatstica

Prof.R.Dyodi

Assim a nossa reta de regresso :

O enunciado quer saber a previso da receita tributria no ano de 2009, ou seja, quando t for
igual a 11:

Sabendo que Yt = ln (RTt), a receita tributria em 2009 ser igual a:

Muito provavelmente, os exerccios sobre regresso linear iro aparecer nos mesmos
moldes dos exerccios resolvidos acima. No entanto, se a banca quiser pegar mais pesado,
ela ir cobrar o clculo de uma medida chamada coeficiente de determinao da reta de
regresso, denominada por . Essa medida nos fornece o grau de ajustamento aos pontos
amostrais, ou seja, se a reta fica bem prxima de todos os pontos ou se ela fica distante de
todos os pontos. Para visualizar, observe os grficos abaixo:

No primeiro caso, a reta se ajusta perfeitamente a todos os pontos amostrais, enquanto


que no segundo caso a reta, apesar de se ajustar bem aos dados, fica distante de alguns
deles. As propriedades de
so as seguintes:

Quanto mais
Quanto mais

se aproxima do valor 1, mais a reta se ajusta aos pontos.


se aproxima do valor 0, mais a reta se afasta dos pontos.

Assim, o primeiro exemplo apresenta


, pois todos os pontos pertencem reta de
regresso. A reta do segundo exemplo apresenta
prximo de 1, mas no igual a 1, pois
alguns pontos ficam distantes da reta.
Para aprender a calcular o valor de
isso, observe a reta de regresso abaixo:

devemos aprender algumas definies. Para

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 47

Estatstica

Prof.R.Dyodi

Agora, vamos traar uma linha que represente o valor de .

Observe a localizao de um dos pontos amostrais utilizados para o clculo da reta de


regresso:

Distncia entre o ponto e :


Distncia entre o ponto e a reta de regresso: (
Distncia entre a reta de regresso e :

Observe que:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 48

Estatstica

Prof.R.Dyodi

Distncia entre o ponto e = Distncia entre o ponto e a reta de regresso + Distncia entre a
reta de regresso e
Ou

Fazendo isso para todos os pontos da amostra e elevando as diferenas ao quadrado,


teremos a seguinte relao:

O termo

O termo (

) chamado de soma dos quadrados dos resduos (SQRes).

O termo (

) chamado de soma dos quadrados devido regresso (SQReg).

chamado de soma total dos quadrados (STQ).

Assim, temos que

O valor de

ser igual a

Acontece que muitas vezes o exerccio no fornece o valor de SQReg, mas existe uma
frmula alternativa para calcul-la:

A melhor maneira de aprender sobre o tema fazendo exerccios, ento vamos


resolv-los!
Exerccio resolvido sobre regresso linear:
(ESAF - 2010 - SMF RJ - Fiscal de Rendas)
A partir de uma amostra aleatria simples formada por 22 observaes das variveis X e Y
calculou-se

Calcule o valor mais prximo do coeficiente de determinao

da regresso linear de X em Y.

a) 0,65
b) 0,81
c) 0,85
d) 0,91

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 49

Estatstica

Prof.R.Dyodi

e) 0,88
Letra C
Resoluo:
O exerccio pede para calcularmos

, que dado por


Como os valores dos somatrios foram dados pelo enunciado, devemos apenas calcular o
valor de
De acordo com as informaes, a melhor forma utilizar a seguinte frmula:

Assim,

Estudaremos agora a medida de correlao, que est diretamente ligada ao estudo


sobre regresso. Relembrando o incio deste tpico, a correlao uma medida que quantifica
o grau da relao entre duas variveis. Vale ressaltar que estamos interessados na relao
linear entre as variveis.
O grau da relao entre as duas variveis ser obtido atravs do coeficiente de
correlao linear, denotado por
. No do nosso interesse saber a diferena entre as
duas notaes. O que importa saber que as questes sobre correlao podem aparecer com
qualquer uma das notaes mencionadas.
Propriedades do coeficiente de correlao linear:
1 propriedade:
2 propriedade: Quanto mais prximo de 1 ou -1, maior ser o grau de associao entre as
variveis
3 propriedade: Quanto mais prximo de 0, menor ser o grau de associao entre as variveis
4 propriedade: O coeficiente de correlao estar prximo de 0 no significa necessariamente
que no exista relao entre as variveis, significa apenas que a relao linear baixa. Outras
relaes podem existir
5 propriedade: O coeficiente de correlao estar prximo de 1 ou -1 no significa que as
variveis apresentem uma relao de causa e efeito
6 propriedade: Se o sinal do coeficiente de correlao for negativo, h uma relao inversa
entre as variveis
7 propriedade: Se o sinal do coeficiente de correlao for positivo, h uma relao direta entre
as variveis
8 propriedade: o sinal do coeficiente de correlao ser igual ao sinal de da reta de
regresso

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 50

Estatstica

Prof.R.Dyodi

Existem 3 formas de calcular o valor de


que devemos saber (todas do o mesmo
resultado). A 1 delas conhecida como coeficiente de correlao linear de Pearson.

Exerccio resolvido sobre coeficiente de correlao linear:


(ESAF - 2005 - Receita Federal Auditor)
Para uma amostra de dez casais residentes em um mesmo bairro, registraram-se os seguintes
salrios mensais (em salrios mnimos):

Assinale a opo cujo valor corresponda correlao entre os salrios dos homens e os
salrios das mulheres.
a) 0,72
b) 0,75
c) 0,68
d) 0,81
e) 0,78
Letra B
Resoluo:
A frmula do coeficiente de correlao linear dada por:

Como o exerccio no forneceu o valor de nenhum destes somatrios, devemos utilizar as


transformaes de somatrio j estudadas. Assim,

Ento,

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 51

Estatstica

Prof.R.Dyodi

A minha observao sobre este exerccio que as contas foram ridiculamente trabalhosas.
Quando eu percebesse o trabalho que levaria para terminar a questo, com certeza passaria
para outra.
No entanto, a questo til para notarmos que foi cobrada numa prova de fiscal a frmula do
coeficiente de correlao de Pearson e, alm disso, as transformaes de somatrio. Caso os
nmeros fossem mais tranquilos, a questo se tornaria vivel.
Exerccio resolvido sobre correlao linear:
(FCC - 2012 ISS SP - Auditor)
Considere as seguintes afirmaes:
I. (suprimido)
II. (suprimido)
III. (suprimido)
IV. Se o coeficiente de correlao linear de Pearson entre duas variveis for igual a zero, no
haver associao linear entre elas, implicando a ausncia de qualquer outro tipo de
associao.
Est correto o que se afirma APENAS em
(A) I e II.
(B) I e III.
(C) II e IV.
(D) I.
(E) II e III.
Letra D
Resoluo:
Vimos que se o coeficiente de correlao linear for igual a zero, no h relao linear entre as
variveis. No entanto, isso no quer dizer que no exista nenhuma outra relao entre elas. A
segunda parte da afirmao est incorreta. Item falso.
A 2 frmula expressa o valor do coeficiente da seguinte forma:

Em outras palavras, o coeficiente de correlao a razo entre a covarincia das duas


variveis e a multiplicao do desvio padro de cada uma delas. O clculo do desvio padro j
foi estudado exaustivamente. Resta a ns apenas aprender o conceito de covarincia, que
definida do seguinte modo:

Exerccio resolvido sobre correlao linear:


(FGV - 2011 - Sefaz RJ Auditor)
Para duas variveis populacionais, X e Y, o desvio-padro de X 40, o desvio-padro de Y
20 e a covarincia entre Y e X 100. Assim, o coeficiente de correlao entre X e Y
(A) 0,5.
(B) 2.
(C) 0,25.
(D) 0,125.
(E) 0,125.

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 52

Estatstica

Prof.R.Dyodi

Letra D
Resoluo:
Basta utilizarmos a frmula da correlao. Questo para ser resolvida em 20 segundos.

A maior parte dos exerccios sobre correlao cobra esta segunda frmula do
coeficiente de correlao linear. Alm disso, as seguintes propriedades tambm so temas de
questes:
Propriedades sobre a covarincia:
1 propriedade: Quando X e Y so variveis aleatrias independentes,
2 propriedade: Se

, no se pode afirmar que as variveis so independentes

3 propriedade:
4 propriedade:
Exerccio resolvido sobre covarincia:
(FGV - 2008 - Sefaz RJ Auditor)
Sejam X e Y duas variveis aleatrias quaisquer. Ento:
(A) VAR (X Y) = VAR (X) VAR (Y).
(B) VAR (X Y) = VAR (X) + VAR (Y) COV (X, Y).
(C) VAR (X Y) = VAR (X) + VAR (Y) 2 COV (X, Y).
(D) VAR (X Y) = VAR (X) + VAR (Y) + COV (X, Y).
(E) VAR (X Y) = VAR (X) + VAR (Y) + 2 COV (X, Y).
Letra C
Resoluo:
A letra C exatamente a 3 propriedade do quadro acima. Questo para ser resolvida em 5
segundos. Voc viu como a estatstica pode ser rpida e fcil para quem se esfora em
aprend-la?
Exerccio resolvido sobre correlao linear:
(FGV - 2006 - Sefaz MS Auditor)
Analise as afirmativas a seguir, a respeito de duas variveis aleatrias X e Y:
I. se X e Y so independentes, ento Cov(X;Y) = 0;
II. se Cov(X;Y) = 0, ento X e Y so independentes;
III. se X e Y so independentes, ento E(XY) = E(X).E(Y);
IV. se E(XY) = E(X).E(Y), ento X e Y so independentes.
Assinale:
(A) se nenhuma afirmativa estiver correta.
(B) se somente as afirmativas I e III estiverem corretas.
(C) se somente as afirmativas I e IV estiverem corretas.
(D) se somente as afirmativas II e IV estiverem corretas.
(E) se todas as afirmativas estiverem corretas.

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 53

Estatstica

Prof.R.Dyodi

Letra B
Resoluo:
Item I Item correto. Trata-se da 1 propriedade da covarincia.
Item II Item incorreto. A 2 propriedade da covarincia diz exatamente o contrrio.
Item III Sabemos que
covarincia ser igual a zero. Ento,
Item correto.

. Se X e Y so independentes, a
que implica
.

Item IV Se
, temos que a covarincia igual a zero. Mas, assim como no
item II, nada podemos afirmar sobre a independncia. Item incorreto.
A 3 frmula do coeficiente de correlao linear a seguinte:

Em outras palavras, o coeficiente de correlao linear igual a raiz quadrada do


coeficiente de determinao da reta de regresso. Essa igualdade nos mostra que realmente
existe uma ligao entre os estudos de regresso e correlao.
Exerccio resolvido sobre regresso e correlao linear:
(FGV - 2010 - SEAD AP Auditor)
Se no ajuste de uma reta de regresso linear simples de uma varivel Y em uma varivel X o
coeficiente de determinao observado foi igual a 0,64, ento o mdulo do coeficiente de
correlao amostral entre X e Y igual a:
(A) 0,24
(B) 0,36
(C) 0,50
(D) 0,64
(E) 0,80
Letra E
Resoluo:
Questo para ser resolvida em 5 segundos. Basta utilizar a terceira frmula do coeficiente de
correlao.
Como o enunciado informa que

, ento:

Para concluir este tpico, devemos falar sobre uma propriedade do coeficiente de
correlao. Voc se lembra que nos captulos anteriores, a mdia, a varincia, a esperana, etc
mudavam quando somvamos ou multiplicvamos algum nmero? Vou repetir o quadro j
estudado para relembr-lo:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 54

Estatstica

Prof.R.Dyodi

Estatstica Descritiva

Mdia

Somar a todos os Subtrair de todos Multiplicar por todos Dividir por todos
elementos
os elementos
os elementos
os elementos
Dividir por
Somar
Subtrair
Multiplicar por

Varincia

Nada fazer

Nada fazer

Multiplicar por

Dividir por

Desvio
padro

Nada fazer

Nada fazer

Multiplicar por

Dividir por

Probabilidade
Somar varivel
aleatria
Esperana

Subtrair da
varivel aleatria

Somar

Multiplicar a varivel
aleatria por

Dividir a varivel
aleatria por

Subtrair

Multiplicar por

Dividir por

Varincia

Nada fazer

Nada fazer

Multiplicar por

Dividir por

Desvio
Padro

Nada fazer

Nada fazer

Multiplicar por

Dividir por

No caso do coeficiente de correlao, a questo mais simples. Observe a


propriedade:
Sejam X e Y duas variveis tais que o coeficiente de correlao entre elas igual a .
Se alterarmos a varivel X para
coeficiente de correlao linear entre

e alterarmos a varivel Y para


ser igual a:

, o

Em outras palavras, o mdulo coeficiente de correlao linear no ser alterado


por somas e multiplicaes. Apenas o sinal poder ser alterado quando ocorrer
multiplicaes por um nmero positivo em X e por um nmero negativo em Y, ou vice-versa.
Exerccio resolvido sobre correlao linear:
(FCC - 2009 - TJ PI - Analista Estatstica)
Sejam as variveis aleatrias X e Y, definidas em um espao amostral de ocorrncias,
assumindo os valores: X = { x1 , x2, . . . ., xn } e Y = { y1, y2, . . ., yn}. O coeficiente de
correlao linear entre X e Y igual a 0,625. Multiplicando por 5 todos os valores de X e por 10
todos os valores de Y, tem-se que o novo coeficiente de correlao linear correspondente aos
dois novos conjuntos formados
(A) 0,8000
(B) 0,6250
(C) 0,5000
(D) 0,4000
(E) 0,3125
Letra B
Resoluo:
Pelos dados do enunciado a correlao entre X e Y igual a 0,625.

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 55

Estatstica

Prof.R.Dyodi

Sabemos que somas e multiplicaes no interferem no mdulo do coeficiente de correlao.


Assim, a alternativa correta a letra B.
Exerccio resolvido sobre correlao linear:
(FCC - 2007 - TRF 2a - Analista Estatistica)
Seja o coeficiente de correlao entre as variveis aleatrias X e Y. Se Z = aX + b e U = cY +
d, onde a > 0 e c < 0, ento os coeficientes de correlao entre Z e U e entre U e Y so dados,
respectivamente, por
(A) e 1
(B) e 1
(C)
e 1
(D) e 1
(E)
e 1
Letra B
Resoluo:
Vamos primeiro analisar o coeficiente de correlao entre Z e U.
Z a varivel resultante das alteraes em X e U a varivel resultante das alteraes em Y.
Assim, o coeficiente de correlao entre Z e U s pode ser igual a
(lembre-se de que
uma outra forma de denominar o coeficiente de correlao). Ento, devemos analisar se os
valores multiplicados possuem o mesmo sinal.
O enunciado diz que a positivo e c negativo. Portanto, o coeficiente de correlao entre Z e
U ser igual a
.
Agora, vamos analisar o coeficiente entre U e Y.
Como U a varivel resultante das alteraes em Y, temos que h uma relao linear perfeita
entre elas. Assim o coeficiente de correlao linear ser igual a 1 ou -1. Como o valor
multiplicado negativo, o coeficiente ser igual a -1.
Exerccio resolvido sobre correlao linear:
(FGV - 2010 - Sefaz RJ Auditor)
Duas variveis aleatrias x e y tm coeficiente de correlao linear igual a 0,8. Se w e z so
tais que w = 2x 3 e z = 4 2y ento o coeficiente de correlao entre w e z ser igual a:
(A) 0,8.
(B) 0,64.
(C) 0,36.
(D) 0,64.
(E) 0,8.
Letra A
Resoluo:
O enunciado nos informa que o coeficiente de correlao linear entre X e Y igual a 0,8
W a varivel resultante das alteraes em X e Z a varivel resultante das alteraes em Y.
Assim, temos apenas que analisar se os valores multiplicados possuem o mesmo sinal.
Enquanto X foi multiplicado por 2, Y foi multiplicado por -2. Como os sinais so diferentes, o
coeficiente de correlao linear entre W e Z ser igual a -0,8.

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 56

Estatstica

Prof.R.Dyodi

3.8. Amostragem
Ufa! Chegamos ao ltimo tpico da apostila. Se voc conseguiu se dedicar at aqui,
meus parabns. Pode ter certeza de que voc ultrapassou milhares de candidatos com o
conhecimento adquirido. Neste ltimo tpico, no faremos mais nenhum tipo de conta, agora o
assunto mais light!
Aprendemos no estudo sobre inferncia estatstica que h diferenas entre trabalhar
com populaes ou trabalhar com amostras. As amostras servem para simplificar nossos
esforos ao inferir algo sobre a populao, pois no temos que analisar todos os dados da
populao. No entanto, nada foi dito sobre como as amostras so colhidas e este ser o objeto
do nosso estudo a partir de agora.
Observao: quando todos os itens da populao so analisados, diz-se que foi realizado um
censo.
A amostragem pode ser probabilstica ou no probabilstica. No se pode dizer que um
tipo de amostragem melhor do que o outro; deve-se analisar caso a caso para determinar
qual ser a melhor escolha. A amostragem probabilstica bastante utilizada, pois ela
delineada de tal modo que se conhece a probabilidade de todas as combinaes amostrais
possveis, assim a melhor escolha quando se quer saber qual a probabilidade de a amostra
representar a populao. A amostragem no probabilstica (tambm conhecida como
amostragem por julgamento), por sua vez, no est interessada nas tcnicas matemticas e
estatsticas; utiliza-se o julgamento profissional para determinar quais itens da populao sero
selecionados.
Existem 4 principais tipos de amostragem probabilstica: aleatria simples, sistemtica,
estratificada e por conglomerados. Veremos cada uma delas.
Em relao amostra aleatria simples, devemos saber que cada elemento da
populao tem a mesma probabilidade de ser includo na amostra. Alm disso, ela pode ser
realizada em processos com ou sem reposio. A amostragem aleatria simples requer uma
lista dos elementos da populao. O exemplo clssico o do sorteio: dentre n nmeros, cada
um deles possui a probabilidade 1/n de ser sorteado.
A amostragem sistemtica tambm requer uma lista dos elementos da populao. No
entanto, difere da amostragem aleatria simples porque os itens so selecionados de forma
peridica. Por exemplo, selecionaremos um elemento da populao a cada dez elementos: os
itens selecionados sero o 1, o 11 o 21, e assim por diante.
A amostragem estratificada aquela em que so escolhidos subgrupos da populao
e cada subgrupo bastante homogneo. Por exemplo, se considerarmos a populao da
cidade de So Paulo, poderamos selecionar um subgrupo composto por crianas, outro
subgrupo composto por adolescentes, outro composto por adultos e outro por idosos.
Por fim, a amostragem por conglomerados aquela em que so escolhidos
subgrupos heterogneos, de modo que represente bem a diversidade da populao. Por
exemplo, se considerarmos uma populao com 70% de mulheres e 30% de homens, seria
ideal selecionar um subgrupo com 70% de mulheres e 30% de homens.
Exerccio resolvido sobre amostragem:
(FCC - 2007 - TRF 2a - Analista Estatistica)
Uma pesquisa pretende estimar o valor mdio mensal dos salrios recebidos pelos professores
de 4 escolas do bairro da Sade. Para a pesquisa primeiramente foram listados todos os
professores das 4 escolas segundo o sexo resultando em 2000 professores do sexo feminino e
1 500 professores do sexo masculino. Foram propostos dois planos amostrais distintos. O
primeiro plano previa um sorteio com reposio de 350 professores do total de 3500. Na
segunda proposta, o total da populao de professores seria dividido em dois grupos (um
grupo do sexo feminino e outro grupo do sexo masculino) e seriam sorteados 10% de cada

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 57

Estatstica

Prof.R.Dyodi

grupo com reposio. Segundo a teoria geral da amostragem, o primeiro e o segundo plano
so, respectivamente,
(A) Amostragem Aleatria simples e Amostragem estratificada.
(B) Amostragem Aleatria simples e Amostragem sistemtica.
(C) Amostragem estratificada e Amostragem aleatria simples.
(D) Amostragem Aleatria simples e Amostragem por conglomerado em dois estgios.
(E) Amostragem Aleatria simples e Amostragem por conglomerados.
Letra A
Resoluo:
A 1 proposta cita um sorteio entre todos os elementos da populao. Trata-se da amostra
aleatria simples.
O 2 caso cita dois subgrupos homogneos, um composto por mulheres e outro composto por
homens. Trata-se da amostragem estratificada.
Exerccio resolvido sobre amostragem:
(FCC - 2009 - TRT 7a - Analista Estatstica)
Com relao teoria geral de amostragem, considere as afirmativas abaixo.
I. A realizao de amostragem aleatria simples s feita para amostragem sem reposio.
II. A amostragem estratificada consiste na diviso de uma populao em grupos segundo
alguma caracterstica conhecida. Os estratos da populao devem ser mutuamente exclusivos.
III. Em uma amostra por conglomerados a populao dividida em subpopulaes distintas.
IV. A amostragem sistemtica um plano de amostragem no probabilstico.
correto o que se afirma APENAS em
(A) I e II.
(B) II e III.
(C) II e IV.
(D) III e IV.
(E) I, II e III.
Letra B
Resoluo:
Item I a amostragem aleatria simples pode ocorrer com ou sem reposio. Item incorreto.
Item II Item correto. Os subgrupos devem ser homogneos, ento a diviso pressupe que
se saiba qual a caracterstica de cada subgrupo.
Item III Item correto. Na amostragem por conglomerado, cada subgrupo deve representar
bem a variabilidade que ocorre na populao.
Item IV A amostragem sistemtica tambm um tipo de amostragem probabilstica. Item
incorreto.
Exerccio resolvido sobre amostragem:
(FGV - 2009 - SAD PE APOF)
Uma pesquisa de opinio dos usurios acerca de qualidade do atendimento em um hospital foi
realizada com o seguinte desenho: a quinta pessoa que chegou ao hospital, num certo dia,
foi selecionada e pesquisada; depois, a dcima pessoa a chegar foi pesquisada; depois, a
dcima quinta; e assim sucessivamente, sempre de cinco em cinco pessoas. Esse desenho
caracteriza uma amostragem:

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 58

Estatstica

Prof.R.Dyodi

(A) sistemtica.
(B) aleatria simples.
(C) estratificada.
(D) por conglomerados.
(E) por sorteios aleatrios sucessivos.
Letra A
Resoluo:
Observa-se que existe uma periodicidade na seleo dos itens amostrais. Assim, a
amostragem sistemtica.
Exerccio resolvido sobre amostragem:
(FCC 2013 Sefaz SP Auditor)
Considere:
I. (suprimido)
II. (suprimido)
III. (suprimido)
IV. Na amostragem aleatria estratificada, a populao dividida em estratos, usualmente, de
acordo com os valores ou categorias de uma varivel, e, depois, uma amostragem aleatria
simples utilizada na seleo de uma amostra de cada estrato.
Est correto o que se afirma APENAS em
(A) I.
(B) II.
(C) III.
(D) I e IV.
(E) IV.
Letra E
Resoluo:
O item IV est correto. Na amostragem aleatria estratificada, inicialmente a populao
dividida em estratos, subgrupos homogneos. Depois, colhe-se uma amostra aleatria de cada
um destes subgrupos.

Rua Baslio da Gama, 98 (prximo ao metr Repblica)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br

Pgina 59