Escolar Documentos
Profissional Documentos
Cultura Documentos
SUMÁRIO PÁGINA
Associação entre variáveis 2
Associação entre variáveis qualitativas 4
Associação entre variáveis quantitativas 10
Associação entre variáveis qualitativas e quantitativas 15
Introdução ao método de regressão 17
Estimação com base em amostra e Método dos Mínimos 21
Quadrados Ordinários (MQO)
Tabela ANOVA 28
Teste de hipóteses sobre os coeficientes 35
Eficiência do estimador de Mínimos Quadrados Ordinários (MQO) 38
Lista de Exercícios resolvidos 60
Gabarito 70
Bem vindos à nossa última aula teórica! Nesta aula, temos alguns assuntos
importantes para discutir:
1) Correlação.
2) Regressão Linear.
Dica de um concurseiro
Mas, uma questão que os estatísticos sempre têm que abordar é: como é o
comportamento conjunto de mais de uma variável?
Por exemplo, um pesquisador pode estar interessado em saber como a renda dos
indivíduos de uma determinada região está correlacionada com seus gastos em
consumo. O que deve ser feito é avaliar como a variável "renda” de um determinado
indivíduo se relaciona com a variável "gastos em consumo” do mesmo.
Renda Consumo
Indivíduo (R$) (R$)
1 1000 700
2 1500 800
3 2000 1000
4 2300 1100
5 2700 1200
6 5500 2300
7 6000 2500
8 7300 3000
Olhe o que este gráfico está te mostrando! Conforme a renda cresce, o valor gasto
em consumo também cresce, mas a taxas decrescentes. Veja que, para o primeiro
indivíduo o consumo é 70% de toda sua renda, enquanto que, para o 8° indivíduo, o
consumo é 41%.
Viu que conclusão interessante você tirou a partir da análise desta amostra fictícia?
A lista de possibilidades é infinita! Vocês terão que fazer isso várias vezes no setor
público, pois a análise de muitos projetos necessita este conhecimento estatístico.
Para que vocês entendam direitinho, vamos analisar alguns exemplos do livro
"Estatística Básica” dos professores Bussab e Morettin.
Olhe, cada entrada da tabela representa quantas vezes ocorre cada realização
conjunta. Não entendeu? Veja o primeiro quadradinho da tabela, que tem o valor
de 85:
O que ele está te dizendo é que há 85 homens que cursam economia, ou seja, ele
dá a realização simultânea de (sexo = masculino) e (curso = economia).
Em vez de trabalharmos com frequências absolutas, como é o caso, fica mais fácil
visualizar interações utilizando frequências relativas!
Aí,depende do que você quer avaliar. No nosso caso, vamos fixar o total dos sexos
como 100% e, com base nisso, encontrar quanto cada curso representa de
matriculas por sexo. Veja como ficaria:
Viu o que eu fiz? Eu dividi cada célula pelo total dado pela coluna e multipliquei por
100. Por exemplo, na célula (1,1), realizamos a divisão de 85 por 140, o que dá,
aproximadamente, 0,61.
INDO
^jrrnais fundo Isso não te lembra nada? Exatamente! As
probabilidades condicionais. As duas primeiras colunas referem-se a “frequências
condicionais”, enquanto que a última seria como se fosse uma “frequência
incondicional”. Lembra-se de que, quando os eventos são independentes, a
probabilidade condicional é igual à incondicional? Aplique um raciocínio análogo ao
presente caso, se a frequência condicional é muito próxima à incondicional, a
“condição” parece não ajudar a explicar o fenômeno.
No fundo, o que fizemos foi comparar a proporção marginal de cada curso com
relação às suas respectivas proporções associada a cada sexo. Assim, caso as
variáveis não tivessem nenhuma associação, esperar-se-ia que:
Entendeu? Se as variáveis não forem associadas, espera-se que 60% das pessoas
frequentarão cursos de Física e 40% cursos de Ciências Sociais,
independentemente do sexo. Se isso for verdade, basta aplicar estes
Se compararmos o valor real de cada célula com seu valor esperado, teremos a
seguinte distribuição:
2
( 16)2 _ ( - 16)2 _ ( 16)2 _ ( - 16)2
x = 3,04 + 4, 57 + 7, 11 + 10,67 = 25,4
84 + 56 + 24 + 36
Este é um valor significantemente maior do que zero, portanto, pode-se inferir que
as variáveis estão associadas. Quanto maior este valor, menor é a associação
entre as variáveis.
Sendo que esta expressão está te dizendo para somar, para todas as células (i, í ), o
quadrado das diferenças entre o valor real (ríjí) e o valor esperado em cada célula
(eu), caso as variáveis não fossem associadas, divido pelo seu respectivo valor
esperado.
“Tá bom professor, mas devo comparar este valor com a tabela qui-
quadrado”?
Olha, não precisamos entrar nisso. Esta parte fica um pouco mais complicadinha e
nunca cai em concursos que não sejam específicos para estatísticos. Assim, só
saiba calcular a estatística de teste e o coeficiente de Pearson que já basta.
C o e fic ie n te d e P e a rs o n =
Essa é uma pergunta sem uma única resposta! Isso muda de autor para autor. Mas,
é importante que vocês conheçam uma "regrinha de bolso” para determinação do
valor ideal de uma amostra com base no erro amostrai tolerável (E).
Isso é, para um erro amostral da ordem de 4%, devemos ter uma amostra de, no
mínimo:
No caso de uma análise entre variáveis quantitativas o nosso "arsenal” para análise
é muito maior! Nós podemos tanto utilizar o que estudamos na seção anterior,
quanto outras possibilidades gráficas, como o diagrama de dispersão.
Entendeu? Se você traçar uma reta que "mais ou menos” que une os pontos, você
encontra uma reta inclinada para cima, ou como chamam os matemáticos,
positivamente inclinada. O que isso quer dizer é: quanto maior a renda, maior
será o consumo associado, isso é, trata-se de variáveis positivamente
correlacionadas.
Este é um caso possível de associação entre duas variáveis quantitativas, mas não
o único. As variáveis podem ser negativamente correlacionadas. Neste caso,
quanto maior uma delas, menor será o valor associado na outra.
Quer um exemplo? Suponha que seja feita uma pesquisa que relacione o PIB de 6
economias com a taxa de incidência de leptospirose nas mesmas. É de se esperar
que economias mais ricas tendam a ter melhores condições de saneamento, o que
reduz a taxa de incidência desta doença. Em termos gráficos, seria algo mais ou
menos assim:
Com efeito, os pontos indicam que, quanto maior o PIB, menor a taxa de incidência
da doença. O traçado de uma reta que explicita esta dinâmica mostra uma reta
inclinada para baixo, ou negativamente inclinada. Este é um caso de variáveis
negativamente associadas.
Os dois casos mostram exemplos de correlação linear, ou seja, que podem ser
representados por uma linha reta. Podem existir casos de associação não linear,
entretanto não vamos entrar neste detalhe. Apenas entenda o que é uma
associação entre variáveis, que pode ser positiva (quando uma aumenta a
outra também aumenta, ou quando uma se reduz a outra também reduz) ou
negativa (quando uma aumenta a outra reduz ou quando uma reduz a outra
aumenta). No frigir dos ovos: uma relação positiva significa que a “direção"
em que uma variável se movimenta é a mesma da outra variável, por outro
lado, uma relação negativa implica que as variáveis se “movimentarão" em
sentidos opostos.
Boa pergunta! Neste caso, não conseguiremos tirar uma "tendência” da análise
gráfica. A título de ilustração:
Neste caso, não há uma tendência clara entre as duas variáveis! Este é um exemplo
de variáveis não associadas.
-!< p < !
Covariância (Cov) é uma medida da “variância conjunta” entre duas variáveis. Para
uma amostra de tamanho (n ), a covariância entre duas variáveis quaisquer, x e y, é
dada por:
Cov{x, y)
Pxy dp{x) •dp{y)
Entendeu? Antes de passarmos para o próximo tópico, vocês precisam saber uma
coisa importante demais sobre a covariância!
Este é um caso que não é muito cobrado em concurso, assim vamos tentar ser mais
rápidos aqui.
Vamos nos basear em outro exemplo dos professores Bussab e Morettin. Suponha
que seja feita uma pesquisa de forma a avaliar o comportamento dos salários
(variável quantitativa) dentro de cada categoria de grau de instrução (variável
qualitativa). Os resultados encontrados foram:
Pode-se inferir que, quanto maior o nível educacional, na média, maior será o
salário do indivíduo. Uma forma de confirmar a veracidade dessa afirmação é
percebendo que a variância amostrai para todos os dados é maior do que a
variância para cada subclasse.
-“E se, por exemplo, a variância da subclasse “ensino superior” fosse de 23”?
Neste caso, a subdivisão dos dados em uma classe de nível superior não estaria
"ajudando” na análise, pois a variabilidade seria menor se analisássemos os dados
dos salários como um todo.
Z(Vari ■nt)
Assim, com base na variância total da amostra (Var), podemos definir R2 como:
Isso quer dizer que 41,5% da variabilidade dos salários é explicada pela
variável “grau de instrução”.
y = f(x).
O que quer dizer "y é função de X" ou que as vendas de uma empresa são uma
função da quantidade investida em propaganda. Pode-se afirmar que y depende de
x, portanto, a nomenclatura usual chama y de variável dependente ou explicada e x
de variável independente ou explicativa.
Uma das formas de se expressar tal função é a partir de uma relação linear, tal
como:
y = 2 + 3x.
y = a + 0x. (1)
- "Professor, ótimo, mas por que você está falando tudo isso?”
Porém, perceba que é muito raro que uma variável do mundo real, ainda mais
quando ligada à economia ou a fenômenos sociais, consiga ser representada por
uma reta. Vamos supor que estamos tratando do exemplo (a) acima descrito para o
ano de 2012 e que possuímos dados de todas as vendas de todas as empresas de
um determinado setor e de todos os gastos de propaganda efetuados por estas
empresas.1 Colocando tal relação em um gráfico:
1 Gente, só para chamar a atenção, por enquanto estamos trabalhando com dados coletados em um
único período de tempo, no caso uma única observação por empresa no ano de 2012 (pode ser a soma
de todo o ano, ou de um determinado mês, etc.) Este tipo de disposição de dados é chamado de dados em
cortes transversais ou “cross section".
A reta é representada pela equação (1) e os pontos são os valores que y assume
para cada x.
E aí pessoal, o que vocês estão vendo? Veja que a reta explica bem o
comportamento da variável, se aproximando dos valores reais, mas ainda assim não
explica tudo. Olhe o 3° ponto, nele o valor das vendas aumentou, na média, muito
mais do que o esperado para um determinado investimento em propaganda. Isso
pode ser decorrência de muitos fatores do mundo real, como o fato de que a
empresa talvez fosse muito desconhecida até então, portanto, um pequeno
investimento em propaganda teve resultados muito grandes quando comparado a
empresas que já são relativamente conhecidas. Este tipo de raciocínio pode ser
aplicado para os pontos abaixo da reta também, que apresentam, na média,
retornos abaixo do esperado para um determinado gasto em propaganda.
Assim, se uma versão linear e simples da equação de reta for a mais bem ajustada
à série de dados, pode-se inferir que a equação que representa a real dinâmica do
fenômeno em estudo, no caso, as vendas da empresa é dada por:
yi = a + p X i + Et
Sendo m o termo que representa o "erro”, ou seja, os desvios das observações com
relação à reta (pensem comigo, o erro é a distância da reta até cada um daqueles
pontos no gráfico acima). O subscrito 7 ’ se refere à cada uma das empresas
Vocês concordam comigo que não dá para levar em conta todas as variáveis que
afetam o comportamento das vendas de todas as empresas? Pode ser que um
gerente comercial muito bom de serviço tenha pedido demissão da empresa (4), o
que puxaria suas vendas para baixo, apesar do investimento em propaganda, etc.
Assim, o erro leva em conta estes efeitos impossíveis de se mensurar, mas que
afetam a dinâmica de y.
Bom, apesar do fato de que este erro é algo que nós temos que aprender a viver
com ele, o mesmo possui uma característica interessante que nós temos que levar
em conta:
E (eô = 0
Isto é, a média dos erros é igual a zero. Ou seja, os desvios "para cima da reta”
igualam o valor dos desvios” para baixo da reta” na média.
Ou seja, estes erros são supostamente aleatórios, então a teoria nos permite inferir
que, se o modelo estiver corretamente especificado, o erro será, na média, igual à
zero.
E aí rapaziada, que cara de sono é esta? Vamos acordando, pois um futuro servidor
público não pode dormir em serviço! Você será bem remunerado e com status, mas
com muita responsabilidade.
Vamos ver se vocês estão realmente atentos: lembram-se quando eu disse que a
regressão tinha a ver com todas as empresas, todas as receitas de vendas e todos
os gastos em propaganda?
Atenção, até agora falamos de uma regressão com a população, ou universo, das
variáveis escolhidas. Mas, na maioria dos casos, não possuímos o universo. Por
exemplo, no caso de uma regressão do valor salarial obtido por um trabalhador em
função do nível de escolaridade de cada um destes, é praticamente impossível se
realizar este exercício, pois a base de dados para isto é infinitamente grande.
Assim, na maior parte das vezes, o pesquisador acaba trabalhando com uma
amostra! Ao se avaliar uma regressão para uma amostra estaremos a estimar os
parâmetros de regressão (a e p na equação (1)), ou como nós falamos no dia a
dia, estimar uma regressão.
- “Tá bom Professor, mas, afinal de contas, como se estima uma regressão?”
Ótimo! Tente imaginar um momento: a estimativa dos parâmetros deve ser feita de
forma a garantir o que?
É isso! De forma a minimizar os erros. Isso é feito pelo método dos Mínimos
Quadrados Ordinários (MQO) que nos dá um valor estimado para a e p, que,
chamaremos, a partir daqui, de a e b.
Com base no fato de que a média dos erros é igual a zero, não há como se
minimizar a soma dos erros, dado que o valor sempre será zero. Assim, o objetivo
do método é minimizar a soma dos quadrados dos erros, o que é feito pelo
X x ty t _ C o v ( x ,y )
Xx f V ar(x )
a = y — bx
xi = xi - x
Exercício 1
Só para vocês ficarem contentes em ver uma aplicação prática, vamos fazer
um exemplo. Vamos lá! Dada a seguinte série de dados, estime a regressão
linear Y = f(X), ou costumeiramente chamada de “Y contra X”.
Variáveis X Y
103 160
123 167
145 207
126 173
189 256
211 290
178 237
155 209
141 193
156 219
166 235
179 234
197 273
204 272
125 181
112 166
107 161
135 195
144 201
188 255
Soma 3084 4284
Média 154,2 214,2
Resolução
X Y (Ycentrado)2
Variáveis X Y X(centrado)*Y(centrado) (Xcentrado)2
centrado centrado
103 160 -51,2 -54,2 277 5 ,0 4 262 1 ,4 4 2 9 3 7,64
123 167 -31,2 -47,2 1472,64 9 7 3 ,4 4 2 2 2 7,84
145 207 -9,2 -7,2 66 ,2 4 84,64 51,84
126 173 -28,2 -41,2 1161,84 7 9 5 ,2 4 1697,44
189 256 34,8 4 1 ,8 1454,64 1211,04 1747,24
211 290 56,8 75,8 4 3 0 5 ,4 4 3 2 2 6 ,2 4 5 7 4 5 ,6 4
178 237 23,8 22,8 5 42,64 5 6 6 ,4 4 5 1 9 ,8 4
155 209 0,8 -5,2 -4,16 0,64 27,04
141 193 -13,2 -21,2 279,84 174,24 4 4 9 ,4 4
156 219 1,8 4,8 8,64 3,24 23,04
166 235 11,8 20,8 245,44 139,24 4 3 2 ,6 4
179 234 24,8 19,8 4 9 1 ,0 4 6 1 5 ,0 4 3 9 2 ,0 4
197 273 4 2 ,8 58,8 251 6 ,6 4 1831,84 3 4 5 7 ,4 4
204 272 4 9 ,8 57,8 287 8 ,4 4 248 0 ,0 4 3 3 4 0 ,8 4
125 181 -29,2 -33,2 9 69,44 8 5 2 ,6 4 1102,24
112 166 -42,2 -48,2 203 4 ,0 4 1780,84 2 3 2 3,24
107 161 -47,2 -53,2 251 1 ,0 4 222 7 ,8 4 2 8 3 0,24
135 195 -19,2 -19,2 3 68,64 3 6 8 ,6 4 3 6 8 ,6 4
144 201 -10,2 -13,2 134,64 104,04 174,24
188 255 33,8 4 0 ,8 1379,04 1142,44 1664,64
Soma 3084 4284 21199,2 31513,2
Média 154,2 214,2 1059,96 1575,66
resolução.
a = y - b x = 2 1 4, 2 - 1,2 0 7 * 1 5 4, 2 = 2 8, 0 5
y. = 2 8, 0 5 + 1,2 0 7xt
Voltando à aula!
Cabe destacar a diferença entre erros e resíduos. Os erros são decorrentes dos
aspectos que relatamos acima, já os resíduos são os erros de ajuste após a
estimação da reta original (1), ou seja, na regressão feita com base na amostra e
não mais na população. Assim, a versão estimada de (1) é dada por:
yt = a + bxi + et (2)
Então, estes parâmetros são a versão estimada dos parâmetros na equação (1).
Portanto, et são os resíduos da regressão com base em uma amostra n da
população N.
Meus amigos, vocês conseguem enxergar que este resíduo tem mais um problema
além dos já citados para os erros? Lembra do gerente comercial eficiente que pediu
demissão? Então, este é um desvio natural de se interpretar um comportamento
econômico, derivado de influências de infinitas variáveis, a partir de uma reta.
Agora, há outro fator em cena, há um "erro” decorrente de se inferir uma estimativa
da reta (1) a partir de (2). Ou seja, o fato de nós só termos uma amostra leva a
desvios com relação à estimativa dos parâmetros. Dado que, com base na nossa
regressão estimada, o valor esperado de y (y) é:
yt = a + bxj
ei = yi ~( a + bXi)
ei = yt - yt
Bom pessoal, nós já temos uma estimativa de uma regressão, agora vocês podem
estar se perguntando: "Será que isso está bom? Será que esta reta representa bem
a situação ocorrida no mundo real?” Nós vamos estudar isso a seguir.
Exercício 2
%Y. = 1 o0
ü l = 60
I YtX. = 6 5 0
= 4 00
I Yj2 = 1 0 8 0
Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-
se que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão
do lucro bruto anual, em mil reais, será de:
a) 158
b) 128,4
c) 121
d) 102,5
e) 84
Resolução
Bom, primeiramente, não caia na armadilha! Estes valores que o exercício te deu
não estão centrados na média. Portanto, com base em propriedades estatísticas,
pode-se demonstrar que:
a = y — bx
100 60
10
7. Tabela ANOVA
Agora vamos falar sobre o grau de ajustamento de uma regressão. Isso é, quanto
uma reta explica dos dados?
Bom, é fácil pensar que há uma parcela da variação explicada pela regressão, ou
seja, aqueles parâmetros que nós estimamos devem explicar parte da variação real
nas observações da amostra, excluída a parte explicada pelos resíduos.
Ok. Acho que esta parte que fica mais intuitiva com a matemática. E aí, qual a
expressão que vocês acham que representa a parcela explicada por uma regressão
realizada com base em uma amostra? Claro que é:
y t = a + bxi
Dado que a é constante, ela não compõe a parte da variância explicada. Assim, com
o intuito de se definir uma expressão para a variância explicada pode-se descartá-
la:
y. = bxt
Portanto, trata-se da parte estimada da reta que dá o valor previsto de y para cada
x, que é costumeiramente descrita como a variável dependente com um acento
circunflexo em cima.
y —y = e
Mas, sabendo-se que os resíduos têm soma igual à zero, o estudo será feito com
base na soma dos quadrados dos resíduos e, por conseqüência, com base na
soma dos quadrados explicados e na soma dos quadrados totais.
Vamos, primeiro, pelo mais fácil. A soma dos quadrados totais (SQT) é:
S Q T = £y?
Vocês estão entendendo o que nós estamos fazendo? Em termos bem leigos, nós
estamos decompondo o quanto uma regressão consegue explicar de quanto ela não
consegue! Será que você consegue pensar em um jeito de dizer, em termos
percentuais, o quanto uma regressão consegue explicar de uma série de dados, ou
seja, o quanto a regressão estimada se aproxima do real processo gerador de
dados (equação (1))?
tome nota!
Este é o famoso R2 ou coeficiente de determinação. Ele determina "o quanto a
regressão está conseguindo refazer da série original a partir de valores estimados”.
Assim, a regressão será bem ajustada quanto mais próximo este coeficiente se
aproximar de 1. Ou seja, um valor de 0,97 indica que a regressão estimada 97% da
variância de y é explicada por x.
Esta é, somente, uma das formas de se encontrar o R2. Mas, ela já caiu várias
vezes, então, meus amigos, vou simplificar para vocês: decorem!
Quadrados
Soma dos Quadrados Graus de Liberdade Teste F
Médios
SQE
SQE K
k
SQR
SQR N- k- 1
n —k — 1
SQT
SQT N- 1
n —1
Novamente pessoal, vamos nos lembrar das aulas de Estatística. Sendo SQR a
soma dos quadrados dos resíduos e sua média igual a zero, se nós dividirmos tal
expressão pelos seus graus de liberdade, o que teríamos?
2=
a2 SQR
N -k - 1
Bom, nós já temos a variância dos erros e a variância explicada pela regressão,
SOE
dada por - j -, portanto cabe questionar: será que a esta regressão faz sentido?
Como nós podemos verificar isso? Por meio do teste F. O teste F é um teste
estatístico que visa comparar variâncias e se a diferença entre ambas é
estatisticamente significante. Analiticamente, sob a hipótese nula, o quociente entre
dois quadrados médios, isso é, entre duas variâncias, segue uma distribuição F.
A título de ilustração vamos nos utilizar da tabela ANOVA que nós construímos.
Portanto:
SQE
N - k - 1
Sob a hipótese nula de que estas duas variâncias são iguais, a estatística de teste
segue uma distribuição F com k graus de liberdade no numerador e N - k - 1 graus
de liberdade no denominador.
O que você está buscando? Bom, quando você estima uma regressão, você busca
encontrar uma relação estatisticamente significante que explique o fenômeno que
está em estudo. Assim, se você concluir que não há como rejeitar a hipótese nula
de que a variância explicada pela sua regressão é igual à variância dos resíduos, na
verdade, você não encontrou nada! Isso deriva do fato de que, se isso aconteceu, é
muito provável que toda parcela que você conseguiu explicar da variável
dependente foi por acaso, o que deve ter acontecido somente em virtude da
variação dos erros e não de uma especificação correta de uma reta. Ou seja, toda
r INDO
^ - / mmais
a i fundo Antes de encerrarmos o assunto sobre o teste F,
temos de ressaltar uma coisa importante. A teoria estatística por detrás da
derivação do teste exige que a variável y seja normalmente distribuída.
Todo mundo se lembra da distribuição normal das aulas de estatística, certo? Trata-
se de uma distribuição de probabilidade, que associa determinado valor a
determinada probabilidade da seguinte forma:
Já que y é composto de uma parte fixa (reta) e de uma parte aleatória (erro), a
variância da variável explicada é igual à variância do erro. Assim, a hipótese de
normalidade de y é equivalente a se afirmar que o erro tem de ser normalmente
distribuído. Portanto, esta será nossa segunda hipótese sobre o modelo de
regressão.
Exercício 3.
%Y. = 1 o0
ü l = 60
I YtX. = 6 5 0
= 4 00
I Yj2 = 1 0 8 0
Assim, chega-se ao gabarito (e). Sabe-se que a alternativa (c) está incorreta porque
o R2 surge da divisão da variação explicada pela total, enquanto que a alternativa
(d) advém da divisão dos quadrados médios explicados e dos resíduos e não
somente da variação.
Na última seção nós vimos como o teste F avalia a hipótese conjunta de que todos
os coeficientes têm valor igual a zero. Agora vamos avaliar a significância estatística
dos coeficientes, um por um. Com efeito, vamos avaliar a significância estatística de
b isoladamente, tal como na equação (2)
y t = a + b jX 1 + b 2X2 + - bnxn + et
Então meus amigos, agora que vocês entenderam o porquê do teste de hipóteses,
além do teste F, vamos entender como operacionalizá-lo.
Vamos para um exemplo prático de nossa aula. Com base na nossa amostra e na
regressão estimada, será que os gastos em propaganda realmente afetam as
vendas da empresa? Isso seria equivalente a estipular duas hipóteses, uma
hipótese nula (H0) e outra alternativa (Hx) de tal forma que:
H 0:b = 0
H ^ .b * 0
b —0
Sendo s o valor estimado para o desvio padrão do parâmetro, que, por se tratar de
uma amostra, é desconhecida.2
SQR
2 _ N - k - 1
5 Ift)2
Caso o valor calculado seja inferior ao valor tabelado, isto significa que não é
possível rejeitar a hipótese nula de que o coeficiente da reta é igual a zero,
3 A consulta na tabela irá depender dos graus de liberdade dos quadrados médios dos resíduos e da
significância estatística que o pesquisador achar relevante, como 5%, por exemplo, o que se escreve como
t(N-k-1,5%).
Caso o valor calculado supere o valor tabelado (área cinza gráfico), rejeita-se a
hipótese nula de que o coeficiente é igual a zero. Ou seja, como aquele "cantinho” é
improvável no caso de a hipótese nula ser verdadeira e como a estatística de teste
nos diz que o valor encontrado está lá, a hipótese nula deve estar errada.
Entenderam?
Uma coisinha: tal como no caso do teste F, a avaliação destes coeficientes por
meio de testes de hipóteses exige que os erros sejam normalmente distribuídos.
Vamos lá, lembram-se das 2 hipóteses que dissemos ser necessárias para a
atividade de análise de regressão?
Veja, tudo que nós discutimos na seção anterior tem a ver com o estimador MQO.
Uma característica importante para um estimador é a sua ausência de viés. Quando
eu digo "viés” é exatamente isso que vocês estão pensando. Ao afirmar que a
opinião de uma pessoa sobre determinado assunto é "enviesada”, você está
dizendo que ela está se distanciando dos fatos da realidade e "puxando a sardinha”
para uma determinada conclusão.
Se eu digo para vocês que um estimador não é viesado, eu estou dizendo que, na
média, ele “acerta”, ou seja, dá o valor real do parâmetro. Vou repetir um
pouquinho da seção anterior, só para vocês lembrarem.
y t = a + p ±x ! + p 2x 2 + - p nxn + et
E{b) = p
Quem pensou assim é um verdadeiro concurseiro, com meio caminho andado para
sua aprovação. Você tem que ser objetivo e focar em resultados e não em
perfumarias. Se você gostar muito de Estatística e quiser aprender isso, passe no
concurso e vá fazer um Mestrado ou Doutorado depois, agora, pense no concurso.
Mas, quem quiser dar uma olhada na demonstração, dê uma olhada no livro do meu
orientador de doutorado, Rodolfo Hoffmann, “Análise de Regressão: uma
introdução à Econometria”.
Então, vamos direto ao ponto. Para garantir o não viés de um estimador de uma
regressão linear, assuma a 1â "hipótese” do modelo de regressão linear e
acrescente:
FIQ U E
3° Hipótese sobre o modelo de regressão linear
atento!
E O jX j) = 0
O que nós estamos dizendo aqui? Vejamos, vamos ao exemplo dos gastos em
propaganda.
Assim, aquelas 2 condições são necessárias para se concluir que o estimador MQO
seja não viesado.
Bom, mas isso não basta para provar que um estimador é eficiente.
Novamente, vocês não têm que saber como derivar tal teorema (no livro do Prof.
Hoffmann você também encontra tal demonstração), então vamos direto ao que
interessa. As pressuposições são as mesmas necessárias para garantir o não viés e
mais estas duas:
VarÇsí) = o 2 = constante
Ef esj ) = 0 , i ± j
Ou seja, os erros não são autocorrelacionados.
Var(£i) = a- Xi
Se isso ocorrer, você concorda que a variância será função do valor da variável
explicativa e, portanto, não constante? Se isso ocorrer, surgirão problemas na
análise de regressão, conforme será discutido mais adiante. Quando a variância dos
erros não é constante, chamamos a este problema de heterocedasticidade.
Vocês lembram de que eu disse que, por enquanto, estamos trabalhando com
dados em cortes transversais, ou seja, com observações para diferentes unidades
no mesmo período de tempo (como no caso dos gastos com propaganda, que
avaliamos diferentes empresas em um único ponto do tempo, um ano, por
exemplo)? Então, a hipótese 5â, na maior parte dos casos, só é violada quando
estamos trabalhando com séries de tempo, ou seja, observações para uma mesma
unidade em diferentes períodos do tempo (seria o equivalente a avaliar a questão
dos gastos com propaganda em uma única empresa, mas ao longo do tempo).
Então, se estas hipóteses estiverem valendo, você pode dizer que sua Regressão
Linear Simples é BLUE.
Ufa! Falamos para burro ao longo deste curso, portanto chega de conversa e
vamos fazer exercícios.
Exercício 4
Média de X = 12,5
Média de Y = 19
Variância de X = 30
Variância de Y = 54
Covariância entre X e Y = 36
a) Y = 19 + 0,667*X
b) Y = 12,5 + 1,2*X
c) Y = 4 + 1,2 X
d) Y = 19 + 1,2 X
e) Y = 80 + 22,8X
Resolução
Vamos lá!
B _ Covjx.y) 36 ^
V ar(x ) 30 '
a = y - f i x = l 9 - (1,2 ) ■( 12, 5) = 4
Exercício 5
a) 144
b) 18
c) 36
d) 72
e) 48
Resolução
Bom, essa é complicada. Agora vamos ter que para pensar um pouquinho. Vamos
nos relembrar de como é calculada a estatística F:
SQE
N - k - l
N-k-l
Viram? Esta é uma forma muito importante de se definir o cálculo do R2. Decorem!
SQE U bxd2 b ^ jx d 2
SQT 2C9í ) 2 K 9 i) 2
V ar(a ■x) = a 2V a r ( x )
Se a = constante.
h2 (xt - x )2
r2 = b N - 1 = b Var(x)
(Vi - 9)2 Var(y)
N -1
f i2 = ( 1 2)2 Q ) = a8
1 - R 2 = 0, 2
0,8
F = 1 =7 2
r 02 '2
18
Exercício 6
£ Yr-ici-pXi)
a) í = l
b)
n
£ [ y í —( a —p X j j f
C )i = l
íi
E [y f-? í]
d) -i = l
, t\Y }-ía -0 X ,f
e) í = l
Resolução
Pessoal, o que faz o método do MQO?
Isso mesmo! Ele minimiza a soma dos quadrados dos resíduos. Portanto, é fácil
perceber que a expressão que mostra isso, dada a notação usada na questão, é:
O gabarito é (a), mas está incorreto, pois deveria haver um sinal de "+” antes de p.
Portanto, foi anulada.
Exercício 7
Resolução
Essa é bem fácil. A alternativa (b) é a definição de homocedasticidade.
Exercício 8
Resolução
Vamos aplicar a fórmula do teste F:
n —k —1 20
Alternativa (c).
Exercício 9
Resolução
Verdadeira! Como eu disse, controvérsias à parte, mesmo que os erros não sejam
normalmente distribuídos, a eficiência do estimador não é afetada.
Exercício 10
Resolução
Exercício 11
Resolução
Perfeito. Esta é uma das condições necessárias impostas pelo Teorema de Gauss-
Markov, que demonstra que o estimador MQO é BLUE.
R2= 0,39
Questão 12
Resolução
Pessoal, substituam:
E{P) = 30 + 20 ■2 + 10 ■1 = 80
Questão 13
Resolução
Gente, a alternativa está falando do R2. No caso, ele é de 39%, portanto não explica
mais da metade da variação dos preços. Alternativa Falsa.
Questão 14
Resolução
Exercício 15
a)
b)
c)
d)
e)
Resolução
Assim:
Var(x) = 9 —( 2) 2 = 5
^V ar(x) V5
CV =
E(x) 2
Alternativa (a)
Exercício 16
Resolução
Exercício 17
Foi usada a técnica de minimizar a soma dos erros quadráticos para ajustar a
reta de regressão, a qual
a) passa por (X, Y), onde X e Y são as médias de X e de Y.
b) passa pela origem (0, 0).
c) não é a única reta que minimiza a soma dos erros quadráticos.
d) tem variância esperada nula.
e) tem coeficiente angular necessariamente negativo.
Resolução
Exercício 18
Resolução
C o v ( x ,y )
^ x,y d p { x ) •d p ( y )
Portanto, quando a correlação for nula, a covariância também o será. Alternativa (a).
Exercício 19
Resolução
desvio padrão a
média X
A média nós já temos, portanto temos que calcular a variância com base na
seguinte fórmula:
Variancia Y =
Esta última conta é meio complicada, mas não tem jeito! A melhor forma de
encontrar a resposta é utilizar jo , 25. Como os números são bem próximos, você
consegue perceber que o coeficiente de variação de Y será menor do que o de X,
eliminando a maior parte das alternativas. A alternativa (d), também não seria
possível, pois cv(Y) não chegaria a ser metade do de X.
Alternativa (b).
Exercício 20
Resolução
Exercício 21
Resolução
Vamos inverter um raciocínio que já fizemos a fim de encontrar o R2! Veja a fórmula
que já usamos:
EL
p _ k
n —k —1
R*_ El
14 = ------ - ^ 14 = — 3
1-R2 1-R2
12 - 3 - 1 8
1-R2 R2 14 - 1 4R2 R2
14x( 8 j = 8 = T
42
( 14 - 14^2 ) x 3 = 8^2 ^ 42 - 42R2 = 8R2 ^ R2 = — = 0, 84 = 84%
Alternativa (e).
Exercício 4
Média de X = 12,5
Média de Y = 19
Variância de X = 30
Variância de Y = 54
Covariância entre X e Y = 36
a) Y = 19 + 0,667*X
b) Y = 12,5 + 1,2*X
c) Y = 4 + 1,2 X
d) Y = 19 + 1,2 X
e) Y = 80 + 22,8X
Exercício 5
a) 144
b) 18
c) 36
d) 72
e) 48
Exercício 6
a) í = l
n
£ [ Y i - ( a - 0Xi)f
c )i = l
n
d) 1 = 1
Exercício 7
Exercício 8
Exercício 9
Exercício 10
Exercício 11
R2= 0,39
Questão 12
Questão 13
Questão 14
Exercício 15
a)
b) 5;V5
V2
c) V5 ’ 5
._2_
V5
d) ’V5
e)
Exercício 16
Exercício 17
Foi usada a técnica de minimizar a soma dos erros quadráticos para ajustar a
reta de regressão, a qual
Exercício 18
Exercício 19
Exercício 20
Exercício 21
a)
00 o> o
o 00 o
b)
c)
d) 72,0.
CO
<3
e)
Gabarito
2- d
3- e
4- c
5- d
6- anulada
7- b
8- c
9- Certo
10- Errado
11- Certo
12- Errado
13- Errado
14- Errado
15- a
16- b
17- b
18- a
19- b
20- e
21- e
jeronymo@estrategiaconcursos.com.br