Você está na página 1de 8

Universidade Potiguar

Mestrado Profissional em Administrao

Felipe de Souza Ferrucio da Rocha


Marcelo Santos Arcanjo
Cntia Regina Galo

MTODOS QUANTITATIVOS
Exerccio 4 Regresso Linear e Correlao

Natal
2015

1.

O que significa correlao espria? Nesse contexto, explique a importncia de

entender a correlao como uma anlise confirmatria e no como uma anlise


exploratria.
Segundo Marconi e Lakatos (2003) a primeira e mais importante pergunta do pesquisador
trata-se de uma relao real?. Ou seja, a relao inerente entre as duas variveis ou uma
relao acidental. Os autores ainda afirmam que espria a interpretao e no a relao em
si. A relao espria significa que nenhuma das variveis exerce influncia sobre a outra.
Correlao espria se refere correlao de dois fenmenos distintos, que no possuem
qualquer relao entre si, porm, por uma questo do acaso, demonstram um forte vnculo
estatstico. Ou seja, h uma forte correlao entre os eventos, muito embora, no possvel
estabelecer qualquer relao de causa e efeito aos mesmos.
Nesse sentido, a correlao utilizada como uma anlise confirmatria, partindo-se da
hiptese levantada no problema de pesquisa e no uma anlise exploratria, haja vista a
possibilidade de se identificar correlaes estatisticamente relevantes, porm sem nenhuma
explicao de relao entre os eventos ou fenmenos evidenciados.
2.

O que fazer no caso do coeficiente de correlao linear encontrado ficar prximo

de zero? O que pode ter acontecido?


Ao se deparar com um caso do coeficiente de correlao linear prximo a zero, deve-se
buscar a verificao do comportamento dos coeficientes atravs de um grfico, de modo
avaliar se o mesmo pode ser aplicado a outro tipo de correlao, como o caso da correlao
exponencial, por exemplo.
Corra (2010) afirma que uma boa maneira de detectar a correlao entre as variveis a
plotagem do grfico de disperso. No grfico fica mais claro a tendncia entre as variveis,
ficando mais fcil identificar se existe uma relao forte ou uma disperso mais acentuada,
no configurando correlao.

3.

Por que imprescindvel para a gesto (controle, previso) de uma varivel

exgena que a correlao seja avaliada entre essa varivel e uma varivel sob controle
da gesto?
Partindo-se da afirmao de que h uma das variveis sob o controle da gesto, pode-se
observar e prever o comportamento da varivel exgena quando da existncia de correlao
entre ambas, podendo haver um tendncia de uma subir/crescer ao passo que a outra tambm

sobe/cresce, cair/decrescer ao passo que a outra cai/decresce ou mesmo de uma subir/crescer


enquanto que a outra cai/decresce e vice-versa.
4.

Um modelo pretende entender o comportamento da varivel Z a partir do

comportamento das variveis X e Y. Explique por que essa estratgia no interessante


se X e Y estiverem fortemente correlacionados.
Caso exista uma forte correlao entre as variveis independentes, o poder de explicao, ou
seja a determinao (R) diminuir, pois as variveis esto explicando a mesma poro do
fenmeno. A fraca correlao entre as variveis independentes acabar por explicar melhor a
relao causa-efeito da varivel dependente, bem como ser mais fcil identificar a
intensidade de mudana de comportamento que as variveis produzem.
Segundo Naghettini e Pinto (2007) em situaes onde as variveis explicativas possuem
correlao forte as mesmas no fornecem novas informaes e dados, dificultando e
empobrecendo a interpretao dos dados obtidos na regresso linear mltipla. Os autores
indicam a necessidade de criar uma matriz de correlao com as variveis a serem inseridas
no modelo de regresso de modo a encontrar as variveis explicativas que se correlacionam,
excluindo em seguida aquelas que apresentarem uma correlao superior 0,85.
5.

Comente a frase: Mesmo que no haja uma forte correlao linear entre as duas

variveis estudadas, sempre ser possvel traar a reta que melhor aproxima o
comportamento conjunto dessas duas variveis.
De acordo com a afirmao, percebe-se que possvel traar uma reta para demonstrar um
comportamento conjunto de duas variveis, ainda que no seja evidenciada uma forte
correlao linear. Entretanto, isso possvel apenas quando aumenta-se consideravelmente a
escala do grfico observado de modo a tentar forar a existncia da linearidade da
correlao entre as variveis analisadas.
6.

Por que importante proceder aos testes de hipteses sobre os coeficientes da

regresso para garantir o sucesso dessa anlise?


O teste de hiptese, neste caso, ganha importncia no sentido de poder dar
garantia de que o modelo utilizado na anlise da regresso , de fato, adequado.
7.

Parte 1:

A partir de um levantamento minucioso dos dados disponveis, chegamos concluso


que o fator catalisador para as oscilaes no Custo de Mo de Obra Direto foi a variao
presente na quantidade de horas extras trabalhadas pelos funcionrios da produo. Ficou
evidente que houve um descontrole produtivo, gerando uma grande variao nas horas extras
executadas, afetando assim diretamente e proporcionalmente o CMOD.
A variao nas Horas extras teve impacto direto no custo do CMOD devido alta
correlao entre as duas variveis. O coeficiente de Pearson para as duas variveis chegou a
0,924. O alto valor do coeficiente, que se aproxima do mximo, faz com que exista uma
intensidade maior na correlao, acentuando as oscilaes no CMOD quando da variao nas
horas extras. Vale salientar, que o motivo do aumento s explicado pois claro e evidente
que o impacto causado no CMOD pelas horas extras ser real e justificar a correlao uma
vez que os custos de mo de obra estaro inclusos dentro do custo de mo de obra direto.
Aps teste de hipteses ficou observado, com margem de erro menor que 1%, que de fato, a
correlao encontrada de 0,924 pode ser atestada com vlida para a amostra.
De acordo com os dados fornecidos, podemos tentar prever que as oscilaes de horas
extras realizados pelos funcionrios da produo podem ter sido causadas pela necessidade de
a produo se equiparar a alta eficincia da cadeia logstica da empresa. Excluindo-se
eventuais problemas externos, podemos deduzir que existe um gargalo entre a produo e
distribuio da empresa, fazendo com que seja mais difcil controlar os custos de mo de obra
direta.
Podemos extrair do grfico abaixo a correlao existente, e como fica evidente a relao
linear entre as variveis, fazendo com que seja inclusive possvel prever os valores de CMOD
para cada valor de horas extras trabalhadas.
Grfico 1

Parte 2:

Para anlise e previso dos valores de CMOD para o futuro, foi utilizado o modelo de
Regresso Linear que tem por finalidade explicar uma variao numa varivel, nesse caso o
CMOD, usando as variaes de outras variveis. No nosso modelo, a varivel independente
a quantidade de horas extras realizadas pelos funcionrios. Analisaremos a quantidade de
horas extras executadas de modo a tentar prever e controlar o CMOD, que ser nossa varivel
dependente.
O primeiro passo foi a proposio de um modelo terico, que concluiu que o impacto das
horas extras seria exatamente no custo de mo de obra na produo da empresa, uma vez que
as horas extras so custos que esto relacionados com a mo de obra. So os funcionrios que
recebem e trabalham nas horas extras. Iniciou-se a anlise dos dados fornecidos de modo a
confirmar a teoria proposta. Conforme resultado demonstrado no exemplo anterior, a
correlao entre as variveis foi forte e positiva, determinando uma correlao diretamente
proporcional. Ou seja, cada vez que se aumentasse o nmero de horas extras, o custo de mo
de obra direto iria se aumentar em mesma proporo.
A ferramenta utilizada para a anlise dos dados foi o Excel 2010. Utilizamos a ferramenta de
anlise de dados presente no prprio software para a realizao da regresso linear. Alguns
valores so importantes para a melhor compreenso do modelo proposto. A correlao
encontrada entre as duas variveis, que aqui chamaremos de x e y, foi de 0,924. A
determinao, que o coeficiente que determina o grau de explicao das variveis pelo
modelo proposto foi de 0,854, ou seja, o modelo consegue explicar o fenmeno em 85,4% dos
casos.
Procedeu-se ento para a determinao da equao da linha de regresso, de modo a
possibilitar a previso dos valores futuros quando da alterao da varivel independente. A
equao da linha de tendncia encontrada foi a seguinte:

Y = ax + c
Y = 7,1069 x X + 125840
Onde:
Y = Varivel dependente;
X= Varivel independente;
a = Coeficiente Angular
c = Coeficiente Linear

Com a equao acima j possvel prever os valores para o CMOD (varivel Y) quando
existir variaes nas horas extras (varivel X). Vale salientar que existe uma margem de erro
atrelada ao modelo e a equao proposta. interessante ento se trabalhar com um intervalo
de previso que tenha uma maior confiana, no qual chamaremos de intervalo de confiana.
Para determinao do intervalo de confiana, para cada valor de Y ser necessrio adicionar o
erro padro uma vez, que determinar o limite superior do intervalo; ser necessrio subtrair o
erro padro uma vez, que resultar no limite inferior do intervalo.
O erro padro da regresso ou erro padro do resduo o desvio padro dos valores previstos
da varivel dependente ao redor da linha de regresso estimada. O erro padro para a amostra
foi de: 7.385,56.
Limite Superior:
Y= 7,1069 x X + 125.840 + 7385,56
Y = 7,1069 x X + 125840
Limite Inferior:
Y= 7,1069 x X + 125.840 - 7385,56

Procedemos ento para o teste de hipteses, de modo a confirmar se o modelo elaborado


poderia ser utilizado com confiana ou no. No nosso modelo, testamos se a inclinao da reta
de tendncia existe na prtica e pode ser usada. As hipteses propostas foram:

H0

b1 = 0

H1

b1 0

Onde: b1 a inclinao da reta de regresso.


O valor-p encontrado para o modelo de regresso proposto foi de 1,80x10 -9 e 5,985x10-9.
Conforme segue:
valor-P
1,80082E-09
5,98573E-09

Foi possvel ento rejeitar a hiptese nula com um erro menor que 0,1% de preciso. Para o
modelo proposto, o erro foi aceito e acatado, validando assim o modelo e a equao de
regresso apresentados.

Vale ressaltar, que o modelo proposto possui limitaes prprias. Fica claro que as margens de
erro, erro padro, e intervalo de confiana so maneiras de se tentar aplicar o modelo como
maior preciso e segurana. Portanto o modelo dever ser usado como estimativa e mais
observaes devem ser realizadas de modo a corroborar com os dados j coletados.
Outra limitao presente no modelo o intervalo de relevncia do modelo. S foram
observados no modelo quantidades de horas extras que variaram de 12000 at 20000. Isso
implica que no modelo proposto, a previso de valores futuros dever estar dentro deste
intervalo, pois no houveram dados de valores acima ou abaixo destes limites, invalidando
assim o modelo para valores no previamente testados.
Jacobi e Souza (2002) alertam para algumas limitaes e ressalvas quando da utilizao de
modelos de regresso para previso de valores futuros para a varivel dependente.
Qualquer previso utilizando-se o modelo de regresso ser condicional, pois
depender da influncia da varivel independente na varivel dependente.
A reta de regresso estimada usando dados passados. Se a relao entre X e Y
se modificar, a reta no poder predizer valores futuros.
Muitas previses de regresso procuram prever valores para a varivel
dependente em situaes em que o valor da varivel independente est fora do
interalo de relevancia do modelo. Essas previses so conhecidas como
extrapolaes, e so muito menos confiveis e precisas que previses feitas dentro
do intervalo de relevncia da amostra.
A simples correlao entre as duas variveis no necessariamente explica uma
relao causal entre as duas. Quando da anlise da reta de regresso, quatro
situaes podem surgir:

Os valores so realmente dependentes, como prevamos.

A relao pode ser completamente aleatria e casual.

Pode haver uma varivel exgena afetando X e Y.

Pode realmente existir a relao causal entre as variveis, mas Y


influencia em X e no o contrrio. Ou seja, foram adotados variveis
dependentes e independentes erroneamente.

JACOBI, Luciane Flores; SOUZA, Adriano Mendona


Silva. Grfico

de

controle

de

regresso

and PEREIRA, Joo Eduardo da

aplicado

na

monitorao

processos.Prod. [online]. 2002, vol.12, n.1, pp. 46-59. ISSN 0103-6513.

de