Você está na página 1de 13

Análise de regressão 1

1. INTRODUÇÃO

No presente trabalho iremos abordar sobre diferentes temas relacionados a analise de


regressão. Tema este que foi falado detalhadamente na cadeira de métodos quantitativos, e
nesse trabalho iremos analisar a relação entre o rendimento e as diferentes variáveis que serão
apresentadas ao longo do trabalho.

Com essa análise poderemos verificar em que medida essas variáveis interferem no nosso
rendimento. Nas variáveis que aqui temos, nesse caso, o rendimento que é a variável
dependente e o restante das variáveis (Preço do produto, gastos com produção, despesas
correntes e gastos em publicidade) independentes.

Iremos analisar essas variáveis mencionadas no paragrafo anterior de modo a ver ate que
ponto afetam o lucro da nossa empresa de modo a verificar essa interferência e gerir da
melhor forma possível.

Durante a realização do trabalho serão feitos diferentes testes que nos permitirão verificar
com dados concretos os pressupostos do nosso modelo.

2. OBJECTIVOS DO TRABALHO
2.1 Objectivo Geral
• Definir um modelo de regressão capaz de prever o rendimento da organização em
função das variáveis existentes.

2.2 Objectivos Específicos


• Identificar o modelo económico e estatístico
• Verificar os pressupostos do modelo
• Avaliar a qualidade de Modelo
• Interpretar a aplicabilidade do Modelo.

7 de junho de 2023
Análise de regressão 2

3. CONTEXTUALIZAÇÃO

Durante o trabalho são apresentados os pressupostos verificados pelos diferentes testes e os


devidos resíduos, de modo a ver se esses não interferem nosso modelo, e garantir o controle
dos mesmos. Tais análises vão nos ajudar a conhecer a situação do lucro da nossa empresa.

Os testes que serão efetuados (test t e teste F) irão nos ajudar a verificar se o modelo existe ou
não (de forma global através do teste F) e se as variáveis são ou não aceites (através do teste t)
verificando o nível de significância e o P-Value.

Em relação aos resíduos irá realizar-se 4 testes, nomeadamente: Linearidade, normalidade,


autocorrelação e Homocedasticidade.

7 de junho de 2023
Análise de regressão 3

4. REVISÃO DE LITERATURA

Análise de regressão é uma técnica estatística que estuda a relação entre uma variável
dependente e uma ou mais variáveis independentes, com vista a fazer previsões da primeira
em relação a segunda variável. (Gujarati, 2003)

Teste F para determinar se a variabilidade entre as médias do grupo é maior que a


variabilidade das observações dentro dos grupos. Ele avalia globalmente a existência do
modelo, se o valor do P for inferior que 5% o modelo é válido, se o valor do P for superior
que 5% o modelo não é válido. (Keselman, 1996)

Os testes t são testes de hipótese úteis na estatística quando é necessário comparar médias.
Ele avalia variável por variável para ver se tem alguma relação com a variável dependente, se
o valor do P for inferior que 5% são avaliados pelo modelo, se o valor do P for superior que
5% são retiradas do modelo. (Lazar, 2016)

Linearidade

É a capacidade de uma metodologia analítica demonstrar que os resultados obtidos são


diretamente proporcionais à concentração do analito na amostra, dentro de um intervalo
especificado. A linearidade é observada por meio ao teste dos resíduos, efetuado com recurso
ao gráfico de resíduos. (Lumley & Emerson, 2002)

Normalidade

O modelo de regressão supõe que todos erros estejam distribuídos normalmente (mesma
média, moda e mediana), a normalidade é testada com recurso ao teste de Shapiro˗Wilk. O
teste de Shapiro-Wilk tem como objetivo avaliar se uma distribuição é semelhante a uma
distribuição normal. (Yap & Sim, 2011)

7 de junho de 2023
Análise de regressão 4

Autocorrelação

A Autocorrelação representa o grau de similaridade entre uma determinada série temporal e


uma versão defasada de si mesma em intervalos de tempo sucessivos. A Autocorrelação mede
a relação entre o valor atual de uma variável e seus valores anteriores. (Jeong & Chung, 2001)

Homocedasticidade é uma característica de um modelo de regressão linear que implica que a


variância dos erros é constante ao longo do tempo. A homocedasticidade é testada com
recurso ao teste Breusch˗Pagan.

O teste de Breusch˗Pagan testa se as variâncias dos resíduos de uma regressão dependem dos
valores das variáveis independentes. (Cochran, 1937)

Coeficiente de determinação

O coeficiente de determinação, também chamado de R², é uma medida de ajuste de um


modelo estatístico linear generalizado, como a regressão linear simples ou múltipla, aos
valores observados de uma variável aleatória. (Rezende, 2005)

Colinearidade

Expressão da relação entre duas (colinearidade) ou mais (multicolinearidade) variáveis


independentes. Diz-se que duas variáveis independentes exibem colinearidade completa se
seu coeficiente de correlação é 1, e completa falta de colinearidade se o coeficiente de
correlação é 0. (JE Santillàn, 2011)

5. METODOLOGIA

Para a execução desse trabalho, a metodologia utilizada será a pesquisa narratia. A pesquisa
narrativa, no campo educacional, inclui bibliografias, relatos, depoimentos. Essa pesquisa tem
sido bastante utilizada nos últimos anos.

A escolha deste tipo de abordagem vem da ideia de através das diversas obras deixadas por
diferentes autores entender melhor a analise de regressão e os diferentes testes desse trabalho.

7 de junho de 2023
Análise de regressão 5

Nesse trabalho incluímos diversos autores que falam sobre a análise de regressão e através
dos conteúdos abordados por eles fizemos uma análise e isso ajudou-nos na interpretação dos
resultados obtidos.

5.1 Etapas da realização do trabalho


• Construção dos modelos (Economico e estatístico)
• Validação ou invalidação do modelo
• Verificação dos pressupostos
• Analise da qualidade do modelo
• Apresentação do modelo final
• Recomendação

7 de junho de 2023
Análise de regressão 6

6. CONSTRUÇÃO DOS MODELOS


6.1 Modelo Economico

Para a criação do modelo económico encontramos as seguintes variáveis, independentes e


dependente.

As variáveis que foram identificadas como sendo variáveis independentes são:

• Preço do produto;
• Gastos com produção;
• Despesas correntes;
• Gastos em publicidade.

A variável identificada como dependente é o Rendimento.

6.2 Modelo Estatístico

Tendo em conta as variáveis do modelo económico criamos o seguinte modelo estatístico:

Rendimento= ꬰ + ꞵ1(Preço do produto) + ꞵ2(Gastos com produção) + ꞵ3(Despesas correntes)


+ ꞵ4(Gastos em publicidade)

7. VALIDAÇÃO OU INVALIDAÇÃO DO MODELO


7.1 Teste F

ANOVA
gl SQ MQ F F de significação
Regressão 4 134097 33524,14 66,47096653 2,66334E-12
Resíduo 23 11599,9 504,3426
Total 27 145696

Interpretação

De forma global o modelo é valido, ou seja, o modelo existe, pois, o valor de P é inferior a
5%.

7 de junho de 2023
Análise de regressão 7

Por mais que o teste t recuse a aceitar algumas variáveis independentes do modelo, o teste f
analisa o parâmetro de forma global, por isso o modelo é válido.

7.2 Teste t

Coluna1 Coeficientes Erro Stat t valor- 95% 95% Inferior Superior


padrão P inferiores superiores 95,0% 95,0%
Interseção 230,1114 49,6324 4,636312 1E-04 127,439 332,7839 127,439 332,784
Variável -12,1014 10,3459 -1,16968 0,254 -33,5034 9,300701 -33,503 9,3007
X1
Variável 31,4444 3,71395 8,466558 2E-08 23,7615 39,1273 23,7615 39,1273
X2
Variável 4,648267 5,96387 0,779404 0,444 -7,68894 16,98548 -7,6889 16,9855
X3
Variável -5,07542 7,78903 -0,65161 0,521 -21,1883 11,03742 -21,188 11,0374
X4

Interpretação

As variáveis independentes preço do produto, despesas correntes e gastos em publicidade


apresentam um valor da probabilidade (P˗ value) superior a 5%, então elas serão retiradas do
modelo, pois não são aceites pelo mesmo pelo facto de não apresentarem nenhuma relação
com a variável dependente (rendimento)

7 de junho de 2023
Análise de regressão 8

8. VERIFICAÇÃO DOS PRESSUPOSTOS


8.1 Linearidade

Interpretação

No gráfico que esta apresentado acima podemos verificar que existe a linearidade, ou seja, os
nossos resíduos estão distribuídos de forma homogenia.

8.2 Autocorrelação

Model R R quadrado R quadrado Erro padrão Durbin-


o ajustado da estimativa Watson
1 ,959a ,920 ,907 22,458 ,824

Interpretação
No caso acima podemos verificar que o valor do Durbin-Watson se encontra fora do intervalo
pré-estabelecido (1.5 – 2.5), com isso podemos afirmar que a interação entre os resíduos
interfere no modelo e de certa forma pode prejudica-lo.

7 de junho de 2023
Análise de regressão 9

8.3 Normalidade

Gastos com Kolmogorov-Smirnovc Shapiro-Wilk


Produção Estatística df Sig. Estatística df Sig.
Rendimento 3 ,385 3 . ,750 3 ,000

Interpretação
No quadro acima verificamos que o nosso modelo não segue uma distribuição normal, pois o
seu nível de significância não está dentro dos parâmetros estabelecidos, ou seja, o nível de
significância é menor que 5%.

8.4 Homogeniedade

F df1 df2 Sig.


. 25 2 .

Interpretação
Nos nossos dados acima temos que o valor da significância do teste de Levene é inferior a
5%, nesse caso rejeitamos a hipótese de homogeneidade das variâncias, ou seja, os resíduos
não interferem no nosso modelo.

9. VERIFICAÇÃO DA QUALIDADE DE MODELO


9.1 Coeficiente de determinação

Estatística de regressão Coluna1


R múltiplo 0,959366057
R-Quadrado 0,920383231
R-quadrado ajustado 0,906536837
Erro padrão 22,45757244
Observações 28

7 de junho de 2023
Análise de regressão 10

Interpretação

Para que o modelo seja considerado com uma qualidade excelente è necessário que tenha um
R-Quadrado acima de 90%. No caso do nosso modelo podemos verificar através do quadro
que temos um R-Quadrado de 92,03%, nesse caso o nosso modelo tem uma qualidade
excelente.

9.2 Colinearidade

Estatísticas de
colinearidade

Tolerância VIF

,482 2,075
,238 4,210

,687 1,455
,245 4,074

Interpretação

Através da tabela nota-se que o VIF é 4,074. Tendo verificado que o VIF é inferior a 10, então
a qualidade do nosso modelo é boa e assumimos que não existe a Colinearidade.

7 de junho de 2023
Análise de regressão 11

10. APRESENTAÇÃO DO MODELO FINAL

Através dos testes realizados, nomeadamente, teste t e teste f, verificou-se inicialmente que o
modelo foi aceite e de seguida obtivemos os dados específicos das variáveis que foram ou não
aceites pelo modelo. Com isso, descartamos algumas variáveis e obtivemos desse modo o
modelo final que será apresentado abaixo:

Rendimento= ɑ+ ꞵ2(Gastos com produção)

Interpretação: Através desse modelo podemos chegar a conclusão para cada uma unidade dos
gastos de produção aumenta o nosso rendimento.

7 de junho de 2023
Análise de regressão 12

11. RECOMENDAÇÃO

Primeiramente através do teste t podemos verificar que algumas variáveis não foram aceites
pelo modelo, nomeadamente: Preço do produto, despesas correntes e gastos com publicidade.

Essas variáveis não foram aceites pelo modelo pois não satisfazem os requisitos necessários
para a sua aceitação, com isso essas mesmas variáveis serão retiradas do nosso modelo.

Forças do modelo

• A não existência da homogeneidade das variâncias;


• O R2 ser acima de 90% e com isso a qualidade do modelo ser excelente;
• A não verificação da linearidade o que representa qualidade boa do modelo.

Fraquezas do modelo

• A não existência da normalidade no nosso modelo;


• A interação entre os resíduos (na autocorrelação) e isso prejudica o nosso modelo.

7 de junho de 2023
Análise de regressão 13

12. REFERÊNCIAS BIBLIOGRÁFICAS


• Barker, L. E., & Shaw, K. M. (2015). Best (but oft-forgotten) practices: Checking
assumptions concerning regression residuals. The American Journal of Clinical Nutrition,
102(3), 533–539. https://doi.org/10.3945/ajcn.115.113498
• ix, L. M., Keselman, J. C., & Keselman, H. J. (1996). Consequences of assumption
violations revisited: A quantitative review of alternatives to the one-way analysis of
variance "f" test. Review of Educational Research, 66(4), 579.
https://doi.org/10.2307/1170654
• Wasserstein, R. L., & Lazar, N. A. (2016). The ASA statement on p-values: Context,
process, and purpose. The American Statistician, 70(2), 129–133.
https://doi.org/10.1080/00031305.2016.1154108
• Yap, B. W., & Sim, C. H. (2011). Comparisons of various types of normality tests.
Journal of Statistical Computation and Simulation, 81(12), 2141–2155.

7 de junho de 2023

Você também pode gostar