Você está na página 1de 18

ESTATÍSTICA APLICADA ÀS

ANÁLISES CONTÁBEIS
AULA 6

Prof. Aline Purcote


CONVERSA INICIAL

Quando analisamos situações do dia a dia, podemos estar interessados


em conhecer como uma variável impacta no comportamento de outra. Assim,
surge a correlação, que está ligada ao grau de relação existente entre duas ou
mais variáveis. A força dessa relação pode ser calculada pelo coeficiente de
correlação linear de Pearson indicando se há uma relação positiva, negativa ou
nula. A relação existente entre variáveis orienta análises e ajuda na tomada de
decisões em várias situações do cotidiano.
Outra análise que podemos realizar é a análise de regressão, que tem
como objetivo determinar o modelo que expressa a relação entre as variáveis,
encontrando uma equação que descreve esse relacionamento. Quando o
problema envolve apenas duas variáveis, temos uma regressão simples e mais
de duas trabalhamos com uma regressão múltipla.
Portanto, a correlação fornece um número que indica o grau de
relacionamento entre as variáveis, já a regressão apresenta como resultado uma
equação matemática que descreve esse relacionamento.

CONTEXTUALIZANDO

Em algumas situações, trabalhamos com diferentes variáveis e


precisamos entender como elas se relacionam. Podemos estar interessados em
saber se há alguma relação entre o volume de vendas e o preço de um produto,
se o clima altera o consumo de uma determinada mercadoria, se o número de
peças produzidas interfere no número de peças defeituosas, se a média de
tempo de atraso de pagamento tem relação com o número de erros de fatura, se
a venda de uma empresa se relaciona com os gastos promocionais ou se há
relação entre a demanda de um determinado produto com o seu preço.
Logo, pensamos em várias situações em que o estudo da correlação e
regressão pode auxiliar na tomada de decisão. Trabalhamos com diferentes
variáveis e podemos encontrar a relação e o grau desse relacionamento,
podendo aplicar e estudar as variáveis em diferentes situações e áreas do
conhecimento, por exemplo, a relação entre a idade e altura das crianças, tempo
de prática de esportes e ritmo cardíaco, tempo de estudo e a nota na prova, taxa
de desemprego e a taxa de analfabetismo.

2
Para entender como ocorrem essas análises, veremos os conceitos
referentes à correlação, cálculo e interpretação do coeficiente de correlação de
Pearson, regressão linear e regressão múltipla.

TEMA 1 – CORRELAÇÃO

O problema da correlação está ligado ao grau de relação existente entre


duas ou mais variáveis e desejamos determinar até que ponto essa relação pode
ser considerada.
A representação gráfica de duas variáveis é chamada de Diagrama de
Dispersão, que indica a forma da relação entre as variáveis estudadas. Segundo
Castanheira (2016), por intermédio da análise, inicialmente visual, do diagrama,
podemos imediatamente constatar se existe alguma relação entre as variáveis
envolvidas e, em caso positivo, se pode ser tratada como aproximadamente
linear.
Quando os valores das duas variáveis estão próximos a uma reta, temos
uma correlação linear. Os aspectos da correlação linear podem ser analisados
pelo diagrama de dispersão que ilustra as variações, podendo ocorrer uma
correlação linear positiva e perfeita, negativa e perfeita, positiva, negativa ou
nula.

 Correlação linear positiva e perfeita: valor alto em uma variável


corresponde a valor alto na outra variável, ou seja, se uma variável
aumenta, a outra também aumenta. É considerada perfeita sempre que
os pontos estiverem perfeitamente alinhados.

 Correlação linear negativa e perfeita: valor alto em uma variável


corresponde a valor baixo na outra variável, ou seja, se uma variável
aumenta, a outra diminui. É considerada perfeita sempre que os pontos
estiverem perfeitamente alinhados.

3
 Correlação linear positiva: quando as variáveis crescem no mesmo
sentido, ou seja, se uma variável aumenta, a outra também aumenta.

 Correlação linear negativa: quando as variáveis crescem em sentido


contrário, ou seja, se uma variável aumenta, a outra diminui.

 Correlação linear nula: não existe correlação, ou seja, os valores estão


totalmente dispersos.

4
TEMA 2 – COEFICIENTE DE CORRELAÇÃO DE PEARSON

Vimos que a correlação pode ser avaliada pelo Diagrama de Dispersão,


mas, além da forma gráfica, também existem outras formas de verificar se a
correlação entre variáveis é forte ou não. Uma delas é o cálculo do coeficiente
de correlação linear de Pearson, que indica a força da relação entre duas
variáveis. Esse coeficiente varia entre -1 e 1 e quanto mais próximo estiver
destes valores, melhor é o grau de correlação linear entre as variáveis.
Quando o coeficiente de correlação se aproxima de 1, há uma relação
linear positiva e quando se aproxima de -1 temos a correlação negativa. O
coeficiente igual a 1 ou -1, indica correlação linear positiva perfeita e negativa
perfeita. Um coeficiente igual a zero demonstra que não há relação entre as duas
variáveis, ou seja, a correlação linear é nula.

Figura 1 – Coeficiente de relação

Fonte: Elaborado pela autora.

O coeficiente de correlação de Pearson (r) e é dado pela fórmula:

Exemplo: uma empresa realizou uma pesquisa para estudar como varia a
procura de determinado produto em função do preço de venda, obtendo os
seguintes resultados. Calcule o coeficiente de correlação linear.

5
Tabela 1 – Variação de um determinado produto (1)

Preço de Venda Venda Mensal


162 248
167 242
173 215
176 220
180 205

Fonte: Elaborado pela autora.

O primeiro passo será multiplicar os valores (X.Y), encontrar as potências


X² e Y² para depois somar X, Y, X.Y, X² e Y². Faremos as operações diretas na
tabela, conforme abaixo:
Para a primeira linha temos:

X. Y = 162 . 248 = 40.176


X² = 162² = 26.244
Y² = 248² = 61.504

Seguimos o mesmo processo para as demais linhas e, após, somamos


cada valor, ou seja, cada coluna:

Tabela 2 – Variação de um determinado produto (2)

Preço de Venda Venda Mensal X.Y X² Y²


162 248 40.176 26.244 61.504
167 242 40.414 27.889 58.564
173 215 37.195 29.929 46.225
176 220 38.720 30.976 48.400
180 205 36.900 32.400 42.025
858 1130 193.405 147.438 256.718

Fonte: Elaborado pela autora.

Com os dados aplicamos a fórmula, sendo que o n é igual à quantidade


de dados fornecidos, ou seja, n = 5.

6
(5.193405)  (858.1130)
r
5.147438  858 .5.256718  1130 
2 2

967025  969540
r
737190  736164. 1283590  1276900

 2515
r
1026.6690

 2515
r
6863940

 2515
r
2619,91221

r  0,95996

Obtemos um coeficiente igual a -0,95996, assim temos uma correlação


linear negativa, conforme observamos no gráfico de dispersão:

Figura 2 – Gráfico de dispersão

Venda Mensal
300

250

200

150

100

50

0
160 165 170 175 180 185

Fonte: Elaborado pela autora.

TEMA 3 – REGRESSÃO

O objetivo da regressão está em determinar a função que exprime a


relação entre duas ou mais variáveis e tem como resultado uma equação que
descreve o relacionamento entre elas. Quando estudamos apenas duas
variáveis, temos uma regressão simples e mais de uma regressão múltipla.

7
Na regressão, y é chamado de variável dependente ou variável não
controlada, já o x é a variável independente, que é a variável que pode ser
controlada em um experimento.
Segundo Castanheira (2016), em termos da complexidade das funções
ajustantes, a regressão é chamada de linear quando o ajustamento é feito por
uma função do primeiro grau, ou seja, pela equação de uma reta e não linear
quando o ajustamento é feito por uma função de grau superior a um, ou seja, por
uma função exponencial, geométrica, parabólica etc. Para que a regressão
possa ser útil, é necessário saber construir um modelo, estimar seus parâmetros
com base nos dados relativos às variáveis e interpretar os resultados.

TEMA 4 – REGRESSÃO LINEAR

Uma regressão é dita linear quando o ajustamento dos dados é feito por
uma função do primeiro grau, tendo como representação uma reta. O nosso
principal objetivo será aproximar por uma linha reta um conjunto de valores,
determinando a equação de regressão linear simples que melhor se ajuste aos
dados, ou seja, precisamos encontrar os coeficientes da equação da reta:

y = a + bx

Um dos métodos utilizados para encontrar as estimativas de a e b é o


Método dos Mínimos Quadrados, que consiste em tomar como estimativas os
valores que minimizam a soma dos quadrados dos desvios. O coeficiente a é
chamado de coeficiente angular e b de coeficiente linear, cujos valores serão
calculados utilizando as seguintes fórmulas:

n x. y   x. y
b
n x 2   x
2

a      b  
 y  x
 n   n 
ou a  y  bx
Exemplo: Considere a seguinte tabela, que indica as quantidades
produzidas de determinado produto e seus respectivos custos totais de
produção. Pela análise de regressão, encontre a reta que melhor se ajuste ao
conjunto de dados.

8
Tabela 3 – Relação entre a quantidade e custo de um produto (1)

Quantidades Produzidas Custo Total (R$)


10 150
25 290
50 540
80 840
90 900

Fonte: Elaborado pela autora.

Para encontrar a reta de regressão, precisamos primeiro encontrar: x.y, x²


e os somatórios, cálculos que apresentamos diretamente na tabela.
Para a primeira linha temos:
x.y = 10 . 150 = 1500
x² = 10² = 100
Seguir o mesmo processo para as demais linhas e, após, somar cada
coluna:

Tabela 4 – Relação entre a quantidade e custo de um produto (2)

Quantidades Produzidas Custo Total (R$) x.y x²


10 150 1.500 100
25 290 7.250 625
50 540 27.000 2.500
80 840 67.200 6.400
90 900 81.000 8.100
255 2.720 183.950 17.725

Fonte: Elaborado pela autora.

Com os cálculos realizados aplicamos as fórmulas para encontrar os


coeficientes a e b onde n é igual a 5, que é a quantidade de dados fornecidos:
n x. y   x. y
b
n x 2   x 2

5.183950  255.2720
b
5.17725  255
2

9
919750  693600
b
88625  65025

226150
b  9,5826
23600

a      b  
 y  x
 n   n 

 2720   255 
a   9,5826 
 5   5 

a  544  9,582651

a  544  488,7126  55,2874

Utilizando os coeficientes a e b, encontramos a equação da reta de


regressão:
y = a + bx

y = 55,2874 + 9,5826 x

O diagrama de dispersão mostra os pontos e a reta de regressão obtida:

Figura 3 – Diagrama de dispersão (2)

Custo Total (R$)


1000
900
800
700
600
500
400
300
200
100
0
0 20 40 60 80 100

Fonte: Elaborado pela autora.

10
Segundo Castanheira (2016), a regressão linear simples é normalmente
utilizada para estudar a relação existente entre variáveis, com o propósito de
fazer previsões com base nos resultados obtidos nelas.
Considerando o exemplo, qual seria o valor estimado do custo para uma
produção de 180 unidades? Utilizaremos a equação encontrada para prever qual
será o custo na produção de 180 unidades, ou seja, substituímos o x da equação
por 180:

y = 55,2874 + 9,5826 x

y = 55,2874 + 9,5826 . 180

y = 55,1874 + 1724,8680

y = 1780,0554 = 1.780

Assim, para produzir 180 unidades, temos um custo previsto de R$ 1.780.

TEMA 5 – REGRESSÃO LINEAR MÚLTIPLA

Determinadas aplicações exigem modelos mais complexos do que o


utilizado na regressão linear simples. Nas aplicações que precisamos trabalhar
com mais de uma variável independente, utilizamos a regressão linear múltipla,
proporcionando uma conclusão mais precisa sobre a variável em estudo. Por
exemplo, queremos verificar o consumo de determinado produto levando em
consideração a renda dos clientes e preço do produto, logo temos duas variáveis
independentes: a renda e o preço.
De acordo com Castanheira (2016), quando uma variável dependente
está simultaneamente correlacionada a mais de uma variável independente, a
análise será efetuada pela fórmula:

onde:
y = variável dependente
M1,2,...n = coeficientes de regressão
x1,2,...,n = variáveis independentes
B = múltiplo intercepto
Quando temos duas variáveis, os parâmetros são determinados utilizando
as seguintes fórmulas:

11
onde:

Exemplo: a seguinte tabela relaciona o consumo de matéria-prima (em


toneladas) para produção de dois produtos A e B, sendo x1 e x2 as quantidades
produzidas de cada produto respectivamente. Determine a equação de
regressão linear múltipla.

12
Tabela 5 – Consumo de matéria-prima (1)

Consumo X1 X2
3,5 10 8
4 12 9
5,4 15 11
6,1 17 13
7 20 15
7,5 23 16
8 25 18

Fonte: Elaborado pela autora.

Para aplicação da fórmula, precisamos encontrar alguns dados que


calculamos direto na tabela:

Tabela 6 – Consumo de matéria-prima (1)

Consumo X1 X2 Y.X1 Y.X2 X1.X2 X 1² X 2²


3,5 10 8 35 28 80 100 64
4 12 9 48 36 108 144 81
5,4 15 11 81 59,4 165 225 121
6,1 17 13 103,7 79,3 221 289 169
7 20 15 140 105 300 400 225
7,5 23 16 172,5 120 368 529 256
8 25 18 200 144 450 625 324
41,5 122 90 780,2 571,7 1.692 2.312 1.240

Fonte: Elaborado pela autora.

Com os dados calculados aplicamos as fórmulas, considerando n = 7 que


é o número de dados que temos:

41,5.122
S y1  780,2 
7

5063
S y1  780,2   780,2  723,285714  56,914286
7

13
41,5.90
S y 2  571,7 
7

3735
S y 2  571,7   571,7  533,571429  38,128571
7

122.90
S12  1692 
7

10980
S12  1692   1692  1568,571429  123,428571
7

S11  2312 
1222
7

14884
S11  2312   2312  2126,285714  185,714286
7

S 22  1240 
90
2

8100
S 22  1240   1240  1157,142857  82,857143
7

14
38,128571 56,914286

123,428571 185,714286
M2 
82,857143 123,428571

123,428571 185,714286

0,308912  0,306462
M2 
0,671296  0,664615

0,002450
M2   0,366712
0,006681

38,128571 82,857143
M1   .0,366712
123,428571 123,428571

M1  0,308912  0,671296.0,366712

M1  0,308912  0,246172  0,06274

41,5 122 90
B  0,06274.  0,366712.
7 7 7

B  5,928571429  0,06274.17,42857143  0,366712.12,85714286

B  5,928571429  1,093468572  4,714868572  0,120234285

A equação procurada é:

y  M1.x1 M 2.x2  B

y  0,06274.x1  0,366712.x2  0,120234285

Segundo Castanheira (2016), a regressão linear múltipla nos fornece


dados mais precisos que a regressão linear simples, no entanto exige o
conhecimento de funções mais complexas e, consequentemente, mais
trabalhosas. Sua aplicação, na prática, requer que recorremos a computadores.

15
TROCANDO IDEIAS

Vimos que a correlação e a regressão são duas técnicas relacionadas. A


correlação fornece um número que resume o grau de relacionamento entre as
variáveis, e a regressão tem como resultado uma equação que descreve esse
relacionamento. Você se recorda de alguma situação em que podemos aplicar a
correlação e a regressão? Qual situação do nosso dia a dia poderia aplicar o
estudo de correlação?

NA PRÁTICA

A correlação e a regressão estudam a relação existente entre variáveis e,


com base nos resultados obtidos, podemos tomar decisões. Vamos verificar
alguns exemplos onde podemos aplicar os assuntos estudados.

Saiba mais

1. POR QUE é importante entender correlação entre variáveis. Escola


EDTI, 8 set. 2016. Disponível em:
<https://www.escolaedti.com.br/entender-correlacao-entre-variaveis>.
Acesso em: 11 out. 2019.
2. O USO da regressão linear na logística reversa no Brasil. Kroton –
Portal Stricto Sensu, S.d. Disponível em: <https://pgsskroton.com.br/>.
Acesso em: 11 out. 2019.
3. OLIVEIRA FILHO, M. L. A utilização da regressão linear como
ferramenta estratégica para a projeção dos custos de produção. IX
Congresso Brasileiro de Custos. São Paulo, 13 a 15 out. 2002.
Disponível em:
<https://anaiscbc.emnuvens.com.br/anais/article/viewFile/2762/2762>.
Acesso em: 11 out. 2019.
4. ELIAS, Z. S. et al. Rateio dos custos indiretos: aplicação da análise de
correlação e de regressão. Revista de Contabilidade do Mestrado em
Ciências Contábeis da UERJ, Rio de Janeiro, v. 14, n. 2, p. 50 - p. 66,
maio/ago, 2009. Disponível em: <http://atena.org.br/revista/ojs-2.2.3-
08/index.php/UERJ/article/viewFile/597/593>. Acesso em: 11 out. 2019.

16
FINALIZANDO

Nesta aula, estudamos os principais conceitos de correlação e regressão


além da análise dos resultados obtidos. Vimos a aplicação do coeficiente de
correlação de Pearson e a diferença entre a regressão linear simples e múltipla.

17
REFERÊNCIAS

CASTANHEIRA, N. P. Cálculo aplicado à gestão e aos negócios. Curitiba:


InterSaberes, 2016.

18

Você também pode gostar