Você está na página 1de 60

Métodos Quantitativos

1
CFG – Certificação de Fundamentos de Gestão
Equivalência de Taxas: Juros Compostos
Programação da HP-12C
PRESSIONAR OBJETIVO VISOR
F R/S P/R: Entrar no modo de programação 00-
F R↓ PRGM: Limpar memória de programas anteriores 00-
STO 0 Guardar o prazo desejado na memória “0” 01- 44 0
RCL i Busca o valor digitado na taxa 02- 45 12
1 % Divide a taxa por 100 04- 25
1 + Soma 1 com a taxa unitária 06- 40
RCL 0 Busca o valor do prazo que quero 07- 45 0
RCL n Busca o valor do prazo que tenho 08- 45 11
÷ Divide os dois prazos 09- 10
Yx Eleva a taxa unitária somado 1, a razão das taxas 10- 21
1 - Subtrai 1 do resultado obtido 12- 30
1 13- 1
0 14- 0
Multiplica o resultado por 100, a fim de transformar a taxa unitária em percentual
0 15- 0
X 16- 20
G R↓ GTO: Retorna a primeira linha de programação. 17-43.33.00 (GOLD)
00 ou 000 Observação: usar “00” para HP (dourada) e “000” para HP Platinum. 017.43.33.000 (PLAT)

F R/S P/R: Finaliza o modo de programação 0,00000000

2
CFG – Certificação de Fundamentos de Gestão
Equivalência de Taxas: Juros Compostos
Programação da HP-12C
Qual a taxa anual equivalente ao mês de 12% ao ano?

PRESSIONAR OBJETIVO VISOR


12 i Introduzir a taxa que desejo converter no [i] 12,000
360 n Introduzir o prazo em dias, correspondente do [i] 360,000
Prazo desejado (dias que você quer 30). Caso seja em
30 30
dias úteis, 1 mês =21 dias; e 1 ano = 252 dias)
R/S Executa o programa 0,948879

q Resposta: 0,948879% ao mês.

3
CFG – Certificação de Fundamentos de Gestão
Como a prova tem cobrado!
[302238] A taxa de juros de 60% ao ano, capitalizada semestralmente, resulta em uma
taxa efetiva anual de

a) 60%.

b) 63%.

c) 69%.

d) 70%.

4
CFG – Certificação de Fundamentos de Gestão
Estatística
Conceito
A Estatística é a ciência das probabilidades, que através de um conjunto de regras
matemáticas, nos permite fazer previsões sobre determinado grupo estudado, a partir de
uma amostra significativa. Ela tem por objetivo coletar, organizar, analisar e interpretar as
informações de um problema que está sendo estudado, para desta forma, auxiliar
na tomada de decisão.

Para as finanças, usamos a estatística para analisar o risco e o retorno dos investimentos,
com certo grau de confiança. Desta forma, precisaremos entender os seguintes conceitos:
Ø Diferença entre Amostra e População
Ø Medidas de Posição Central: Média, Moda e Mediana (As “Três Marias”)
Ø Medidas de Dispersão: Desvio Padrão e Variância
Ø Covariância
Ø Coeficiente de Correlação
Ø Intervalo de Confiança: Distribuição Normal

5
CFG – Certificação de Fundamentos de Gestão
Estatística
População e Amostra
Para iniciarmos os estudos de estatística, precisamos primeiramente entender a diferença
de População e Amostra. Assim sendo:
Ø População: O Conceito de População é “a totalidade dos números do grupo a ser
estudado”. Por exemplo, um fundo de investimentos possui 10 anos de criação e
vamos analisar estes 10 anos.
Ø Amostra: Já a Amostra é “uma parte da totalidade do grupo que deseja ser
estudado, ou seja, um pedaço da População”. Por exemplo, desejamos saber em
quem a população brasileira pretende votar. Como é muito difícil perguntar para
todos os brasileiros, fazemos uma pesquisa somente com uma “parte” da população,
que será considerada como se fosse o todo.

POPULAÇÃO Amostra

6
CFG – Certificação de Fundamentos de Gestão
Medidas de Posição Central
Média
A MÉDIA nada mais é que um valor que aponta para onde mais se concentram os dados
de uma distribuição, ou seja, “o ponto de equilíbrio” do grupo de dados analisados. É
como se todos os números desse grupo, fossem iguais neste ponto de equilíbrio. Para
fazermos o cálculo da média, primeiro precisamos compreender que a média poderá ser
de dois tipos:
Ø Média Aritmética Simples: quando todos os dados possuem a mesma relevância,
ou seja, o mesmo peso. Exemplo: aplicar em quatro ativos diferentes, mas com o
mesmo valor financeiro. Desta forma, para fazer o seu cálculo devemos somar todos
valores do grupo de dados e dividir pela quantidade total de números.

Ø Média Aritmética Ponderada: quando os dados do grupo analisada possuam


relevâncias diferentes, ou seja, pesos diferenças. Por exemplo, um cliente aplicar
valores diferentes em diversos investimentos. Desta forma, para fazer o seu cálculo
devemos levar em consideração o peso de cada um dos dados. Este cálculo será
apresentado adiante.

7
CFG – Certificação de Fundamentos de Gestão
Medidas de Posição Central
Média Simples: Exemplo
Rafael é seu cliente no banco e deseja saber qual foi o retorno médio da sua aplicação
financeira no Fundo de investimentos “A”. Analisando os dados abaixo, o que você diria?

MÊS RETORNO
Janeiro +1%
+
Fevereiro +3%
+ Total = 15%
5 meses Março +3%
+
Abril +5%
+
Maio +3%

Para fazer o cálculo da média, devemos somar todos os meses e dividir pela quantidade
de meses, ou seja (1 + 3 + 3 + 5 + 3 = 15) e dividir este valor por 5. Desta forma, a média
do retorno do fundo aplicado pelo Rafael, foi de 3% ao mês. É como se cada mês tivesse
tido um retorno de 3%, ao invés de ter tido as devidas rentabilidades.

8
CFG – Certificação de Fundamentos de Gestão
Medidas de Posição Central
Média Simples: HP 12C
Para calcular o conjunto anterior (+3%, +1%, +3%, +3%, +5%) na HP 12C, devemos seguir
os seguintes passos:

FLUXO TECLA MOTIVO Visor


1 [∑+] 1º número do grupo Número 1

3 [∑+] 2º número do grupo Número 2

3 [∑+] 3º número do grupo Número 3

5 [∑+] 4º número do grupo Número 4

3 [∑+] 5º número do grupo Número 5

Média !: [g][0]
𝒙 Média 3%

A tecla [∑+] serve para adicionar um número em um grupo estatístico, sendo avisado no
visor, quantos números esse grupo tem no momento.

9
CFG – Certificação de Fundamentos de Gestão
Medidas de Posição Central
Média Ponderada: Exemplo
Rafael investiu R$ 100 mil em 4 ações, investindo valores diferentes em cada uma delas.
No último mês, ele viu que estas empresas tiveram retornos diferentes, sendo eles 1%,
2%, 3% e 4%. Desta forma, quando ele fez a média do retorno (1 + 2 + 3 + 4, totalizando
10%, divididos por 4), percebeu que o retorno calculado foi de 2,5%, mas o lucro gerado
pelas empresas foi de apenas R$ 2.000,00, ou seja, de 2%. Por quê?

Ativo Retorno Valor Investido Lucro


Banco do Brasil +4,00% R$ 10.000,00 R$ 400,00
+
Itaú +3,00% R$ 20.000,00 R$ 600,00 Lucro:
+ R$ 2.000,00
Bradesco +2,00% R$ 30.000,00 R$ 600,00
+
Santander +1,00% R$ 40.000,00 R$ 400,00

q RESPOSTA: Quando Rafael dividiu os retornos por 4, ele calculou a média simples.
Porém, os retornos possuem pesos diferentes (por exemplo, Itaú possui um peso de 20%,
pois foi investido R$ 20 mil do total de R$ 100 mil). O que deveria ser feito é multiplicar o
peso de cada ativo pelo retorno e somar todos os valores, gerando os 2% de média.

10
CFG – Certificação de Fundamentos de Gestão
Medidas de Posição Central
Média Ponderada: HP 12C
Para calcular o conjunto anterior na HP 12C, devemos lançar “quem desejamos” clicar em
[ENTER] e depois lançar “quem é o peso”. Neste caso, “quem desejamos” é o retorno [%]
e “quem é o peso” é o valor financeiro investido.

FLUXO TECLA MOTIVO Visor


4 ENTER 10.000 [∑+] 1º número do grupo Número 1

3 ENTER 20.000 [∑+] 2º número do grupo Número 2

2 ENTER 30.000 [∑+] 3º número do grupo Número 3

1 ENTER 40.000 [∑+] 4º número do grupo Número 4

Média Ponderada !w: [g][6]


𝒙 Média Ponderada 2,00%

11
CFG – Certificação de Fundamentos de Gestão
Medidas de Posição Central
Moda
A moda é o valor que ocorre com maior frequência em uma amostra (série de valores), ou
seja, o número que “mais enxergamos” no grupo. Um conjunto de resultado pode
apresentar uma moda ou mais, sendo classificado como:
Ø 1 moda = unimodal;
Ø 2 modas = bimodal;
Ø 3 ou mais = multimodal.
Como exemplo, temos dois fundos (A e B) apresentando os seguintes retornos:

Mês Retorno do Fundo A Retorno do Fundo B


Janeiro 1,00% 1,00%
Fevereiro 3,00% 5,00%
Março 3,00% 2,00%
Abril 5,00% 2,00%
Maio 3,00% 5,00%
MODA UNIMODAL: 3,00% BIMODAL: 2% e 5%,

12
CFG – Certificação de Fundamentos de Gestão
Medidas de Posição Central
Mediana
A mediana de um grupo de dados é o número do meio, ou seja, o valor numérico que
divide o grupo em duas partes iguais. No entanto, antes de fazermos esta divisão,
devemos ordenar o grupo de forma crescente ou decrescente. Se a quantidade de
números do grupo for ímpar, consideramos o divisor dos dois grupos. Se for par, pegamos
os dois “mais próximos do centro” e fazemos sua média. Por exemplo:
Ø Um fundo teve os seguintes retornos de Janeiro a Maio: {1%, 4%, 2%, 5%, 5%}
Se não ordenarmos o grupo, entenderíamos que a Mediana do Fundo A seria 2%
(número que está dividindo o grupo em duas partes iguais). No entanto,
primeiramente devemos ORDENAR: {1%, 2%, 4%, 5%, 5%}. Com o grupo ordenado,
percebemos agora que o número do meio, a mediana, é o 4% e não mais o 2%.

Ø Considerando mais um mês de 1%, qual a mediana?: {1%, 4%, 2%, 5%, 5%, 1%}
Repare agora que não existe mais um único número que divide o grupo em duas
partes iguais. Desta forma, devemos fazer a média dos dois números centras, mas
primeiramente devemos ordenar o grupo: {1%, 1%, 2%, 4%, 5%, 5%}. Com o grupo
ordenado, fazemos a média dois centrais (em verde) que será a mediana: 3%.

13
CFG – Certificação de Fundamentos de Gestão
Como a prova tem cobrado!
[207124] Com relação a uma amostra com mais de 30 observações, é correto afirmar
que:

a) ao serem alterados apenas os termos dos extremos, a mediana não será alterada.

b) a média é sempre maior que a mediana.

c) haverá somente uma moda.

d) ao serem alterados apenas os termos dos extremos, o desvio-padrão não será


alterado.

14
CFG – Certificação de Fundamentos de Gestão
Medidas de Dispersão
Variância e Desvio Padrão
A Variância e o Desvio Padrão são medidas estatísticas que medem o grau de dispersão
de um conjunto de dados em relação a sua média, ou seja, o risco dos dados não darem a
média do grupo. Quanto maior a Variância ou Desvio Padrão, maior será o risco, já que a
distância entre cada ponto até a média será maior.

A Variância é calculada através da MÉDIA DO QUADRADO DA DISTÂNCIA DE CADA


PONTO ATÉ A MÉDIA DO GRUPO, e o Desvio Padrão será a raiz quadrada deste número.
Este passo-a-passo deixará um pouco mais claro:
Ø (1) Calcular a média do grupo;
Ø (2) Calcular a distância de cada ponto até a média;
Ø (3) Elevar cada uma destas distâncias ao quadrado (Motivo: deixar todos os
números positivos);
Ø (4) Calcular a média desses números que foram elevados ao quadrado.
Este número será a Variância Populacional.
Ø (5) Desvio Padrão = Raiz quadrada da Variância.
Ou seja, da Variância chegamos no Desvio Padrão, consequentemente, do Desvio Padrão
chegamos na Variância.

15
CFG – Certificação de Fundamentos de Gestão
Medidas de Dispersão
Variância e Desvio Padrão: Exemplo Gráfico
Agora calcularemos a Variância e o Desvio Padrão dos retornos do Fundo de “A” no qual
teve retornos de (+3%, +1%, +3%, +3%, +5%). Mas primeiro, vamos “enxergar” o risco de
cada retorno em não dar a média do retorno, que seria o “padrão” do grupo. Perceba que
os retornos nos meses 1, 3 e 4 foram exatamente a média, portanto “não há risco”.

6
Fundo A Média

5
Risco de Volatilidade
Retorno Mensal (%)

4 (Distância entre o
ponto e a média )
3

0
1 2 3 4 5

16
CFG – Certificação de Fundamentos de Gestão
Medidas de Dispersão
Variância e Desvio Padrão Populacional
Para calcularmos a Variância e o Desvio Padrão do grupo (+3%, +1%, +3%, +3%, +5%),
iremos seguir o passo-a-posso através da construção de uma tabela:

Retornos (ETAPA 2) (ETAPA 3)


Retorno – Média Elevar ao quadrado
3% (3 – 3) = 0 (0)2 = 0
1% (1 – 3) = -2 (-2)2 = 4
+
+
3% (3 – 3) = 0 (0)2 = 0 Média = (8 ÷ 5) = 1,6
+
3% (3 – 3) = 0 (0)2 = 0
+
5% (5 – 3) = +2 (+2)2 = 4
(ETAPA 4):
(ETAPA 1) Variância = 1,6
Média = 3% (ETAPA 5)
𝑫𝑷 = 𝟏, 𝟔 = ±1,26

17
CFG – Certificação de Fundamentos de Gestão
Medidas de Dispersão
Variância e Desvio Padrão Amostral
Para calcularmos a Variância e o Desvio Padrão Amostral, ao invés de calcular a média da
ETAPA 3, dividindo por “N TERMOS”, devemos dividir por “N menos 1”, neste caso por 4.

Retornos (ETAPA 2) (ETAPA 3)


Retorno – Média Elevar ao quadrado
3% (3 – 3) = 0 (0)2 = 0
1% (1 – 3) = -2 (-2)2 = 4
+
3% (3 – 3) = 0 (0)2 = 0
+
Média N-1 = (8 ÷ 4) = 2
+
3% (3 – 3) = 0 (0)2 = 0
+
5% (5 – 3) = +2 (+2)2 = 4
(ETAPA 4):
(ETAPA 1) Variância = 2
Média = 3% (ETAPA 5)
𝑫𝑷 = 𝟐 = ±1,41

18
CFG – Certificação de Fundamentos de Gestão
Medidas de Dispersão
Variância e Desvio Padrão Amostral: HP-12C
A Hp-12 calcula diretamente apenas o Desvio Padrão, sendo ele o Amostral. Mas com o
Desvio Padrão, podemos chegar na Variância elevando-o ao quadrado. Primeiro, vamos
“limpar” a HP-12C com “[F] [CLx]”.

FLUXO TECLA MOTIVO Visor


1 [∑+] 1º número do grupo Número 1

3 [∑+] 2º número do grupo Número 2

3 [∑+] 3º número do grupo Número 3

5 [∑+] 4º número do grupo Número 4

3 [∑+] 5º número do grupo Número 5

Desvio Padrão 𝑺: [g][.] Desvio Padrão 1,41

2 [YX] Variância 2,00

19
CFG – Certificação de Fundamentos de Gestão
Medidas de Dispersão
Variância e Desvio Padrão Populacional: HP-12C
Para podermos calcular através da população, devemos “enganar” a HP-12, adicionando
um número extra que será a média do grupo.

FLUXO TECLA MOTIVO Visor


1 [∑+] 1º número do grupo Número 1
3 [∑+] 2º número do grupo Número 2
3 [∑+] 3º número do grupo Número 3
5 [∑+] 4º número do grupo Número 4
3 [∑+] 5º número do grupo Número 5
3 [∑+] Média adicionado ao grupo Número 6

Desvio Padrão 𝑺: [g][.] Desvio Padrão – População 1,26

2 [YX] Variância – População 1,60

20
CFG – Certificação de Fundamentos de Gestão
Medidas de Dispersão
Analisando duas Aplicações
Para as finanças, o Desvio Padrão e a Variância nos indicam o Risco de Mercado do ativo.
Este risco é conhecido também por Volatilidade, que nada mais é que a sua oscilação
perante a média de retornos. No entanto, quanto maior o risco, maior o retorno exigido
por aquele investimento e caso dois investimento possuam o mesmo retorno, devemos
escolher o que possui o menor risco. Por exemplo, dois fundos que possuam um retorno
médio de 3% e que apresentem os retornos abaixo, deve-se escolher o Fundo A, pois
possui menor oscilação e, consequentemente, menor Desvio Padrão que o Fundo B.

7 Fundo B Fundo A Média


6

0
0 1 2 3 4 5 6 7 8 9 10

21
CFG – Certificação de Fundamentos de Gestão
Medidas de Dispersão
Variância e Desvio Padrão: Resumo
Os principais pontos a serem destacados do Desvio Padrão e da Variância são :
Ø Medem o risco de mercado (volatilidade ou oscilação) de um ativo;
Ø Quanto maior o desvio padrão/variância, maior será o risco do investimento (mais
ele estará se “desviando do seu padrão”).
Ø A Variância sempre será um número positivo;
Ø O Desvio Padrão é tanto um número positivo, quanto negativo;
Ø O Símbolo do Desvio Padrão é o Sigma (σ)
Ø A Variância é representada pelo Sigma ao quadrado (σ2)

q FÓRMULAS:

VARIÂNCIA POPULACIONAL VARIÂNCIA AMOSTRAL

22
CFG – Certificação de Fundamentos de Gestão
Medidas de associação entre 2 variáveis
Covariância
A Covariância é uma medida estatística para entendermos como uma variável (ATIVO A)
se comporta em relação a outra variável (ATIVO B). Quando a covariância é positiva, duas
variáveis tendem a variar na mesma direção. Já quando a covariância é negativa, as
devidas variáveis tendem a variar em direção oposta. Variáveis independentes (que não
possuem nenhuma correlação) têm covariância igual a zero.

Por exemplo, o aumento do preço do petróleo é benéfico para as Petrolíferas (vendem


petróleo), mas prejudicial ao lucro das empresas aéreas (custo do combustível). Desta
forma, quando o preço do petróleo aumenta, as ações da Petrobrás tendem a valorizar e
as ações da companhia aéreas tendem a desvalorizar. Caso o petróleo diminua de valor, as
ações da Petrobrás tendem a desvalorizar e as ações das companhias aéreas tendem a
valorizar. Podemos demonstrar isto pelo cálculo da Covariância:
Ø A Covariância entre Petróleo-Petrobras é POSITIVA (andam na mesma direção)
Ø A Covariância entre Petróleo-CIA Aéreas é NEGATIVA (andam em direção opostas)

A grosso modo podemos dizer que “Variância de um Ativo com seu COmpanheiro” é a
COvariância, ou seja, o risco interligado de dois ativos.

23
CFG – Certificação de Fundamentos de Gestão
Medidas de associação entre 2 variáveis
Coeficiente de Correlação (ρ)
No entanto, a covariância possui dois problemas:
Ø (1) Seus valores não são padronizados, variando de menos infinito a mais infinito;
Ø (2) Não é possível comparar a relação linear de dois grupos com unidades
distintas.

Assim, Karl Pearson (ρ) corrigiu o problema da Covariância, conseguindo transformar


estes números em uma nova variável que SEMPRE irá variar de -1 até +1, chamada de
“Coeficiente de Correlação”. O sinal indicará se há uma relação direta ou inversa entre as
variáveis e o número a intensidade (quanto mais próximo de “1”, maior a correlação
linear). Por exemplo, duas variáveis X e Y que possuam os seguintes Coeficientes de
Correlação:
Ø X e Y possuem (ρ) = +1: Se X aumentar 10%, Y AUMENTARÁ 10%;
Ø X e Y possuem (ρ) = -1: Se X aumentar 10%, Y DIMINUIRÁ 10% (lados opostos).
Ø X e Y possuem (ρ) = 0: Se X aumentar 10%, Y não terá NENHUMA relação, irá se
movimentar independentemente uma da outra.
Ø X e Y possuem (ρ) = +0,3: Se X diminuir 10%, Y DIMINUIRÁ 3%.

24
CFG – Certificação de Fundamentos de Gestão
Medidas de associação entre 2 variáveis
Covariância e Coef (ρ)
Quando estamos tratando de gestão de risco nas carteiras de investimentos, desejamos
adquirir ativos que se comportem o mais inverso possível e estas variáveis servem para
isso. Voltando ao nosso exemplo com Petrolíferas, mesmo que as empresas sejam muito
bem administradas, gerando bons lucros, o valor das suas ações sempre estão
diretamente relacionadas a cotação do petróleo. Se o mesmo, se desvalorizar, as ações
irão se desvalorizar. Desta forma, é muito interessante para diminuir o “risco de petróleo”,
adquirir ativos que sejam beneficiados com a queda do valor desta commodities, como
por exemplo, companhias aéreas. Para isso, analisamos o Coeficiente de Corre

Por exemplo, vejamos como duas carteiras se comportariam com o petróleo caindo 10%,
estimando Coef (Petrobrás, Petróleo) = +1; e Coef (LATAM; Petróleo) = ‒1

Ativo Valor Inicial Prejuízo/ Lucro Resultado Final


CARTEIRA (A) 100% Petrobrás R$ 100.000 - R$ 10.000 (-10%) R$ 90.000
50% Petrobrás R$ 50.000 - R$ 5.000 (-10%)
CARTEIRA (B) R$ 100.000
50% LATAM R$ 50.000 +R$ 5.000 (+10%)

25
CFG – Certificação de Fundamentos de Gestão
Medidas de associação entre 2 variáveis
Fórmulas
Agora que sabemos os conceitos de Covariância e de Coeficiente de Correlação,
entraremos nas fórmulas, lembrando sempre que quando tratarmos de População deve
ser dividido por “N termos” e quando tratarmos de Amostra, deve-se dividir por “N – 1”.

q Covariância: A covariância poderá ser calculada através de duas maneiras:

, / × 1! .1
-! .- / , / × 1! .1
-! .- /
Ø (1) COV(X,Y) = ∑*+, ; OU ∑*+, ;
2 2.3

Ø (2) COV(X,Y) = DP(X)×DP(Y) × Coef (X,Y); quando se tem o Coeficiente.

q Coeficiente de Correlação: O coeficiente de correlação é calculado através:

:;<(-,1)
Coef (X,Y)=
=>(?)×=>(@)

26
CFG – Certificação de Fundamentos de Gestão
Medidas de associação entre 2 variáveis
Cálculo Covariância
Sabemos empiricamente que quanto mais alto estão os juros (SELIC), menos as pessoas
tendem a comprar (o crédito fica mais caro). No entanto, podemos provar essa relação
inversa com o cálculo da Covariância entre a Taxa de Juros versus Consumo. Por exemplo,
calcule a Covariância entre “Consumo & Taxa de Juros”, sabendo que nos últimos quatro
anos, foram coletados os seguintes dados:
Ø Consumo por pessoa: {R$ 800; R$ 700; R$ 600; R$ 500}
Ø Taxa SELIC: {10%; 11%; 13%; 14%}

Para calcularmos Covariância entre dois ativos (A,B), devemos seguir este Passo-a-Passo:
Ø (1) Calcular a média do “Ativo A” e do “Ativo B”;
Ø (2) Em cada ativo, calcular a distância de cada ponto até a sua média (“RISCO”);
Ø (3) Multiplicar o “RISCO” ´de cada período do “Ativo A” com o respectivo RISCO do
mesmo período do “ativo B”;
Ø (4) Para calcular a Covariância Populacional, deve-se somar o resultado destas
multiplicações e dividir por “N”, ou seja, calcular a média destas multiplicações. Caso
seja uma amostra, a divisão deverá ser por “n – 1” .

27
CFG – Certificação de Fundamentos de Gestão
Medidas de associação entre 2 variáveis
Cálculo Covariância: Passo a Passo
Primeiramente, devemos notar que o exemplo nos passa a informação dos “últimos
quatro anos”, portanto, uma amostra. Para termos a população entre “Consumo & Taxa de
Juros” deveríamos ter todos os dados desde a primeira vez que alguém consumiu no
Brasil (uma coleta de dados impossível). Assim, nossa soma final será divida por 3 (n – 1).
Seguindo o passo-a-passo, chegamos na seguinte tabela:

Consumo (A) ETAPA 2: SELIC (B) ETAPA 2: ETAPA3:


Retorno – Média Retorno – Média Multiplicar Riscos
800 +150 10 ‒2 (150×-2)= ‒300
+
700 +50 11 ‒1 (50×-1)= ‒50
+ (-700 ÷ 3)
600 ‒50 13 +1 (-50×1)= ‒50
+
500 ‒150 14 +2 (-150×2)= ‒300
ETAPA 1: (ETAPA 1) ETAPA 4:
Média: 650 Média: 12 Cov (A,B) = ‒233

A conclusão para nossos estudos é que a COV (Consumo, Selic) é negativa, portanto,
possuem relação inversa (quando um sobe, o outro diminui).

28
CFG – Certificação de Fundamentos de Gestão
Medidas de associação entre 2 variáveis
Cálculo HP-12C: Covariância e Coef(ρ)
A HP-12C não calcula diretamente a Covariância, somente o Coeficiente de Correlação. No
entanto, sabemos que ela também calcula o desvio padrão dos ativo. Desta forma,
podemos aplicar a seguinte fórmula, lembrando que nossos resultados são sempre
Amostrais:

COV (a,b) = DP(a) × DP(b) × Coeficiente de Correlação(a,b)


Risco A Risco B Risco relacionado entre A,B
q HP-12C - Passo-a-Passo:
Ø (1) Zerar a Hp-12C com [f][CLx]
Ø (2) Inserir um por um, os pares do grupo: Ativo A “ENTER” + Ativo B “[∑+]”,
Com os grupos criados, podemos solicitar o cálculo do Coef (a,b), DP(a) e DP(b).
Ø (3) Calcular Coef(A,B): [g][2] e posteriormente “inverter variáveis” [x><y]
Ø (4) Calcular DP(B): [g][.]; a Hp-12 sempre nos mostra primeiro o “segundo ativo”.
Ø (5) Calcular DP(A): [x><y]; inverter variáveis (você já pediu o DP(b), agora esta
pedindo para a HP somente inverter a variável)
Ø (6) Calcular COV(A,B): multiplicar os itens anteriores (3)×(4)×(5).

29
CFG – Certificação de Fundamentos de Gestão
Medidas de associação entre 2 variáveis
Cálculo HP-12C: Covariância e Coef(ρ)
q Aplicando o Passo-a-Passo:

FLUXO TECLA MOTIVO Visor


800 ENTER 10 [∑+] 1º número do grupo 1
700 ENTER 11 [∑+] 2º número do grupo 2
600 ENTER 13 [∑+] 3º número do grupo 3
500 ENTER 14 [∑+] 4º número do grupo 4
A,r: [g][2]
𝒚 Correlação (r) 1.210
COEF (A,B) [x><y] Inverter resultado ‒0,99
DESVIO PADRÃO (B) S: [g][.] A HP calcula 1º segundo ativo 1,83
DESVIO PADRÃO (A) [x><y] Inverter o Ativo 129,10
Multiplicar duas vezes, pois os
COV(A,B) [×] [×] valores do COEF, DP(a) e DP(b) -233,33
já estão na memória da HP

30
CFG – Certificação de Fundamentos de Gestão
Medidas de associação entre 2 variáveis
Coeficiente de Correlação: Gráfico
Para enxergarmos essa relação, vejamos os gráficos abaixo com suas devidas explicações:
Ø Coef (a,b) = +1: Quando o coeficiente de correlação for igual
a “+1”, percebemos que as duas variáveis estarão se movendo
na mesma direção e na mesma intensidade. Ou seja, quando
um cai, a outra também cai. Quando uma sobe, a outra
também sobe.
Ø Coef (a,b) = 0: Quando o coeficiente de correlação for igual
a “0”, percebemos que as duas variáveis estarão se movendo
sem nenhuma correlação, independente uma da outra (como
se elas tivessem vidas próprias). Importante ressaltar que
mesmo o coeficiente sendo zero, há diversificação da carteira
de investimentos.
Ø Coef (a,b) = - 1: Quando o coeficiente de correlação for igual
a “‒1”, percebemos que as duas variáveis estarão se movendo
em direções opostos, porém, na mesma intensidade. Ou seja,
quando um cai, a outra sobe. Quando uma sobe, a outra cai.

31
CFG – Certificação de Fundamentos de Gestão
Medidas de associação entre 2 variáveis
Covariância e Coef(ρ): Resumo
Os principais pontos da Covariância e do Coeficiente de Correlação são:
Ø São variáveis para demonstrar o risco entre ativos e não o risco de cada ativo. Por
tanto, eles diminuem o Risco Não-Sistêmico, também chamado de Risco
Diversificável;
Ø A Covariância nos dirá “somente” se os ativos se movimentam para a mesma
direção ou para direções contrárias.
Ø O Coeficiente de Correlação no dirá a direção e a intensidade de como os ativos se
relacionam.
Ø Todo ativo que possuir Coeficiente de Correlação MENOR que +1, diversificará a
carteira de investimentos.
Ø Quanto menor for o Coeficiente de Correlação, maior o benefício da
diversificação que este ativo estará gerando a carteira de investimentos.
Ø Ativos com Coeficiente igual a ZERO, diversificam a carteira. No entanto, não se
sabe o que irá ocorrer entre eles.

32
CFG – Certificação de Fundamentos de Gestão
Como a prova tem cobrado!
[306112] A correlação entre os ativos A e B é de -0,65, pode-se afirmar que a
covariância entre esses dois ativos é de aproximadamente:

a) 0,0026.

b) – 0,0026.

c) 0,0062.

d) – 0,0062.

33
CFG – Certificação de Fundamentos de Gestão
Distribuição Normal e Intervalo de Confiança
Conceito
A importância de se saber a média e o desvio-padrão da amostra coleta nos
investimentos, está em conhecer a probabilidade de eventos futuros de se afastarem da
média do grupo. Esta probabilidade é chamada de “Intervalo de Confiança” e pode ser
demonstrada através da “Curva da Distribuição Normal”, formada pela distribuição dos
dados coletados em uma curva. Estas probabilidades já foram calculadas pelos estatísticos
e são padronizadas da seguinte forma:
Ø Aproximadamente 68% dos valores de uma distribuição normal encontram-se
dentro da faixa de UM desvio padrão, para mais ou para menos da média.
Ø Aproximadamente 95% dos valores de uma distribuição normal encontram-se
dentro da faixa de DOIS desvio padrão, para mais ou para menos da média.
Ø Aproximadamente 99% dos valores de uma distribuição normal encontram-se
dentro da faixa de TRÊS desvio padrão, para mais ou para menos da média.

Importante destacar que a curva da distribuição normal simétrica tem forma de sino, e
desta forma, as suas “três Marias” – Média, Moda e a Mediana – são iguais!

34
CFG – Certificação de Fundamentos de Gestão
Intervalo de Confiança
Gráfico
A partir da média (µ), quanto mais nos afastamos dela, maior a probabilidade de um
evento ocorrer. Este afastamento é baseado pela quantidade de desvios padrões (σ).
Importante ressaltar que não importa a quantidade de desvios padrões utilizarmos, jamais
teremos 100% de certeza.

A curva de distribuição normal é apresentada desta forma:

1 DP(𝝈) = 68,26%
2 DP(𝝈) = 95,44%
3 DP(𝝈) = 99,74%
1,96 DP(𝝈) = 95%

35
CFG – Certificação de Fundamentos de Gestão
Distribuição Normal e Intervalo de Confiança
Exemplo
Um fundo de ações possui retorno médio anual de 40% e um desvio padrão de 5%. Para
um intervalo de confiança de 95%, qual a variação esperada aproximada?

q RESPOSTA: para cada desvio padrão utilizado, o fundo deverá se distanciar da sua
média 5%, tanto para mais, quanto para menos. Lembrando que:
Ø Para 68% de Intervalo de Confiança, se utiliza UM Desvio Padrão;
Ø Para 95% de Intervalo de Confiança, se utiliza DOIS Desvios Padrão;
Ø Para 99% de Intervalo de Confiança, se utiliza TRÊS Desvios Padrão;

Assim, devemos nos “desviar” 2 vezes da média, sendo que cada desvio equivale a 5%:
Ø Intervalo de Confiança = Média ± n x DP
o IC Mínimo = 40% ‒ 2 × 5% = 30%
o IC Máximo = 40% + 2 × 5% = 50%

Desta forma, podemos dizer que esperamos que o fundo de tenha uma variação entre
30% e 50%, com 95% de confiança.

36
CFG – Certificação de Fundamentos de Gestão
Como a prova tem cobrado!
[503203] O intervalo com 99% de confiança para os possíveis retornos de um ativo
com média de 40%, desvio padrão de 5% e t crítico de 2,33 é

a) 35%; 45%.

b) 37,33%; 42,67%.

c) 28,35%; 51,65%.

d) 188,35%; 211,65%.

37
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Teste de Hipóteses
O Teste de Hipótese envolve um cálculo estatístico que tem como base a utilização de
uma amostra aleatória, extraída a partir de uma população, com o intuito de testar se
uma afirmação sobre determinado parâmetro ou certa característica dessa população.

Assim, o Teste de Hipóteses irá nos responder se o valor obtido a partir de certa amostra
representa ou não uma simples variação amostral de determinada situação. Em outras
palavras, ele pode ser usado para determinar se uma afirmação sobre o valor de um
parâmetro populacional deve ou não ser rejeitado.

O Teste de Hipóteses apresenta sempre duas hipóteses:

H0: Hipótese inicial, também conhecida por hipótese nula. Representa uma suposição
inicial que é feita a respeito de um parâmetro populacional. É essa a hipótese que
procuramos evidências estatísticas para rejeitá-la!

Ha: Hipótese alternativa. É essa a hipótese que gostaríamos de confirmar, mas isso é feito
a partir da possível rejeição da hipótese nula.

38
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Teste de Hipóteses
Resumo das hipóteses

Podemos expressar, em linhas gerais, o teste de hipóteses de três formas:

1) Teste Unicaudal

H 0 : µ ≤ µ0 ; H 0 : µ ≥ µ0 ;
H a: µ > µ 0 . H a: µ < µ 0 .

2) Teste Bicaudal IMPORTANTE!


O termo de igualdade da expressão (≤, ≥, =) sempre
H 0 : µ = µ0 ; aparece na hipótese NULA. Da mesma forma, os termos
Ha: µ ≠ µ. sem a igualdade (<, >, ≠) sempre aparecem na hipótese
ALTERNATIVA.

39
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Erros Tipo I e Tipo II
Como estamos tratando de procedimentos estatísticos, nunca conseguiremos 100% de
certeza com relação às nossas conclusões dos Testes de Hipóteses.

Assim, é possível que rejeitemos H0 quando ela for verdadeira, o que seria incorreto, ou
ainda não rejeitemos H0 quando ela for falsa (outra conclusão equivocada). No primeiro
caso, cometeríamos um Erro Tipo I e, no segundo caso, um Erro Tipo II.

H0 é verdadeira H0 é falsa
Rejeitar H0 Erro Tipo I Conclusão correta
Não rejeitar H0 Conclusão correta Erro Tipo 2

O Erro Tipo I também é conhecido por Nível de Significância (a), que mede justamente a
probabilidade de cometermos um Erro Tipo I, ou seja, de rejeitarmos H0 quando ela é
verdadeira.
Já o resultado de (1 – probabilidade de cometermos um Erro Tipo 2) é conhecido por
Poder do Teste (b), ou seja, 1 menos a probabilidade de não rejeitar H0 quando ela é falsa.

40
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Etapas do Teste de Hipóteses
Em resumo, o teste de hipótese envolve as seguintes etapas:

1) Desenvolver as hipóteses nula (H0) e alternativa (Ha);


2) Especificar o nível de significância (a);
3) Calcular o valor da estatística do teste (z).

Agora temos duas formas para concluir: usando o valor-p ou o valor crítico. Começando
pelo valor-p:

Ø Usar o valor da estatística do teste (z) para calcular o valor-p;


Ø Rejeitar H0 se o valor-p ≤ a

Usando agora o valor crítico:

Ø Usar o nível de significância para estabelecer o valor crítico e a regra de rejeição;


Ø Com base na regra de rejeição e do valor da estatística do teste, determinar se
podemos ou não rejeitar H0.

41
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Nível de Significância e Estatística do Teste
E como fazemos para finalmente concluir se devemos ou não rejeitar a hipótese nula?
Uma vez definidas as hipóteses nulas e alternativas, devemos decidir outras duas coisas:

1) Nível de significância (a): como vimos, é a probabilidade de ocorrência de um Erro Tipo


I, ou seja, rejeitar H0 quando ela é verdadeira. Na prática, é o próprio pesquisador que vai
definir o nível de significância mais apropriado para cada situação.

Por exemplo, se o custo de cometer um Erro Tipo I for elevado, é preferível utilizar
pequenos valores de a, diminuindo assim a probabilidade de conclusões equivocadas.
Porém, se o custo de cometer esse equívoco não for tão alto, então é possível trabalhar
com valores mais elevados de nível de significância.

42
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Nível de Significância e Estatística do Teste
2) Estatística do teste: precisamos aplicar uma fórmula para conseguirmos concluir nosso
teste de hipóteses. Se a população da qual extraímos a amostra está normalmente
distribuída (e, consequentemente, a amostra também), temos a seguinte estatística para
nosso teste:
x - µ0
z=
s
𝑛
Em que:

x = média amostral
µ0 = média populacional
= desvio-padrão populacional (conhecido)
n = número de observações da amostra

43
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Teste de Hipóteses
Exemplo
Uma engarrafadora de agua mineral comercializa galões de 10 litros. Contudo, como o
processo de engarrafamento é totalmente automatizado, é possível que alguns galões
eventualmente tenham pequenas variações no conteúdo de água.
A empresa reconhece essa possibilidade mas, de acordo com as regras de proteção ao
consumidor, o volume médio populacional deve ser de no mínimo 10 litros. Se essa
condição for satisfeita, eventuais variações são toleráveis pelos órgãos de proteção ao
consumidor.

Logo, a empresa gostaria de rejeitar a hipótese de que a média do volume dos galões da
população (ou seja, de toda a sua produção) seja igual ou inferior a 10 litros. Com isso,
podemos enunciar as seguintes hipóteses:

H0: µ ≤ 10;

Ha: µ > 10.

44
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Nível de Significância e Estatística do Teste
A área de qualidade da empresa fez testes em 50 galões, assumiu que os dados
populacionais são normalmente distribuídos e que o desvio-padrão dessa população
(conhecido) era de 0,25. Nos testes com os galões, chegaram a um volume médio de 9,9
litros por galão e o nível de significância adotado foi de 0,01. Temos então o seguinte:

H0: µ ≤ 10;
Ha: µ > 10.

Aplicando a estatística do teste, temos:

9,9 - 10
z=
0,25
50
-0,1
z=
0,03536
z = - 2,83.

45
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
A Tabela de Probabilidade da Curva Normal

x = 9,9 µ0 = 10
Valor-p = 1 – 0,9977
Valor-p = 0,0023

z = -2,83 0
Devemos procurar, na tabela da Distribuição Normal
Padrão, o valor correspondente a 2,83. Na coluna à
esquerda, procuramos os dois primeiros números
(2,8) e, então, seguimos nessa linha até a coluna
0,03, encontrando o valor de 0,9977.

46
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
A Tabela de Probabilidade da Curva Normal
E o que significa esse valor de 0,9977? Essa é
a área à direita do z (estatística do teste
encontrada). Portanto, podemos concluir
que há probabilidade muito pequena
(0,23%) de encontrarmos na populações Valor-p = 0,0023
galões com média amostral de 9,9 litros
(essa é a área à esquerda do z).

Ao nível de significância de 1%, podemos


concluir que há evidências para rejeitar a
hipótese nula e aceitar, dessa forma, que a z = -2,83 0
média do volume dos galões de água é
superior a 10 litros. IMPORTANTE!
A probabilidade de qualquer valor
Em outras palavras, há 0,23% de chances de individual é zero!
se cometer um Erro Tipo 1, ou seja, rejeitar
a hipótese nula quando ela for verdadeira
(na hipótese de serem encontrados galões
com 9,9 litros ou menos).
47
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Regra de Rejeição de H0
Dessa forma, podemos concluir a regra de
rejeição da hipótese nula para um dado nível de
significância a em um teste unicaudal inferior:

Ø Rejeitamos H0 se o valor-p ≤ a.

Ø Rejeitamos H0 se z ≤ − 𝒛a.
No nosso exemplo, temos valor-p = 0,0023,
inferior ao a de 0,01 (nível de significância
escolhido). Da mesma forma, o z encontrado
pela estatística do teste, de -2,83, é inferior ao
z a de -2,33 (também conhecido por valor
crítico).
E como encontramos esse za? Voltando à tabela
da distribuição normal, temos que procurar nas
células a área de 0,99, que corresponde a 99% à
direita do z. E o número equivalente é 2,33.
48
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Teste Bicaudal
De forma genérica, o teste de hipóteses bicaudal engloba as seguintes hipóteses:

H 0 : µ = µ0 ;
Ha: µ ≠ µ.

Suponha que um pesquisador gostaria de verificar se a média populacional é igual a 300.


Ele então assume um nível de significância de 5% (a = 0,05) e coleta uma amostra de 50
observações, na qual verifica uma média amostral de 302, com desvio-padrão de 12. Uma
vez definidos as hipóteses e o nível de significância, devemos agora calcular a estatística
do teste:
302 - 300
z=
12 50
2
z=
1,6971
z = 1,18.

49
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Vamos agora interpretar os resultados Teste Bicaudal
encontrando o valor-p e o valor crítico.

Devemos procurar na coluna da esquerda


pelo número 1,1 e, nessa linha, seguirmos
para a direita até a coluna 0,08. Encontramos
0,8810. Isso significa p (z < 1,18) é 0,8810.
Logo, p(z ≥ 1,18) é de 1 – 0,8810 = 0,1190.
Para calcularmos o valor-p, devemos duplicar
esse número, pois temos duas caudas. Logo,
valor-p = 2 x 0,1190 = 0,2380.

P(z ≤-1,18) = 0,1190 P(z ≥ 1,18) = 0,1190

z = - 1,18 0 z = + 1,18

50
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Dessa forma, podemos concluir a regra de
rejeição da hipótese nula para um dado nível de Regra de Rejeição de H0
significância a em um teste bicaudal:

Ø Rejeitamos H0 se o valor-p ≤ a.
Ø Rejeitamos H0 se z ≤ − 𝒛a/2 ou se z ≥ 𝒛a/2.

No nosso exemplo, temos valor-p = 0,2380,


superior ao a de 0,05 (nível de significância
escolhido), o que nos permite concluir que NÃO
podemos rejeitar H0.

Da mesma forma, o z encontrado pela estatística


do teste, de 1,18, é inferior ao z a/2 de 1,96
(também conhecido por valor crítico). E como
encontramos esse z a/2 ? Voltando à tabela da
distribuição normal, temos que procurar nas
células a área de 0,975, corresponde a 1 – 0,975 =
0,025 em cada cauda. Como é um teste bicaudal,
isso representa 0,05 em ambas as caudas. E o
número equivalente é 1,96.
51
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Resumo

Exemplo do teste Unicaudal


Estatística do teste (z) = -2,83.
Como caiu na área de rejeição
de H0, temos evidências
suficientes para dizer que a
- 2,83 za= -2,33 0 média populacional não é igual
ou inferior a 10 litros por galão.
Rejeita H0 Não rejeita H0
Exemplo do teste Bicaudal
P(z ≤-1,96) = 0,025 P(z ≥ 1,96) = 0,025
Estatística do teste (z) = 1,18.
Como caiu na área de não
rejeição de H0, não temos
za=/2 - 1,96 0 1,18 za=/2+ 1, 96 evidências suficientes para
dizer que a média amostral é
Rejeita H0 Não rejeita H0 Rejeita H0 diferente da média
populacional.
52
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Teste de Hipóteses - Resumo
Cauda inferior Cauda superior Bicaudal

H 0 : µ ≥ µ0 ; H 0 : µ ≤ µ0 ; H 0 : µ = µ0 ;
Hipóteses H a: µ < µ 0 H a: µ > µ 0 . Ha: µ ≠ µ.
x - µ0 x - µ0 x - µ0
Estatística do teste z= z= z=
s s s
𝑛 𝑛 𝑛
Regra de rejeição
pelo critério do Rejeitar H0 se o Rejeitar H0 se o Rejeitar H0 se o
valor-p valor-p ≤ a valor-p ≤ a valor-p ≤ a

Regra de rejeição Rejeitar H0 se


Rejeitar H0 se Rejeitar H0 se
pelo critério do z ≤ − 𝑧a/2 ou
z ≤ − 𝑧a. z ≥ 𝑧a.
valor crítico se z ≥ 𝑧a/2.

Desvio-padrão da população é conhecido!


53
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Regressão Linear Simples
A análise de regressão é um procedimento estatístico para desenvolver uma equação que
demonstra como as variáveis se relacionam. Portanto, precisamos incialmente definir os
dois tipos de variáveis que são abordados em uma regressão:

Variável dependente: é a variável prevista;


Variável independente: é a variável utilizada para prever o valor da variável dependente.

Por exemplo, o cálculo do beta de uma ação envolve uma regressão. Como ele nos
fornece uma medida quantitativa de quanto irá variar uma ação em função de uma
variação no mercado, podemos concluir que, no caso do beta, a variável dependente é a
ação e a variável independente, o mercado (Ibovespa, por exemplo).

Se trabalharmos com apenas uma variável independente, usamos a Regressão Linear


Simples, pois a relação entre essas variáveis (dependente e independente) se aproxima de
uma reta. Havendo duas ou mais variáveis independentes, usamos a Regressão Múltipla.

54
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Regressão Linear Simples
A equação de regressão linear simples estimada é expressa genericamente da seguinte
forma:

E(y) = b0 + b1x + e.

Em que E(y) é o valor esperado de y, b0 e b1 são os parâmetros do modelo e e é uma


variável aleatória chamada erro aleatório ou parcela de erro. Em outras palavras, mede a
variabilidade de y (variável dependente) que não pode ser explicada pela relação linear
entre x e y.

Na prática, os valores desses parâmetros muitas vezes não são conhecidos. Portanto,
precisamos estimá-los a partir de amostras. Nesse caso, as estatísticas amostrais passam a
ser b0 e b1 e, assim, obtemos a equação de regressão estimada:

y = bo + b1x.

55
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Regressão Linear
Regressão Linear Simples
E(y) positiva E(y)

b0 A inclinação de b1 é
negativa
b0 A inclinação de b1 é
positiva
Regressão Linear
negativa

x x
E(y)
Sem relação
b0
A inclinação de b1 é
zero

x
56
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Regressão Linear Simples
E como fazemos para calcular os valores b0 e b1 na equação de regressão estimada?

Primeiro plotamos os dados em um gráfico, de modo a obter um diagrama de dispersão.


Nesse gráfico, temos a variável independente (x) no eixo horizontal e a variável
dependente (y) no eixo vertical. A partir da análise do diagrama, podemos observar os
dados em um formato gráfico e, com isso, já tirar algumas conclusões prévias.
Variável 25

dependente (y)
20

15

10

0
0 2 4 6 8 10 12

Variável independente (x)

57
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Regressão Linear Simples
Então, utilizamos o Método dos Mínimos Quadrados para calcular a equação de
regressão estimada. Esse método utiliza dados amostrais para produzir os valores b0 e b1
que minimizam a soma dos quadrados dos desvios entre os valores observados da
variável dependente y e os valores estimados da variável dependente y.

Utilizando um software, como o MS Excel, chegamos que a reta de regressão estimada


para os dados plotados no gráfico abaixo é de: y = 6,6857 + 1,4571x.

25
Assim, se x = 6, substituímos na
Variável
20 equação e teríamos que o valor
dependente (y) 15 estimado de y seria:
10
y = 6,6857 + 1,4571 x 6
5

0 y = 15,43.
0 2 4 6 8 10 12

Variável
independente (x)
58
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Coeficiente de Determinação
Outra questão importante quando falamos de regressão é o quão bem essa reta de
regressão se ajusta aos dados. Para responder a essa pergunta, precisamos calcular o R2,
também chamado de Coeficiente de Determinação.

Ele pode ser interpretado como a proporção da variabilidade da variável dependente


que pode ser explicada pela equação de regressão estimada. Se for de 0%, significa que o
modelo não tem poder algum de explicação sobre a variabilidade dos dados; no outro
extremo, 100%, o modelo explica perfeitamente a variação do dados.

Assim, quanto maior for o R2, melhor o ajuste do modelo e, quanto menor for o R2, pior o
ajuste do modelo.

Em regressões lineares simples, o R2 é exatamente igual ao coeficiente de correlação ao


quadrado. Logo, R2 = 𝝆2.

59
CFG – Certificação de Fundamentos de Gestão
Métodos Quantitativos
Regressão Múltipla
Como falamos anteriormente, havendo duas ou mais variáveis independentes, usamos a
Regressão Múltipla.

Os procedimentos usados para estimar o valor médio de y e para prever um avalor


individual de y na regressão múltipla são similares aos da análise de regressão que
envolvem apenas uma variável independente (regressão simples).

Exemplo
Seja a seguinte equação de regressão estimada:

y = - 0,74 + 0,05x1 + 1,57x2. Sendo x1 = 100 e x2 = 200, o valor estimado de y será de:

y = - 0,74 + 0,05 x 100 + 1,57 x 200 = - 0,74 + 5 + 314 = 318,26.

60
CFG – Certificação de Fundamentos de Gestão

Você também pode gostar