Você está na página 1de 17

Estatística

Estatística

Medidas de Posição Central

Média Aritmética
Média aritmética é a medida de localização do centro, ou média, da população ou da amostra, sendo
obtida somando-se todos os elementos da população (ou da amostra) e dividindo-se o resultado da
soma pelo número de observações da população/amostra.

Existem dois tipos de médias: populacional (representada pela letra grega µ) e amostral
(representada por X). População é a totalidade de observações existentes, enquanto que a amostra é
composta por parte de uma população.

Se x1, x2, …, xn são os valores dos dados e n é a dimensão, então podemos escrever a média como:

n
ΣX
i=l
i

X=
n
Uma carteira de ações obteve os seguintes retornos anuais nos últimos três anos:
12%, 7% e 2% respectivamente. Seu retorno anual médio foi de:

Média aritmética: (0,12 + 0,07 + 0,02) / 3 = 0,07, ou 7%

Média Ponderada
A média ponderada é similar à média aritmética comum. A diferença é que na média aritmética
todos os valores contribuem com peso igual, enquanto que no cálculo da média ponderada se
leva em consideração o peso de cada termo, uma vez que existem termos que contribuem mais
que outros.

Uma carteira composta por 50% de ações, 40% de títulos públicos e 10% de
dinheiro, com retornos anuais de 12%, 7% e 3% respectivamente, terá um retorno
anual total de:

Média ponderada: (0,50 x 0,12) + (0,40 x 0,07) + (0,10 x 0,03) = 0,091, ou 9,1%

1
Estatística

Média Geométrica
A média geométrica indica a tendência central ou o valor típico de um conjunto de números usando
o produto dos seus valores (diferente da média aritmética, que usa a soma dos valores). A média
geométrica é definida como n-ésima raiz (onde n é a quantidade de termos) da multiplicação dos
termos. Sua fórmula é:
n
MG = √ X1 . X2 . X3 . ... . Xn

Onde,

MG: média geométrica

n: número de elementos do conjunto de dados

x1, x2, x3, ..., xn: valores dos dados

Exemplo:

Qual o valor da média geométrica entre os números 3, 8 e 9? Como temos 3


valores, iremos calcular a raiz cúbica do produto.
3 3
MG = √ 3. 8. 9 = √ 216 = 6

Mediana
É a medida de localização do centro da distribuição dos dados, correspondente ao valor que
divide
a amostra ao meio quando organizada em ordem crescente ou decrescente.

Isto é, metade dos elementos do conjunto de dados é menor ou igual à mediana, enquanto os
restantes são superiores ou iguais.

Para a sua determinação, organize os dados dos maiores para os menores valores, ou dos
menores para os maiores valores, e encontre a observação do meio. Utiliza-se a seguinte regra
para determiná-la:

― Se n é ímpar, a mediana é o elemento localizado no meio da amostra.

― Se n é par, a mediana é a semissoma dos dois elementos do meio.

Os retornos das ações de 5 bancos foram de 4%, 6%, 10%, 20% e 80% no último
ano. Qual foi a média e a mediana dos retornos?

Média: 24%

Mediana: 10%

2
Estatística

É possível calcular a média aritmética utilizando a HP 12C. Para isso,


basta utilizar a tecla Σ+ da calculadora. Para o exemplo acima, basta
proceder da seguinte forma:

1. Limpe os registros utilizando f FIN e f REG.

2. Insira o valor 4 e aperte a tecla Σ+ (aparecerá no visor o número 1, que


corresponde à quantidade de observações armazenadas na HP).

3. Insira o valor 6 e aperte a tecla Σ+ (aparecerá no visor o número 2).

4. Insira o valor 10 e aperte a tecla Σ+ (aparecerá no visor o número 3).

5. Insira o valor 20 e aperte a tecla Σ+ (aparecerá no visor o número 4).

6. Insira o valor 80 e aperte a tecla Σ+ (aparecerá no visor o número 5).

7. Para descobrir a média, aperte g 0 (em azul, na tecla zero, está grafado x).

Resultado: 24

Moda
É o valor que surge com mais frequência num conjunto de dados. Um conjunto de dados pode ter
mais do que uma moda (multimodal) ou até mesmo nenhuma moda.

Assimetria (skewness)
Uma distribuição é considerada simétrica quando seu formato é idêntico em ambos os lados a
partir de sua média. A simetria de uma distribuição significa, por exemplo, que intervalos de ganhos
e perdas irão exibir a mesma frequência. Ou seja, uma distribuição simétrica com retorno média
igual a zero terá a frequência de perdas entre -5% e -1% igual a frequência de ganhos entre 1% e
5%.

A extensão da simetria de uma distribuição é importante porque sinaliza ao analista se os desvios


em relação à média são mais provavelmente negativos ou positivos.

Assimetria, ou skewness, refere-se a uma medida de extensão da não simetria de uma distribuição.
Distribuições não simétricas, ou assimétricas, podem ser positiva ou negativamente enviesadas
e resultam da ocorrência de valores atípicos (outliers) na série de dados. Valores atípicos são as
observações com grande afastamento em relação à média, tanto positivo como negativo.

Sendo assim, uma distribuição assimétrica pode ser:

― Positivamente assimétrica (positively skewed) = caracterizada por muitos valores


atípicos na região superior (upper), ou na cauda direita (right tail). Uma distribuição
positivamente assimétrica é referenciada como enviesada à direita em face de sua
relativamente longa cauda direita.

3
Estatística

― Negativamente assimétrica (negatively skewed) = caracterizada por muitos valores


atípicos na região inferior (lower), ou na cauda esquerda (left tail). Uma distribuição
negativamente assimétrica é dita como enviesada à esquerda por causa de sua
relativamente longa cauda esquerda.

A assimetria afeta a localização da média, mediana e moda de uma distribuição:

― Em uma distribuição simétrica, a média, mediana e moda são iguais.


― Em uma distribuição positivamente assimétrica, a média é maior que a
mediana, que é maior que moda. A média é afetada pelos valores atípicos
positivos, ou seja, tais valores irão “puxar” a média para a direita.
― Em uma distribuição negativamente assimétrica, a média é menor que
a mediana, que é menor que a moda. = Neste caso, são os valores atípicos
negativos que “puxam a média” para a esquerda.

4
Estatística

Quartis
Um quartil é qualquer um dos três valores que divide o conjunto ordenado de dados em quatro
partes iguais, e assim cada parte representa 1/4 da amostra ou da população.

Assim, no caso de uma amostra ordenada:

― primeiro quartil (designado por Q1/4) = quartil inferior = é o valor aos 25%
da amostra ordenada = 25º percentil;

― segundo quartil (designado por Q2/4) = mediana = é o valor até o qual se


encontram 50% da amostra ordenada = 50º percentil, ou 5º decil;

― terceiro quartil (designado por Q3/4) = quartil superior = valor a partir


do qual se encontram 25% dos valores mais elevados = valor aos 75% da
amostra ordenada = 75º percentil.

Veja esses dois exemplos:

1. Amostra: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36

Amostra ordenada: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

Q1/4 = 15

Q2/4 = 40

Q3/4 = 43

2. Amostra ordenada: 7, 15, 36, 39, 40, 41

Q1/4 = 15

Q2/4 = (39 + 36) / 2 = 37,5

Q3/4 = 40

5
Estatística

Medidas de Retorno

O retorno médio histórico é calculado pela média simples dos retornos observados. Por exemplo, o
retorno médio dos últimos 5 anos será a soma dos 5 retornos dividida por 5.

O retorno esperado de uma carteira (Rport) com n ativos é dado pela média dos retornos esperados
de cada ativo (Ri), ponderada pelos respectivos pesos individuais de cada ativo na carteira (wi):
n
E(Rport) = Σ
i=1
w E(R )
i i

Vamos considerar que um investidor possui a seguinte carteira de investimento:

― R$ 15.000,00 no ativo A;

― R$ 45.000,00 no ativo B;

― R$ 20.000,00 no ativo C;

― R$ 20.000,00 no ativo D.

Esse investidor espera, para o final de um período, que cada ativo tenha os seguintes
retornos respectivamente: 4,6%, 5,2%, 8,2% e 14,3%.

Como apresentado a seguir, a carteira com os quatro ativos terá um retorno


esperado igual a 7,53% no período considerado:

Ativos Wi E(Ri) Wi x E(Ri)

A 0,15 0,0460 0,0069


B 0,45 0,0520 0,0234
C 0,20 0,0820 0,0164
D 0,20 0,1430 0,0286
retorno esperado da carteira 0,0753

Medidas de Dispersão: Variância e Desvio-padrão


(Volatilidade)

Variância
A variância é uma medida de variabilidade ou dispersão, calculada como a soma dos quadrados dos

6
Estatística

desvios em relação à média (as diferenças entre o valor de cada observação X i e a média), dividido
pelo número de observações:
N
Σ (Xi - X)
σ =
i=l

N
Em geral, como não temos todos os elementos da população, a fórmula
da variância calculada com os valores de uma amostra deve ter (n -1) no
denominador.
N
Σ (Xi - X)
S2 =
i=l

n-1
Desvio-padrão
Uma vez que o resultado da variância é expresso em unidades ao quadrado, temos que calcular a raiz
quadrada da variância e, com isso, obtemos o desvio-padrão. Assim, temos uma medida com as
mesmas unidades que os dados:

S = √Variância
O desvio-padrão é uma medida que só pode assumir valores não negativos e, quanto maior for,
maior será a dispersão dos dados.

Algumas propriedades do desvio-padrão que resultam imediatamente da definição são:

― O desvio-padrão é sempre não negativo e será tanto maior, quanto mais variabilidade
houver entre os dados.

― Se s = 0, então não existe variabilidade, isto é, os dados são todos iguais.

Em finanças, a variância e o desvio-padrão de retornos esperados


são medidas comuns de risco de investimento.

Essas duas medidas determinam a variabilidade de distribuição de retornos sobre a sua média.

O risco está associado justamente à probabilidade de se contabilizar rendimento


negativo (da ocorrência de um evento não esperado).

7
Estatística

Por exemplo, quando se realiza um investimento, há duas probabilidades, em linhas gerais: que o
valor investido renda positivamente ou negativamente em relação a determinado patamar (pode ser
o valor inicialmente investido ou mesmo um benchmark de mercado, usado como comparação para
avaliar o desempenho de um investimento, por exemplo, CDI ou Ibovespa).

Ao comprar uma ação e se analisar o desvio-padrão das cotações desse ativo,


provavelmente será possível notar uma grande dispersão com relação à média,
demonstrando, em termos quantitativos, o risco desse investimento.

Por sua vez, ao se investir num fundo DI ou em títulos pós-fixados do Tesouro Nacional e se calcular
o desvio-padrão, será possível notar uma menor dispersão com relação à média (menor desvio-
padrão), pois os retornos são mais constantes.

A fórmula do desvio padrão para uma carteira com dois ativos é:

Onde:

Wa: peso do ativo A na carteira

σa2: variância do ativo A

Wb: peso do ativo B na carteira

σb2: variância do ativo B

ρ AB: correlação entre os ativos A e B

Valores Esperados
A variância (σ2) para um investimento individual, considerando valores esperados, é calculada da
seguinte maneira:

σ2 = [r1 - E(r)]2 x p1 + [r2 -E (r)]2 x p2 + + [rt - E(r)]2 x Pt

Os retornos esperados do exemplo 1 acima foram reproduzidos nas 3 primeiras


colunas da tabela abaixo. Utilizando esses dados esperados, calcule a variância e o
desvio-padrão de todos os retornos. Lembre-se de que o retorno esperado é
de 15%.

Estado da
Probabilidade Retorno [(Ri) – E(R)]² Pi[(Ri) - E(R)]²
Economia

8
Estatística

Expansão 0,25 0,05 0,01 (0,25) (0,01) = 0,0025

Normal 0,50 0,15 0,00 (0,50) (0,00) = 0,0000

Recessão 0,25 0,25 0,01 (0,25) (0,01) = 0,0025

Variância = ∑ Pi[(Ri) – E(R)]² = 0,0025 + 0,0000 + 0,0025 = 0,0050


Desvio-padrão = (0,0050)1/2 = 0,0707 = 7,07%

Valores Históricos

A variância (σ2) para um investimento individual, considerando valores históricos, é calculada da


seguinte maneira:

Considere que os retornos de uma ação nos últimos 6 meses foram: +10%,

-15%, +20%, +25%, -30% e +20%. Calcule a variância e o desvio-padrão.

Solução: Primeiramente, é necessário calcular o retorno esperado.

E(R) = 0,10 - 0,15 + 0,20 + 0,25 - 0,30 + 0,20 = 0,05 = 5,0%

O exercício será solucionado na tabela abaixo, para melhor visualização:

Rt (Rt – E(R)) (Rt – E(R))²

+0,10 +0,05 0,0025

-0,15 -0,20 0,0400

+0,20 +0,15 0,0225

+0,25 +0,20 0,0400

-0,30 -0,35 0,1225

+0,20 +0,15 0,0225

9
Estatística

E(R) = 0,05 ∑ = 0,2500

Variância = 0,2500/(6 - 1) = 0,05


Desvio-padrão = 0,2236 = 22,36%

Medidas de Associação entre Duas Variáveis:


Covariância, Correlação e Coeficiente de
Determinação (R2)

A variância e o desvio-padrão são medidas de dispersão, ou volatilidade, de somente uma


variável.

Em várias situações financeiras, no entanto, estamos interessados em saber como duas variáveis se
movem, uma em relação à outra.

A covariância (em inglês, covariance ou COV) é essa medida do grau com que duas variáveis se
movem juntas. Captura a relação linear entre uma variável e outra.

N
Σ (Xi - X)(Yi - Y)
Cov(X,Y) = i=l

n
Se tratar-se de uma amostra, lembre-se de que, no denominador, deve constar

n - 1. Logo, a covariância amostral pode ser definida como:


n
Σ (Xi - X)(Yi - Y)
Cov(X,Y) = i=l

n-l
Uma covariância positiva indica que as variáveis tendem a se mover na mesma direção; uma
covariância negativa indica que as variáveis tendem a se mover em direções opostas relativas
aos seus meios.

A covariância apenas indica a direção do relacionamento, não indicando


a força da relação.

10
Estatística

Sendo assim, se você compara duas medidas de covariância e uma é duas vezes o valor da outra,
a relação do segundo grupo não é necessariamente duas vezes mais fraca que a do primeiro.

Calcule a covariância dos retornos da empresa X (Rx) com os retornos


da empresa Y (Ry) utilizando os dados da tabela abaixo (os dados são
probabilidades conjuntas):

Estado da Retorno da Retorno da


Probabilidade
Economia Empresa X Empresa Y
Expansão 30% 15% 20%
Recessão 70% 10% 5%

Solução:

Primeiramente, ache o retorno esperado de X e Y como segue:

E (Rx) = 0,30 (15) + 0,70 (10) = 11,5%

E (Ry) = 0,30 (20) + 0,70 (5) = 9,5%

Cov (Rx,Ry) = [0,3(15,0 - 11,5)(20,0 - 9,5)] + [0,7(10,0 - 11,5)(5,0 - 9,5)]

Cov (Rx,Ry) = 11,025 + 4,725 = 15,75

Para ser mais fácil de interpretar o valor da covariância de duas variáveis, utilizamos o coeficiente de
correlação (ρ).

Esse coeficiente nada mais é do que a covariância de duas variáveis dividido pelo produto dos
desvios-padrão de cada uma.

É uma medida padronizada, diferentemente da covariância, da força de uma relação linear


(correlação) entre duas variáveis. O coeficiente de correlação pode estar entre -1 e +1.

Você pode converter correlação em covariância (e vice-versa) conforme a fórmula a seguir:

COV a,b
ρ a,b = = COV a,b = ρ a,b x σa x σb
σa x σ b

11
Estatística

― +1 significa que os retornos se movem juntos na mesma direção.

― -1 significa que os retornos se movem em direções opostas.

― 0 significa que não há qualquer relação.

O gráfico abaixo descreve uma situação em que a correlação dos retornos dos ativos A e B é
igual a 0,9. Observe que os retornos tendem a se mover na mesma direção.
RA

RB

Exemplo de correlação positiva: a variação de preços da ação da Petrobras e o índice IBX. Como a
ação da Petrobras possui um elevado peso no IBX, é de se esperar que, na maioria das vezes, a ação e
o índice tenham comportamentos na mesma direção e com magnitudes próximas.

Exemplo de correlação negativa: quando o dólar subiu, historicamente os retornos mostram que, na
maioria das vezes, o Ibovespa registrou desvalorização, e vice-versa.

Exemplo de correlação nula: a variação de índices de preços no Brasil não apresenta movimentos
com tendência definida se comparada com a variação de câmbio, como no caso do peso argentino.

A covariância apenas indica a direção do relacionamento, não indicando


a força da relação.

Correlação positiva Correlação negativa

Retorno ativo i Retorno ativo i

Retorno Retorno
ativo j ativo j

12
Estatística

Correlação nula
Retorno ativo i

Retorno
ativo j

A correlação nos permite dizer se uma carteira está diversificada ou não.

No caso de dois ativos com correlação negativa, ao incorrer uma perda no ativo i, ganhamos com o
ativo “j”; o caso contrário também se verifica, um ganho do ativo “i” significa uma perda no ativo “j”.

Portanto, para ativos que possuem correlação negativa, há a formação de um hedge entre ambos,
justamente a partir da diversificação.

Coeficiente de Determinação (R2)


Nas regressões lineares, o coeficiente de determinação (R2) é definido como percentagem da
variação total da variável dependente explicada pela variável independente. Assim, R2 = 0,75 significa
que 75% da variação é explicada pelo modelo.

É importante ressaltar que para regressões lineares simples, isto é, aquelas com apenas uma variável
independente, o coeficiente de determinação R2 pode ser computado elevando ao quadrado o
coeficiente de correlação (r).

Em outras palavras, R2 = (r)2 nas regressões lineares simples.

Entretanto, esta relação não é válida quando mais de uma variável independente é utilizada, isto é,
em uma regressão linear múltipla. Neste caso, o R2 pode ser calculado através de um procedimento
estatístico denominado Análise de Variância - ANOVA.

Risco de uma carteira com 2 ou 3 ativos

A fórmula para cálculo do risco de uma carteira, medido pelo desvio-padrão de uma carteira
com dois ativos (A e B), é dada por:

σP = √ W A2σ A2 + W B2σ B2 + 2 ρ ABW AW Bσ Aσ B

13
Estatística

Ou, substituindo o coeficiente de correlação por covariância:

√ W A2σ A2 + W B2σ B2 + 2 W AW BC o v AB
Em que:

WA: peso do ativo A na carteira

σA2: variância do ativo A

WB: peso do ativo B na carteira

σB2: variância do ativo B

CovAB: covariância entre os ativos A e B

ρAB: correlação entre os ativos A e B

Considere dois pontos importantes:

― Se a questão fornecer a variância dos ativos, não é necessário elevar as medidas


ao quadrado; por sua vez, caso sejam fornecidos os desvios-padrão, estes
deverão ser elevados ao quadrado para chegarmos à variância. Utilize sempre os
dados na forma decimal (0,01 em vez de 1%).

― Fique atento à medida que foi fornecida na prova: covariância ou correlação.

Um investidor pretende determinar o risco de uma carteira na qual possui R$


20.000,00 investidos em um ativo A, com desvio-padrão de 4%, e R$ 30.000,00
investidos em um ativo B, com desvio-padrão de 1%. Ele sabe que o coeficiente de
correlação entre os ativos é de 0,85.

Solução:

Primeiramente, determinamos a covariância dos ativos:

covAB = 0,85*(0,04*0,01) = 0,00034

A seguir, devemos determinar o peso de cada ativo na carteira.

Ativo Valor absoluto Valor relativo (peso)

A R$ 20.000 40%

B R$ 30.000 60%

Total da Carteira R$ 50.000 100%

Agora, vamos finalmente calcular o risco da carteira:

riscocarteira = √(0,4 x 0,04)2 + (0,6 x 0,01)2 + 2 x 0,4 x 0,6 x 0,00034

riscocarteira = 2,134%

14
Estatística

O risco de uma carteira com três ativos é:

σp2 = wA2σ2A + wB2σ2B + wC2σ2C + 2wAwB ρ ABσAσB + 2wAwC ρ ACσAσC + 2wBwC ρ BCσBσC

Em que:

wA, wB, wC = pesos dos ativos na carteira

σ2A, σ2B, σ2C = variâncias dos ativos A, B e C

ρAB, ρAC, ρBC = correlação dos retornos dos pares de ativos (A&B, A&C, B&C)

Distribuição Normal
A Distribuição Normal é a mais familiar das distribuições de probabilidade e também uma das mais
importantes em estatística.

A forma exata de Distribuição Normal (a característica “curva do sino”) é definida por uma função que
tem apenas dois parâmetros: média e desvio-padrão.

São propriedades características da Distribuição Normal:

― É simétrica.

― 68% das observações caem dentro de um intervalo de + ou - 1 desvio-padrão


em torno da média: P(x estará entre a média +/- 1 desvio- padrão) = 68%.

― 90% das observações caem dentro de um intervalo de + ou - 1,65


desvios-padrão em torno da média: P(x estará entre a média +/- 1,65
desvios-padrão) = 90%.

― 95% das observações caem dentro de um intervalo de + ou - 1,96


desvios-padrão em torno da média: P(x estará entre a média +/- 1,96
desvios-padrão) = 95%.

― 99% das observações caem dentro de um intervalo de + ou - 2,58


desvios-padrão em torno da média: P(x estará entre a média +/- 2,58
desvios-padrão) = 99%.

Esta relação pode ser observada no gráfico abaixo:

A Curva Normal é Simétrica: as duas metades são idênticas.

15
Estatística

Probability

-2σ -σ E(x) +σ +2σ

68%
= 95%

A média, a moda e a mediana são iguais.

Intervalo de Confiança em uma Distribuição Normal


Um Intervalo de Confiança abrange os possíveis valores de uma determinada estatística para
um dado grau de certeza a ela associado. Trata-se, portanto, da margem de erro em torno de uma
estatística.

Por que usamos intervalos de confiança?

― Para sumarizar o erro na média da amostra.

― Para prover elementos para sabermos se a amostra é significativa.

― Para permitir comparações à luz dos erros.

Em um intervalo de 90% de confiança, 10% das médias das amostras coletadas não
abrangem a média da população.

Exemplo:

O retorno de uma ação tem distribuição normal, com média de 5% e desvio-padrão


de 20%.

Como interpretar este desvio-padrão? Checaremos os possíveis retornos, usando


os intervalos de confiança:

16
Estatística

Intervalo de
Possíveis Resultados Interpretação
Confiança

5 - (1,65 x 20) = -28 Há 90% de chance de o retorno


90%
5 + (1,65 x 20) = 38 esperado ficar entre -28% e 38%.

5 - (1,96 x 20) = -34,2 Há 95% de chance de o retorno


95%
5 + (1,96 x 20) = 44,2 esperado ficar entre -34,2% e 44,2%.

5 - (2,58 x 20) = -46,6 Há 99% de chance de o retorno


99%
5 + (2,58 x 20) = 56,6 esperado ficar entre -46,6% e 56,6%.

17

Você também pode gostar