Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística
Média Aritmética
Média aritmética é a medida de localização do centro, ou média, da população ou da amostra, sendo
obtida somando-se todos os elementos da população (ou da amostra) e dividindo-se o resultado da
soma pelo número de observações da população/amostra.
Existem dois tipos de médias: populacional (representada pela letra grega µ) e amostral
(representada por X). População é a totalidade de observações existentes, enquanto que a amostra é
composta por parte de uma população.
Se x1, x2, …, xn são os valores dos dados e n é a dimensão, então podemos escrever a média como:
n
ΣX
i=l
i
X=
n
Uma carteira de ações obteve os seguintes retornos anuais nos últimos três anos:
12%, 7% e 2% respectivamente. Seu retorno anual médio foi de:
Média Ponderada
A média ponderada é similar à média aritmética comum. A diferença é que na média aritmética
todos os valores contribuem com peso igual, enquanto que no cálculo da média ponderada se
leva em consideração o peso de cada termo, uma vez que existem termos que contribuem mais
que outros.
Uma carteira composta por 50% de ações, 40% de títulos públicos e 10% de
dinheiro, com retornos anuais de 12%, 7% e 3% respectivamente, terá um retorno
anual total de:
Média ponderada: (0,50 x 0,12) + (0,40 x 0,07) + (0,10 x 0,03) = 0,091, ou 9,1%
1
Estatística
Média Geométrica
A média geométrica indica a tendência central ou o valor típico de um conjunto de números usando
o produto dos seus valores (diferente da média aritmética, que usa a soma dos valores). A média
geométrica é definida como n-ésima raiz (onde n é a quantidade de termos) da multiplicação dos
termos. Sua fórmula é:
n
MG = √ X1 . X2 . X3 . ... . Xn
Onde,
Exemplo:
Mediana
É a medida de localização do centro da distribuição dos dados, correspondente ao valor que
divide
a amostra ao meio quando organizada em ordem crescente ou decrescente.
Isto é, metade dos elementos do conjunto de dados é menor ou igual à mediana, enquanto os
restantes são superiores ou iguais.
Para a sua determinação, organize os dados dos maiores para os menores valores, ou dos
menores para os maiores valores, e encontre a observação do meio. Utiliza-se a seguinte regra
para determiná-la:
Os retornos das ações de 5 bancos foram de 4%, 6%, 10%, 20% e 80% no último
ano. Qual foi a média e a mediana dos retornos?
Média: 24%
Mediana: 10%
2
Estatística
7. Para descobrir a média, aperte g 0 (em azul, na tecla zero, está grafado x).
Resultado: 24
Moda
É o valor que surge com mais frequência num conjunto de dados. Um conjunto de dados pode ter
mais do que uma moda (multimodal) ou até mesmo nenhuma moda.
Assimetria (skewness)
Uma distribuição é considerada simétrica quando seu formato é idêntico em ambos os lados a
partir de sua média. A simetria de uma distribuição significa, por exemplo, que intervalos de ganhos
e perdas irão exibir a mesma frequência. Ou seja, uma distribuição simétrica com retorno média
igual a zero terá a frequência de perdas entre -5% e -1% igual a frequência de ganhos entre 1% e
5%.
Assimetria, ou skewness, refere-se a uma medida de extensão da não simetria de uma distribuição.
Distribuições não simétricas, ou assimétricas, podem ser positiva ou negativamente enviesadas
e resultam da ocorrência de valores atípicos (outliers) na série de dados. Valores atípicos são as
observações com grande afastamento em relação à média, tanto positivo como negativo.
3
Estatística
4
Estatística
Quartis
Um quartil é qualquer um dos três valores que divide o conjunto ordenado de dados em quatro
partes iguais, e assim cada parte representa 1/4 da amostra ou da população.
― primeiro quartil (designado por Q1/4) = quartil inferior = é o valor aos 25%
da amostra ordenada = 25º percentil;
Amostra ordenada: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49
Q1/4 = 15
Q2/4 = 40
Q3/4 = 43
Q1/4 = 15
Q3/4 = 40
5
Estatística
Medidas de Retorno
O retorno médio histórico é calculado pela média simples dos retornos observados. Por exemplo, o
retorno médio dos últimos 5 anos será a soma dos 5 retornos dividida por 5.
O retorno esperado de uma carteira (Rport) com n ativos é dado pela média dos retornos esperados
de cada ativo (Ri), ponderada pelos respectivos pesos individuais de cada ativo na carteira (wi):
n
E(Rport) = Σ
i=1
w E(R )
i i
― R$ 15.000,00 no ativo A;
― R$ 45.000,00 no ativo B;
― R$ 20.000,00 no ativo C;
― R$ 20.000,00 no ativo D.
Esse investidor espera, para o final de um período, que cada ativo tenha os seguintes
retornos respectivamente: 4,6%, 5,2%, 8,2% e 14,3%.
Variância
A variância é uma medida de variabilidade ou dispersão, calculada como a soma dos quadrados dos
6
Estatística
desvios em relação à média (as diferenças entre o valor de cada observação X i e a média), dividido
pelo número de observações:
N
Σ (Xi - X)
σ =
i=l
N
Em geral, como não temos todos os elementos da população, a fórmula
da variância calculada com os valores de uma amostra deve ter (n -1) no
denominador.
N
Σ (Xi - X)
S2 =
i=l
n-1
Desvio-padrão
Uma vez que o resultado da variância é expresso em unidades ao quadrado, temos que calcular a raiz
quadrada da variância e, com isso, obtemos o desvio-padrão. Assim, temos uma medida com as
mesmas unidades que os dados:
S = √Variância
O desvio-padrão é uma medida que só pode assumir valores não negativos e, quanto maior for,
maior será a dispersão dos dados.
― O desvio-padrão é sempre não negativo e será tanto maior, quanto mais variabilidade
houver entre os dados.
Essas duas medidas determinam a variabilidade de distribuição de retornos sobre a sua média.
7
Estatística
Por exemplo, quando se realiza um investimento, há duas probabilidades, em linhas gerais: que o
valor investido renda positivamente ou negativamente em relação a determinado patamar (pode ser
o valor inicialmente investido ou mesmo um benchmark de mercado, usado como comparação para
avaliar o desempenho de um investimento, por exemplo, CDI ou Ibovespa).
Por sua vez, ao se investir num fundo DI ou em títulos pós-fixados do Tesouro Nacional e se calcular
o desvio-padrão, será possível notar uma menor dispersão com relação à média (menor desvio-
padrão), pois os retornos são mais constantes.
Onde:
Valores Esperados
A variância (σ2) para um investimento individual, considerando valores esperados, é calculada da
seguinte maneira:
Estado da
Probabilidade Retorno [(Ri) – E(R)]² Pi[(Ri) - E(R)]²
Economia
8
Estatística
Valores Históricos
Considere que os retornos de uma ação nos últimos 6 meses foram: +10%,
9
Estatística
Em várias situações financeiras, no entanto, estamos interessados em saber como duas variáveis se
movem, uma em relação à outra.
A covariância (em inglês, covariance ou COV) é essa medida do grau com que duas variáveis se
movem juntas. Captura a relação linear entre uma variável e outra.
N
Σ (Xi - X)(Yi - Y)
Cov(X,Y) = i=l
n
Se tratar-se de uma amostra, lembre-se de que, no denominador, deve constar
n-l
Uma covariância positiva indica que as variáveis tendem a se mover na mesma direção; uma
covariância negativa indica que as variáveis tendem a se mover em direções opostas relativas
aos seus meios.
10
Estatística
Sendo assim, se você compara duas medidas de covariância e uma é duas vezes o valor da outra,
a relação do segundo grupo não é necessariamente duas vezes mais fraca que a do primeiro.
Solução:
Para ser mais fácil de interpretar o valor da covariância de duas variáveis, utilizamos o coeficiente de
correlação (ρ).
Esse coeficiente nada mais é do que a covariância de duas variáveis dividido pelo produto dos
desvios-padrão de cada uma.
COV a,b
ρ a,b = = COV a,b = ρ a,b x σa x σb
σa x σ b
11
Estatística
O gráfico abaixo descreve uma situação em que a correlação dos retornos dos ativos A e B é
igual a 0,9. Observe que os retornos tendem a se mover na mesma direção.
RA
RB
Exemplo de correlação positiva: a variação de preços da ação da Petrobras e o índice IBX. Como a
ação da Petrobras possui um elevado peso no IBX, é de se esperar que, na maioria das vezes, a ação e
o índice tenham comportamentos na mesma direção e com magnitudes próximas.
Exemplo de correlação negativa: quando o dólar subiu, historicamente os retornos mostram que, na
maioria das vezes, o Ibovespa registrou desvalorização, e vice-versa.
Exemplo de correlação nula: a variação de índices de preços no Brasil não apresenta movimentos
com tendência definida se comparada com a variação de câmbio, como no caso do peso argentino.
Retorno Retorno
ativo j ativo j
12
Estatística
Correlação nula
Retorno ativo i
Retorno
ativo j
No caso de dois ativos com correlação negativa, ao incorrer uma perda no ativo i, ganhamos com o
ativo “j”; o caso contrário também se verifica, um ganho do ativo “i” significa uma perda no ativo “j”.
Portanto, para ativos que possuem correlação negativa, há a formação de um hedge entre ambos,
justamente a partir da diversificação.
É importante ressaltar que para regressões lineares simples, isto é, aquelas com apenas uma variável
independente, o coeficiente de determinação R2 pode ser computado elevando ao quadrado o
coeficiente de correlação (r).
Entretanto, esta relação não é válida quando mais de uma variável independente é utilizada, isto é,
em uma regressão linear múltipla. Neste caso, o R2 pode ser calculado através de um procedimento
estatístico denominado Análise de Variância - ANOVA.
A fórmula para cálculo do risco de uma carteira, medido pelo desvio-padrão de uma carteira
com dois ativos (A e B), é dada por:
13
Estatística
√ W A2σ A2 + W B2σ B2 + 2 W AW BC o v AB
Em que:
Solução:
A R$ 20.000 40%
B R$ 30.000 60%
riscocarteira = 2,134%
14
Estatística
σp2 = wA2σ2A + wB2σ2B + wC2σ2C + 2wAwB ρ ABσAσB + 2wAwC ρ ACσAσC + 2wBwC ρ BCσBσC
Em que:
ρAB, ρAC, ρBC = correlação dos retornos dos pares de ativos (A&B, A&C, B&C)
Distribuição Normal
A Distribuição Normal é a mais familiar das distribuições de probabilidade e também uma das mais
importantes em estatística.
A forma exata de Distribuição Normal (a característica “curva do sino”) é definida por uma função que
tem apenas dois parâmetros: média e desvio-padrão.
― É simétrica.
15
Estatística
Probability
68%
= 95%
Em um intervalo de 90% de confiança, 10% das médias das amostras coletadas não
abrangem a média da população.
Exemplo:
16
Estatística
Intervalo de
Possíveis Resultados Interpretação
Confiança
17